新聞中心

EEPW首頁 > 設(shè)計(jì)應(yīng)用 > 樂聚對(duì)“人形機(jī)器人“的研發(fā)與商業(yè)探索

樂聚對(duì)“人形機(jī)器人“的研發(fā)與商業(yè)探索

—— 樂聚創(chuàng)始人冷曉琨談9年從業(yè)經(jīng)驗(yàn),以及對(duì)行業(yè)的觀察建議
作者:迎九(EEPW) 時(shí)間:2025-07-17 來源:EEPW 收藏

“人形機(jī)器人”的技術(shù)路線如何?產(chǎn)業(yè)發(fā)展如何避坑?今年4 月,在上?!?025 中國人形機(jī)器人生態(tài)大會(huì)”上,人形機(jī)器人的新勢力—— 樂聚(深圳)機(jī)器人公司的創(chuàng)始人 冷曉琨介紹了其探索與發(fā)展建議。包括六部分:①機(jī)器人成本已大幅下降,②關(guān)注產(chǎn)業(yè)化,先讓機(jī)器人能用起來,③要像博士一樣聰明,家電一樣便宜,?小腦運(yùn)動(dòng)控制路線:model-based+RL(強(qiáng)化學(xué)習(xí)),?產(chǎn)業(yè)化的三步走,?對(duì)產(chǎn)業(yè)發(fā)展的建議。

1752726689803087.png

樂聚創(chuàng)始人 冷曉琨

1   前人開路,使機(jī)器人成本已大幅下降

這兩年人形機(jī)器人出現(xiàn)了井噴,因此有種觀點(diǎn)是否定過去一二十年人形機(jī)器人開拓者所做的工作,認(rèn)為那時(shí)效率低下。樂聚對(duì)此有不同意見,并以親身經(jīng)歷來說明。實(shí)際上,樂聚2016 年就成立了,由10 位哈工大的師兄弟組成,定位于人形機(jī)器人,在2018 年時(shí)做了第一臺(tái)人形機(jī)器人,那時(shí)所有的核心零部件是進(jìn)口的,一臺(tái)人形機(jī)器人的BOM(物料清單)成本接近300 萬元,但是現(xiàn)在這款機(jī)器人的成本只有幾十萬元—— 這個(gè)變化不是樂聚或某一家公司可以實(shí)現(xiàn)的,而是過去十年甚至幾十年,前輩從國家層面把整個(gè)機(jī)器人的產(chǎn)業(yè)生態(tài)鏈布局好了,后人才能踩在巨人的肩膀上做成一些事。

2   聚焦產(chǎn)業(yè)化,先讓機(jī)器人能用起來

從2016 年樂聚做人形機(jī)器人開始,一直聚焦在人形機(jī)器人產(chǎn)業(yè)化上,即無論技術(shù)成熟到哪一步,至少先讓機(jī)器人用起來,而不只是做一個(gè)能跑、能跳、能讓人看的。

樂聚去年把人形機(jī)器人作為主營業(yè)務(wù),希望在產(chǎn)業(yè)化、商業(yè)化上實(shí)現(xiàn)閉環(huán)。例如2024 年完成了100 臺(tái)全尺寸(1.7 米)以上的人形機(jī)的產(chǎn)業(yè)化交付,今年一季度完成了300 臺(tái)的交付??梢姡F(xiàn)在是一個(gè)指數(shù)性上升的狀態(tài)。

3   博士一樣聰明,家電一樣便宜

從時(shí)間迭代看,2016年成立公司,2018年做出第一臺(tái)人形機(jī)。2022年迎來人形機(jī)器人市場爆發(fā)。在此期間,樂聚經(jīng)歷了6次大的迭代。

2019年業(yè)界就在探討人形機(jī)器人什么時(shí)候爆發(fā)?當(dāng)時(shí)孫立寧教授(注:俄羅斯工程院外籍院士,蘇州大學(xué)特聘教授,哈工大博士畢業(yè))給出了一句話:像博士一樣聰明,像家電一樣便宜。對(duì)核心任務(wù)的定位是:技能遷移。即如何把人做任務(wù)的數(shù)據(jù)提取出來,經(jīng)過黑盒子把技能給到人形機(jī)器人。

4   小腦運(yùn)動(dòng)控制路線:model-based+RL(強(qiáng)化學(xué)習(xí))

所以那時(shí)人們就在探討黑盒子應(yīng)該怎么構(gòu)建?但是沒有找到答案?,F(xiàn)在隨著大模型/ 具身智能的成熟,人們發(fā)現(xiàn)黑盒子是具身智能。所以整個(gè)的技術(shù)邏輯/ 工程邏輯就成熟起來了。

盡管工程/ 技術(shù)路線在變化,但是多年來也有沒變的、樂聚一直在堅(jiān)持的技術(shù)。例如盡管有VLA(視覺語言動(dòng)作)大模型、端到端模型等,但產(chǎn)業(yè)化還需要時(shí)間。如果先做成原子級(jí)的小數(shù)據(jù)、小技能,再通過調(diào)度系統(tǒng)來完成,至少可以保證當(dāng)前讓機(jī)器人能夠快速進(jìn)入產(chǎn)業(yè)化,迭代使用起來。所以樂聚現(xiàn)在做的整體架構(gòu)里,依然要培養(yǎng)一些原子級(jí)技能,上面隨著智能調(diào)度系統(tǒng)逐漸成熟,再落地到不同的場景里。

這涉及運(yùn)動(dòng)技術(shù)路線,樂聚的觀點(diǎn)和趙杰教授(注:哈工大機(jī)器人所所長)一致,認(rèn)為未來小腦的一個(gè)核心發(fā)展趨勢是model-based + RL(強(qiáng)化學(xué)習(xí))的耦合。這也是去年?duì)幾h很大的一件事。樂聚之前一直在堅(jiān)持model-based路線,好處是場景應(yīng)用時(shí)每個(gè)行為是可控的,每個(gè)規(guī)則是預(yù)定好的,可以精確執(zhí)行某個(gè)任務(wù),并且每臺(tái)機(jī)器人調(diào)試好之后、批量化生產(chǎn)時(shí),每臺(tái)機(jī)器人都可以完成這個(gè)任務(wù)。但是缺點(diǎn)也很明顯:不能像RL一樣泛化,所以沒法像去年很火的爬山視頻一樣,做不了翻山越嶺等任務(wù)。

但是純RL(強(qiáng)化學(xué)習(xí))路線也存在一個(gè)問題:這個(gè)機(jī)器人調(diào)試完之后,無法保證剩下生產(chǎn)的所有機(jī)器人都能夠完成這個(gè)工作。因?yàn)橐獙?duì)這一臺(tái)機(jī)器人做精細(xì)建模。這就是為什么很多用戶在網(wǎng)上發(fā)出質(zhì)疑:我看到的視頻和拿到的機(jī)器人會(huì)有一些差距。因?yàn)槊恳慌_(tái)機(jī)器人都需要做一個(gè)很精密的建??刂啤?/p>

因此,我們既要有model-based這種精準(zhǔn)的控制方式,又希望有RL 這種泛化性,二者結(jié)合起來較為理想。

所以可以看到包括波士頓動(dòng)力等國際頭部公司及樂聚等國內(nèi)公司在往這條路線去做。

所以關(guān)于小腦的運(yùn)動(dòng)控制路線,在去年業(yè)界還在爭議:到底model-based 這種落后路線對(duì),還是RL(強(qiáng)化學(xué)習(xí))這種新型的路線對(duì)?但是今年可能各家的觀點(diǎn)比較一致了:一定是往model-based+RL 這種融合路線上去做。

實(shí)際上,model-based早期一直是業(yè)界堅(jiān)持的,與RL的分水嶺是在2020年,即MIT開源了RL(強(qiáng)化學(xué)習(xí))之后,人們發(fā)現(xiàn)model-based有很大的問題——它的天花板是很低的,例如本田的阿西莫(ASIMO)公認(rèn)是人形機(jī)器人中做得很好的,但是不夠靈活,很難進(jìn)入到產(chǎn)業(yè)中。

隨著MIT于2020年左右開源RL(強(qiáng)化學(xué)習(xí))之后,因?yàn)樗且粋€(gè)非結(jié)構(gòu)化網(wǎng)絡(luò),大量的數(shù)據(jù)是訓(xùn)練出來的,所以大部分的產(chǎn)業(yè)和學(xué)術(shù)界往RL(強(qiáng)化學(xué)習(xí))上去轉(zhuǎn)了。

但是那時(shí)樂聚仍堅(jiān)持認(rèn)為,如果想讓人形機(jī)器人在產(chǎn)業(yè)里用起來,model-based這條路不會(huì)被放棄,過去50年的控制理論建設(shè)不可能隨著一個(gè)RL的出現(xiàn)而被全盤否定。所以樂聚在2022年之前一直還是在堅(jiān)持model-based這條路線,后來發(fā)現(xiàn)特斯拉、Figure AI、波士頓動(dòng)力等公司也是類似的做法。

樂聚去年已到了第三代model-based,核心是解決了傳統(tǒng)model-based 的幾個(gè)問題:求解精度問題,并把算法、實(shí)時(shí)性這兩個(gè)最核心的問題解決了,所以才使model-based 這條路線能夠用起來了。接下來會(huì)用到工廠等一些真正的場景中。

對(duì)于強(qiáng)化學(xué)習(xí),樂聚在去年年底也做了純強(qiáng)化學(xué)習(xí)方案,當(dāng)時(shí)訓(xùn)練了2個(gè)月,可以保證機(jī)器人有45分鐘的連續(xù)奔跑,并發(fā)布了一個(gè)視頻。

到樂聚的第四代產(chǎn)品,把model-based 與RL 開始融合。成功的案例是在今年3月的北京中關(guān)村論壇上,樂聚只用了20天時(shí)間,實(shí)現(xiàn)了20臺(tái)機(jī)器人在現(xiàn)場進(jìn)行太極拳的表演。

國內(nèi)同行也采用了model-based 和RL 融合的技術(shù)路線。例如在今年4 月的北京亦莊人形機(jī)器人半程馬拉松上,哈工大和清華的本科生、研究生組成了一支聯(lián)合隊(duì),就采用了此路線,使機(jī)器人的成功率及擬人化程度都有了大幅度提升。

1752726996484288.png

圖1 “夸父”在一汽紅旗工廠搬箱子

5   產(chǎn)業(yè)化三步走

產(chǎn)業(yè)化分三個(gè)階段,正如趙杰教授(哈工大機(jī)器人研究所所長)等專家提出的,第一階段,是現(xiàn)在仍在探索的科研,以及商業(yè)/ 展廳服務(wù);第二個(gè)階段是在工廠,這是今年及未來幾年的核心場景;第三是未來的家庭。

image.png

5.1 第一階段:科研和商服

需要做的是把足夠的接口開放出來,方便作為科研平臺(tái)來使用;或者搭載了大模型的機(jī)器人,例如像講解員一樣做展廳的引導(dǎo)服務(wù),特點(diǎn)是較少地介入物理世界,就可以使用起來。

從樂聚角度看,展廳今年接受度較高,在樂聚的出貨中比重較大,主要是“夸父”(KUAVO)系列。關(guān)于樂聚的做法,由于人形機(jī)器人由大腦、小腦和本體組成,樂聚的核心技術(shù)是在小腦和本體上,因此在大腦方面,樂聚這幾年和盤古大模型綁得較緊,并與豆包大模型、阿里云通義大模型在做深度綁定。在產(chǎn)業(yè)鏈方面,與科研院所和企業(yè)在做具身智能產(chǎn)業(yè)生態(tài)的布局。

5.2 第二階段:工業(yè)場景

工業(yè)場景是否需要人形機(jī)器人?這個(gè)爭議較大,因?yàn)榇蟛糠謭鼍耙驯蛔詣?dòng)化設(shè)備取代了。但是如果真正進(jìn)到車廠里轉(zhuǎn)一圈,依然存在一些場景需要人形機(jī)器人來做。

樂聚今年4 月初發(fā)布了“夸父”在一汽紅旗車廠里搬箱子的視頻(圖1)。但是效率現(xiàn)在只有人的百分之六七十。好在搬空箱這個(gè)場景不考驗(yàn)節(jié)拍,達(dá)到70%左右就可以了。它一天可以完成1000 多個(gè)箱子的搬運(yùn)。對(duì)箱子的泛化性是一大技術(shù)挑戰(zhàn),因?yàn)閷?shí)際搬運(yùn)時(shí),大小、顏色、重量等都不同,非??简?yàn)泛化性,以及它的空間很狹窄。它所有的運(yùn)動(dòng)控制都是用model-based 做的,但是樂聚今年下半年開始逐漸交付的就是modelbased+RL,再加上大腦的技能。

關(guān)于工業(yè)人形機(jī)器人,3 年內(nèi)將是人形機(jī)器人的一個(gè)重要場景,但不是人形機(jī)器人的最終場景,工業(yè)只是一個(gè)過渡階段,是從過去固定的場景到未來家庭服務(wù)/ 超泛化場景之間的階段,一般用在最后一條產(chǎn)線上輕微泛化的場景,因此工業(yè)應(yīng)用的天花板不會(huì)太高,例如做搬運(yùn)、SPS分揀等工作,這些市場的體量不會(huì)很大。

但是從戰(zhàn)略上來看,它是大腦、小腦在輕泛化場景下的磨合使用。所以這第二類應(yīng)用雖然場景不大,但對(duì)于當(dāng)前國內(nèi)的幾家人形機(jī)器人企業(yè)的產(chǎn)業(yè)化是足夠的。未來一兩年內(nèi)還需要深度打磨。

除了SPS 分揀、搬箱子之外,接下來,如果人形機(jī)器人在工廠里再要做其他的工作,一個(gè)核心是要建訓(xùn)練場。實(shí)際上,今年全國各地都在建訓(xùn)練場,本質(zhì)上,訓(xùn)練場是人形機(jī)器人的職業(yè)技能培訓(xùn)院校—— 把工廠里需要的場景抽象出來,然后采集人和遙控機(jī)器人的數(shù)據(jù),形成技能模型,這種技能一旦形成、效率達(dá)到之后,它就可以直接在工廠里應(yīng)用。

可能今年的核心是建訓(xùn)練場,估計(jì)明年上半年逐漸形成,下半年會(huì)在工業(yè)場景有一次應(yīng)用的爆發(fā)。

5.3 第三個(gè)場景:家庭,還要三五年或十年

當(dāng)前不需要過多去講家庭場景。因?yàn)闃I(yè)界能夠如此深地去布局人形機(jī)器人的未來產(chǎn)業(yè),都盯的是希望它能夠像新能源汽車和智能手機(jī)一樣,每個(gè)家庭甚至每個(gè)人身邊都有一臺(tái)。但這個(gè)時(shí)間可能需要很長。很多領(lǐng)導(dǎo)來考察時(shí),都愛問“人形機(jī)器人什么時(shí)候能進(jìn)入家庭?”冷曉琨的答案是三五年。

實(shí)際上,從技術(shù)和工程方面的挑戰(zhàn)并不太大,即真的在家庭里完成這些任務(wù)是可以的。但是真正作為一個(gè)產(chǎn)品銷售的時(shí)候,涉及安全問題、倫理問題、準(zhǔn)入問題、交互體驗(yàn)問題等,這些問題需要更久來解決,可能還要抱著一個(gè)10 年的周期來做。

6   對(duì)產(chǎn)業(yè)的建議

6.1 當(dāng)前要考慮行業(yè)泡沫了

一切要以商業(yè)化閉環(huán)為本質(zhì)。這也是為什么最近的輿論有一些反過來,質(zhì)疑它的發(fā)展。其實(shí)這個(gè)階段在2016 年也出現(xiàn)過一次,因?yàn)槟菚r(shí)也是優(yōu)必選上完春晚之后,國內(nèi)出現(xiàn)了10 多家做小人型機(jī)器人的公司,例如樂聚、優(yōu)必選等都是在2016 年出來的。那時(shí)在深圳就有七八家是做小人形機(jī)器人的,目標(biāo)是讓機(jī)器人跳舞—— 但當(dāng)這形不成贏利的時(shí)候,半年之后就會(huì)出現(xiàn)一批企業(yè)倒閉。

所以今年又出現(xiàn)類似情況:會(huì)涌現(xiàn)一批公司,可能只是做出了一臺(tái)機(jī)器人,甚至出現(xiàn)了硬件解決方案公司—— 可把方案調(diào)試出來,讓機(jī)器人能走,然后以此來做商業(yè)化,其實(shí)并沒有形成商業(yè)化閉環(huán)。閉環(huán)必須要考慮人形機(jī)器人能用在哪里,怎么能為用戶產(chǎn)生價(jià)值。如果沒有商業(yè)閉環(huán),可能到今年年底,人形機(jī)器人或具身智能行業(yè)還會(huì)進(jìn)入一個(gè)冷靜期。為什么是這半年?因?yàn)闊o論是具身智能火爆還是被批評(píng),都是被媒體流量帶著走的,這對(duì)于行業(yè)是沒有任何引導(dǎo)能力的,核心原因就是企業(yè)沒有把商業(yè)化閉環(huán)講清楚。你產(chǎn)生不了產(chǎn)業(yè)化價(jià)值,所以所有的流量主導(dǎo)權(quán)都在自媒體或者外部手里。這是一個(gè)很大的問題。所以當(dāng)前階段,從業(yè)者需要冷靜下來,來解決商業(yè)化落地的問題。

6.2 大腦和小腦融合,誰來主導(dǎo)?

哈工大機(jī)器人研究所的趙杰所長曾指出,人形機(jī)器人不只是機(jī)器人制造業(yè)的問題,它是強(qiáng)人工智能,是“大腦+ 機(jī)器人制造業(yè)”的一次深度耦合催生出來的一個(gè)新的產(chǎn)業(yè)業(yè)態(tài)和生態(tài)。過去,計(jì)算機(jī)、AI 搞自己的一套,機(jī)器人制造業(yè)搞自己的一套,是兩個(gè)完全獨(dú)立的體系。但是人形機(jī)器人、具身智能體需要大腦和小腦的深度融合。

融合的難點(diǎn)是什么?不是大腦,也不是小腦,而是在于家長上—— 到底誰來主導(dǎo)?誰能夠把二者融合在一起?這不僅是技術(shù)問題,還是行業(yè)的問題。

為什么我們今年一直在做訓(xùn)練場?在訓(xùn)練場里以場景為牽引,讓大腦和小腦的不同團(tuán)隊(duì)在這里有一個(gè)主導(dǎo)方進(jìn)行融合。所以這個(gè)問題接下來會(huì)是一個(gè)挑戰(zhàn),甚至誰能夠把這個(gè)問題解決好,可能就會(huì)贏得具身智能行業(yè)的下一個(gè)先機(jī)。

6.3 需要全社會(huì)的信心與包容

人形機(jī)器人的爆發(fā)時(shí)間需要5 年甚至10 年,這需要整個(gè)社會(huì)對(duì)這個(gè)行業(yè)有信心,以及有包容心,例如如何看待馬拉松等人形機(jī)器人比賽。實(shí)際上,只要能有很多單位的人形機(jī)器人出來參與,已經(jīng)很不容易了,因?yàn)槿诵螜C(jī)器人還處于早期。

6.4 新技術(shù)催生新企業(yè),新企業(yè)要有謹(jǐn)慎態(tài)度

只有技術(shù)出現(xiàn)重大變革時(shí),例如這次大模型的出現(xiàn),這次人形機(jī)器人本體的工程能力出現(xiàn)提升的時(shí)候,才有新興企業(yè)的機(jī)會(huì)。因?yàn)槠髽I(yè)發(fā)展到一定程度時(shí),就會(huì)形成寡頭壟斷。只有新技術(shù)出現(xiàn)的時(shí)候,才有新企業(yè)的機(jī)會(huì)。但是新企業(yè)依然還是要抱有一個(gè)謹(jǐn)慎的態(tài)度,一步一步地來做這個(gè)市場。

(本文來源于《EEPW》


關(guān)鍵詞: 202507

評(píng)論


技術(shù)專區(qū)

關(guān)閉