人形機(jī)器人該怎么做?應(yīng)用目標(biāo)是什么?
人形機(jī)器人為何這兩年突破很快?當(dāng)前研究的熱門是哪三樣?未來在工業(yè)和家庭等應(yīng)用的突破點(diǎn)是什么?在日前上?!?025 中國人形機(jī)器人生態(tài)大會”上,哈爾濱工業(yè)大學(xué)機(jī)器人研究所所長 趙杰談了他的思考。包括8 個(gè)部分:①半馬比賽是個(gè)里程碑,②為何這兩年成果很多?③肢體、小腦、大腦需協(xié)同發(fā)展,?“仿生”是拓展,而非復(fù)制人,?產(chǎn)業(yè)鏈從老三樣向軟硬一體化過渡,?發(fā)展階段:四橫三縱,?應(yīng)用方面,工業(yè)在先,家用遙遠(yuǎn),?人形機(jī)器人的終極目標(biāo)。
哈工大機(jī)器人所所長 趙杰
1 半馬比賽是個(gè)里程碑
人形機(jī)器人現(xiàn)在很火,2025 年4 月北京亦 莊還進(jìn)行了“人形機(jī)器人半程馬拉松賽”,之后有些自媒體及外行人對人形機(jī)器人產(chǎn)生了質(zhì)疑和負(fù)面觀點(diǎn),一些影響還很大。
實(shí)際上,很多先驅(qū)10 年前就在做人形機(jī)器人,當(dāng)年就被問到:能不能把機(jī)器人拉到操場上轉(zhuǎn)一圈?現(xiàn)在經(jīng)過10 年,機(jī)器人不僅能在操場上,甚至還在馬路上走了21 公里—— 盡管給機(jī)器人換了幾次電,因?yàn)橛行┘夹g(shù)(例如電源)不是機(jī)器人領(lǐng)域要解決的核心,而是其他學(xué)科要解決的,機(jī)器人行業(yè)解決不了所有的問題。
因此,或許這次半馬賽會成為人形機(jī)器人發(fā)展的一個(gè)里程碑事件,至少解決了過去在實(shí)驗(yàn)室里能走幾步,發(fā)展到近幾年能翻幾個(gè)跟頭,甚至現(xiàn)在已經(jīng)能夠拉出去遛了,這是人形機(jī)器人往前走的必須一步。
而且這種以比賽的形式出現(xiàn),一是向社會的展示,不管它是正面還是負(fù)面的;二是展示了人形機(jī)器人企業(yè)的整體自信心,因?yàn)楫吘?1 公里,我們還是有好幾款機(jī)器人走完了。所以我們應(yīng)該從正面的角度來肯定這件事。
2 已做了20 年,為何不如這兩年吸引眼球?
趙杰所長等專家這兩年經(jīng)常被問到這樣一個(gè)問題:國家863 計(jì)劃時(shí)(注:始于1986 年3 月),機(jī)器人專家組就開始支持雙足機(jī)器人,20 多年取得的成果為何不如這兩年多?
的確,這兩年人形機(jī)器人得到了快速發(fā)展。原因主要有三點(diǎn)。①驅(qū)動力不同。當(dāng)年863 計(jì)劃部署的項(xiàng)目是做科研,現(xiàn)在很多初創(chuàng)公司是以產(chǎn)品驅(qū)動的。②投資金額不同。我國前20 年在人形機(jī)器人或稱仿雙足機(jī)器人方面的總投資約1.4 億元,可能還不如現(xiàn)在一家初創(chuàng)公司1 年的投入。③新技術(shù)的加持。例如現(xiàn)在有的可以翻跟頭,有的能像人一樣以自然步態(tài)行走,……這些得益于現(xiàn)在端到端等新技術(shù)。
3 肢體、小腦、大腦需協(xié)同發(fā)展
首先觀察人類。一些殘疾人沒有上肢、只有雙足,叫身殘志堅(jiān),可以做一些簡單的工作;上肢健全,下肢癱瘓,也可以服務(wù)社會。類比機(jī)器人,機(jī)器人要想服務(wù)社會,還是要先把上肢做好;關(guān)于行走,是否還可以有其他形式?
還有像霍金一樣的全身癱瘓,但大腦特別聰明。相反,如果大腦不好用,就干不了活。即大腦和肢體要協(xié)同起來。
所以人形機(jī)器人的肢體、小腦、大腦必須要協(xié)同發(fā)展。
4 “ 仿生”是拓展,而非復(fù)制人
波士頓動力的新一代Atlas 電動機(jī)器人出來以后,給了業(yè)界非常好的啟示。例如人類的腦袋轉(zhuǎn)不了360°,腰轉(zhuǎn)不了360°,但新一代機(jī)器人是行的,可以比人更靈活。人的進(jìn)化并不非是最優(yōu)的。
所以“仿生”一定要拓展人的能力,而非一味地復(fù)制人的能力。復(fù)制的結(jié)果可能還不如人。
5 產(chǎn)業(yè)鏈從老三樣向軟硬一體化過渡
隨著生成式AI加持,人形機(jī)器人推動了整個(gè)機(jī)器人產(chǎn)業(yè)鏈的延展。但是過去和現(xiàn)在的很多人形機(jī)器人企業(yè)還在熱衷宣傳減速器、電驅(qū)、關(guān)節(jié)如何好,實(shí)際上到了這個(gè)階段,不僅是人形機(jī)器人,AI 和機(jī)器人的深度融合一定會驅(qū)動機(jī)器人的產(chǎn)業(yè)鏈延展,是軟硬件一體化的產(chǎn)業(yè)鏈。
機(jī)器人產(chǎn)業(yè)已從原來的老三樣—— 減速器、電機(jī)、控制器,到了硬件新三樣:專用的傳感器,高算力的芯片,智能終端,以及新的軟三樣:操作系統(tǒng)、模型、數(shù)據(jù)。這是未來機(jī)器人產(chǎn)業(yè)鏈的一個(gè)大的構(gòu)架。
我們要做的事情還有很多。例如減速器,我們大量用的諧波、行星都存在一些問題,會不會有一些新的高效率正逆向傳動類的減速器?對于觸覺/ 電子皮膚/ 觸覺傳感器,國內(nèi)外已做了好多,哪種技術(shù)路線更實(shí)用?關(guān)于手,不要小看手,現(xiàn)在我們做的手為什么用不了?因?yàn)闆]有感知的功能。所以這些方面的挑戰(zhàn),說明我們的產(chǎn)業(yè)鏈現(xiàn)在應(yīng)該從關(guān)注老三樣要向整個(gè)的軟硬一體化來過渡。
6 發(fā)展階段:四橫三縱
在一些專家學(xué)者的觀點(diǎn)基礎(chǔ)上,趙杰所長進(jìn)行了補(bǔ)充完善,總結(jié)為四橫三縱。
人形機(jī)器人的發(fā)展階段有四橫,與人的成長過程類似。首先,出生時(shí)肢體不會走;第二,慢慢地隨著肢體的健壯、小腦的發(fā)育,人開始會走了;第三,有了大腦,能對一些通用的基本智能進(jìn)行理解,例如四五歲的小孩可能不識字,但至少能識別一些東西,完成一些基本動作。第四,知識賦能,就像去學(xué)校上學(xué),只有學(xué)習(xí)才能賦予它很多智慧和技能。
縱向可以分成三類。一類是電動、液壓等類型。還有一類是創(chuàng)新型的,包括現(xiàn)在正在探討的熱點(diǎn),諸如電動型要進(jìn)入家庭,養(yǎng)老要與老人接觸,這些技術(shù)方案是不是最終的形態(tài)?實(shí)際上,想做到與人交互,本質(zhì)是安全,目前還是挺難達(dá)到的。第三類是未來要探討的,例如是否還有其他形態(tài)?例如肌腱驅(qū)動的繩驅(qū)等,是不是還有很多其他的形態(tài)?
有了這個(gè)四橫三縱后,整個(gè)的技術(shù)體系應(yīng)該是什么?從肢體、小腦、大腦到知識賦能,前沿技術(shù)是什么?共性技術(shù)是什么?產(chǎn)業(yè)鏈?zhǔn)鞘裁矗空麢C(jī)是什么樣的應(yīng)用場景?相比海外,我們有跟跑的地方、并跑的地方,也有領(lǐng)跑的地方。一些專家正在整理這些,看看下一步到底如何來發(fā)展。
就運(yùn)動控制的技術(shù)路線而言,趙杰所長在與很多專家討論,例如都知道端到端的訓(xùn)練效果好,但是其泛化能力、遷移能力怎樣?即在這臺機(jī)器上訓(xùn)練的,在另一臺機(jī)器上是不是好使?具體有以下兩點(diǎn)。
● 模型驅(qū)動。早期的Atlas是令人佩服的,沒有什么訓(xùn)練,純是模型驅(qū)動。電動的Atlas 也是用端到端訓(xùn)練的。之后還在模型的基礎(chǔ)上加入了強(qiáng)化學(xué)習(xí),這條路線可能是未來可持續(xù)性的。
● 數(shù)據(jù)驅(qū)動。所謂的數(shù)據(jù)驅(qū)動、端到端、無模型等,正因?yàn)榻忉尣磺宄?,它的泛化遷移能力會非常差,短期內(nèi)一次性解決是可以的,長期真正要落地到實(shí)際/ 產(chǎn)業(yè)的時(shí)候,其可持續(xù)性與否還是值得關(guān)注的。
7 應(yīng)用:工業(yè)在先,家用遙遠(yuǎn)
第一個(gè)是公共服務(wù)??赡芄卜?wù)會最早突破。現(xiàn)在的人形機(jī)器人主要賣給科研院所,還有一些個(gè)人、娛樂機(jī)構(gòu)甚至公共場所。隨著大語言模型的出現(xiàn),至少對話能力增強(qiáng)了,答非所問減少了。這方面近一兩年已經(jīng)開始在做了,但是這個(gè)市場很容易飽和,可能再有一年半載就達(dá)到飽和了。
第二個(gè)是工業(yè)場景。趙杰所長去過很多車廠,看到人形機(jī)器人。先不談這些場合是否一定要由雙足機(jī)器人來做,至少說明已在這個(gè)場合試驗(yàn),這就是進(jìn)步,但是離真正用起來還有距離。我們不期望人形機(jī)器人做得比人快多少,至少它類似人,才能有用。
為什么工業(yè)場景能早于家庭場景?工業(yè)場景里用人手干活時(shí),98%是人用工具來干活的,不是完全用手?jǐn)Q螺絲,而是用螺絲刀、扳手等。正因?yàn)橛霉ぞ?,可以把工具做快換,就可以完成一些技能型的工作。但是家用的手/ 爪真正要做好/ 實(shí)用,可能跟做機(jī)器人本體的難度差不多。所以從這個(gè)角度來看,工業(yè)場景較為容易,家庭場景挺難的。至少目前看,家庭場景方面,最先實(shí)現(xiàn)的也許是家庭服務(wù)類的,但是真正做點(diǎn)家務(wù),真正地去服侍老人/ 養(yǎng)老/ 助老這方面可能還很遠(yuǎn)很遠(yuǎn)。
所以我們把人形機(jī)器人定義成未來產(chǎn)業(yè)。5年后的產(chǎn)業(yè)不是未來產(chǎn)業(yè),叫嶄新產(chǎn)業(yè)。至少10年以后的才能叫未來產(chǎn)業(yè)。我們現(xiàn)在所做的人形機(jī)器人是為未來做的,如果真的做成,未來一定是一個(gè)較大的增量。
8 終極目標(biāo)是什么?
未來的機(jī)器人/ 人形機(jī)器人到底能干點(diǎn)什么事?愿景是什么?希望成為未來制造業(yè)的機(jī)器工人,家政服務(wù)業(yè)的機(jī)器保姆,照顧老人的機(jī)器孝子。
這個(gè)愿景實(shí)現(xiàn)以后會帶來什么?重構(gòu)了機(jī)器人在人類社會的身份地位和生產(chǎn)關(guān)系。機(jī)器人將不再僅僅是生產(chǎn)生活的工具,而是人類生活和工作中不可或缺的伙伴。這是人形機(jī)器人的價(jià)值所在。
(本文來源于《EEPW》202507)
評論