丨掃上圖二維碼加入星球
丨數(shù)據(jù),報(bào)告與資訊,知識(shí),問答與合作
想理解機(jī)器人的大腦,不妨先看看我們自己的大腦。人腦由大腦、小腦、腦干和間腦組成,各司其職。大腦掌控著高級(jí)認(rèn)知和感覺運(yùn)動(dòng),小腦負(fù)責(zé)運(yùn)動(dòng)協(xié)調(diào)和平衡,腦干維持生命活動(dòng)并傳遞信息,間腦則管理感覺信息中轉(zhuǎn)和內(nèi)分泌調(diào)節(jié)。在機(jī)器人世界里,這種結(jié)構(gòu)也有了對(duì)應(yīng)。機(jī)器人的“大腦”是中央控制器,目前還處于發(fā)展階段,未來有望實(shí)現(xiàn)更強(qiáng)大的高級(jí)認(rèn)知和信息處理能力。小腦的功能則體現(xiàn)在動(dòng)作學(xué)習(xí)模仿和復(fù)雜動(dòng)作控制上,讓機(jī)器人能像人類一樣做出精細(xì)動(dòng)作。腦干和間腦對(duì)應(yīng)的則是機(jī)器人中的傳感器、執(zhí)行器、線束和網(wǎng)關(guān),負(fù)責(zé)電源管理、通信控制和狀態(tài)監(jiān)測(cè)等基礎(chǔ)功能,確保機(jī)器人各個(gè)部件協(xié)同運(yùn)作。
在具身機(jī)器人的“大腦”領(lǐng)域,英偉達(dá)憑借其強(qiáng)大的計(jì)算平臺(tái)占據(jù)了主導(dǎo)地位。其Jetson系列專為機(jī)器人和邊緣AI應(yīng)用設(shè)計(jì),從Nano到AGX Xavier,再到最新的Jetson Thor,不斷為機(jī)器人提供更強(qiáng)大的算力支持。Jetson Thor更是基于NVIDIA Thor SoC,具備800萬億次8位浮點(diǎn)運(yùn)算的AI性能,能夠執(zhí)行復(fù)雜任務(wù)并與人機(jī)交互。國(guó)內(nèi)廠商也在奮起直追,推出了高低配的算力模組方案。例如,宇樹、眾擎等廠商的基礎(chǔ)算力模組能滿足機(jī)器人基礎(chǔ)動(dòng)作需求,而高算力模組則多基于英偉達(dá)平臺(tái)進(jìn)行開發(fā),為二次開發(fā)提供了更多可能。
訓(xùn)練方案上,模仿學(xué)習(xí)和強(qiáng)化學(xué)習(xí)各有千秋。模仿學(xué)習(xí)讓機(jī)器人快速學(xué)習(xí)專家策略,但泛化能力有限;強(qiáng)化學(xué)習(xí)則通過大量試錯(cuò)探索未知策略,適合復(fù)雜動(dòng)態(tài)環(huán)境,不過學(xué)習(xí)過程緩慢且獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)困難。數(shù)據(jù)采集方面,基于仿真環(huán)境的Sim2Real方法能低成本獲取大量數(shù)據(jù),但存在仿真與現(xiàn)實(shí)差異;基于真實(shí)世界的數(shù)據(jù)采集雖然數(shù)據(jù)真實(shí)可靠,但成本高、效率低。
國(guó)內(nèi)外廠商在具身機(jī)器人領(lǐng)域的大模型進(jìn)展如火如荼。銀河通用發(fā)布的GraspVLA模型,通過預(yù)訓(xùn)練和后訓(xùn)練相結(jié)合,利用合成大數(shù)據(jù)和小樣本學(xué)習(xí),展現(xiàn)出強(qiáng)大的泛化能力。Figure AI的人形機(jī)器人VLA通用大模型則通過互補(bǔ)的系統(tǒng)權(quán)衡,實(shí)現(xiàn)了快速反應(yīng)與通用性的平衡。智元通用的具身基座大模型GO-1采用ViLLA架構(gòu),通過預(yù)測(cè)Latent Action Tokens,彌合圖像-文本與機(jī)器人動(dòng)作之間的鴻溝,大幅提升了機(jī)器人在多種任務(wù)上的成功率。英偉達(dá)的GR00T N1模型則借鑒人類認(rèn)知處理,采用雙系統(tǒng)架構(gòu),結(jié)合真實(shí)機(jī)器人軌跡、人類視頻和合成數(shù)據(jù)進(jìn)行訓(xùn)練,提升了機(jī)器人在復(fù)雜環(huán)境中的操作能力。
從L1的完全由人控制到L5的完全自主智能,機(jī)器人正逐步邁向更高的智能水平。目前,人形機(jī)器人產(chǎn)業(yè)正朝著L3級(jí)邁進(jìn),預(yù)計(jì)到2026年,具備L3初階能力的人形機(jī)器人將進(jìn)入適度規(guī)模的商業(yè)化量產(chǎn)階段。L4級(jí)具身智能機(jī)器人將在未來3-5年內(nèi)落地,主要應(yīng)用于B端的工業(yè)制造和商業(yè)服務(wù)等領(lǐng)域,如餐廳服務(wù)員、清潔工和制造車間工人等。這些機(jī)器人能夠在特定活動(dòng)范圍內(nèi)獨(dú)立自主完成工作,具有一定的泛化學(xué)習(xí)能力。而L5級(jí)具身智能機(jī)器人預(yù)計(jì)在未來5-10年內(nèi)落地,將成為C端家庭中的硅基家人,承擔(dān)家務(wù)助理和個(gè)人事務(wù)助理的角色,具備高度復(fù)雜場(chǎng)景下的自主工作能力和情感化交流能力。
遙操作技術(shù)在具身機(jī)器人的發(fā)展中扮演著重要角色。通過將人類操作包含在控制回路中,遙操作能夠加速具身智能的數(shù)據(jù)采集環(huán)節(jié),同時(shí)在商業(yè)化領(lǐng)域,也能在惡劣環(huán)境下取代人類,降低企業(yè)用工成本。特斯拉的Optimus人型機(jī)器人就是通過VR頭顯和動(dòng)捕服等設(shè)備,讓人類訓(xùn)練員的動(dòng)作被機(jī)器人實(shí)時(shí)復(fù)刻,從而加速了機(jī)器人的訓(xùn)練過程。智元機(jī)器人則在上海建立了“數(shù)據(jù)采集工廠”,通過一對(duì)一的數(shù)據(jù)采集員,讓機(jī)器人在不同場(chǎng)景中學(xué)習(xí)執(zhí)行任務(wù),日均采集大量數(shù)據(jù),為機(jī)器人的訓(xùn)練提供了豐富的素材。遙操作技術(shù)不僅有助于具身機(jī)器人的訓(xùn)練,還可能成為未來具身智能生態(tài)的基礎(chǔ)設(shè)施級(jí)技術(shù),持續(xù)賦能物理交互能力的進(jìn)化迭代。






























2025具身機(jī)器人行業(yè)未來展望報(bào)告
本平臺(tái)只做公開內(nèi)容的整理分析分享,內(nèi)容來源于網(wǎng)絡(luò),僅供參考,不構(gòu)成任何建議,版權(quán)歸原撰寫發(fā)布機(jī)構(gòu)所有,所有內(nèi)容通過公開渠道獲得合理引用,如涉及侵權(quán),請(qǐng)及時(shí)聯(lián)系我們刪除;如對(duì)內(nèi)容存疑,請(qǐng)與撰寫、發(fā)布機(jī)構(gòu)聯(lián)系。
行業(yè)報(bào)告智庫高端社群從事行業(yè)交流,社群人脈圈子,希望通過收集和整理數(shù)據(jù)行業(yè)報(bào)告知識(shí)幫助有需要的人更快更精準(zhǔn)了解最新各行業(yè)各領(lǐng)域動(dòng)態(tài),涉及各行業(yè)領(lǐng)域,如需了解更多詳情可加入圈子。如有侵權(quán)問題,商務(wù)合作,其他咨詢等問題,請(qǐng)聯(lián)系客服Hikalikuh處理。
已有3000+小伙伴加入星球社區(qū)交流
















丨掃上圖二維碼加入星球
丨數(shù)據(jù),報(bào)告與資訊,知識(shí),問答與合作
往期推薦




今日?qǐng)?bào)告分享
戳“閱讀原文”,查看更多精彩內(nèi)容