(精選報(bào)告來源:報(bào)告研究所)
人形機(jī)器人小腦(運(yùn)控)介紹
人形機(jī)器人“小腦”概念
人形機(jī)器人“小腦”:目前產(chǎn)業(yè)界對人形“小腦”的定義并沒有形成統(tǒng)一共識,一般認(rèn)為“小 腦”就是運(yùn)動(dòng)控制,即由軟硬件構(gòu)成,硬件包括控制器、驅(qū)動(dòng)系統(tǒng)、編碼器等,軟件主要為部 署在硬件上的控制和感知算法等。人形運(yùn)控與傳統(tǒng)運(yùn)控最大的區(qū)別在于:后者是根據(jù)已編程好 的軌跡去完成實(shí)時(shí)控制,而前者需要通過各種場景的實(shí)時(shí)判斷來生成實(shí)時(shí)運(yùn)動(dòng)軌跡(即AI大模 型訓(xùn)練學(xué)習(xí)后,實(shí)時(shí)生成運(yùn)控軌跡的指令),進(jìn)而實(shí)現(xiàn)控制。
“小腦”的主要功能:與“大腦”主要負(fù)責(zé)環(huán)境感知和智能交互不同,“小腦”更多地關(guān)注于機(jī)器 人的運(yùn)動(dòng)控制和平衡調(diào)節(jié),通過接收來自傳感器(如視覺傳感器、力覺傳感器、觸覺傳感器等)的 信息,對這些信息進(jìn)行處理和分析,進(jìn)而指導(dǎo)機(jī)器人的運(yùn)動(dòng)。主要功能可以分為四類:運(yùn)動(dòng)執(zhí)行、 協(xié)調(diào)運(yùn)作、反饋調(diào)節(jié)和動(dòng)態(tài)平衡。
人形機(jī)器人“小腦”的控制技術(shù)
包括三類:①模型控制(MPC)?;诰_的運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)模型,實(shí)現(xiàn)對機(jī)器人動(dòng)作的精準(zhǔn)控制, 適用于特定任務(wù)的自動(dòng)化執(zhí)行,即傳統(tǒng)運(yùn)控范疇。②強(qiáng)化學(xué)習(xí)。通過在復(fù)雜環(huán)境中的自主探索,學(xué) 習(xí)最優(yōu)控制策略,顯著提升了上肢和下肢在復(fù)雜任務(wù)中的效率、精度和適應(yīng)性。③模仿學(xué)習(xí)。通過 模仿人類行為,減少對環(huán)境探索的依賴,利用人類行為數(shù)據(jù)訓(xùn)練智能體(動(dòng)捕是關(guān)鍵,即數(shù)據(jù)獲 取),顯著提升任務(wù)執(zhí)行能力。
人形機(jī)器人“小腦”案例
案例:目前業(yè)界基于強(qiáng)化學(xué)習(xí)和模仿學(xué)習(xí)已進(jìn)行多種嘗試,以美國Agility Robotics的Digit機(jī)器人 為例,其利用強(qiáng)化學(xué)習(xí)算法,通過在仿真環(huán)境中不斷進(jìn)行訓(xùn)練和優(yōu)化,學(xué)習(xí)各種運(yùn)動(dòng)技能(行走、 奔跑、轉(zhuǎn)彎、上下臺階)。在實(shí)際應(yīng)用場景中,Digit機(jī)器人與亞馬遜合作,負(fù)責(zé)倉庫物流,能夠根 據(jù)環(huán)境的變化和任務(wù)需求,自主規(guī)劃路徑,快速準(zhǔn)確地完成物品的搬運(yùn)和分揀。Digit在物流領(lǐng)域中 的成功應(yīng)用,不僅提高物流效率,還降低人力成本,為物流行業(yè)的發(fā)展帶來了新的解決方案。
人形機(jī)器人“小腦”面臨的挑戰(zhàn)
挑戰(zhàn):主要包括如何進(jìn)一步提高AI模型在機(jī)器人控制中的實(shí)時(shí)性、魯棒性和可解釋性,以確保機(jī)器 人在復(fù)雜環(huán)境中的穩(wěn)定運(yùn)行和安全可靠。此外,如何將控制與感知、決策和規(guī)劃更緊密地結(jié)合,構(gòu) 建端到端的自主系統(tǒng),亦是未來重要的研究方向。
小腦在垂直場景有望率先成熟, 小模型性價(jià)比凸顯
人形機(jī)器人落地難度和市場規(guī)模:To C >To B
TO B有望率先落地和放量,原因:技術(shù)適配與需求剛性:B端客戶,如工業(yè)、醫(yī)療、物流等需求明確且結(jié)構(gòu)化,技術(shù)更易適配。例如,工廠 中的搬運(yùn)、質(zhì)檢等任務(wù)對機(jī)器人的運(yùn)動(dòng)控制、環(huán)境感知能力要求較高,但場景相對封閉,無需復(fù)雜的人 機(jī)交互。To C場景家庭環(huán)境復(fù)雜多變,需要高度靈活性與自然交互能力。成本與價(jià)格敏感度:企業(yè)用戶注重性價(jià)比,TO B產(chǎn)品量產(chǎn)萬臺后價(jià)格預(yù)計(jì)可降至20-30萬元(以優(yōu)必選機(jī) 器人為例),而C端對性能要求高,目前To C主流產(chǎn)品售價(jià)在9.9萬元-65萬元(以宇樹科技機(jī)器人為例)。政策與法規(guī)支持:政策明確支持工業(yè)場景開放與標(biāo)準(zhǔn)化;To C場景下,隱私、安全等倫理問題尚未解決, 制約C端場景落地。
TO B場景下,開發(fā)統(tǒng)一的底層大模型難度大
機(jī)器人下肢:運(yùn)動(dòng)關(guān)節(jié)相對固定,更容易形成一個(gè)統(tǒng)一的模型,可以設(shè)置“不摔倒、走得快” 等作為獎(jiǎng)勵(lì)函數(shù)來強(qiáng)化學(xué)習(xí)。目前主流的下肢算法是英偉達(dá)的Issac Gim底層算法+強(qiáng)化學(xué)習(xí)。機(jī)器人上肢:屬于精細(xì)運(yùn)動(dòng)范疇,尤其是靈巧手關(guān)節(jié)的控制,不同應(yīng)用場景下運(yùn)動(dòng)軌跡的規(guī) 劃千差萬別,開發(fā)統(tǒng)一的底層大模型面臨兩大難題:①開發(fā)難度大,訓(xùn)練成本高,高能耗 以及在特定場景下的性能瓶頸等;②高質(zhì)量的訓(xùn)練數(shù)據(jù)獲取難。
難度①:上肢的底層運(yùn)控算法
人形運(yùn)控產(chǎn)業(yè)未來將由一次開發(fā)(一開)商和二次開發(fā)(二開)商兩部分構(gòu)成。一開企業(yè)如特斯 拉、華為、宇樹等做人形運(yùn)控算法的一次開發(fā)(即平臺型通用機(jī)器人企業(yè)),類似于iOS之于 蘋果,不同廠商硬件規(guī)格和方案不同,運(yùn)控算法不兼容,因此運(yùn)控產(chǎn)業(yè)是平臺型企業(yè)的兵家 必爭之地;二開企業(yè)是應(yīng)用廠商,類似于APP應(yīng)用開發(fā)商,在一開企業(yè)軟硬件基礎(chǔ)上,開發(fā)針 對特定應(yīng)用場景的機(jī)器人(如針對教育、養(yǎng)老、消防、危化、礦山、電力、冶金等領(lǐng)域開發(fā) 機(jī)器人)。
難度②:數(shù)據(jù)采集
數(shù)據(jù)需求激增:在特斯拉2024年第四季度財(cái)報(bào)電話會(huì)上,馬斯克指出,人形機(jī)器人所承擔(dān)的 任務(wù)及用途,相較汽車自動(dòng)駕駛而言復(fù)雜得多,大概有1000倍之多,所需的訓(xùn)練數(shù)據(jù)規(guī)模也 會(huì)隨之?dāng)U大至10倍左右。數(shù)據(jù)現(xiàn)狀難以支撐訓(xùn)練:目前可用于訓(xùn)練人形機(jī)器人的開源數(shù)據(jù)集,無論是在數(shù)量上還是規(guī) 模上都極為匱乏,難以支撐高效訓(xùn)練。
誰有望搶占小腦發(fā)展的制高點(diǎn)?
人形機(jī)器人運(yùn)控重要環(huán)節(jié)的玩家
下載完整報(bào)告,請掃描下方圖片二維碼入知識星球社群查閱下載
(本文僅供參考,不代表我們的任何投資建議。如需使用相關(guān)信息,請參閱報(bào)告原文。)

入群方式:添加助理微信【touzireport666】,發(fā)送「個(gè)人紙質(zhì)名片」或「電子名片」審核后即可入群。