全球具身智能領域迎來重大突破——高德正式宣布全量開源ABot-M0,這是全球首個基于統(tǒng)一架構的機器人具身操作基座模型。該模型通過構建"通用大腦",實現(xiàn)了對多種形態(tài)具身機器人的適配,為行業(yè)提供了全新的技術范式。
在權威基準測試中,ABot-M0展現(xiàn)出顯著優(yōu)勢。該模型在Libero、Libero-Plus、RoboCasa等測試中均達到SOTA(最優(yōu)狀態(tài))水平,其中在Libero-Plus基準上的任務成功率高達80.5%,較此前行業(yè)標桿方案Pi0提升近30個百分點。這一突破性表現(xiàn)驗證了統(tǒng)一架構在具身智能領域的可行性。
此次開源項目涵蓋數(shù)據(jù)、算法、模型三大核心維度。數(shù)據(jù)層面,高德開源了全球規(guī)模最大的通用機器人數(shù)據(jù)集UniACT,整合超過600萬條真實操作軌跡。該數(shù)據(jù)集通過統(tǒng)一動作表示、坐標系與控制頻率,解決了異構機器人數(shù)據(jù)的兼容性問題,使分散在全球的機器人數(shù)據(jù)得以高效利用,預訓練效率提升顯著。
算法創(chuàng)新是ABot-M0的核心競爭力。高德提出的動作流形學習(AML)算法,摒棄了傳統(tǒng)依賴噪聲干擾的預測方式,直接生成物理可行的動作序列,大幅提升了解碼效率與策略穩(wěn)定性。同時,雙流感知架構將VLM(Qwen3-VL)的高級語義理解能力與3D幾何模塊(如VGGT)的幾何先驗知識相結合,在保持骨干網(wǎng)絡不變的情況下,彌補了標準VLM在3D空間推理方面的不足。
模型層面,ABot-M0開源了完整的端到端預訓練模型與工具鏈。開發(fā)者可直接基于該框架進行二次開發(fā),無需從零搭建訓練系統(tǒng),能夠快速適配工業(yè)制造、家庭服務等多個應用場景。這種"通用大腦+專用軀體"的設計模式,為具身智能產(chǎn)業(yè)的標準化發(fā)展提供了重要實證支撐。
通過此次開源,高德旨在打破數(shù)據(jù)孤島與技術壁壘,推動具身智能領域的技術共享與協(xié)同創(chuàng)新。該項目的實施不僅降低了行業(yè)研發(fā)門檻,更為全球開發(fā)者提供了前沿的空間理解能力與開箱即用的技術基座,有望加速具身智能技術的商業(yè)化落地進程。





















