tradingkey.logo

【券商聚焦】國泰海通:GR-3複雜長任務執行能力較好 泛化性顯著提升 字節有望在ToC場景積累領先優勢

金吾財訊2025年7月25日 01:03

金吾財訊 | 國泰海通發研報指,7月22日,字節跳動Seed團隊發佈通用機器人模型GR-3,該模型爲VLA架構,具備泛化到新物體和新環境的能力,能理解包含抽象概念的語言指令,還能夠精細地操作柔性物體。GR-3模型與GR-2模型(2024.10推出)相比,在面對新環境和新物體時操作性能卓越,複雜指令理解精準度高,具備處理泛化任務的能力,主要源於:1)模型架構上:GR-3採用MoT+DiT的網絡結構,將“視覺-語言模塊”和“動作生成模塊”集成爲40億參數的端到端模型,生成動作後通過RMSNorm增強動態指令跟隨能力,使機器人反應更敏捷、高效;2)訓練數據上:GR-3採用三合一數據訓練法,遙操作數據(高質量)、人類VR軌跡數據(低成本,可達450條數據/小時),公開圖文數據(理解抽象概念、認識新物體以提升泛化能力)。

該機構表示,Seed團隊在基礎環境、新環境、複雜指令、新物品四類場景中測試對比了GR-3和π0,GR-3的任務執行成功了顯著提升,經過公開圖文數據中積累的“見識”的GR-3在新物品操作的成功率上較π0高出17.8%。特別的,GR-3僅需10條人類軌跡數據即可將新物體操作成功率從60%提升至80%以上。我們認爲,GR-3的高泛化性與複雜任務執行能力可以助力機器人場景落地探索。從字節跳動公開進展看,其具身智能持續迭代發展,暫無明確商業化規劃。隨着技術進步和產業鏈成熟,我們認爲字節具備進行軟硬件產品化的可能,且有望在ToC場景積累領先優勢。

免責聲明:本網站提供的資訊僅供教育和參考之用,不應視為財務或投資建議。
Tradingkey

相關文章

Tradingkey
KeyAI