【券商聚焦】國泰海通：GR-3複雜長任務執行能力較好泛化性顯著提升字節有望在ToC場景積累領先優勢

金吾財訊2025年7月25日 01:03

金吾財訊 | 國泰海通發研報指，7月22日，字節跳動Seed團隊發佈通用機器人模型GR-3，該模型爲VLA架構，具備泛化到新物體和新環境的能力，能理解包含抽象概念的語言指令，還能夠精細地操作柔性物體。GR-3模型與GR-2模型（2024.10推出）相比，在面對新環境和新物體時操作性能卓越，複雜指令理解精準度高，具備處理泛化任務的能力，主要源於：1）模型架構上：GR-3採用MoT+DiT的網絡結構，將“視覺-語言模塊”和“動作生成模塊”集成爲40億參數的端到端模型，生成動作後通過RMSNorm增強動態指令跟隨能力，使機器人反應更敏捷、高效；2）訓練數據上：GR-3採用三合一數據訓練法，遙操作數據（高質量）、人類VR軌跡數據（低成本，可達450條數據/小時），公開圖文數據（理解抽象概念、認識新物體以提升泛化能力）。

該機構表示，Seed團隊在基礎環境、新環境、複雜指令、新物品四類場景中測試對比了GR-3和π0，GR-3的任務執行成功了顯著提升，經過公開圖文數據中積累的“見識”的GR-3在新物品操作的成功率上較π0高出17.8%。特別的，GR-3僅需10條人類軌跡數據即可將新物體操作成功率從60%提升至80%以上。我們認爲，GR-3的高泛化性與複雜任務執行能力可以助力機器人場景落地探索。從字節跳動公開進展看，其具身智能持續迭代發展，暫無明確商業化規劃。隨着技術進步和產業鏈成熟，我們認爲字節具備進行軟硬件產品化的可能，且有望在ToC場景積累領先優勢。

免責聲明：本網站提供的資訊僅供教育和參考之用，不應視為財務或投資建議。

Tradingkey