
微軟研究院於2026年1月下旬推出了一款全新的機器人控制系統,該系統可以讓機器工作,同時還能處理語音指令和物理反饋。這套名爲Rho-alpha的系統標誌着微軟正式進軍雙臂機器人基礎模型領域。
這項技術將首先通過早期體驗計劃面向纔會將其發佈在其 Foundry 平臺上。屆時,企業可以利用自身數據,根據特定需求對系統進行定製。
工廠和倉庫需要應對永遠重複相同的預設動作醫院也需要適應機器。生產線上,不同批次的產品各不相同,這給傳統的自動化帶來了難以有效解決的問題。微軟 開發了Rho-alpha 來滿足這一需求,它通過傳感器處理機器人所看到的、聽到的以及感受到的物理信息。
如今大多數機器人系統都依賴攝像頭和麥克風來感知周圍環境並接收指令。Rho -alpha 在此基礎上更進一步,將觸覺視爲同等重要的信息來源。當機器人夾爪內置壓力傳感器時,系統就能獲取攝像頭完全無法獲取的信息。這在將物品插入插座或組裝零件時至關重要,因爲僅憑視覺無法提供足夠的細節來判斷部件是否正確對齊。
微軟展示了這些功能,使用了兩臺配備壓力和接觸傳感器的Universal Robots UR5e機械臂。在名爲BusyBox的任務測試中,人們指示機器人執行諸如將托盤放入工具箱並關上蓋子之類的任務。系統轉化爲雙臂之間的協調運動,並根據傳感器的感知進行調整。當第一次嘗試插入插頭失敗時,操作員可以使用3D輸入設備引導機器人,系統會從這些糾正中學習。
獲取足夠的訓練數據仍然是構建高性能機器人的最大挑戰。語言模型可以從海量的在線文本中學習,但機器人訓練需要實際的物理演示,而錄製這些演示需要耗費大量的時間和金錢。微軟通過三種類型的信息訓練 Rho-alpha 解決了這個問題:真實物理演示的錄像、模擬練習任務以及來自網絡的包含問答的大型圖像數據集。該公司使用運行在 Azure 服務器上的 Nvidia Isaac Sim,通過強化學習過程創建逼真的合成場景。
這種模擬設置能夠生成物理上精確的練習場景,是對實際演示的補充。這種組合方法使模型能夠應對異常情況和故障場景,而這些情況如果通過實際運行,則需要數千小時才能捕捉到。
這種訓練方法遵循其他機器人公司正在使用的模式 Robotics系統、Figure AI的人形機器人Helix模型以及Physical Intelligence的Pi-zero都採用了類似的方法來解決數據不足的問題。該技術幫助這些系統學習通用的操作技能,而無需針對它們可能遇到的每個任務進行專門的演示。
微軟加入了機器人基礎模型市場,該市場在過去一年半中增長迅猛 N1.6 ,專注於全身控制和情境理解。谷歌DeepMind將Gemini擴展到機器人領域,使其具備從摺紙到玩撲克牌等多種能力。Physical Intelligence推出了Pi-zero,這是一個經過訓練,可跨不同類型機器人使用的通用系統。
Rho-alpha 的突出之處在於三點。首先,它強調觸覺感知,這解決了僅的系統難以應對的情況。其次,該模型源自微軟的 Phi 系列,微軟已對其進行優化,使其能夠在普通消費級硬件上高效運行。這意味着它可以在本地設備上運行,而無需持續連接雲服務器。第三,它專注於從實際操作中的用戶糾正中學習,這使其區別於那些需要完全重新訓練才能掌握新行爲的模型。
微軟的商業模式也與競爭對手有所。該公司計劃通過其 Foundry 平臺提供 Rho-alpha 作爲基礎設施,製造商和系統集成商可以利用其專有信息進行定製。這與該公司在 Azure OpenAI 服務,旨在滿足那些希望創建定製版本而非使用通用模型的組織的需求。
對於製造商和物流公司而言,最直接的機會在於發現當前自動化系統無法勝任。例如,質量檢驗站、成套組件組裝作業以及小批量裝配線等,Rho-alpha 的語言理解和觸覺感應相結合的功能可以有效減少編程需求。
微軟宣佈的早期訪問計劃讓企業能夠,測試該系統是否符合自身需求。企業在參與評估時應做好人工監督的準備,並規劃好工作流程,以便操作員在初始學習階段糾正和引導機器人。
物理人工智能標誌着機器人從程序化工具向靈活協作夥伴的轉變。這一轉變需要數年而非數月時間,但微軟、英偉達和谷歌的基礎模型奠定了未來十年企業機器人技術的基本defi。
加入高級加密交易社區 30 天 - 通常每月 100 美元。