8月14日消息,據媒體報道,智元機器人正式推出業內首個開源的機器人世界模型平臺——Genie Envisioner (GE)。
GE 平臺顛覆了傳統機器人學習流程,創新性地構建了一個以統一視頻生成世界模型為核心的閉環系統。該系統整合了未來幀預測、策略學習與仿真評估,使機器人能夠在單一模型中完成從感知環境、思考決策到執行動作的端到端處理。
平臺的核心優勢在于其無縫集成的閉環設計:GE-Base 模型基于超百萬條數據訓練,擅長解析環境布局與動作意圖;GE-Act 動作解碼器負責將理解轉化為具體動作指令;而GE-Sim 則作為基于動作條件的神經仿真器,利用分層機制實現精準視覺預測。三者協同工作,驅動整個平臺高效運行。
為構建這一強大平臺,智元機器人利用了約3000小時的真實機器人操控視頻數據。這些寶貴數據幫助 GE 建立了從語言指令到視覺空間的直接映射,完整保留了交互的時空信息,為模型的準確性和實用性奠定了堅實基礎。
在實際測試中,搭載 GE-Act 組件的機器人已成功完成制作三明治、倒茶、擦拭桌面等多項任務。這有力驗證了 GE 平臺的性能,并展示了其在提升機器人智能交互與任務執行能力方面的廣闊應用前景。