近期,具身智能創業公司“自變量機器人(X Square Robot)”完成數億元Pre-A++輪融資。本輪融資由光速光合與君聯資本領投、北京機器人產業基金、神騏資本跟投。融資將用于下一代統一具身智能通用大模型的訓練與場景落地。
據了解,這是光速光合首度投資具身智能大模型方向,而君聯資本同樣在具身智能大模型領域積極布局,對這一賽道給予了高度關注與投入。北京機器人產業基金和神騏資本作為產業方投資人,將加速自變量機器人的場景落地進程。
自變量機器人成立于2023年12月,致力于通過研發具身智能通用大模型,實現通用機器人。2024年11月完成億元級Pre-A與Pre-A+輪融資。
通用機器人的終極目標是像人一樣通過交互、感知和行動自主執行任務,并具備高效的泛化和遷移能力。而實現這一目標的核心,就在于機器人通用具身智能大模型。
在海外,包括Skild AI、谷歌DeepMind、Physical Intelligence(PI)等科技公司都在該領域進行積極布局。
具身智能可主要分為大腦(認知與決策)和小腦(運動控制)。目前國內企業在探索不同發展路徑:部分專注于大腦,提升機器人語言理解與規劃能力;部分聚焦小腦,優化行走、抓取動作等運動控制;也有企業選擇大小腦統一的端到端路線,這一路線也是國外頭部科技公司如Physical Intelligence(PI)、Skild AI等的選擇。
統一端到端具身智能大模型是提升機器人泛化能力和適應能力的關鍵。傳統的分層架構雖能在特定任務上實現優化,但難以適應復雜環境的動態變化。而端到端方案,使機器人能夠從感知直接映射到運動,形成高效的反饋閉環,從而在多任務、多場景中具備更強的自主學習與適應能力。
自變量從成立之初就選擇了“大小腦統一的端到端大模型”路線。公司創始人兼CEO王潛表示,真正的具身智能大模型,應當由一個模型覆蓋從感知信號輸入到動作輸出的完整過程,而不進行人為地分層或模塊劃分。這才是實現通用具身智能的真正解法。
而在國內,選擇端到端模型的廠商中,技術路線也有所分化:部分廠商選擇優先訓練特定任務或單一場景的小模型;自變量則從一開始采用多任務、大量場景訓練,以提升模型的通用性和適應能力。
王潛表示,目前業內對于明顯超過單一操作的復雜任務,所有較好的實現結果幾乎都是由具身智能大模型完成的。小模型為每個任務設計特定的模型結構,往往只能執行最基本的單一操作,無法實現泛化。與之相反,大模型則重視如何通過工程化方式實現模型的scaling-up,直至達到完全通用。二者技術棧完全不同,依賴小模型的積累并不能有效遷移實現大模型。
通用性和泛化性是定義這一代具身智能技術最核心的要素。只有達到足夠的通用性、泛化性和可遷移性,才使得具身智能真正區別于傳統自動化,能實現在自由環境中,不受預設環境和預設物體限制的自由操作。
去年11月,自變量機器人宣布實現了全球目前最大參數規模的具身智能通用操作大模型——Great Wall系列(GW)的WALL-A模型。該模型在通用性、泛化性上可以做到用極少的樣本,完成各種物理環境變量、動作模式的泛化和遷移,同時在長序列復雜操作上具有絕對優勢。
王潛表示,經過最近數月的迭代,WALL-A模型的能力已經與Skild AI、Physical Intelligence處于同一水平線上,部分能力甚至強于國外競爭對手。從任務復雜度層面來看,能夠完成例如拉拉鏈、整理衣物等精細操作,展現出在隨機環境中對復雜拓撲結構、復雜物理交互的強大適應性。從復雜任務的準確率來看,在疊衣服、晾衣服等復雜柔性操作中表現出色,數分鐘級別的任務成功率達到90%以上。
此外,自變量機器人的通用具身智能大模型,還能夠實現無需地圖和深度輸入的語義導航,并能基于視頻進行即時決策和實時指令跟隨,也具備自主環境探索能力。
團隊方面,自變量機器人的核心團隊成員位于深圳,軟件算法團隊具有Robotics Learning(機器人學習)和大模型的雙重背景。硬件方面,公司匯集了一批來自頭部硬件公司的核心技術骨干及高管,擁有成熟的工程能力和量產經驗。
創始人兼CEO王潛本碩畢業于清華大學,是全球最早在神經網絡中提出注意力機制的研究人員之一,博士期間曾在美國頂級機器人實驗室參與了多項Robotics Learning的研究,研究經歷涵蓋機器人操作和家庭服務機器人相關的幾乎所有領域。聯合創始人兼CTO王昊是北大計算物理博士,曾在粵港澳大灣區數字經濟研究院(IDEA研究院)擔任封神榜大模型團隊算法負責人,領導了國內第一個百億級大模型和最早一批千億級大模型之一Ziya的研發。
-轉載自“自變量機器人”公眾號-

自變量機器人成立于2023年12月。公司致力于通過研發具身智能通用大模型的路徑,實現通用機器人。2024年4月初,《智能涌現》曾報道過其完成數千萬元天使輪及天使+輪融資。