四虎AV成人在线观看|免费免费特黄的欧美大片|人妻丝袜中文字幕一区三区|性爱一级二级三级|日本黄色视频在线观看免费|亚洲午夜天堂超碰大香蕉中出|国产日韩三级黄色AV一区二区三区|a片网站在线观看视频|人人AV播放日韩操在线|国产伦清品一区二区三区

正在閱讀:

對話自變量機器人CTO:看好家庭方向,不能為了追求落地犧牲基模

掃一掃下載界面新聞APP

對話自變量機器人CTO:看好家庭方向,不能為了追求落地犧牲基模

模型的上限,或許也將決定這個行業(yè)的上限。

家庭方向;不能犧牲基模;追求落地

圖片來源:自變量機器人

界面新聞記者 | 陸柯言

界面新聞編輯 | 文姝琪

接連拿到阿里巴巴、美團、字節(jié)跳動三家互聯(lián)網巨頭投資之后,自變量機器人動作變得更加頻繁。

在剛剛結束的3月,自變量作為主辦方之一,舉辦了“首屆具身智能開發(fā)者大會(Embodied AI Developers Conference,EAIDC 2026),通過不限模型的方式,搭建線下真機評測競技平臺,吸引開發(fā)者并發(fā)掘人才。大賽期間,自變量CTO王昊接受了媒體采訪,披露了這家備受關注的機器人公司的最新進展。

圖片來源:自變量機器人

自變量創(chuàng)始人兼CEO王潛是曾在美國機器人實驗室從事機器人學習與人機交互研究,也是全球最早提出Attention機制(Transformer結構核心)的研究者之一。回國創(chuàng)辦自變量之后,CTO王昊成為了他找到的第一個合伙人。王昊擁有IDEA研究院經歷,曾主導開發(fā)了多個知名開源模型。

兩位關鍵技術決策者的背景,讓自變量從一開始就成為了堅定的端到端技術路線推動者。2024年,自變量發(fā)布了其自研的端到端具身智能大模型——Great Wall系列WALL-A模型,其分支WALL-OSS在去年宣布開源。

王昊表示,自變量近期的一條工作主線,是將世界模型與VLA(Vision-Language-Action,視覺語言動作模型)融合為一個聯(lián)合框架,讓動作和視覺實現(xiàn)聯(lián)合建模,從而讓模型更好地理解物理定律?!岸唐趤碇v,我們希望引入更多多模態(tài)輸出架構,減少誤差累積,中期和長期來看,我們還是希望在基模上實現(xiàn)絕對意義的通用場景泛化?!?/span>

和宇樹等硬件為先的廠商不同,自變量更倡導做強基礎模型的重要性。因此,自變量從成立之初就在數(shù)據和算力上進行大規(guī)模投入。王昊認為,越早建立規(guī)模化效應,資源聚集效應就越明顯,后來者追趕要花數(shù)倍的資源。

不是說你先把技術做到完全泛化,再去考慮場景。恰恰相反,場景給你迭代,迭代讓基模更強,更強的基模再反哺商業(yè),才能形成完整的閉環(huán)。"王昊說。

今年,自變量的一個重要舉措是進軍家庭場景。同樣在3月,自變量宣布與58同城合作,由58到家平臺隨機調度阿姨與機器人組成搭檔,共同進行家政服務。目前這一服務已在深圳開啟,未來幾個月計劃進入更多城市。在家庭場景中,機器人已經可以承擔清理垃圾、收拾桌面等基礎工作。

家庭是公認標準化程度最低、最難落地的場景,業(yè)內普遍判斷家庭場景成熟應用需要等待5-10年。相比之下,多數(shù)廠商在現(xiàn)階段的商業(yè)化選擇上更傾向于工業(yè)場景,這是因為后者環(huán)境可控、任務單一、ROI(投入產出比)可核算,是落地的最佳切入點。廠商能拿到多少工廠訂單,甚至等同于在資本市場的認可度。

但在自變量看來,家庭場景才是機器人最終的目標。自變量CTO王昊在接受采訪時表示,家庭代表最開放的環(huán)境和最廣泛的任務,解決了家庭任務,就代表模型可以實現(xiàn)完全泛化。只有一開始就直面最復雜的場景,才能提升模型的智能化水平。

“不管從什么時候開始,越早開始越好,這是最重要的?!蓖蹶徽f。

當然,工廠同樣是自變量切入的場景之一。此前自變量創(chuàng)始人王潛曾在采訪中提到,今年就能看到機器人以正ROI的方式實現(xiàn)商業(yè)化落地。

王昊也提到了落地工業(yè)場景的桎梏:機器人本體的基模能力不足,但商業(yè)壓力要求快速落地,于是廠商會在工程上做許多彌補。例如發(fā)現(xiàn)機器人在視覺上有盲區(qū),就疊加視覺小模型。短期來看這種做法可以加速落地,但長期來,基模得不到真正有價值的迭代反饋,能力也會陷入停滯。

這背后的事實是,即便各大廠商的工廠訂單量正在高歌猛進,但真正在工廠上規(guī)?;瘧玫娜诵螜C器人仍然有限。這是個老生常談的話題:現(xiàn)有的機器人缺乏足夠好用的“大腦”,不夠聰明,無法像人一樣絲滑思考。背后的核心原因,還是數(shù)據量不足。

當前業(yè)內有幾種主流的數(shù)據采集方式:真機遙操、仿真合成、互聯(lián)網挖掘等。其中真機采集的數(shù)據含金量最高,但成本高、效率低。王昊表示,自變量會堅持真機采集,這是最重要的數(shù)據來源。

但他也提到,隨著模型規(guī)模擴大,2026年會越來越依賴于Ego-Centric的方式采集數(shù)據,即通過在真人頭上佩戴攝像頭等傳感器,讓AI通過第一人稱視角來學習人類如何與真實世界交互?!斑@一定是個大趨勢,但要和真機采集形成很好的配比,這個數(shù)據策略會決定模型的上限。”

而模型的上限,或許也將決定這個行業(yè)的上限。

未經正式授權嚴禁轉載本文,侵權必究。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

對話自變量機器人CTO:看好家庭方向,不能為了追求落地犧牲基模

模型的上限,或許也將決定這個行業(yè)的上限。

家庭方向;不能犧牲基模;追求落地

圖片來源:自變量機器人

界面新聞記者 | 陸柯言

界面新聞編輯 | 文姝琪

接連拿到阿里巴巴、美團、字節(jié)跳動三家互聯(lián)網巨頭投資之后,自變量機器人動作變得更加頻繁。

在剛剛結束的3月,自變量作為主辦方之一,舉辦了“首屆具身智能開發(fā)者大會(Embodied AI Developers Conference,EAIDC 2026),通過不限模型的方式,搭建線下真機評測競技平臺,吸引開發(fā)者并發(fā)掘人才。大賽期間,自變量CTO王昊接受了媒體采訪,披露了這家備受關注的機器人公司的最新進展。

圖片來源:自變量機器人

自變量創(chuàng)始人兼CEO王潛是曾在美國機器人實驗室從事機器人學習與人機交互研究,也是全球最早提出Attention機制(Transformer結構核心)的研究者之一?;貒鴦?chuàng)辦自變量之后,CTO王昊成為了他找到的第一個合伙人。王昊擁有IDEA研究院經歷,曾主導開發(fā)了多個知名開源模型。

兩位關鍵技術決策者的背景,讓自變量從一開始就成為了堅定的端到端技術路線推動者。2024年,自變量發(fā)布了其自研的端到端具身智能大模型——Great Wall系列WALL-A模型,其分支WALL-OSS在去年宣布開源。

王昊表示,自變量近期的一條工作主線,是將世界模型與VLA(Vision-Language-Action,視覺語言動作模型)融合為一個聯(lián)合框架,讓動作和視覺實現(xiàn)聯(lián)合建模,從而讓模型更好地理解物理定律?!岸唐趤碇v,我們希望引入更多多模態(tài)輸出架構,減少誤差累積,中期和長期來看,我們還是希望在基模上實現(xiàn)絕對意義的通用場景泛化?!?/span>

和宇樹等硬件為先的廠商不同,自變量更倡導做強基礎模型的重要性。因此,自變量從成立之初就在數(shù)據和算力上進行大規(guī)模投入。王昊認為,越早建立規(guī)?;?,資源聚集效應就越明顯,后來者追趕要花數(shù)倍的資源。

不是說你先把技術做到完全泛化,再去考慮場景。恰恰相反,場景給你迭代,迭代讓基模更強,更強的基模再反哺商業(yè),才能形成完整的閉環(huán)。"王昊說。

今年,自變量的一個重要舉措是進軍家庭場景。同樣在3月,自變量宣布與58同城合作,由58到家平臺隨機調度阿姨與機器人組成搭檔,共同進行家政服務。目前這一服務已在深圳開啟,未來幾個月計劃進入更多城市。在家庭場景中,機器人已經可以承擔清理垃圾、收拾桌面等基礎工作。

家庭是公認標準化程度最低、最難落地的場景,業(yè)內普遍判斷家庭場景成熟應用需要等待5-10年。相比之下,多數(shù)廠商在現(xiàn)階段的商業(yè)化選擇上更傾向于工業(yè)場景,這是因為后者環(huán)境可控、任務單一、ROI(投入產出比)可核算,是落地的最佳切入點。廠商能拿到多少工廠訂單,甚至等同于在資本市場的認可度。

但在自變量看來,家庭場景才是機器人最終的目標。自變量CTO王昊在接受采訪時表示,家庭代表最開放的環(huán)境和最廣泛的任務,解決了家庭任務,就代表模型可以實現(xiàn)完全泛化。只有一開始就直面最復雜的場景,才能提升模型的智能化水平。

“不管從什么時候開始,越早開始越好,這是最重要的?!蓖蹶徽f。

當然,工廠同樣是自變量切入的場景之一。此前自變量創(chuàng)始人王潛曾在采訪中提到,今年就能看到機器人以正ROI的方式實現(xiàn)商業(yè)化落地

王昊也提到了落地工業(yè)場景的桎梏:機器人本體的基模能力不足,但商業(yè)壓力要求快速落地,于是廠商會在工程上做許多彌補。例如發(fā)現(xiàn)機器人在視覺上有盲區(qū),就疊加視覺小模型。短期來看這種做法可以加速落地,但長期來,基模得不到真正有價值的迭代反饋,能力也會陷入停滯。

這背后的事實是,即便各大廠商的工廠訂單量正在高歌猛進,但真正在工廠上規(guī)?;瘧玫娜诵螜C器人仍然有限。這是個老生常談的話題:現(xiàn)有的機器人缺乏足夠好用的“大腦”,不夠聰明,無法像人一樣絲滑思考。背后的核心原因,還是數(shù)據量不足。

當前業(yè)內有幾種主流的數(shù)據采集方式:真機遙操、仿真合成、互聯(lián)網挖掘等。其中真機采集的數(shù)據含金量最高,但成本高、效率低。王昊表示,自變量會堅持真機采集,這是最重要的數(shù)據來源。

但他也提到,隨著模型規(guī)模擴大,2026年會越來越依賴于Ego-Centric的方式采集數(shù)據,即通過在真人頭上佩戴攝像頭等傳感器,讓AI通過第一人稱視角來學習人類如何與真實世界交互?!斑@一定是個大趨勢,但要和真機采集形成很好的配比,這個數(shù)據策略會決定模型的上限?!?/span>

而模型的上限,或許也將決定這個行業(yè)的上限。

未經正式授權嚴禁轉載本文,侵權必究。