文|日晞視野 咸閑
編輯|咸閑
8月9日,在世界機器人大會的演講臺上,宇樹科技創(chuàng)始人王興興談?wù)摰侥壳皺C器人運動控制領(lǐng)域存在的RL Scaling Law問題,他認(rèn)為現(xiàn)在的機器人在學(xué)習(xí)一項新的技能時,往往都是需要從頭開始研究以及教學(xué)。
而在未來更加希望的是能夠在原有的基礎(chǔ)上去不斷學(xué)習(xí),使得他們的學(xué)習(xí)速度更加快速以及效果更好。
整個具身智能行業(yè)在目前并沒有人將強化學(xué)習(xí)的Scaling Law做好,所研究的算力增長、數(shù)據(jù)堆積,并不能直接讓機械手臂變得更加靈巧,或者讓雙足的機器人走得更穩(wěn)。
事實上,問題并不在于我們所提供的硬件、數(shù)據(jù)不夠好,而是其“大腦進化”以及環(huán)境不斷適應(yīng),那么,面對具身智能Scaling Law缺失,我們是否應(yīng)該如同嬰兒時的教學(xué),讓其不斷嘗試,具備真正不斷演化的能力,促使機器人界的“摩爾定律”誕生?
算力增長≠智能進化:具身智能的物理瓶頸困局
在目前的人工智能領(lǐng)域,我們逐漸認(rèn)為當(dāng)我們提供了更多的數(shù)據(jù)以及算力時,就能夠支撐機器人擁有更聰明的能力。
例如,ChatGPT的發(fā)展似乎印證了這一點——給它更大的模型、更多的訓(xùn)練文本,它就能寫出更流暢的文章,解答更復(fù)雜的問題。
我們可以知道在虛擬ai領(lǐng)域,數(shù)據(jù)是單一的,規(guī)則是明確的,所以增加算力和數(shù)據(jù)就能夠去提升虛擬ai的性能。
但當(dāng)這樣的方式放到機器人的身上,在它與現(xiàn)實世界交互的時候,我們發(fā)現(xiàn)其真實效果往往就會受到不同材質(zhì)的摩擦、空氣阻力、物體形變等產(chǎn)生隨機性影響,比如,運行中會被一些障礙物絆倒等。
哈佛大學(xué)的“機器螞蟻”實驗生動地展示了這個困境。研究人員給這個小機器人增加了10倍的運算能力,期待它能更好地適應(yīng)復(fù)雜地形。
但結(jié)果令人失望:它的環(huán)境適應(yīng)能力只提升了微不足道的2%。問題不在于芯片不夠強,而在于螞蟻的機械腿無法像真實昆蟲那樣靈敏地感知和適應(yīng)地面變化。
所以,現(xiàn)實世界中無數(shù)的物理特性就讓機器人在運行出現(xiàn)了無數(shù)個“意外狀況”。
并且,如今機器人在學(xué)習(xí)新的技能以及適應(yīng)新環(huán)境時,其芯片總是會需要較大的能耗。
這并不是通過技術(shù)的不斷進化,從而減少能耗的消耗量能夠解決的問題,而是應(yīng)該去面對根本性的缺陷:機器人還在用"蠻力計算"來對抗物理法則。
這樣的困境揭示了一個深刻的事實:在機器人領(lǐng)域,單純的算力增長就像給汽車裝了強勁的引擎,卻忘了我們所要前行的道路是崎嶇、坑洼的道路,它是否能夠?qū)崟r應(yīng)對路況呢?
我們更加希望的是其能夠像人類的生物系統(tǒng)一樣,總是在原有的基礎(chǔ)之上不斷進化,去面臨并解決受物理世界制約的困境。
達爾文式進化:具身智能的身體適應(yīng)智慧
真正智能的關(guān)鍵并不是在于它的“大腦”學(xué)習(xí)的東西是不是足夠多,就比如在自然界中,章魚沒有脊椎動物那樣集中的大腦,它的5億神經(jīng)元分布在觸手中,卻能讓八條腕足各自獨立抓取、探測甚至"思考"。
然而,這樣的生物所體現(xiàn)的行為是不同于機器人的集中依靠數(shù)據(jù)驅(qū)動的“大腦”智能模式,而是將身體本身也作為計算的一部分。
過去,機器人和AI的進步主要靠堆算力和數(shù)據(jù),就像不斷給計算機提供大量的知識,希望它變得更加聰明。
但事實上的現(xiàn)實智能發(fā)展,無論是人類嬰兒學(xué)步,還是動物的精準(zhǔn)捕獵,都依賴著我們的身體與環(huán)境的實時互動。
所以我們更加需要它的身體有著的自己適應(yīng)能力——就像人類肌肉會在出現(xiàn)突發(fā)狀況時,主動產(chǎn)生一定的行為。
然而機器人需要適應(yīng)的是未在提前預(yù)設(shè)的情況下,根據(jù)指令以及環(huán)境變換,提供不同的狀態(tài)和行為。
正如,王興興所提及希望當(dāng)機器人處于一個新的環(huán)境時,能夠主動去探索一些事物,來滿足我們所提供的指令,而不是我們將一些具體的數(shù)據(jù)提供給它,只需要照做就行。
未來的突破點可能在于其“身體”和“大腦”的像自然生物一樣共同進化,算法不再需要為每個細(xì)微的環(huán)境狀況進行不斷地訓(xùn)練,而是像生物那樣在互動中自然調(diào)整。
這條路雖然艱難,但自然界的進化史當(dāng)中已經(jīng)證明其可行性。從單細(xì)胞生物到人類,生命進化或許給我們提供了較優(yōu)方向。
未來的機器人或許需要向生物學(xué)習(xí),發(fā)展出與物理世界和諧共處的"身體智能"。
真正的突破,不是建造更精密的機械臂,而是創(chuàng)造出更加具有生命力的機器人。
重塑衡量標(biāo)準(zhǔn):具身智能需要擁抱“生存力”
對于具身智能來說,真正的考驗從來不是重復(fù)完成某個固定任務(wù),而是在變化中保持穩(wěn)定。
目前的機器人缺乏真正的抗干擾智慧——不是避免犯錯,而是犯錯后快速修正的本事。
我們總是笑著現(xiàn)在的機器人有著些許笨拙的行為,甚至對于它們的動作稱之為“老太行為”,但對于這樣還需不斷進化的具身智能來說,應(yīng)該把"容錯率"變成衡量智能的新尺度。畢竟在真實世界里,穩(wěn)定比精準(zhǔn)更重要。
像在孩童時期,當(dāng)我們拿起保溫杯時,不需要重新學(xué)習(xí)"抓握"這個動作——我們知道它和馬克杯一樣都是圓柱形容器,只需微調(diào)力度,就能夠同樣的拿起這個東西。
但今天的機器人完美掌握馬克杯后,面對保溫杯時又要從零開始訓(xùn)練。問題不在于它不夠“聰明”,而在于它缺乏對“杯子”這個概念的真正理解。
這種“泛化能力”的缺失,暴露了當(dāng)前機器人學(xué)習(xí)的核心缺陷:它們通過海量數(shù)據(jù)只能記住對于這個特定物體的抓取方式,卻無法抽象出通用規(guī)律。
真正的突破可能需要讓機器人像孩子一樣,先理解“抓握”的本質(zhì)(形狀、重量、摩擦力之間的關(guān)系),而不是死記硬背每個物體的數(shù)據(jù)。
當(dāng)測評標(biāo)準(zhǔn)轉(zhuǎn)向“生命力”而非“精準(zhǔn)度”,具身智能才能突破現(xiàn)在的天花板,邁向真正的實用化。
參考資料:
1。杭州ai之都— —王興興“炸裂”發(fā)言:機器人的ChatGPT時刻 即將到來丨王興興在2025世界機器人大會演講實錄(文字+視頻)
2. 機器之心— — 機器人邁向ChatGPT時刻!清華團隊首次發(fā)現(xiàn)具身智能Scaling Laws

