文|allinone 沛林
編輯|沐風(fēng)
豆包手機(jī)的底層系統(tǒng),竟然出現(xiàn)了錘子SmartisanOS的代碼?!
近日,字節(jié)聯(lián)合中興,推出了搭載了豆包AI助手的手機(jī),售價(jià)3499元,備貨3萬(wàn)臺(tái),第一批已售罄,出貨量字節(jié)并未透露。
消息一出,科技圈被點(diǎn)燃了,手機(jī)二手版被黃牛一度炒到7000元。
當(dāng)開(kāi)發(fā)者真正收到手機(jī),并陸續(xù)發(fā)出體驗(yàn)帖,甚至是吐槽帖,黃牛價(jià)格又逐漸跌回4000元以下。
有開(kāi)發(fā)者把系統(tǒng)解包后,在代碼里竟然看到了smartisan、smartisanos等字樣——難道錘子手機(jī)系統(tǒng),在豆包手機(jī)上復(fù)活了?
不管豆包手機(jī)打幾分,短短幾天之內(nèi),它帶來(lái)的驚喜,足夠吸引我們關(guān)注——
這到底是一款怎樣的手機(jī)?
01 新一代硬件交互模板?
12月1日,字節(jié)跳動(dòng)豆包團(tuán)隊(duì),發(fā)布豆包手機(jī)助手技術(shù)預(yù)覽版。
豆包手機(jī)助手,是在豆包APP的基礎(chǔ)上,基于豆包大模型的能力和手機(jī)廠(chǎng)商的授權(quán),在操作系統(tǒng)層面做出的AI助手軟件。
開(kāi)發(fā)者可以在豆包與中興合作的工程樣機(jī)nubia M153上,體驗(yàn)豆包手機(jī)助手的技術(shù)預(yù)覽版本。
主推功能,是使用語(yǔ)音指令,便可讓AI Agent自由調(diào)用APP,試圖定義新一代人機(jī)交互關(guān)系。
從豆包手機(jī)助手的定位來(lái)看,字節(jié)并不想從頭做一個(gè)全新的底層系統(tǒng),而是把豆包手機(jī)助手,當(dāng)作手機(jī)上的代理層——你告訴它一個(gè)指令,它調(diào)用各個(gè)APP,幫你把任務(wù)完成。
例如,你想買(mǎi)一件羽絨服,只需對(duì)豆包手機(jī)說(shuō)一句:“幫我在全平臺(tái)比價(jià)下單xx款羽絨服”,AI 就能自動(dòng)跨應(yīng)用跳轉(zhuǎn),搜索同款、對(duì)比價(jià)格、領(lǐng)券,甚至幫你選好最低價(jià)的商品填入購(gòu)物車(chē)。
這里體現(xiàn)的,是底層系統(tǒng)具備精準(zhǔn)的圖形界面(GUI)識(shí)別能力,說(shuō)人話(huà)就是AI看得懂屏幕,理解“購(gòu)物車(chē)”按鍵,看得明白不同頁(yè)面價(jià)格顯示等含義,這源自豆包大模型在多模態(tài)能力上的積累。
豆包在官方視頻中,還演示了更復(fù)雜任務(wù)的執(zhí)行。
當(dāng)用戶(hù)提出“下個(gè)月去巴黎,幫我把收藏的餐廳標(biāo)在地圖上,看看哪天有展并訂票”,這句話(huà)包含多條指令,AI能迅速拆解任務(wù),并按順序執(zhí)行查詢(xún)社交媒體收藏、高德地圖標(biāo)記、攜程訂票、整理進(jìn)備忘錄。
這里體現(xiàn)的,是手機(jī)助手打通多項(xiàng)APP權(quán)限的調(diào)用能力,和穩(wěn)定的輸入輸出能力,說(shuō)人話(huà),就是能接收語(yǔ)音/文字/手勢(shì)等各種形式的指令輸入,然后使用AI Agent,調(diào)用所需APP,在監(jiān)督下安全完成支付等任務(wù),和自動(dòng)復(fù)制粘貼的能力。
總結(jié)來(lái)說(shuō),豆包手機(jī)助手,走的是一條“系統(tǒng)級(jí) RPA(機(jī)器人流程自動(dòng)化) + 大模型 + 視覺(jué)理解”的路。
這個(gè)過(guò)程中,APP之間的界限消除,不可避免地帶來(lái)權(quán)限與隱私的隱患。
果然,手機(jī)發(fā)貨第二天,吐槽就來(lái)了。
02 剛出貨,就塌房?
最先出現(xiàn)的問(wèn)題,是微信賬號(hào)被強(qiáng)制退出。
這簡(jiǎn)直是暴擊,畢竟現(xiàn)在還有誰(shuí)離得開(kāi)微信?
后來(lái),陸續(xù)出現(xiàn)了其它類(lèi)似問(wèn)題,如支付寶支付行為被截停、無(wú)法喚餓了么進(jìn)行外賣(mài)訂單支付......
人們懷疑,豆包在沒(méi)有獲得APP廠(chǎng)商API授權(quán)的情況下,強(qiáng)行接管應(yīng)用。
豆包手機(jī)暴露的第二個(gè)問(wèn)題,是操作沒(méi)有視頻演示的絲滑,體驗(yàn)拉胯。
大家想象中的AI,是使用者不用打字,說(shuō)兩句話(huà),消息立馬發(fā)出。
但是有網(wǎng)友在直播中展示“發(fā)消息”,左搞右搞,半分鐘過(guò)去了,消息還沒(méi)發(fā)出去。
“這還不如自己動(dòng)手?!庇腥送虏鄣?。
第三個(gè)問(wèn)題,是使用者對(duì)隱私安全的質(zhì)疑。
豆包手機(jī)助手之所以能工作,是因?yàn)樗鼡碛小吧系垡暯恰?,能?shí)時(shí)讀取你的屏幕、聊天記錄、相冊(cè)、通訊錄、外賣(mài)/購(gòu)物等信息。
人們不僅會(huì)想:這些數(shù)據(jù)是在本地處理,還是傳回了云端?用戶(hù)隱私是否被侵犯?甚至有人質(zhì)問(wèn):這算黑客操作嗎?突破Android權(quán)限的調(diào)用了吧?
豆包隨后發(fā)布了一篇長(zhǎng)文澄清。關(guān)于微信登錄異常的情況,豆包沒(méi)有解釋APP官方是否授權(quán),直接說(shuō)明,已下線(xiàn)手機(jī)助手操作微信的能力。
對(duì)于更棘手的,關(guān)于未經(jīng)授權(quán)、侵犯隱私,甚至黑客嫌疑,豆包承認(rèn)調(diào)用權(quán)限的確是系統(tǒng)級(jí)能力,該權(quán)限用途在清單中有披露,在目前業(yè)內(nèi)所有AI助手中,屬于常規(guī)操作,且每次調(diào)用必須經(jīng)過(guò)用戶(hù)主動(dòng)授權(quán)。
可以想象,大概在決定售賣(mài)工程機(jī)之前,字節(jié)就想到過(guò),可能有這樣那樣的公關(guān)風(fēng)險(xiǎn)出現(xiàn)。這也是為什么,這次只是限量的工程機(jī)發(fā)售。
而且字節(jié)對(duì)這次“技術(shù)預(yù)覽版”定位的強(qiáng)調(diào),也是在傳達(dá),這是一場(chǎng)技術(shù)探索,先把原型放出來(lái),讓行業(yè)看到目前可達(dá)到、下一代系統(tǒng)級(jí)能力的雛形。
03 彩蛋:豆包手機(jī)驚現(xiàn)錘子代碼
最讓人驚訝的,不是豆包手機(jī)對(duì)AI Agent調(diào)用能力的實(shí)現(xiàn),或者實(shí)際操作中的“翻車(chē)”體驗(yàn),而是當(dāng)開(kāi)發(fā)者把豆包手機(jī)的系統(tǒng)解包后,在代碼里看到了smartisan、smartisanos、smartisan tracker appid的字段。
另一位科技博主發(fā)現(xiàn),系統(tǒng)內(nèi)置鈴聲里,還留著錘子時(shí)代的經(jīng)典鈴聲“米店”、“被禁忌的游戲”。
竟然,豆包手機(jī)的底層,有SmartisanOS的代碼!
這時(shí)人們突然想起,2019年,字節(jié)跳動(dòng)收購(gòu)錘子科技部分專(zhuān)利使用權(quán),相當(dāng)于接收了SmartisanOS系統(tǒng)。
同時(shí),字節(jié)也接收了一部分錘子團(tuán)隊(duì),原堅(jiān)果手機(jī)負(fù)責(zé)人吳德周等核心成員,連同大批OS與硬件工程師,一起進(jìn)了字節(jié)。
羅永浩曾說(shuō)過(guò):“錘子的真正核心競(jìng)爭(zhēng)力不是硬件,而是系統(tǒng)層的設(shè)計(jì)哲學(xué)?!?/p>
錘子作為公司,當(dāng)年死于融資和供應(yīng)鏈。但作為產(chǎn)品,SmartisanOS這個(gè)基于 Android底層深度重寫(xiě)的操作系統(tǒng),擁有完整的桌面、系統(tǒng)服務(wù)棧和輸入法,也是少數(shù)在交互和審美上,都形成獨(dú)特氣質(zhì)的國(guó)產(chǎn)OS之一。
錘粉們因豆包手機(jī),紛紛懷念起,SmartisanOS當(dāng)年最酷炫的兩項(xiàng)核心功能:閃念膠囊和Big Bang——
閃念膠囊(Idea Pills),是一項(xiàng)能夠快速記錄一閃而過(guò)想法的能力,它通過(guò)長(zhǎng)按快捷鍵啟動(dòng),允許用戶(hù)用語(yǔ)音輸入來(lái)快速記錄靈感,并將語(yǔ)音轉(zhuǎn)化為文字膠囊,無(wú)需手動(dòng)打開(kāi)記事本,從而大大提高了日常記錄的便利性;
Big Bang功能,是一種智能文字識(shí)別和拆分技術(shù)。它允許用戶(hù)通過(guò)大面積按壓屏幕上的文字,將一段文字“炸開(kāi)”,并智能地將其拆分成單個(gè)漢字或詞語(yǔ),方便用戶(hù)進(jìn)行后續(xù)操作,如搜索、分享和復(fù)制。
這兩項(xiàng)錘子手機(jī)獨(dú)創(chuàng)的功能,本質(zhì)上都是跨應(yīng)用的信息與操作能力重組。它們與豆包AI助手“跨APP操作”的理念,異常契合。
更何況,SmartisanOS系統(tǒng)當(dāng)初的定位,就是針對(duì)高頻人機(jī)交互場(chǎng)景而設(shè)計(jì),例如前面舉例的閃念膠囊和Big Bang功能。當(dāng)SmartisanOS與大模型結(jié)合,本身就有天然的化學(xué)反應(yīng)空間。
六年后,隨著豆包手機(jī)的出現(xiàn),“smartisan”重見(jiàn)天日,怎么不能說(shuō)是一次,給科技愛(ài)好者們,猝不及防的彩蛋呢。
04 結(jié)語(yǔ)
豆包手機(jī),或許并不是未來(lái)硬件的最終形態(tài),但字節(jié)通過(guò)“軟硬結(jié)合”,表現(xiàn)出將AI落地C端的渴望。
也許這次的豆包手機(jī)并不完美,甚至問(wèn)題迭出,但是人們想象了很久的語(yǔ)音直接發(fā)指令、用AI Agent打通APP 間調(diào)用,和重構(gòu)人機(jī)交互邏輯,我們總算有了一次真實(shí)體驗(yàn)。
這種深入操作系統(tǒng)底層,追求“說(shuō)一句話(huà)就直達(dá)服務(wù)”的嘗試,仍然比單純的 Chatbot,更具創(chuàng)新意義。
而SmartisanOS的復(fù)現(xiàn),讓我們看到,好產(chǎn)品的價(jià)值,并不會(huì)因一時(shí)的成敗,被人們遺忘。這大概也是,技術(shù)愛(ài)好者們守護(hù)的浪漫情懷吧。
參考資料:
極客公園《首銷(xiāo)備貨 3 萬(wàn)臺(tái),豆包 AI 手機(jī)要賣(mài)給誰(shuí)?》
Z Finance《深度|老羅的 SmartisanOS 真的沒(méi)死,它以「豆包手機(jī)助手」的方式,在 2025年偷偷復(fù)活了》
路人甲TM《豆包手機(jī)翻車(chē)了!被反手一巴掌》
科技博主wuxianlin微博
科技博主白徵明微博

