文|慢放
現(xiàn)在,基本上可以把2025年稱作「智能眼鏡年」了。
蘋果前幾天在官網(wǎng)低調(diào)發(fā)布了升級硬件的VisionPro,vivo在兩個月前的8月高調(diào)發(fā)布了對標它的「vivoVision探索版」;Meta9月發(fā)布了首款帶顯示屏的智能眼鏡MetaRay-BanDisplay,小米則在更早的6月帶來了1999的「年輕人第一副智能眼鏡」;還有早已深耕多年的雷鳥,Rokid;剛剛入場的魅族;躍躍欲試的百度、阿里等等。
從1月至今,累計有20多家廠商或正式官宣或被傳出要涉足智能眼鏡行業(yè)。IDC預測,2025年全年,全球智能眼鏡市場出貨量預計將達到1451.8萬臺,同比增長42.5%。中國市場預計總出貨量將達到290.7萬臺,同比增長121.1%。
廠商悉數(shù)下場,大幕已經(jīng)拉開,但這個市場因何而起?有哪些技術流派?以及最重要的——智能眼鏡,何時迎來自己的「iPhone時刻」?
01「早產(chǎn)兒」谷歌
很多科技數(shù)碼產(chǎn)品,都是從科幻作品開始的——智能眼鏡亦是如此。
在《終結者》里,T-800機器人的機械眼能瞬間掃描、分析眼前的一切,并實時顯示出來;在《少數(shù)派報告》里,阿湯哥能用手勢在空氣中調(diào)取圖標,操作電腦。這種將數(shù)字信息與現(xiàn)實世界無縫疊加的能力,就是科幻作家為智能眼鏡描繪的最初的、也是最迷人的藍圖——所見皆可操作,所見皆可數(shù)字化。
第一個試圖將這個科幻夢想帶到現(xiàn)實的,是谷歌。
2012年,谷歌眼鏡(GoogleGlass)橫空出世。在一支短視頻中,谷歌為用戶描繪了一個非??苹玫摹钢悄苎坨R的一天」:
用戶戴上之后,通過一塊小小的棱鏡,一切信息全都呈現(xiàn)在眼前:看向天空,天氣預報自動浮現(xiàn);路邊發(fā)現(xiàn)一幅歌手海報,旁邊即浮現(xiàn)演唱會信息;跟著導航箭頭,在書店里找到想要的書;朋友發(fā)來的短信,不僅自動彈出還能語音回復;站在樓頂,實時為女友直播絕美的夕陽……
任誰看完都要感嘆一句「未來已來」。然而,理想很豐滿,現(xiàn)實……那都不叫骨感,那干脆就是骨灰。
現(xiàn)實是,當時谷歌的技術根本不足以實現(xiàn)這部宣傳片中提到的99%以上的功能——它其實就只是一個能拍照的玻璃小屏罷了。無論是芯片、電池還是顯示技術,在2012年都遠未成熟。售價高達1500美元,續(xù)航卻只有可憐的幾個小時,而且——從顏值的角度來說,這玩意屬實也是太丑了。
2022年,前谷歌研發(fā)人員WarrenCraddock撰文表示,當時谷歌眼鏡的工程師在測試時整天「問眼鏡一些類似埃菲爾鐵塔有多高之類的問題,或者就是給桌上的盆栽拍照」。研發(fā)團隊甚至自己都「不知道它有什么用」。
更致命的,是這款產(chǎn)品在社會倫理上引發(fā)的恐慌。
一個戴著谷歌眼鏡的人走進酒吧,他是在看酒單,還是在偷拍你?很快,一個充滿貶義的新詞誕生了——「Glasshole」(眼鏡混蛋)。用來描述那些戴著谷歌眼鏡瞎晃的人。它精準地概括了公眾對這種穿戴設備的普遍反感:它打破了人與人之間關于隱私的默契,帶來了強烈的不安全感和被冒犯感。
最終,在技術和倫理的雙重困境下,谷歌眼鏡不了了之。時至今日,它依然是智能眼鏡乃至整個科技創(chuàng)新圈的知名反面典型。
盡管如此,谷歌眼鏡確實點燃了智能眼鏡行業(yè)的第一把火。它的高關注度驗證了市場需求,它所踩過的坑也被其他同行拿來認真學習。十幾年后,隨著技術成熟,一些后續(xù)者開始陸續(xù)出現(xiàn)。
那么,這次,廠商們會怎么做?
02 音頻、攝像頭與MR
盡管都被冠以「智能眼鏡」之名,但2025年當下的在售眼鏡產(chǎn)品,差異可能比智能手機和功能機還大。這背后,是三條截然不同的技術路線。
首先就是「音頻派」。
早在2019年,亞馬遜就發(fā)布過一款名為EchoFrames的「音頻智能眼鏡」。眼鏡尾部有揚聲器,前端有麥克風,說是智能眼鏡,不如說是「戴在臉上的開放式耳機」。但亞馬遜表示,智能不是白叫的:用戶可以用它連接手機,和亞馬遜Alexa智能語音助手對話,查天氣,定日程,問問題,操縱家里的智能設備;等等。手機來了通知,也能直接讀給用戶聽。
之后的幾年,Bose、雷柏、華為,小米等廠商也相繼下場,開發(fā)了各自的音頻眼鏡產(chǎn)品,功能總體上大同小異:聽音樂,打電話,連接各自手機的智能語音助手,最多再加點類似感應頭部動作的頸椎保護功能。因為功能簡單,價格也可以很低,例如小米的「MIJIA智能音頻眼鏡悅享版」就來到了最低469的價位。
從好的方面來看,音頻智能眼鏡完美規(guī)避了重量和隱私兩大難題。大部分這類產(chǎn)品不到30g,幾乎和原配眼鏡沒啥差別,用戶長期佩戴的壓力不大;物理上也沒有偷拍的可能;但這也正是它的短板:無論怎么包裝「智能」功能,說到底,它也只是個形態(tài)新穎的耳機罷了。
光聽顯然不夠,因此更主流,或者說更「智能」的方案,是第二個流派:「攝像頭派」——尾部有揚聲器,前端有攝像頭,不僅能聽,還能「看」的智能眼鏡。
這個領域,Meta是無可爭議的老大。2023年10月,Meta發(fā)布首款MetaRay-Ban眼鏡,最初并不被外界看好,但Meta將主打功能定位在「AI語音交互」和「影像記錄生活」兩大領域,并通過和雷朋合作,提升了眼鏡的顏值。解決了谷歌眼鏡當年面臨過的「有什么用」和「戴著丑」的兩大痛點。
兩年時間200萬副的銷量,證明了確實有相當一部分人有「臉上長攝像頭」的需求。據(jù)國盛證券報告,2025年Q1全球AI智能眼鏡銷量約為60萬臺,而其中MetaRay-Ban的單品銷量就達到52.5萬臺??梢哉f,今年很多下場的廠商,如小米、魅族、阿里等,走的也正是Meta開創(chuàng)的這個路線。
「攝像頭派」是目前將AI能力與現(xiàn)實結合最緊密的路線,對于Vlogger,它是無與倫比的第一視角記錄工具。對于普通用戶,它則是一個強大的「外置大腦」??床欢馕牟藛??拍一下,實時翻譯。路邊看到不認識的植物?看一眼,百科信息立刻通過耳機告訴你……當然,谷歌眼鏡面臨的「偷拍」困境,「攝像頭派」們一樣繞不過去。Meta和小米的產(chǎn)品都有拍攝時閃光的設置,提醒周圍的人「此人正在攝像」,但這個提醒有多大作用,只能說……比沒有好。
最后就是「MR派」——或者說「空間計算派」。
這無疑是最野心勃勃的一派。它不僅要「看」世界,更要「創(chuàng)造」和「融合」一個新世界,實現(xiàn)真正的增強現(xiàn)實(AR)或混合現(xiàn)實(MR)。這也是唯一有望顛覆手機的路線,因為它從根本上改變了信息的維度。在工業(yè)、醫(yī)療等專業(yè)領域,可能會展現(xiàn)出驚人的生產(chǎn)力。
但還是那句話,理想豐滿,現(xiàn)實骨感?!溉诤吓伞沟牧觿荩瑤缀醵荚从诋斍凹夹g與物理定律的矛盾。蘋果VisionPro超過600克的重量和不到2小時的續(xù)航就是典型。vivoVision將重量壓到398克,但這依然遠未達到普通眼鏡的水平。
也有廠商嘗試在眼鏡中植入顯示器。Meta在9月發(fā)布了采用彩色光波導顯示功能的MetaRay-BanDisplay智能眼鏡。它右眼鏡片有一塊郵票大小的顯示區(qū)域,支持顯示音樂播放器、相機取景預覽、實時字幕翻譯等內(nèi)容。整體上更接近于「增強信息提示」的智能眼鏡,而非完全的混合現(xiàn)實設備。效果……只能說未來可期,畢竟連小扎自己在發(fā)布會上都翻車了。
03 AI眼鏡會迎來自己的「iPhone時刻」嗎?
智能眼鏡顯然已經(jīng)夠多了,下一個問題則是:它什么時候會從大號玩具「飛入尋常百姓家」?換句話說,智能眼鏡會迎來自己的「iPhone時刻」嗎?
上文提到的WarrenCraddock在文章中,提到了谷歌眼鏡的失敗的另一個原因,是開發(fā)團隊沉迷于為眼鏡尋找某一款「殺手級應用」。無獨有偶,2023年蘋果VisionPro剛上市時,也有媒體頻頻提及「殺手級應用」,寄希望于某一款app,能讓智能眼鏡徹底走向大眾。
這個想法,或許有點偏。事實上,歷史上那些「改變世界」的數(shù)碼產(chǎn)品,他們靠的都不是某一兩個打動人的功能,而是為自己的用戶打造了一個「場景」。
比如索尼的Walkman隨身聽,它的成功,源于索尼對這款產(chǎn)品的定位。Walkman沒有揚聲器,隨機附贈耳機,體積只有磁帶盒大小。這所有的設計,都圍繞一個核心的「場景」:音樂出街。Walkman不是第一個「移動音樂播放設備」,但他確實史上第一次創(chuàng)造了「隨身攜帶的、私密的、個性化的聲場」。它滿足了人類在公共空間中構建「自我小世界」的心理需求。
上市七個月,索尼就賣出了14萬臺Walkman,截止到2010年停產(chǎn)為止,所有型號的磁帶式Walkman累計賣出2.2億臺。而如果把CD,MiniDisc等衍生型號的Walkman設備也算上的話,總銷量達到了驚人的4億臺。
這,就是場景的力量。
還有iPhone,2007年的初代iPhone的確是革命性的,但它真正封神,是在2008年AppStore上線之后,讓它從一個「能流暢上網(wǎng)的漂亮手機」,變成了一個「數(shù)字應用分發(fā)站」。它讓開發(fā)者能夠非常輕松地對用戶收費,它讓用戶可以像便利店買水一樣,便捷地在手機上購買應用程序。是數(shù)以百萬計的應用,才真正定義了iPhone。
2008年第三季度,iPhone全球銷量72萬臺。在推出AppStore之后的第四季度,直接暴漲到689萬臺。2008年一整年,蘋果賣出了1163萬臺iPhone,2009年,這個數(shù)字是2073萬,之后的幾年,iPhone的銷量都保持著不低于70%的增長率。
這其實也符合當下的市場表現(xiàn):綜合來看,2025年的智能眼鏡市場,呈現(xiàn)一種微妙的悖論:廠商們爭相給自己貼上「智能」的標簽,但用戶真正付費購買的原因,卻并不是因為虛無縹緲的「AI大模型」,而是實打?qū)嵉膱鼍埃河腥讼氩淮鞫鷻C聽歌;有人需要解放雙手拍照,有人想隨時隨地隨手錄音,等等。
那么,適合智能眼鏡的場景,會是什么?
結語
傳播學大師麥克盧漢曾提出:「媒介即信息」。意思是,傳播媒介本身對人的影響,要超過媒介傳達的信息本身。比如,在電影出現(xiàn)之前,人們看到的畫面是連續(xù)的;在電影出現(xiàn)之后,隨著「剪輯」的誕生,人們很自然地接受了畫面可以是跳躍的,割裂的。
所以,這可能才是智能眼鏡的最終場景:重塑人類接收信息的方式,并因此而改變世界。
在文字、廣播的時代,信息是一維的,只有單純語言,聲音的輸入;
后來,電視、電影出現(xiàn),信息變成了二維。人們可以同時接收畫面,聲音,語言和文字。智能手機延續(xù)了二維信息傳遞,讓它更加個人化,多元化——但依然沒有突破二維。
而現(xiàn)在,智能眼鏡有可能讓我們迎來三維信息時代:信息從面前的屏幕中,走到了你我每個人的身邊。從此之后,每個用戶都會擁有一個只屬于自己的「世界」。當你導航時,不再是低頭看手機箭頭,而是抬頭「看到」一條金色光帶在真實道路上為你引航;當你與朋友視頻通話,不再是盯著小屏幕,而是「看到」他的影像就坐在你對面的沙發(fā)上。
只有當智能眼鏡能夠真正無縫、自然、低成本地提供這種三維信息體驗時,它或許才能完成從「極客玩具」到「大眾基礎設施」的終極遷移,迎來自己的「iPhone時刻」。眼下的所有AI眼鏡,距離完美回答這個問題,都還有很長的路要走。但,齒輪已經(jīng)開始轉動了。
唯一的問題是,誰會是那個天選之子?而我們,又是否真的準備好,去迎接一個「所見即可得」的未來了呢?

