文 | 定焦One 王璐
編輯 | 阿倫
近期,一則“懸而未決”的競(jìng)購(gòu)在AI圈引發(fā)轟動(dòng)。
靠AI搜索成為行業(yè)獨(dú)角獸的Perplexity稱要以345億美元的價(jià)格收購(gòu)谷歌的Chrome瀏覽器,這一報(bào)價(jià)幾乎是Perplexity自身估值(180億美元)的兩倍。想買Chrome的還不止Perplexity,另一家AI明星企業(yè)OpenAI,此前也透露出了收購(gòu)意愿。不過,谷歌方面暫時(shí)沒有接受任何報(bào)價(jià)。
看到這個(gè)新聞,很多人不由得發(fā)出疑問:瀏覽器,這個(gè)“老掉牙”的互聯(lián)網(wǎng)產(chǎn)品,怎么又重新“性感”起來(lái)了?
不止國(guó)外,國(guó)內(nèi)互聯(lián)網(wǎng)大廠近一年來(lái)也都圍繞瀏覽器做文章。騰訊、阿里、360,分別押寶QQ瀏覽器、夸克瀏覽器、360AI瀏覽器,想要打造“AI時(shí)代的超級(jí)入口”。
有必要討論:當(dāng)AI遇上瀏覽器,會(huì)發(fā)生什么化學(xué)反應(yīng)?AI瀏覽器,為什么能成為大廠和創(chuàng)業(yè)公司在AI時(shí)代的戰(zhàn)略重心?這場(chǎng)爭(zhēng)奪賽,誰(shuí)最有可能占得先機(jī)?
AI瀏覽器的兩大流派:界面、功能各不相同
什么是AI瀏覽器?
可以理解為將AI融入到傳統(tǒng)瀏覽器中,具備智能搜索與問答、內(nèi)容理解與生成摘要、自動(dòng)化任務(wù)執(zhí)行、多模態(tài)交互體驗(yàn)、個(gè)性化推薦等功能,實(shí)現(xiàn)從“工具”到“智能”的轉(zhuǎn)變。
很多從業(yè)者認(rèn)為,AI瀏覽器和Agent一樣,都屬于大勢(shì)所趨,但此刻大家圍繞AI瀏覽器的謎團(tuán)也有很多。
目前各家公司在AI瀏覽器的技術(shù)路線與產(chǎn)品形態(tài)上有著明顯區(qū)別,究竟何種形態(tài)才能稱之為AI瀏覽器?它和Chatbot、Agent在功能和技術(shù)上又有何區(qū)別?
先看競(jìng)爭(zhēng)比較激烈的國(guó)外市場(chǎng)。
谷歌和微軟這兩大科技巨頭均推出了“AI瀏覽器”,前者讓Chrome瀏覽器直接集成了AI能力,從而對(duì)用戶搜索內(nèi)容進(jìn)行總結(jié)提煉。后者則在原有Edge瀏覽器的基礎(chǔ)上推出了Copilot模式,啟用該模式后,Edge瀏覽器的新標(biāo)簽頁(yè)會(huì)變成一個(gè)簡(jiǎn)潔的輸入框,用戶可以直接和AI對(duì)話。

Edge中開啟Copilot模式
但與傳統(tǒng)版本相比,兩家AI瀏覽器的整體界面形態(tài)變化不大。
從事Agent應(yīng)用算法方向研究的資深人士趙江杰表示,谷歌和微軟均采用的是集成技術(shù)路線打造AI瀏覽器,即把AI作為獨(dú)立模塊融入到傳統(tǒng)瀏覽器架構(gòu)中,可以簡(jiǎn)單理解為,在管理網(wǎng)頁(yè)的基礎(chǔ)上,加上了AI能力和Chatbot式交互。
另一種為AI原生路線,多為AI初創(chuàng)公司采用。
比如Perplexity的Comet、TheBrowserCompany的Dia瀏覽器以及FellouAI的同名瀏覽器,“這些產(chǎn)品在開發(fā)時(shí)便基于AI原生架構(gòu)打造,和集成模式不同,它是在Chatbot式交互和AI能力的基礎(chǔ)上,加入網(wǎng)頁(yè)管理功能。界面設(shè)計(jì)大多采用對(duì)話框形式,凸顯了AI交互的核心地位?!壁w江杰表示。

FellouAI頁(yè)面
再看國(guó)內(nèi),目前公開宣布研發(fā)AI瀏覽器的主要為互聯(lián)網(wǎng)大廠,“AI六小虎”為代表的大模型初創(chuàng)公司尚未公布相關(guān)動(dòng)作,趙江杰透露,除夸克外,國(guó)內(nèi)大廠的AI瀏覽器基本都采用的是集成模式。
除了界面存在差異,各家AI瀏覽器的功能側(cè)重點(diǎn)也不太一樣,區(qū)別在于智能化水平。
目前大多數(shù)AI瀏覽器可以理解為非自主型,較傳統(tǒng)瀏覽器相比,AI功能體現(xiàn)在能完成網(wǎng)頁(yè)總結(jié)、生成框架圖、推薦相似網(wǎng)頁(yè)、網(wǎng)頁(yè)翻譯、文字續(xù)寫、語(yǔ)音助手。
比如360AI瀏覽器比較突出的功能有總結(jié)概括長(zhǎng)視頻內(nèi)容,快速梳理出重點(diǎn)概念并生成腦圖。阿里的夸克瀏覽器支持在文字之外制作PPT、生成圖片等多模態(tài)能力。
總體來(lái)看,國(guó)外的Chrome以及國(guó)內(nèi)絕大多數(shù)的AI瀏覽器,基本都以上述信息交互與內(nèi)容生成功能為主。
另一類偏自主型AI瀏覽器,能自主完成多網(wǎng)頁(yè)讀取與分析、自主操作復(fù)雜任務(wù),以及預(yù)測(cè)用戶的個(gè)性化需求。
比如國(guó)外的Comet、Dia可跨網(wǎng)站執(zhí)行多步任務(wù)操作,F(xiàn)ellouAI更是號(hào)稱“全球首個(gè)行動(dòng)型瀏覽器”,用戶給出“在亞馬遜搜RTX4060顯卡,并按評(píng)分加購(gòu)最高型號(hào)”的指令,F(xiàn)ellouAI會(huì)自動(dòng)執(zhí)行“登錄-篩選-比價(jià)-下單”整個(gè)過程。
目前自主型AI瀏覽器是AI初創(chuàng)公司主打的功能方向。
在趙江杰看來(lái),自主型AI瀏覽器更加智能,不過他也強(qiáng)調(diào),即便自主型AI瀏覽器看起來(lái)做到了智能化,但功能也比較基礎(chǔ),目前成熟場(chǎng)景主要有三種:多標(biāo)簽頁(yè)信息對(duì)比總結(jié)、自動(dòng)搜索并回復(fù)社交媒體發(fā)帖、監(jiān)控Gmail郵件反饋以及跨境電商自動(dòng)報(bào)價(jià)等商用場(chǎng)景。總之,是輔助用戶處理一些重復(fù)性的工作。
Agent帶飛瀏覽器
在互聯(lián)網(wǎng)早期,因?yàn)榫邆渌阉?、社交、?gòu)物等多樣功能,瀏覽器曾是用戶上網(wǎng)的主要入口。
2000年前后,微軟的IE瀏覽器(Internet Explorer,后被Edge取代)憑借Windows系統(tǒng)預(yù)裝壟斷市場(chǎng),份額一度高達(dá)95%。到了移動(dòng)互聯(lián)網(wǎng)時(shí)代,隨著蘋果硬件暢銷、谷歌安卓系統(tǒng)被廣泛使用,蘋果的Safari瀏覽器和谷歌的Chrome瀏覽器不斷蠶食IE瀏覽器的地盤。
根據(jù)市場(chǎng)調(diào)查機(jī)構(gòu) Statcounter 最新公布的數(shù)據(jù),在全球所有平臺(tái)中,Chrome、Safari、Edge的市場(chǎng)份額分別為:67.9%、16.2%、5.1%。在國(guó)內(nèi),除了三巨頭之外,360瀏覽器、QQ瀏覽器、UC瀏覽器也有一定的市場(chǎng)份額。
然而,這些年瀏覽器們的日子并不好過。因?yàn)樵谝苿?dòng)時(shí)代,瀏覽器的入口地位被APP嚴(yán)重削弱,只有在訪問陌生網(wǎng)站、臨時(shí)查信息等場(chǎng)景下,瀏覽器還有一點(diǎn)存在感。
到了AI時(shí)代,本來(lái)以為,被Chatbot接替了部分功能的瀏覽器,地位會(huì)更加岌岌可危。然而,隨著Agent的爆發(fā),瀏覽器徹底“翻紅”了。
石榴AI首席研究員、大模型從業(yè)者張恒認(rèn)為,瀏覽器被重新重視,主要是因?yàn)樗腁gent入口地位。
據(jù)了解,大模型的產(chǎn)品形態(tài)由簡(jiǎn)單到復(fù)雜可分為:Chatbot(對(duì)話機(jī)器人)、Copilot(智能助手)、單智能體和多智能體,后兩者被統(tǒng)稱為Agent。如今以ChatGPT為代表的Chatbot類產(chǎn)品,弊端越來(lái)越明顯,比如:用戶能否提出明確指令,直接影響回復(fù)的準(zhǔn)確度與完成度,同時(shí)Chatbot自身缺乏長(zhǎng)期記憶與連續(xù)性,這在一定程度上降低了大模型的智能水平。
相比之下,Agent則像個(gè)有自主意識(shí)的智能助手,能幫用戶琢磨事、做計(jì)劃、動(dòng)手干活、規(guī)劃行程、完成報(bào)告等等,且具有自主性和通用性。
而這些功能的實(shí)現(xiàn),繞不開瀏覽器。
趙江杰表示,目前Agent的開發(fā)場(chǎng)景主要有兩種,一種是垂直領(lǐng)域,比如完成做視頻這種單一任務(wù),只需生成視頻片段并做拼接,操作比較簡(jiǎn)單,或者專門針對(duì)某一企業(yè),只服務(wù)于公司內(nèi)部系統(tǒng),不用跨其他平臺(tái)。
另一種則是toC場(chǎng)景,比如常見的網(wǎng)購(gòu)、訂票,這種涉及可視化界面和跳轉(zhuǎn)到其他網(wǎng)站的功能,都得依靠瀏覽器。
簡(jiǎn)言之,瀏覽器是Agent的“舞臺(tái)”,幫它在不同應(yīng)用之間進(jìn)行操作,從而完成訪問登錄網(wǎng)站、瀏覽電腦文件等復(fù)雜任務(wù)?!按竽P拖袢说哪X子,Agent是手和腳,瀏覽器就是手腳和腦子一起干活兒的地方,在執(zhí)行一項(xiàng)復(fù)雜指令時(shí),需要大模型、Agent和瀏覽器三者協(xié)作完成?!彼硎尽?/p>
以購(gòu)買一雙跑鞋為例,用戶下達(dá)這一指令后,大模型作為大腦接收、理解“買跑鞋”的任務(wù),Agent作為手腳行動(dòng)將其拆解為“比價(jià)”“購(gòu)買”等多個(gè)子任務(wù)執(zhí)行,而其在操作時(shí)需要通過瀏覽器打開淘寶、京東這些網(wǎng)站。
趙江杰認(rèn)為,Agent的關(guān)鍵在于高效完成任務(wù)并交付結(jié)果,而瀏覽器作為本地環(huán)境,天然具備訪問用戶本地?cái)?shù)據(jù)和操作權(quán)限的能力,能直接讀取用戶的登錄狀態(tài)、已安裝的插件、本地存儲(chǔ)的數(shù)據(jù)等必要信息,從而顯著提升Agent完成任務(wù)的質(zhì)量和準(zhǔn)確性。
而且,將瀏覽器作為Agent入口,用戶無(wú)需將賬號(hào)密碼等個(gè)人信息交給第三方AI工具,降低了泄露用戶隱私的風(fēng)險(xiǎn)。
總之,如果Agent有未來(lái),瀏覽器也會(huì)有未來(lái)。
AI瀏覽器的喜和憂
瀏覽器不僅是Agent入口,在整個(gè)AI生態(tài)中也占據(jù)著重要位置。
張恒表示,瀏覽器減少了AI需要適配的終端類型,是AI應(yīng)用的統(tǒng)一入口,比如,瀏覽器使Copilot的功能開發(fā)更聚焦,用戶無(wú)需在多個(gè)應(yīng)用或設(shè)備間切換,提升了使用便捷性。
意識(shí)到了瀏覽器對(duì)于AI產(chǎn)品的獨(dú)特價(jià)值,Perplexity等AI獨(dú)角獸,不僅自研AI瀏覽器,還要花高價(jià)收購(gòu)Chrome。綜合從業(yè)者的說法,競(jìng)購(gòu)的目的主要有兩點(diǎn)。
一是搶市場(chǎng)份額。
據(jù)第三方數(shù)據(jù)平臺(tái)Statcounter統(tǒng)計(jì),截至2025年7月,Chrome在全球?yàn)g覽器市場(chǎng)的份額為67.9%,擁有超過30億活躍用戶,可見其主導(dǎo)地位。
在張恒看來(lái),海外的瀏覽器三巨頭,Edge主要適配Windows系統(tǒng),Safari依托蘋果設(shè)備的封閉生態(tài),而Chrome憑借跨平臺(tái)兼容性、豐富的插件生態(tài)和與谷歌服務(wù)的深度整合,市占率最高,這就意味著AI初創(chuàng)公司只要掌握了Chrome、占有了Chrome產(chǎn)品,也就相當(dāng)于擁有了大批用戶,比自己做瀏覽器從零積累要快得多。
而且,做一個(gè)具有強(qiáng)兼容性和豐富生態(tài)的瀏覽器,復(fù)雜度等同于操作系統(tǒng)。“想要再自研一個(gè)類似于Chrome的瀏覽器難度巨大,市面上大多數(shù)瀏覽器都為Chrome(Chromium)套殼?!壁w江杰表示。
二是通過瀏覽器積累用戶數(shù)據(jù)。
用戶在瀏覽器上的每一次搜索、每一次停留、每一個(gè)糾錯(cuò)反饋,都是珍貴的數(shù)據(jù)信息,“研發(fā)團(tuán)隊(duì)不僅能及時(shí)根據(jù)用戶反饋優(yōu)化AI模型,也可以用來(lái)改進(jìn)AI產(chǎn)品,讓產(chǎn)品變得越來(lái)越‘懂’用戶。”
不過,與傳統(tǒng)瀏覽器相比,AI瀏覽器目前也有明顯弊端,一是會(huì)和Chatbot一樣出現(xiàn)“幻覺”,二是生態(tài)尚未成熟。
所謂“幻覺”,就是AI會(huì)一本正經(jīng)地胡說八道,編造出看似合理但根本不存在的信息,這主要是由于瀏覽器的信息生成、內(nèi)容總結(jié)功能,都依賴大模型完成。換句話說,幻覺的根源是大模型,AI瀏覽器自身無(wú)法降低幻覺。
生態(tài)未成熟可以理解為配套問題,“AI瀏覽器要理解網(wǎng)頁(yè),要么靠截圖,要么靠解析DOM樹(網(wǎng)頁(yè)的結(jié)構(gòu)化表示方法),但截圖會(huì)漏掉如下拉菜單這類隱藏元素,解析DOM樹又很耗費(fèi)計(jì)算資源。而且現(xiàn)在的圖像識(shí)別技術(shù),還沒法像人一樣順暢地操作復(fù)雜網(wǎng)頁(yè),也會(huì)觸發(fā)驗(yàn)證碼之類的安全驗(yàn)證,這些都讓AI瀏覽器用起來(lái)不夠順暢。”趙江杰表示。
以上種種問題共同導(dǎo)致AI瀏覽器在實(shí)際應(yīng)用中面臨效率低、可靠性差等挑戰(zhàn),限制了其在復(fù)雜場(chǎng)景下的廣泛應(yīng)用。
在使用習(xí)慣上,AI瀏覽器也面臨著不小的挑戰(zhàn)。
一位從業(yè)者認(rèn)為,傳統(tǒng)瀏覽器的核心操作邏輯是“用戶主動(dòng)搜索+篩選”,老用戶已經(jīng)習(xí)慣了在地址欄輸網(wǎng)址或輸入關(guān)鍵詞、點(diǎn)鏈接跳轉(zhuǎn),相比之下,AI瀏覽器更像“主動(dòng)服務(wù)”,用戶能否適應(yīng)這一轉(zhuǎn)變也不一定,這也是傳統(tǒng)搜索公司面對(duì)AI瀏覽器這塊“香餑餑”時(shí)格外謹(jǐn)慎、不敢貿(mào)然推出顛覆性的AI瀏覽器的原因,即便是推出了AI瀏覽器,也保留著傳統(tǒng)瀏覽器的操作界面。
目前,從業(yè)者更傾向于構(gòu)建“AI瀏覽器—Chatbot—Agent”的協(xié)同生態(tài),實(shí)現(xiàn)各司其職的高效分工,三者的功能邊界與應(yīng)用場(chǎng)景有所區(qū)分,AI瀏覽器提供信息檢索和展示,方便用戶快速獲取信息;Chatbot一方面?zhèn)戎孬@取信息的基礎(chǔ)功能,另一方面完成文本生成、知識(shí)問答等更細(xì)節(jié)性的任務(wù),但不執(zhí)行實(shí)際操作;Agent則是思考+操作,側(cè)重自動(dòng)化辦公、數(shù)據(jù)分析等復(fù)雜任務(wù)。
比如用戶想做一個(gè)假期帶娃出游計(jì)劃:可以用AI瀏覽器爬取OTA平臺(tái)、景區(qū)官方等平臺(tái)信息,篩選出適合帶娃的景點(diǎn)以及路線,然后自己做規(guī)劃;也可以讓Chatbot給出某地某項(xiàng)目適合多少歲的孩子玩等具體規(guī)劃,但自己買票;或者直接用Agent給出整體規(guī)劃并直達(dá)交付鏈條,即用戶接收確認(rèn)景點(diǎn)門票的訂單鏈接。
簡(jiǎn)言之,同樣是做假期帶娃出游計(jì)劃,AI瀏覽器負(fù)責(zé)給用戶整理信息包,Chatbot給用戶提供詳細(xì)的建議和文案,Agent不僅給建議,還幫用戶進(jìn)行預(yù)約、下單,三者的核心差異在于“提供的服務(wù)深度”和“是否能自主操作”。
不過,雖然瀏覽器已在AI時(shí)代展現(xiàn)出獨(dú)特價(jià)值,但仍然有很多問題等待解決。
而眼下這場(chǎng)轟轟烈烈的“Chrome爭(zhēng)奪戰(zhàn)”,最終的贏家,不僅會(huì)重寫瀏覽器的市場(chǎng)格局,更有可能主導(dǎo)AI時(shí)代的數(shù)據(jù)主權(quán)和技術(shù)標(biāo)準(zhǔn)。
回到故事原點(diǎn),美國(guó)司法部以反壟斷的理由,竭力想讓谷歌賣掉Chrome,但“手握重器”的谷歌,一定知道Chrome的價(jià)值,也一定會(huì)盡力使Chrome免于分拆。
那些想通過收購(gòu)Chrome一飛沖天的AI公司,恐怕還得繼續(xù)眼饞。

