四虎AV成人在线观看|免费免费特黄的欧美大片|人妻丝袜中文字幕一区三区|性爱一级二级三级|日本黄色视频在线观看免费|亚洲午夜天堂超碰大香蕉中出|国产日韩三级黄色AV一区二区三区|a片网站在线观看视频|人人AV播放日韩操在线|国产伦清品一区二区三区

正在閱讀:

AI御三家年終“火拼”

掃一掃下載界面新聞APP

AI御三家年終“火拼”

巨頭博弈,變化再變化。

文 | 吳懟懟

2025年的人工智能(AI)領(lǐng)域可謂風(fēng)起云涌:大模型你追我趕、商業(yè)版圖急劇擴(kuò)張。

以前我感覺用ChatGPT+Claude就可以了,現(xiàn)在必須加上Gemini和Grok,要取四個(gè)AI之長(zhǎng)。跟打王者榮耀升級(jí)一樣,要有個(gè)本命英雄,但是同一分路還要會(huì)點(diǎn)別的英雄,最好還要擅長(zhǎng)不同分路。

當(dāng)然,被討論和使用最多的,還是ChatGPT,Claude和Gemini,我愿稱之為AI御三家。

01 AI御三家瘋狂加碼

年底壓軸登場(chǎng)的OpenAI GPT-5.2成為年終焦點(diǎn)。

面對(duì)Gemini 3在各大榜單上后來(lái)居上的壓力,OpenAI提前啟動(dòng)紅色代碼警告,加速推出了這款新一代大模型。

GPT-5.2被定位為“一款為專業(yè)知識(shí)工作打造的最強(qiáng)模型”,在推理、編程和智能體任務(wù)上較前代有顯著提升。

其最大亮點(diǎn)之一是超長(zhǎng)上下文記憶能力:支持40萬(wàn)Token的輸入窗口和12.8萬(wàn)Token的輸出長(zhǎng)度,可一次性 ingest 海量文檔或代碼庫(kù)并生成長(zhǎng)篇報(bào)告。

這意味著GPT-5.2能夠閱讀理解數(shù)百頁(yè)資料后給出總結(jié),在長(zhǎng)鏈多步驟推理中表現(xiàn)更穩(wěn)健。

OpenAI還將GPT-5.2劃分為Instant、Thinking和Pro三個(gè)等級(jí)模型,以平衡速度與深度需求——Instant偏重日??焖倩卮穑琓hinking適合復(fù)雜結(jié)構(gòu)化任務(wù)和長(zhǎng)時(shí)智能Agent執(zhí)行,Pro則追求極致準(zhǔn)確率以應(yīng)對(duì)棘手問(wèn)題。

在各項(xiàng)權(quán)威基準(zhǔn)測(cè)試上,GPT-5.2全面刷新紀(jì)錄:比如在SWE-Bench Pro編程測(cè)試中達(dá)到55.6%的新高分,遠(yuǎn)超前代;在通用推理ARC-AGI測(cè)試上首次突破90%正確率。

值得一提的是,GPT-5.2雖然對(duì)圖像生成暫未有顯著改進(jìn)(OpenAI透露“圖像生成的增強(qiáng)還在籌備中”),但在多模態(tài)理解上已有進(jìn)步:它能夠更好地“感知圖像”并結(jié)合視覺輸入完成復(fù)雜任務(wù)。

此外,GPT-5.2成為OpenAI推動(dòng)“Mega-Agent時(shí)代”的引擎,其連貫長(zhǎng)程代理能力令人矚目——測(cè)試顯示它能自主完成40%更復(fù)雜的長(zhǎng)鏈任務(wù),如根據(jù)乘客反饋?zhàn)詣?dòng)完成改簽航班、預(yù)訂酒店、申請(qǐng)賠償?shù)囊徽资聞?wù),比前代5.1覆蓋更多步驟且更準(zhǔn)確。

這一年,經(jīng)歷了年初GPT-5.0/5.1推出時(shí)的波折(性能和風(fēng)格調(diào)整一度飽受爭(zhēng)議,被用戶批評(píng)“過(guò)于冰冷刻板”,OpenAI火速用5.1版本改善了親和度),OpenAI憑借GPT-5.2在年末重奪技術(shù)王冠,在大模型軍備競(jìng)賽中卷土重來(lái)。

作為OpenAI強(qiáng)勁的對(duì)手,Anthropic在2025年持續(xù)發(fā)力,9月發(fā)布了Claude 4.5。Claude 4.5主打自主編程與工具操作能力。

在內(nèi)部測(cè)試中,其子型號(hào)Claude 4.5-Sonnet曾連續(xù)自主編程30小時(shí)構(gòu)建出一個(gè)Web應(yīng)用,而此前Claude Opus 4只能堅(jiān)持7小時(shí)。

這一飛躍體現(xiàn)出Claude在長(zhǎng)程任務(wù)上的穩(wěn)定性提升,讓AI代理真正能夠長(zhǎng)時(shí)間無(wú)監(jiān)督地工作。

Anthropic表示4.5在金融分析和科學(xué)推理上也更勝一籌,在一項(xiàng)操作系統(tǒng)使用能力測(cè)試中得分約60%,遠(yuǎn)高于前代模型的40%。

換言之,Claude 4.5更善于像人一樣使用電腦完成多步驟任務(wù),這對(duì)需要AI自動(dòng)執(zhí)行業(yè)務(wù)流程的企業(yè)非常關(guān)鍵。Anthropic一貫強(qiáng)調(diào)安全可靠,以降低出錯(cuò)或產(chǎn)生有害內(nèi)容的風(fēng)險(xiǎn),定位于企業(yè)及專業(yè)用戶場(chǎng)景。

在架構(gòu)上,Claude 4.5提供了不同性能版本:例如Claude 4.5-Haiku、Sonnet、Opus等,分別平衡速度、成本與精度,其中最強(qiáng)的Opus 4.5版本支持更大的上下文窗口和更高的調(diào)用上限(相應(yīng)成本也最高)。

這反映出大模型普遍朝著精細(xì)化配置方向發(fā)展。值得關(guān)注的是,Claude 4.5在發(fā)布當(dāng)日即宣布與微軟深化合作:微軟將其引入Microsoft 365 Copilot,增加Excel/Word的“智能體模式”和Copilot聊天中的“Office助手”等新特性。

微軟此舉意在讓Office用戶獲得更強(qiáng)的自動(dòng)辦公助手,同時(shí)也表明其生態(tài)策略從獨(dú)家捆綁OpenAI轉(zhuǎn)為多模型并舉。

而在OpenAI和Anthropic激戰(zhàn)正酣之際,谷歌DeepMind整合優(yōu)勢(shì),于11月發(fā)布了里程碑式的Gemini 3模型。作為谷歌雄心勃勃的旗艦,Gemini 3 Pro號(hào)稱谷歌“有史以來(lái)最智能、事實(shí)準(zhǔn)確率最高”的AI。

與其前代相比,Gemini 3最大的突破是“原生多模態(tài)”:它能同時(shí)處理文本、圖像和音頻,多模態(tài)融合能力業(yè)界領(lǐng)先。

例如,用戶可以讓Gemini讀取菜譜照片并直接生成烹飪手冊(cè),或讓它看一系列視頻課程后自動(dòng)創(chuàng)建交互式學(xué)習(xí)卡片。

這種將視覺、聽覺與文本理解打通的能力,為AI應(yīng)用打開了新局面。借助多模態(tài)和強(qiáng)大的編程能力,Gemini 3還能輸出富媒體結(jié)果:在Google搜索的AI模式下,它可以把答案呈現(xiàn)為圖片、表格、網(wǎng)頁(yè)等動(dòng)態(tài)格式,而非僅有文字。

更驚艷的是,Gemini 3內(nèi)置增強(qiáng)版的搜索工具調(diào)用機(jī)制,能自主將復(fù)雜問(wèn)題拆解成子查詢?nèi)ニ阉?,并結(jié)合結(jié)果給出整合答案。這一“查詢分解+工具使用”策略提升了答案的廣度和準(zhǔn)確性。

Gemini 3在交互風(fēng)格上也別具特色:谷歌直言其回復(fù)將摒棄討好傾向,不再一味迎合用戶而是提供“聰明、簡(jiǎn)潔、直接”的洞見,避免空洞恭維。過(guò)去聊天機(jī)器人易有的過(guò)度諂媚在Gemini上大幅減少,這被視為對(duì)ChatGPT習(xí)慣說(shuō)“好話”的一針諷刺。

除了日常問(wèn)答,Gemini 3 Pro還強(qiáng)化了推理規(guī)劃和Agent能力。谷歌稱其可以“可靠地進(jìn)行更長(zhǎng)遠(yuǎn)的計(jì)劃”,驅(qū)動(dòng)實(shí)驗(yàn)性的Gemini智能代理,幫助用戶自動(dòng)收發(fā)郵件、研究行程甚至預(yù)訂機(jī)票。這預(yù)示著搜索引擎正從提供信息進(jìn)化為直接代辦任務(wù)的全能助理。

性能方面,Gemini 3 Pro一經(jīng)推出即登頂權(quán)威排行榜LMArena,足見其實(shí)力。Gemini 3發(fā)布當(dāng)天,谷歌選擇在其Gemini App上向全民免費(fèi)開放旗艦?zāi)P蚉ro,并很快在搜索服務(wù)中提供給訂閱用戶使用。

這種大規(guī)模分發(fā)策略與OpenAI先會(huì)員后開放的方式形成對(duì)比,也顯示了谷歌在消費(fèi)級(jí)AI領(lǐng)域搶占用戶的迫切。

Gemini 3 Pro的橫空出世,標(biāo)志著谷歌在經(jīng)歷了GPT-4/Bard時(shí)期的相對(duì)落后后,于2025年強(qiáng)勢(shì)反超,一度引發(fā)行業(yè)內(nèi)“Holy Shit!,谷歌贏得AI競(jìng)賽”的驚嘆。

02 估值飆升再飆升

2025年,AI賽道的融資規(guī)模再創(chuàng)新高,多家頭部獨(dú)角獸估值飆漲,吸金能力驚人。

OpenAI在未進(jìn)行公開融資的情況下,據(jù)報(bào)道正尋求員工股份出售,潛在估值高達(dá)5000億美元——這一數(shù)字是歐洲AI獨(dú)角獸估值的數(shù)十倍,體現(xiàn)出投資者對(duì)其龍頭地位的信心。

而Anthropic在9月宣布完成130億美元的巨額融資,投后估值達(dá)1830億美元,較年初翻了近兩倍。

此輪融資由硅谷知名投資機(jī)構(gòu)ICONIQ領(lǐng)投,富達(dá)、Lightspeed等跟投,亦有中東的卡塔爾主權(quán)基金和華爾街巨頭黑石等參與。

Anthropic一躍成為全球估值第三高的非上市公司,僅次于SpaceX等少數(shù)巨頭。隨著資金涌入,Anthropic公布其業(yè)務(wù)營(yíng)收增長(zhǎng)迅猛:2025年初年化收入約10億美元,到了8月激增至50億美元,表明大型AI模型的商業(yè)付費(fèi)需求正被快速開發(fā)。

另一家引人注目的創(chuàng)業(yè)公司是法國(guó)的Mistral AI。這家2023年才成立的創(chuàng)業(yè)公司,2025年9月獲得了17億歐元(約20億美元)的系列C投資。由荷蘭光刻機(jī)巨頭ASML領(lǐng)投1.3億歐元,占股11%,其余包括DST、a16z、創(chuàng)投基金B(yǎng)pifrance、英偉達(dá)等紛紛押注。

此次融資使Mistral估值達(dá)到117億歐元,成為歐洲AI領(lǐng)域新的價(jià)值巔峰。盡管這一估值僅相當(dāng)于OpenAI傳聞估值的約1/40,但對(duì)于歐洲來(lái)說(shuō)是重大突破——Mistral被視為歐盟對(duì)抗美中AI巨頭的重要希望,法國(guó)更將其視作國(guó)家AI戰(zhàn)略的核心。

馬斯克于2023年創(chuàng)建的xAI在今年也有所動(dòng)作。xAI開發(fā)的對(duì)話模型Grok持續(xù)迭代,2025年推出了Grok 4,據(jù)稱在部分基準(zhǔn)上號(hào)稱“世界最聰明”。

Musk在社交媒體上高調(diào)宣傳Grok整合了實(shí)時(shí)網(wǎng)絡(luò)檢索和各種工具插件,并賦予其鮮明的“直言不諱”個(gè)性,讓其回答帶有一點(diǎn)“Meme風(fēng)格”,以吸引年輕用戶。

03 巨頭博弈變化再變化

作為OpenAI背后最大的金主和合作伙伴,微軟在2025年的策略出現(xiàn)了微妙變化。一方面,微軟將OpenAI模型深度嵌入其Windows、Office、Bing等核心產(chǎn)品,持續(xù)收割付費(fèi)用戶和云計(jì)算消耗。

今年微軟全面上線了Windows 11的Copilot助手,將操作系統(tǒng)與GPT助手融為一體,用戶可以直接在桌面調(diào)用AI完成設(shè)置、搜索等操作,讓傳統(tǒng)OS煥發(fā)新生。

同時(shí),微軟Azure云借助OpenAI服務(wù)吸引了大量企業(yè)上云進(jìn)行AI開發(fā),Azure的使用量和收入顯著增長(zhǎng)。

但另一方面,微軟不再將寶押在OpenAI一家:10月,微軟宣布與Anthropic達(dá)成合作,將后者Claude模型引入Azure并在Office中集成。微軟高管稱此舉是為了給客戶提供“多樣化選擇”,降低對(duì)單一供應(yīng)商的依賴。

這或許與2023年末OpenAI高層動(dòng)蕩(Altman一度被董事會(huì)驅(qū)逐后又復(fù)歸)有關(guān),微軟意識(shí)到必須預(yù)防風(fēng)險(xiǎn)、扶持第二陣營(yíng)以維持自己的AI領(lǐng)先地位。

此外,微軟也加碼自研,傳聞其內(nèi)部的生成式模型項(xiàng)目(代號(hào)Omega)在研制多模態(tài)基礎(chǔ)模型,以備不時(shí)之需。

谷歌在經(jīng)歷了ChatGPT帶來(lái)的“AI覺醒”之后,今年實(shí)現(xiàn)了AI戰(zhàn)略的大幅轉(zhuǎn)身。Google DeepMind的成立整合了谷歌原有的Brain團(tuán)隊(duì)與DeepMind研究院資源,成為谷歌AI創(chuàng)新的核心引擎。

Gemini 3的成功推出讓谷歌重奪技術(shù)話語(yǔ)權(quán),也增強(qiáng)了內(nèi)部信心。谷歌隨即在產(chǎn)品線上全面開花:搜索業(yè)務(wù)推出“AI對(duì)話模式”,地圖應(yīng)用上線路線智能生成和旅行規(guī)劃助手,Gmail/Docs增加AI寫作輔助功能等。

不僅軟件服務(wù),谷歌在Android系統(tǒng)中也增加了端側(cè)AI能力,例如利用手機(jī)SoC內(nèi)的TPU微芯片,實(shí)現(xiàn)小型語(yǔ)言模型的本地推理,提供離線的智能輸入法、更精準(zhǔn)的相冊(cè)識(shí)別等。

甚至有報(bào)道指出,谷歌與蘋果達(dá)成協(xié)議,為后者提供定制的Gemini模型用于提升iOS上的智能體驗(yàn)。

這表明谷歌積極尋求將其AI技術(shù)輸出賦能更多平臺(tái)。商業(yè)上,谷歌云也以提供多元模型著稱——除了自家的PaLM/Gemini系列,第三方的Meta Llama2、Anthropic Claude等也能在其Vertex AI平臺(tái)上獲取,從而與微軟Azure在企業(yè)市場(chǎng)上抗衡。

谷歌今年對(duì)AI創(chuàng)業(yè)公司的投資并購(gòu)也有增加,據(jù)傳它投資了多家生成式AI初創(chuàng)(例如Inflection)以擴(kuò)展生態(tài)。谷歌卷土重來(lái),在AI領(lǐng)域從被動(dòng)應(yīng)戰(zhàn)轉(zhuǎn)為主動(dòng)出擊,通過(guò)技術(shù)突破和生態(tài)聯(lián)盟重塑了自己的領(lǐng)先地位。

Meta繼續(xù)走開放生態(tài)和消費(fèi)者應(yīng)用兩手抓的路線。一方面,它在開源社區(qū)的地位鞏固。自從2023年開源LLaMA模型大獲成功后,Meta在2025年又相繼推出了改進(jìn)版的LLaMA 3模型以及一系列開源的多模態(tài)模型,包括圖像生成模型和語(yǔ)音合成模型。

這些模型免費(fèi)供研究者和開發(fā)者使用,僅要求遵守一些不用于有害用途的許可,大量第三方應(yīng)用建立在Meta模型之上。

另一方面,Meta充分發(fā)揮旗下社交產(chǎn)品的流量,將AI融入數(shù)十億用戶的日常。2025年,Meta在Messenger和Instagram中推出了一系列AI角色聊天功能,例如用戶可以和由名人形象構(gòu)建的AI聊天(這些明星形象的對(duì)話風(fēng)格由模型模擬,并獲得了明星本人的授權(quán))。

用戶還可以讓AI根據(jù)朋友圈內(nèi)容自動(dòng)生成趣味回應(yīng),或在Instagram上通過(guò)文字命令生成個(gè)性化的圖片貼紙。Meta的VR/AR事業(yè)部也不甘落后,在Meta Quest頭顯中集成了AI教練和AI健身指導(dǎo),提供沉浸式的互動(dòng)體驗(yàn)。

值得注意的是,Meta在AI商業(yè)化上更側(cè)重間接收益——通過(guò)提升用戶黏性、廣告定向和內(nèi)容生態(tài)繁榮來(lái)賺錢,而非直接出售API。因此,Meta樂于推動(dòng)AI開源降低成本,同時(shí)憑借其社交帝國(guó)將AI無(wú)縫融入產(chǎn)品,鞏固自身社交媒體霸主地位。

相比喧囂的友商,蘋果在AI領(lǐng)域依舊低調(diào)、緩慢但務(wù)實(shí)。2025年的WWDC大會(huì)上,蘋果官宣了一項(xiàng)重大底層升級(jí):iOS/macOS引入了本地大型語(yǔ)言模型(Foundation Models)框架,開發(fā)者可調(diào)用系統(tǒng)提供的基礎(chǔ)模型,在App中實(shí)現(xiàn)更智能的功能。

蘋果透露,他們針對(duì)Apple設(shè)備專門訓(xùn)練了多語(yǔ)言的中等規(guī)模語(yǔ)言模型,并進(jìn)行了深度優(yōu)化,使其能夠在iPhone/蘋果電腦上離線運(yùn)行,用于鍵盤聯(lián)想、語(yǔ)音助手Siri應(yīng)答等場(chǎng)景。

這意味著用戶的部分AI請(qǐng)求不必上傳云端,在設(shè)備上即可處理,提升了隱私與響應(yīng)速度。同時(shí),蘋果也將AI應(yīng)用于照片處理(利用生成模型一鍵除物或改變背景)、Apple Music個(gè)性歌單(AI分析用戶喜好生成播放列表)等方面,提升用戶體驗(yàn)。

有傳聞稱蘋果還與谷歌達(dá)成某種合作,可能在云端借助定制版Gemini模型來(lái)增強(qiáng)iCloud的AI服務(wù)。

但截至年底,蘋果并未發(fā)布類似ChatGPT的通用聊天產(chǎn)品,Siri的智能度也還有提升空間——不過(guò)可以預(yù)料,一旦蘋果認(rèn)為時(shí)機(jī)成熟,可能會(huì)推出深度融合硬件優(yōu)勢(shì)的AI助手,引發(fā)新的行業(yè)震動(dòng)。

蘋果的策略體現(xiàn)了差異化競(jìng)爭(zhēng):它不與OpenAI等正面拼參數(shù)規(guī)模,而是發(fā)揮軟硬件一體的長(zhǎng)處,讓AI默默融入生態(tài),為用戶提供便利且安全的功能。這種潤(rùn)物細(xì)無(wú)聲的推進(jìn),契合蘋果品牌調(diào)性,也為行業(yè)提供了另一種范式:以終端和隱私為中心的AI道路。

當(dāng)然,另一面,AI是否存在泡沫的討論也越來(lái)越多。

無(wú)論如何,作為用戶,還是希望,2026,AI御三家,以及更多玩家,繼續(xù)打起來(lái)吧。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

OpenAI

  • OpenAI最新模型打不動(dòng)了?GPT-5.2因“降智”陷“差評(píng)潮”
  • ChatGPT被控引發(fā)命案,為美國(guó)首起直接關(guān)聯(lián)AI聊天與謀殺訴訟

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

AI御三家年終“火拼”

巨頭博弈,變化再變化。

文 | 吳懟懟

2025年的人工智能(AI)領(lǐng)域可謂風(fēng)起云涌:大模型你追我趕、商業(yè)版圖急劇擴(kuò)張。

以前我感覺用ChatGPT+Claude就可以了,現(xiàn)在必須加上Gemini和Grok,要取四個(gè)AI之長(zhǎng)。跟打王者榮耀升級(jí)一樣,要有個(gè)本命英雄,但是同一分路還要會(huì)點(diǎn)別的英雄,最好還要擅長(zhǎng)不同分路。

當(dāng)然,被討論和使用最多的,還是ChatGPT,Claude和Gemini,我愿稱之為AI御三家。

01 AI御三家瘋狂加碼

年底壓軸登場(chǎng)的OpenAI GPT-5.2成為年終焦點(diǎn)。

面對(duì)Gemini 3在各大榜單上后來(lái)居上的壓力,OpenAI提前啟動(dòng)紅色代碼警告,加速推出了這款新一代大模型。

GPT-5.2被定位為“一款為專業(yè)知識(shí)工作打造的最強(qiáng)模型”,在推理、編程和智能體任務(wù)上較前代有顯著提升。

其最大亮點(diǎn)之一是超長(zhǎng)上下文記憶能力:支持40萬(wàn)Token的輸入窗口和12.8萬(wàn)Token的輸出長(zhǎng)度,可一次性 ingest 海量文檔或代碼庫(kù)并生成長(zhǎng)篇報(bào)告。

這意味著GPT-5.2能夠閱讀理解數(shù)百頁(yè)資料后給出總結(jié),在長(zhǎng)鏈多步驟推理中表現(xiàn)更穩(wěn)健。

OpenAI還將GPT-5.2劃分為Instant、Thinking和Pro三個(gè)等級(jí)模型,以平衡速度與深度需求——Instant偏重日??焖倩卮?,Thinking適合復(fù)雜結(jié)構(gòu)化任務(wù)和長(zhǎng)時(shí)智能Agent執(zhí)行,Pro則追求極致準(zhǔn)確率以應(yīng)對(duì)棘手問(wèn)題。

在各項(xiàng)權(quán)威基準(zhǔn)測(cè)試上,GPT-5.2全面刷新紀(jì)錄:比如在SWE-Bench Pro編程測(cè)試中達(dá)到55.6%的新高分,遠(yuǎn)超前代;在通用推理ARC-AGI測(cè)試上首次突破90%正確率。

值得一提的是,GPT-5.2雖然對(duì)圖像生成暫未有顯著改進(jìn)(OpenAI透露“圖像生成的增強(qiáng)還在籌備中”),但在多模態(tài)理解上已有進(jìn)步:它能夠更好地“感知圖像”并結(jié)合視覺輸入完成復(fù)雜任務(wù)。

此外,GPT-5.2成為OpenAI推動(dòng)“Mega-Agent時(shí)代”的引擎,其連貫長(zhǎng)程代理能力令人矚目——測(cè)試顯示它能自主完成40%更復(fù)雜的長(zhǎng)鏈任務(wù),如根據(jù)乘客反饋?zhàn)詣?dòng)完成改簽航班、預(yù)訂酒店、申請(qǐng)賠償?shù)囊徽资聞?wù),比前代5.1覆蓋更多步驟且更準(zhǔn)確。

這一年,經(jīng)歷了年初GPT-5.0/5.1推出時(shí)的波折(性能和風(fēng)格調(diào)整一度飽受爭(zhēng)議,被用戶批評(píng)“過(guò)于冰冷刻板”,OpenAI火速用5.1版本改善了親和度),OpenAI憑借GPT-5.2在年末重奪技術(shù)王冠,在大模型軍備競(jìng)賽中卷土重來(lái)。

作為OpenAI強(qiáng)勁的對(duì)手,Anthropic在2025年持續(xù)發(fā)力,9月發(fā)布了Claude 4.5。Claude 4.5主打自主編程與工具操作能力。

在內(nèi)部測(cè)試中,其子型號(hào)Claude 4.5-Sonnet曾連續(xù)自主編程30小時(shí)構(gòu)建出一個(gè)Web應(yīng)用,而此前Claude Opus 4只能堅(jiān)持7小時(shí)。

這一飛躍體現(xiàn)出Claude在長(zhǎng)程任務(wù)上的穩(wěn)定性提升,讓AI代理真正能夠長(zhǎng)時(shí)間無(wú)監(jiān)督地工作。

Anthropic表示4.5在金融分析和科學(xué)推理上也更勝一籌,在一項(xiàng)操作系統(tǒng)使用能力測(cè)試中得分約60%,遠(yuǎn)高于前代模型的40%。

換言之,Claude 4.5更善于像人一樣使用電腦完成多步驟任務(wù),這對(duì)需要AI自動(dòng)執(zhí)行業(yè)務(wù)流程的企業(yè)非常關(guān)鍵。Anthropic一貫強(qiáng)調(diào)安全可靠,以降低出錯(cuò)或產(chǎn)生有害內(nèi)容的風(fēng)險(xiǎn),定位于企業(yè)及專業(yè)用戶場(chǎng)景。

在架構(gòu)上,Claude 4.5提供了不同性能版本:例如Claude 4.5-Haiku、Sonnet、Opus等,分別平衡速度、成本與精度,其中最強(qiáng)的Opus 4.5版本支持更大的上下文窗口和更高的調(diào)用上限(相應(yīng)成本也最高)。

這反映出大模型普遍朝著精細(xì)化配置方向發(fā)展。值得關(guān)注的是,Claude 4.5在發(fā)布當(dāng)日即宣布與微軟深化合作:微軟將其引入Microsoft 365 Copilot,增加Excel/Word的“智能體模式”和Copilot聊天中的“Office助手”等新特性。

微軟此舉意在讓Office用戶獲得更強(qiáng)的自動(dòng)辦公助手,同時(shí)也表明其生態(tài)策略從獨(dú)家捆綁OpenAI轉(zhuǎn)為多模型并舉。

而在OpenAI和Anthropic激戰(zhàn)正酣之際,谷歌DeepMind整合優(yōu)勢(shì),于11月發(fā)布了里程碑式的Gemini 3模型。作為谷歌雄心勃勃的旗艦,Gemini 3 Pro號(hào)稱谷歌“有史以來(lái)最智能、事實(shí)準(zhǔn)確率最高”的AI。

與其前代相比,Gemini 3最大的突破是“原生多模態(tài)”:它能同時(shí)處理文本、圖像和音頻,多模態(tài)融合能力業(yè)界領(lǐng)先。

例如,用戶可以讓Gemini讀取菜譜照片并直接生成烹飪手冊(cè),或讓它看一系列視頻課程后自動(dòng)創(chuàng)建交互式學(xué)習(xí)卡片。

這種將視覺、聽覺與文本理解打通的能力,為AI應(yīng)用打開了新局面。借助多模態(tài)和強(qiáng)大的編程能力,Gemini 3還能輸出富媒體結(jié)果:在Google搜索的AI模式下,它可以把答案呈現(xiàn)為圖片、表格、網(wǎng)頁(yè)等動(dòng)態(tài)格式,而非僅有文字。

更驚艷的是,Gemini 3內(nèi)置增強(qiáng)版的搜索工具調(diào)用機(jī)制,能自主將復(fù)雜問(wèn)題拆解成子查詢?nèi)ニ阉鳎⒔Y(jié)合結(jié)果給出整合答案。這一“查詢分解+工具使用”策略提升了答案的廣度和準(zhǔn)確性。

Gemini 3在交互風(fēng)格上也別具特色:谷歌直言其回復(fù)將摒棄討好傾向,不再一味迎合用戶而是提供“聰明、簡(jiǎn)潔、直接”的洞見,避免空洞恭維。過(guò)去聊天機(jī)器人易有的過(guò)度諂媚在Gemini上大幅減少,這被視為對(duì)ChatGPT習(xí)慣說(shuō)“好話”的一針諷刺。

除了日常問(wèn)答,Gemini 3 Pro還強(qiáng)化了推理規(guī)劃和Agent能力。谷歌稱其可以“可靠地進(jìn)行更長(zhǎng)遠(yuǎn)的計(jì)劃”,驅(qū)動(dòng)實(shí)驗(yàn)性的Gemini智能代理,幫助用戶自動(dòng)收發(fā)郵件、研究行程甚至預(yù)訂機(jī)票。這預(yù)示著搜索引擎正從提供信息進(jìn)化為直接代辦任務(wù)的全能助理。

性能方面,Gemini 3 Pro一經(jīng)推出即登頂權(quán)威排行榜LMArena,足見其實(shí)力。Gemini 3發(fā)布當(dāng)天,谷歌選擇在其Gemini App上向全民免費(fèi)開放旗艦?zāi)P蚉ro,并很快在搜索服務(wù)中提供給訂閱用戶使用。

這種大規(guī)模分發(fā)策略與OpenAI先會(huì)員后開放的方式形成對(duì)比,也顯示了谷歌在消費(fèi)級(jí)AI領(lǐng)域搶占用戶的迫切。

Gemini 3 Pro的橫空出世,標(biāo)志著谷歌在經(jīng)歷了GPT-4/Bard時(shí)期的相對(duì)落后后,于2025年強(qiáng)勢(shì)反超,一度引發(fā)行業(yè)內(nèi)“Holy Shit!,谷歌贏得AI競(jìng)賽”的驚嘆。

02 估值飆升再飆升

2025年,AI賽道的融資規(guī)模再創(chuàng)新高,多家頭部獨(dú)角獸估值飆漲,吸金能力驚人。

OpenAI在未進(jìn)行公開融資的情況下,據(jù)報(bào)道正尋求員工股份出售,潛在估值高達(dá)5000億美元——這一數(shù)字是歐洲AI獨(dú)角獸估值的數(shù)十倍,體現(xiàn)出投資者對(duì)其龍頭地位的信心。

而Anthropic在9月宣布完成130億美元的巨額融資,投后估值達(dá)1830億美元,較年初翻了近兩倍。

此輪融資由硅谷知名投資機(jī)構(gòu)ICONIQ領(lǐng)投,富達(dá)、Lightspeed等跟投,亦有中東的卡塔爾主權(quán)基金和華爾街巨頭黑石等參與。

Anthropic一躍成為全球估值第三高的非上市公司,僅次于SpaceX等少數(shù)巨頭。隨著資金涌入,Anthropic公布其業(yè)務(wù)營(yíng)收增長(zhǎng)迅猛:2025年初年化收入約10億美元,到了8月激增至50億美元,表明大型AI模型的商業(yè)付費(fèi)需求正被快速開發(fā)。

另一家引人注目的創(chuàng)業(yè)公司是法國(guó)的Mistral AI。這家2023年才成立的創(chuàng)業(yè)公司,2025年9月獲得了17億歐元(約20億美元)的系列C投資。由荷蘭光刻機(jī)巨頭ASML領(lǐng)投1.3億歐元,占股11%,其余包括DST、a16z、創(chuàng)投基金B(yǎng)pifrance、英偉達(dá)等紛紛押注。

此次融資使Mistral估值達(dá)到117億歐元,成為歐洲AI領(lǐng)域新的價(jià)值巔峰。盡管這一估值僅相當(dāng)于OpenAI傳聞估值的約1/40,但對(duì)于歐洲來(lái)說(shuō)是重大突破——Mistral被視為歐盟對(duì)抗美中AI巨頭的重要希望,法國(guó)更將其視作國(guó)家AI戰(zhàn)略的核心。

馬斯克于2023年創(chuàng)建的xAI在今年也有所動(dòng)作。xAI開發(fā)的對(duì)話模型Grok持續(xù)迭代,2025年推出了Grok 4,據(jù)稱在部分基準(zhǔn)上號(hào)稱“世界最聰明”。

Musk在社交媒體上高調(diào)宣傳Grok整合了實(shí)時(shí)網(wǎng)絡(luò)檢索和各種工具插件,并賦予其鮮明的“直言不諱”個(gè)性,讓其回答帶有一點(diǎn)“Meme風(fēng)格”,以吸引年輕用戶。

03 巨頭博弈變化再變化

作為OpenAI背后最大的金主和合作伙伴,微軟在2025年的策略出現(xiàn)了微妙變化。一方面,微軟將OpenAI模型深度嵌入其Windows、Office、Bing等核心產(chǎn)品,持續(xù)收割付費(fèi)用戶和云計(jì)算消耗。

今年微軟全面上線了Windows 11的Copilot助手,將操作系統(tǒng)與GPT助手融為一體,用戶可以直接在桌面調(diào)用AI完成設(shè)置、搜索等操作,讓傳統(tǒng)OS煥發(fā)新生。

同時(shí),微軟Azure云借助OpenAI服務(wù)吸引了大量企業(yè)上云進(jìn)行AI開發(fā),Azure的使用量和收入顯著增長(zhǎng)。

但另一方面,微軟不再將寶押在OpenAI一家:10月,微軟宣布與Anthropic達(dá)成合作,將后者Claude模型引入Azure并在Office中集成。微軟高管稱此舉是為了給客戶提供“多樣化選擇”,降低對(duì)單一供應(yīng)商的依賴。

這或許與2023年末OpenAI高層動(dòng)蕩(Altman一度被董事會(huì)驅(qū)逐后又復(fù)歸)有關(guān),微軟意識(shí)到必須預(yù)防風(fēng)險(xiǎn)、扶持第二陣營(yíng)以維持自己的AI領(lǐng)先地位。

此外,微軟也加碼自研,傳聞其內(nèi)部的生成式模型項(xiàng)目(代號(hào)Omega)在研制多模態(tài)基礎(chǔ)模型,以備不時(shí)之需。

谷歌在經(jīng)歷了ChatGPT帶來(lái)的“AI覺醒”之后,今年實(shí)現(xiàn)了AI戰(zhàn)略的大幅轉(zhuǎn)身。Google DeepMind的成立整合了谷歌原有的Brain團(tuán)隊(duì)與DeepMind研究院資源,成為谷歌AI創(chuàng)新的核心引擎。

Gemini 3的成功推出讓谷歌重奪技術(shù)話語(yǔ)權(quán),也增強(qiáng)了內(nèi)部信心。谷歌隨即在產(chǎn)品線上全面開花:搜索業(yè)務(wù)推出“AI對(duì)話模式”,地圖應(yīng)用上線路線智能生成和旅行規(guī)劃助手,Gmail/Docs增加AI寫作輔助功能等。

不僅軟件服務(wù),谷歌在Android系統(tǒng)中也增加了端側(cè)AI能力,例如利用手機(jī)SoC內(nèi)的TPU微芯片,實(shí)現(xiàn)小型語(yǔ)言模型的本地推理,提供離線的智能輸入法、更精準(zhǔn)的相冊(cè)識(shí)別等。

甚至有報(bào)道指出,谷歌與蘋果達(dá)成協(xié)議,為后者提供定制的Gemini模型用于提升iOS上的智能體驗(yàn)。

這表明谷歌積極尋求將其AI技術(shù)輸出賦能更多平臺(tái)。商業(yè)上,谷歌云也以提供多元模型著稱——除了自家的PaLM/Gemini系列,第三方的Meta Llama2、Anthropic Claude等也能在其Vertex AI平臺(tái)上獲取,從而與微軟Azure在企業(yè)市場(chǎng)上抗衡。

谷歌今年對(duì)AI創(chuàng)業(yè)公司的投資并購(gòu)也有增加,據(jù)傳它投資了多家生成式AI初創(chuàng)(例如Inflection)以擴(kuò)展生態(tài)。谷歌卷土重來(lái),在AI領(lǐng)域從被動(dòng)應(yīng)戰(zhàn)轉(zhuǎn)為主動(dòng)出擊,通過(guò)技術(shù)突破和生態(tài)聯(lián)盟重塑了自己的領(lǐng)先地位。

Meta繼續(xù)走開放生態(tài)和消費(fèi)者應(yīng)用兩手抓的路線。一方面,它在開源社區(qū)的地位鞏固。自從2023年開源LLaMA模型大獲成功后,Meta在2025年又相繼推出了改進(jìn)版的LLaMA 3模型以及一系列開源的多模態(tài)模型,包括圖像生成模型和語(yǔ)音合成模型。

這些模型免費(fèi)供研究者和開發(fā)者使用,僅要求遵守一些不用于有害用途的許可,大量第三方應(yīng)用建立在Meta模型之上。

另一方面,Meta充分發(fā)揮旗下社交產(chǎn)品的流量,將AI融入數(shù)十億用戶的日常。2025年,Meta在Messenger和Instagram中推出了一系列AI角色聊天功能,例如用戶可以和由名人形象構(gòu)建的AI聊天(這些明星形象的對(duì)話風(fēng)格由模型模擬,并獲得了明星本人的授權(quán))。

用戶還可以讓AI根據(jù)朋友圈內(nèi)容自動(dòng)生成趣味回應(yīng),或在Instagram上通過(guò)文字命令生成個(gè)性化的圖片貼紙。Meta的VR/AR事業(yè)部也不甘落后,在Meta Quest頭顯中集成了AI教練和AI健身指導(dǎo),提供沉浸式的互動(dòng)體驗(yàn)。

值得注意的是,Meta在AI商業(yè)化上更側(cè)重間接收益——通過(guò)提升用戶黏性、廣告定向和內(nèi)容生態(tài)繁榮來(lái)賺錢,而非直接出售API。因此,Meta樂于推動(dòng)AI開源降低成本,同時(shí)憑借其社交帝國(guó)將AI無(wú)縫融入產(chǎn)品,鞏固自身社交媒體霸主地位。

相比喧囂的友商,蘋果在AI領(lǐng)域依舊低調(diào)、緩慢但務(wù)實(shí)。2025年的WWDC大會(huì)上,蘋果官宣了一項(xiàng)重大底層升級(jí):iOS/macOS引入了本地大型語(yǔ)言模型(Foundation Models)框架,開發(fā)者可調(diào)用系統(tǒng)提供的基礎(chǔ)模型,在App中實(shí)現(xiàn)更智能的功能。

蘋果透露,他們針對(duì)Apple設(shè)備專門訓(xùn)練了多語(yǔ)言的中等規(guī)模語(yǔ)言模型,并進(jìn)行了深度優(yōu)化,使其能夠在iPhone/蘋果電腦上離線運(yùn)行,用于鍵盤聯(lián)想、語(yǔ)音助手Siri應(yīng)答等場(chǎng)景。

這意味著用戶的部分AI請(qǐng)求不必上傳云端,在設(shè)備上即可處理,提升了隱私與響應(yīng)速度。同時(shí),蘋果也將AI應(yīng)用于照片處理(利用生成模型一鍵除物或改變背景)、Apple Music個(gè)性歌單(AI分析用戶喜好生成播放列表)等方面,提升用戶體驗(yàn)。

有傳聞稱蘋果還與谷歌達(dá)成某種合作,可能在云端借助定制版Gemini模型來(lái)增強(qiáng)iCloud的AI服務(wù)。

但截至年底,蘋果并未發(fā)布類似ChatGPT的通用聊天產(chǎn)品,Siri的智能度也還有提升空間——不過(guò)可以預(yù)料,一旦蘋果認(rèn)為時(shí)機(jī)成熟,可能會(huì)推出深度融合硬件優(yōu)勢(shì)的AI助手,引發(fā)新的行業(yè)震動(dòng)。

蘋果的策略體現(xiàn)了差異化競(jìng)爭(zhēng):它不與OpenAI等正面拼參數(shù)規(guī)模,而是發(fā)揮軟硬件一體的長(zhǎng)處,讓AI默默融入生態(tài),為用戶提供便利且安全的功能。這種潤(rùn)物細(xì)無(wú)聲的推進(jìn),契合蘋果品牌調(diào)性,也為行業(yè)提供了另一種范式:以終端和隱私為中心的AI道路。

當(dāng)然,另一面,AI是否存在泡沫的討論也越來(lái)越多。

無(wú)論如何,作為用戶,還是希望,2026,AI御三家,以及更多玩家,繼續(xù)打起來(lái)吧。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。