四虎AV成人在线观看|免费免费特黄的欧美大片|人妻丝袜中文字幕一区三区|性爱一级二级三级|日本黄色视频在线观看免费|亚洲午夜天堂超碰大香蕉中出|国产日韩三级黄色AV一区二区三区|a片网站在线观看视频|人人AV播放日韩操在线|国产伦清品一区二区三区

正在閱讀:

AI Agent是2025年最大風口還是泡沫?

掃一掃下載界面新聞APP

AI Agent是2025年最大風口還是泡沫?

什么是“模型即Agent”?為何大模型公司都趨之若鶩?

文|IT時報記者 賈天榮

編輯|錢立富 孫妍

ChatGPT不僅能“說”,更開始“做”了。

7月18日凌晨,Sam Altman攜四位OpenAI研究員在直播中正式發(fā)布ChatGPT Agent——一款通用型AI Agent。這讓許久未有“大動作”的OpenAI,再次引發(fā)關(guān)注。

從功能來看,ChatGPT Agent與市面上已有的Agent產(chǎn)品相差不大,能做表格、查資料、執(zhí)行任務(wù),但仍有許多人將其視為OpenAI的又一次“王炸”,因為它驗證了一個正在成為主流的新方向——模型即Agent。

今年以來,越來越多的大模型公司押注“模型即Agent”概念,xAI、月之暗面(Kimi)、零一萬物、阿里云先后推出的新產(chǎn)品,都或多或少與它有關(guān)。

什么是“模型即Agent”?為何大模型公司都趨之若鶩?

“模型即Agent” 通往AGI的必經(jīng)之路?

2025年之前,大模型和Agent似乎走的是兩條路。

慣常的解釋是,大語言模型像一個知識淵博的助手,能夠回答問題和生成文本,但缺乏主動性和執(zhí)行力;“Agent智能體”則更像一個目標明確、具備獨立思考能力的虛擬員工,不僅能夠理解需求,還能主動行動、執(zhí)行任務(wù),甚至與外部環(huán)境互動。

以去年廣受關(guān)注的全球首款通用AI助手Manus為例,它通過調(diào)用多個底層模型,實現(xiàn)了從規(guī)劃到執(zhí)行、再到輸出的閉環(huán)能力,就像將多個工具整合在一個智能體內(nèi),雖然是個“縫合怪”,但“縫合”水平還不錯。

不過,彼時便有業(yè)內(nèi)人士指出,通用智能體的壁壘并不高。面壁智能聯(lián)合創(chuàng)始人、CEO李大海曾提到:“每當大模型版本迎來質(zhì)的飛躍時,往往會吞沒上一代模型所支撐的全部應用生態(tài)?!?/p>

2025年,“模型即Agent”的路徑越來越明顯。

所謂“模型即Agent”,是指大模型本身成為Agent的核心大腦和驅(qū)動引擎,與過去依賴復雜工作流編排或外部模型整合不同,AI將從單純的“能說會道”進化為“能做會干”,這種轉(zhuǎn)變使得AI成為能夠?qū)嶋H幫助用戶完成任務(wù)的智能助手。

以ChatGPT Agent為例,不同于Manus,它在單一模型內(nèi)部完成了所有技能調(diào)用與任務(wù)執(zhí)行的全過程。在這一過程中,用戶可以實時看到AI在虛擬電腦上的操作路徑,體驗它從理解需求、選擇工具、執(zhí)行操作到交付結(jié)果的全過程。這種“可觀察、可互動”的Agent形態(tài),正是OpenAI在技術(shù)底座上的獨特創(chuàng)新。

此前,全球公認編程能力最強的大模型是Anthropic的Claude 4系列,它在編程、推理和Agent方面“樹立了全新標準”,能夠處理復雜且長時間運行的任務(wù),甚至很多智能體的背后就是“套殼”Claude 4。

這也讓Claude 4成為“眾矢之的”。7月9日,馬斯克旗下的人工智能初創(chuàng)公司xAI發(fā)布新一代大模型Grok 4,包括單智能體、多智能體兩個版本,具備工具使用、實時搜索等功能,對標的正是Claude 4 Opus。

國內(nèi)不少大模型公司業(yè)已轉(zhuǎn)向。

去年年底,面壁智能聯(lián)合清華大學發(fā)布了新一代主動Agent交互范式,Agent不再是簡單的指令執(zhí)行者,而是升級為具有“眼力見”的智能助手。李大海認為,模型本身而非工作流,才是未來AI智能體的發(fā)展方向,“模型即Agent,模型即產(chǎn)品,模型即交互”。

今年7月11日,月之暗面時隔半年推出新一代基座模型Kimi K2,據(jù)官方介紹,Kimi K2是一款具備更強代碼能力、更擅長通用Agent任務(wù)的MoE架構(gòu)基礎(chǔ)模型,模型自身就集成了自主決策和執(zhí)行任務(wù)的能力,能夠作為智能體解決復雜任務(wù)。

7月23日清晨,阿里開源全新的通義千問AI編程大模型Qwen3-Coder,同樣強調(diào)Agent能力,尤為擅長解決多步驟的長任務(wù),不僅能通觀全局自主安排工作內(nèi)容,支持Agent調(diào)用各種工具深入鉆研,最終解決復雜編程任務(wù)。

“幻覺或許不是壞事”

這些大模型公司,為什么都押注“模型即Agent”?

“‘模型即Agent’這個概念體現(xiàn)了我們對AI認知的根本轉(zhuǎn)變,不僅僅是技術(shù)架構(gòu)的變化,更是人機協(xié)作關(guān)系的變化。”特贊科技 Tezign 創(chuàng)始人及 CEO范凌告訴《IT時報》記者,在他看來,“模型即Agent”的核心價值在于大語言模型可以模擬真實用戶行為,AI不僅能回答問題,更能主動構(gòu)建用戶畫像、驅(qū)動決策流程。

比如,如果將《哈利·波特》所有故事輸入到大語言模型里,那大語言模型可以變成“哈利·波特”,甚至模擬哈利·波特來想問題。

這種邏輯的更迭會給行業(yè)帶來一個顯著的變化,就是Agent要從“工具思維”向“協(xié)作伙伴思維”轉(zhuǎn)變,甚至會對以往的一些AI認知形成沖擊?!耙郧叭藗儞幕糜X,但實際上幻覺反而可能是好事,當我們需要AI能夠主動思考時,那么在推理層面,要從現(xiàn)在的‘收斂優(yōu)先’轉(zhuǎn)向‘發(fā)散優(yōu)先’,盡可能讓AI的思維更開放?!狈读枵J為,這條路是能走通的,但當下的關(guān)鍵在于找準應用場景。

中金研報指出,基礎(chǔ)大模型仍是決定Agent能力上限的關(guān)鍵,大模型的編程及智能體能力是各家廠商競爭關(guān)注的焦點。

不過,相較難度更大的“模型即Agent”,C端Agent具有更大的市場想象空間,類似Manus的多智能體協(xié)作模式——通過不同角色的智能體分工,實現(xiàn)多樣化任務(wù)處理,在當前更為普遍。

ChatGPT Agent發(fā)布后,Manus第一時間放出10個實測案例,試圖通過財務(wù)建模、生活規(guī)劃、行程安排、消費購物、航班篩選等不同場景任務(wù),證明ChatGPT Agent在任務(wù)閉環(huán)和可視化交付上并不占優(yōu)。

不過,無論是ChatGPT Agent,還是Manus,當前業(yè)內(nèi)普遍共識是,通用智能體的應用仍處于早期階段,處于業(yè)務(wù)場景探索和技術(shù)驗證的過程中。

Gartner也認為,這一市場仍存在“泡沫”問題,預計到2027年底,超過40%的智能體項目將被取消。

范凌對此表示認同。他認為,正如任何新技術(shù)的發(fā)展過程一樣,Agent領(lǐng)域也會經(jīng)歷“過度期待”和“理性回歸”的周期,“生存的關(guān)鍵在于Agent是否能解決商業(yè)核心問題,同時要在技術(shù)和成本之間找到平衡。在Atypica.AI實踐中,我們發(fā)現(xiàn),AI能夠直接交付結(jié)果時,用戶的付費意愿顯著提升”。

市場格局已變

AI技術(shù)還在加速奔跑,但現(xiàn)實情況是,2025年以來,大模型公司所處的市場格局已經(jīng)發(fā)生巨大的變化。

年初,DeepSeek憑借低成本、高性能的開源模型強勢入場。去年備受關(guān)注的“六小虎”——智譜AI、MiniMax、月之暗面、階躍星辰、百川智能和零一萬物,融資、流量以及市場份額方面都出現(xiàn)了不同程度的變化。除智譜AI和階躍星辰外,其余幾家公司自2024年下半年以來便未再獲得融資。

與此同時,用戶流失、高管出走、裁撤業(yè)務(wù)線等消息也伴隨而來,特別是零一萬物和百川智能,早早放棄了基座大模型訓練,并進行了戰(zhàn)略收縮,百川智能聚焦于AI醫(yī)療,而零一萬物則重點押注AI行業(yè)落地。

能夠直接“動手”的智能體,成為全球科技圈最快形成共識的第二個風口,市場咨詢機構(gòu)Gartner將AI Agent列為2025年十大戰(zhàn)略技術(shù)趨勢之首。

對于如何實現(xiàn)AI Agent,有人向左,有人向右。

早在今年年初,《IT時報》記者就Agent的未來采訪了多位行業(yè)專家,泛微副總裁楊國生彼時接受《IT時報》記者采訪時表示,通用大模型應用于垂直領(lǐng)域時,其穩(wěn)定性難以令人滿意,這意味著,在B端市場,精準度尤為關(guān)鍵,“需要大量的工程技術(shù)介入,才能確保其真正實現(xiàn)企業(yè)級應用的效果”。

如今半年過去,Agent仍然是風口,但似乎又不是那個Agent。

“今年以來,Agent領(lǐng)域出現(xiàn)了根本變化?!狈读柚赋?,在特贊的Atypica.AI實踐中,他發(fā)現(xiàn)很多人仍將Agent視為傳統(tǒng)工具的升級版,但實際上,Agent的內(nèi)涵早已發(fā)生了變革,尤其隨著大模型的推理能力得到顯著提升后,可以結(jié)合多種工具調(diào)用直接給出執(zhí)行結(jié)果,Multi-Agent(多智能體)將是一個更大的機會。

不過范凌也認為,通用Agent并不能“包打天下”,當技術(shù)遇到未被滿足的需求,就有了生長的土壤,垂直Agent的價值在于它能解決特定的行業(yè)痛點。

便捷與風險并存

與此同時,一些風險也不容小覷。

從技術(shù)角度看,AI模型可能面臨偏差風險。例如,算法歧視可能導致不公平結(jié)果,訓練數(shù)據(jù)不足或應用不當也可能導致模型失效。此外,網(wǎng)絡(luò)安全問題也不容忽視,DeepSeek便曾遭遇過DDoS攻擊。

《IT時報》記者也注意到,OpenAI在發(fā)布ChatGPT Agent后,隨即發(fā)布了長篇警告,提示用戶使用AI Agent可能帶來的風險。雖然ChatGPT Agent在處理復雜任務(wù)方面表現(xiàn)強大,但OpenAI強調(diào),產(chǎn)品的潛在風險仍然存在。例如,不法分子可能嘗試“誘騙”AI代理提供不該提供的私人信息,或采取不當行動。

為此,OpenAI加強了對高風險任務(wù)的控制,推出了多項安全措施:關(guān)鍵操作必須經(jīng)過用戶明確授權(quán);高風險任務(wù)(如發(fā)送郵件)需要啟用“監(jiān)督模式”,要求用戶全程監(jiān)控;對于銀行轉(zhuǎn)賬等高風險指令,AI會主動拒絕執(zhí)行;用戶可以隨時清除瀏覽數(shù)據(jù)并注銷會話,或在不聯(lián)網(wǎng)的情況下禁用連接器。

達觀數(shù)據(jù)CEO陳運文也坦言,AI Agent的全民普及仍面臨瓶頸。大眾對其功能和價值的理解不深,接受度較低,且專業(yè)人才匱乏,尤其缺少既懂技術(shù)、產(chǎn)品,又熟悉商業(yè)和生態(tài)的復合型人才。同時,在倫理、法律與安全方面,AI決策往往缺乏可解釋性,責任歸屬不清晰,且存在隱私泄露和被攻擊的風險。

無論如何,ChatGPT Agent仍需在解決實際問題上更進一步,AGI(通用人工智能)依然是眾所矚目的“星辰大?!?,而屢次跳票的GPT-5,是“全村的希望”。

排版/ 季嘉穎

 
本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

AI Agent是2025年最大風口還是泡沫?

什么是“模型即Agent”?為何大模型公司都趨之若鶩?

文|IT時報記者 賈天榮

編輯|錢立富 孫妍

ChatGPT不僅能“說”,更開始“做”了。

7月18日凌晨,Sam Altman攜四位OpenAI研究員在直播中正式發(fā)布ChatGPT Agent——一款通用型AI Agent。這讓許久未有“大動作”的OpenAI,再次引發(fā)關(guān)注。

從功能來看,ChatGPT Agent與市面上已有的Agent產(chǎn)品相差不大,能做表格、查資料、執(zhí)行任務(wù),但仍有許多人將其視為OpenAI的又一次“王炸”,因為它驗證了一個正在成為主流的新方向——模型即Agent。

今年以來,越來越多的大模型公司押注“模型即Agent”概念,xAI、月之暗面(Kimi)、零一萬物、阿里云先后推出的新產(chǎn)品,都或多或少與它有關(guān)。

什么是“模型即Agent”?為何大模型公司都趨之若鶩?

“模型即Agent” 通往AGI的必經(jīng)之路?

2025年之前,大模型和Agent似乎走的是兩條路。

慣常的解釋是,大語言模型像一個知識淵博的助手,能夠回答問題和生成文本,但缺乏主動性和執(zhí)行力;“Agent智能體”則更像一個目標明確、具備獨立思考能力的虛擬員工,不僅能夠理解需求,還能主動行動、執(zhí)行任務(wù),甚至與外部環(huán)境互動。

以去年廣受關(guān)注的全球首款通用AI助手Manus為例,它通過調(diào)用多個底層模型,實現(xiàn)了從規(guī)劃到執(zhí)行、再到輸出的閉環(huán)能力,就像將多個工具整合在一個智能體內(nèi),雖然是個“縫合怪”,但“縫合”水平還不錯。

不過,彼時便有業(yè)內(nèi)人士指出,通用智能體的壁壘并不高。面壁智能聯(lián)合創(chuàng)始人、CEO李大海曾提到:“每當大模型版本迎來質(zhì)的飛躍時,往往會吞沒上一代模型所支撐的全部應用生態(tài)。”

2025年,“模型即Agent”的路徑越來越明顯。

所謂“模型即Agent”,是指大模型本身成為Agent的核心大腦和驅(qū)動引擎,與過去依賴復雜工作流編排或外部模型整合不同,AI將從單純的“能說會道”進化為“能做會干”,這種轉(zhuǎn)變使得AI成為能夠?qū)嶋H幫助用戶完成任務(wù)的智能助手。

以ChatGPT Agent為例,不同于Manus,它在單一模型內(nèi)部完成了所有技能調(diào)用與任務(wù)執(zhí)行的全過程。在這一過程中,用戶可以實時看到AI在虛擬電腦上的操作路徑,體驗它從理解需求、選擇工具、執(zhí)行操作到交付結(jié)果的全過程。這種“可觀察、可互動”的Agent形態(tài),正是OpenAI在技術(shù)底座上的獨特創(chuàng)新。

此前,全球公認編程能力最強的大模型是Anthropic的Claude 4系列,它在編程、推理和Agent方面“樹立了全新標準”,能夠處理復雜且長時間運行的任務(wù),甚至很多智能體的背后就是“套殼”Claude 4。

這也讓Claude 4成為“眾矢之的”。7月9日,馬斯克旗下的人工智能初創(chuàng)公司xAI發(fā)布新一代大模型Grok 4,包括單智能體、多智能體兩個版本,具備工具使用、實時搜索等功能,對標的正是Claude 4 Opus。

國內(nèi)不少大模型公司業(yè)已轉(zhuǎn)向。

去年年底,面壁智能聯(lián)合清華大學發(fā)布了新一代主動Agent交互范式,Agent不再是簡單的指令執(zhí)行者,而是升級為具有“眼力見”的智能助手。李大海認為,模型本身而非工作流,才是未來AI智能體的發(fā)展方向,“模型即Agent,模型即產(chǎn)品,模型即交互”。

今年7月11日,月之暗面時隔半年推出新一代基座模型Kimi K2,據(jù)官方介紹,Kimi K2是一款具備更強代碼能力、更擅長通用Agent任務(wù)的MoE架構(gòu)基礎(chǔ)模型,模型自身就集成了自主決策和執(zhí)行任務(wù)的能力,能夠作為智能體解決復雜任務(wù)。

7月23日清晨,阿里開源全新的通義千問AI編程大模型Qwen3-Coder,同樣強調(diào)Agent能力,尤為擅長解決多步驟的長任務(wù),不僅能通觀全局自主安排工作內(nèi)容,支持Agent調(diào)用各種工具深入鉆研,最終解決復雜編程任務(wù)。

“幻覺或許不是壞事”

這些大模型公司,為什么都押注“模型即Agent”?

“‘模型即Agent’這個概念體現(xiàn)了我們對AI認知的根本轉(zhuǎn)變,不僅僅是技術(shù)架構(gòu)的變化,更是人機協(xié)作關(guān)系的變化?!碧刭澘萍?Tezign 創(chuàng)始人及 CEO范凌告訴《IT時報》記者,在他看來,“模型即Agent”的核心價值在于大語言模型可以模擬真實用戶行為,AI不僅能回答問題,更能主動構(gòu)建用戶畫像、驅(qū)動決策流程。

比如,如果將《哈利·波特》所有故事輸入到大語言模型里,那大語言模型可以變成“哈利·波特”,甚至模擬哈利·波特來想問題。

這種邏輯的更迭會給行業(yè)帶來一個顯著的變化,就是Agent要從“工具思維”向“協(xié)作伙伴思維”轉(zhuǎn)變,甚至會對以往的一些AI認知形成沖擊?!耙郧叭藗儞幕糜X,但實際上幻覺反而可能是好事,當我們需要AI能夠主動思考時,那么在推理層面,要從現(xiàn)在的‘收斂優(yōu)先’轉(zhuǎn)向‘發(fā)散優(yōu)先’,盡可能讓AI的思維更開放?!狈读枵J為,這條路是能走通的,但當下的關(guān)鍵在于找準應用場景。

中金研報指出,基礎(chǔ)大模型仍是決定Agent能力上限的關(guān)鍵,大模型的編程及智能體能力是各家廠商競爭關(guān)注的焦點。

不過,相較難度更大的“模型即Agent”,C端Agent具有更大的市場想象空間,類似Manus的多智能體協(xié)作模式——通過不同角色的智能體分工,實現(xiàn)多樣化任務(wù)處理,在當前更為普遍。

ChatGPT Agent發(fā)布后,Manus第一時間放出10個實測案例,試圖通過財務(wù)建模、生活規(guī)劃、行程安排、消費購物、航班篩選等不同場景任務(wù),證明ChatGPT Agent在任務(wù)閉環(huán)和可視化交付上并不占優(yōu)。

不過,無論是ChatGPT Agent,還是Manus,當前業(yè)內(nèi)普遍共識是,通用智能體的應用仍處于早期階段,處于業(yè)務(wù)場景探索和技術(shù)驗證的過程中。

Gartner也認為,這一市場仍存在“泡沫”問題,預計到2027年底,超過40%的智能體項目將被取消。

范凌對此表示認同。他認為,正如任何新技術(shù)的發(fā)展過程一樣,Agent領(lǐng)域也會經(jīng)歷“過度期待”和“理性回歸”的周期,“生存的關(guān)鍵在于Agent是否能解決商業(yè)核心問題,同時要在技術(shù)和成本之間找到平衡。在Atypica.AI實踐中,我們發(fā)現(xiàn),AI能夠直接交付結(jié)果時,用戶的付費意愿顯著提升”。

市場格局已變

AI技術(shù)還在加速奔跑,但現(xiàn)實情況是,2025年以來,大模型公司所處的市場格局已經(jīng)發(fā)生巨大的變化。

年初,DeepSeek憑借低成本、高性能的開源模型強勢入場。去年備受關(guān)注的“六小虎”——智譜AI、MiniMax、月之暗面、階躍星辰、百川智能和零一萬物,融資、流量以及市場份額方面都出現(xiàn)了不同程度的變化。除智譜AI和階躍星辰外,其余幾家公司自2024年下半年以來便未再獲得融資。

與此同時,用戶流失、高管出走、裁撤業(yè)務(wù)線等消息也伴隨而來,特別是零一萬物和百川智能,早早放棄了基座大模型訓練,并進行了戰(zhàn)略收縮,百川智能聚焦于AI醫(yī)療,而零一萬物則重點押注AI行業(yè)落地。

能夠直接“動手”的智能體,成為全球科技圈最快形成共識的第二個風口,市場咨詢機構(gòu)Gartner將AI Agent列為2025年十大戰(zhàn)略技術(shù)趨勢之首。

對于如何實現(xiàn)AI Agent,有人向左,有人向右。

早在今年年初,《IT時報》記者就Agent的未來采訪了多位行業(yè)專家,泛微副總裁楊國生彼時接受《IT時報》記者采訪時表示,通用大模型應用于垂直領(lǐng)域時,其穩(wěn)定性難以令人滿意,這意味著,在B端市場,精準度尤為關(guān)鍵,“需要大量的工程技術(shù)介入,才能確保其真正實現(xiàn)企業(yè)級應用的效果”。

如今半年過去,Agent仍然是風口,但似乎又不是那個Agent。

“今年以來,Agent領(lǐng)域出現(xiàn)了根本變化。”范凌指出,在特贊的Atypica.AI實踐中,他發(fā)現(xiàn)很多人仍將Agent視為傳統(tǒng)工具的升級版,但實際上,Agent的內(nèi)涵早已發(fā)生了變革,尤其隨著大模型的推理能力得到顯著提升后,可以結(jié)合多種工具調(diào)用直接給出執(zhí)行結(jié)果,Multi-Agent(多智能體)將是一個更大的機會。

不過范凌也認為,通用Agent并不能“包打天下”,當技術(shù)遇到未被滿足的需求,就有了生長的土壤,垂直Agent的價值在于它能解決特定的行業(yè)痛點。

便捷與風險并存

與此同時,一些風險也不容小覷。

從技術(shù)角度看,AI模型可能面臨偏差風險。例如,算法歧視可能導致不公平結(jié)果,訓練數(shù)據(jù)不足或應用不當也可能導致模型失效。此外,網(wǎng)絡(luò)安全問題也不容忽視,DeepSeek便曾遭遇過DDoS攻擊。

《IT時報》記者也注意到,OpenAI在發(fā)布ChatGPT Agent后,隨即發(fā)布了長篇警告,提示用戶使用AI Agent可能帶來的風險。雖然ChatGPT Agent在處理復雜任務(wù)方面表現(xiàn)強大,但OpenAI強調(diào),產(chǎn)品的潛在風險仍然存在。例如,不法分子可能嘗試“誘騙”AI代理提供不該提供的私人信息,或采取不當行動。

為此,OpenAI加強了對高風險任務(wù)的控制,推出了多項安全措施:關(guān)鍵操作必須經(jīng)過用戶明確授權(quán);高風險任務(wù)(如發(fā)送郵件)需要啟用“監(jiān)督模式”,要求用戶全程監(jiān)控;對于銀行轉(zhuǎn)賬等高風險指令,AI會主動拒絕執(zhí)行;用戶可以隨時清除瀏覽數(shù)據(jù)并注銷會話,或在不聯(lián)網(wǎng)的情況下禁用連接器。

達觀數(shù)據(jù)CEO陳運文也坦言,AI Agent的全民普及仍面臨瓶頸。大眾對其功能和價值的理解不深,接受度較低,且專業(yè)人才匱乏,尤其缺少既懂技術(shù)、產(chǎn)品,又熟悉商業(yè)和生態(tài)的復合型人才。同時,在倫理、法律與安全方面,AI決策往往缺乏可解釋性,責任歸屬不清晰,且存在隱私泄露和被攻擊的風險。

無論如何,ChatGPT Agent仍需在解決實際問題上更進一步,AGI(通用人工智能)依然是眾所矚目的“星辰大?!?,而屢次跳票的GPT-5,是“全村的希望”。

排版/ 季嘉穎

 
本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。