四虎AV成人在线观看|免费免费特黄的欧美大片|人妻丝袜中文字幕一区三区|性爱一级二级三级|日本黄色视频在线观看免费|亚洲午夜天堂超碰大香蕉中出|国产日韩三级黄色AV一区二区三区|a片网站在线观看视频|人人AV播放日韩操在线|国产伦清品一区二区三区

正在閱讀:

深度解析2026 GTC:英偉達(dá)萬億訂單背后的AI大爆發(fā)、Token經(jīng)濟(jì)學(xué)與失衡供應(yīng)鏈

掃一掃下載界面新聞APP

深度解析2026 GTC:英偉達(dá)萬億訂單背后的AI大爆發(fā)、Token經(jīng)濟(jì)學(xué)與失衡供應(yīng)鏈

“AI的五層蛋糕”。

文 | 硅谷101 陳茜

1萬億美元,這是接下來21個月,英偉達(dá)GPU訂單的收入預(yù)期。

剛過去的GTC大會,黃仁勛開始停止了講芯片的故事。他開始瞄準(zhǔn)更大的敘事:token經(jīng)濟(jì),而這將是更有野心且更持久的市場蛋糕。

本篇文章,我們將拆解英偉達(dá)的五層蛋糕生態(tài)體系。一萬億美元收入是怎么算出來的?基于Groq的LPU將給英偉達(dá)帶來什么新的機(jī)會?還有黃仁勛在光通信上的提前布局與未來Scale-across(跨區(qū)域擴(kuò)展)的AI工廠機(jī)會。以及OpenClaw的里程碑后,英偉達(dá)押注的token經(jīng)濟(jì)學(xué)將會如何發(fā)展,給算力市場將帶來如何的挑戰(zhàn)呢?

01 推理拐點已至,多模態(tài)+OpenClaw

2026年的英偉達(dá)的GTC敘事建立在兩個背景和事件:一是AI應(yīng)用得到落地;二是OpenClaw的爆火帶動了全球的agent生態(tài)。這讓黃仁勛在GTC演講中高呼,推理拐點已經(jīng)到來。

新云(Neocloud)廠商GMI Cloud創(chuàng)始人Alex Yeh在跟我們對話中就透露,北美的需求暴增是來自多模態(tài)和編程,而OpenClaw帶來的token需求則主要來自中國。

Alex Yeh

GMI Cloud創(chuàng)始人

Token(詞元)的推理使用量一直在暴增,而且是以倍數(shù)的方式在增長。我們的客戶也從大型的訓(xùn)練客戶轉(zhuǎn)到很多推理需要的邊緣端的節(jié)點。(美國這邊)一個是以代碼生成為首的推理調(diào)量,另一個是多模態(tài)的視頻和圖片生成,這兩個發(fā)展的速度都太快了。我覺得在OpenClaw這一塊,美國的市場事實上還沒有意識到這個影響究竟有多大。

Alex的觀察和我們最近在硅谷與很多業(yè)內(nèi)人士的探討是相似的,因為北美用戶,特別是有技術(shù)背景的開發(fā)者已經(jīng)很適應(yīng)用Claude Cowork去做一些agent任務(wù)。所以雖然OpenClaw是從硅谷火出圈的,但遠(yuǎn)沒有到國內(nèi)那么卷的程度。

Alex Yeh

GMI Cloud創(chuàng)始人

我覺得OpenClaw是從國內(nèi)火到這邊來,可是國內(nèi)已經(jīng)先開始一波了,現(xiàn)在也是在Mac mini或者DGX Spark上跑,可是我覺得這不是一個常態(tài)。因為這東西絕對之后都是上云的,畢竟部署一個PC的成本實在是太高。而且我看到很多的硅谷公司已經(jīng)在做一個零代碼、用戶界面非常好用的OpenClaw。隨著開源和閉源的模型越來越好,它的調(diào)用量會越來越高。所以我覺得我們甚至連1%或5%都還沒有到??墒沁@才剛開始,全球(算力)就已經(jīng)沒了,token調(diào)用規(guī)模未來的發(fā)展是超級可怕的。

所以,以上是目前AI發(fā)展現(xiàn)狀的一個大背景。有了推理需求飆升和OpenClaw爆火這兩個趨勢,黃仁勛的整個演講的敘事邏輯就完全和去年不同了:以前英偉達(dá)賣芯片給云廠商和AI公司,而如今,老黃要賣token給全世界每一家公司。

黃仁勛

英偉達(dá)創(chuàng)始人&CEO

每一個企業(yè),全球的每一家軟件公司,都需要一套智能體系統(tǒng),需要一套智能體策略,需要擁有一套OpenClaw策略。

這也是我參加今年老黃keynote的最大感受,看看PPT上面的這些小心心,就知道黃仁勛的姿態(tài)是we love everybody(我們擁抱所有人)。所以,今年GTC的最關(guān)鍵主題是“生態(tài)”,而不是“芯片”。

早在GTC開會的幾天前,英偉達(dá)就放出了一篇名為“AI五層蛋糕”的文章來為大會造勢,預(yù)示黃仁勛在今年大會上強(qiáng)調(diào)的是垂直整合能力和生態(tài),而不是單芯片。

簡單來說,黃仁勛給外界畫了一個更大的餅。我們先來說黃仁勛在GTC演講中提到的一萬億這個數(shù)字。

02 一萬億美元,過于保守還是極度樂觀?

黃仁勛在去年的GTC上說,當(dāng)前和下一代的GPU架構(gòu)Blackwell和Vera Rubin的訂單收入,從當(dāng)時到2026年年底會達(dá)到5000億美元。這次,他將這個預(yù)期直接上調(diào)了一倍,說截止現(xiàn)在,到2027年年底,預(yù)計光是Blackwell和Vera Rubin的訂單收入,會直接到1萬億美元。

要注意,這個收入是不包括英偉達(dá)新發(fā)的CPU和基于Groq的LPU芯片等其他產(chǎn)品線的訂單收入,而光是GPU架構(gòu)的訂單。他在媒體閉門會上專門特別澄清,原因是因為這樣外界能直觀的感受到英偉達(dá)的GPU上的業(yè)務(wù)增長。

黃仁勛

英偉達(dá)創(chuàng)始人&CEO

如果我把這1萬億的業(yè)務(wù)范圍進(jìn)行更改,將CPU、Groq以及存儲包含在內(nèi),那就會把兩件不同的事情混為一談,這樣我在進(jìn)行比較時就不夠簡單直接了。然而,對其他人來說,理解這1萬億的復(fù)雜之處在于:既然英偉達(dá)今天能提供多得多的產(chǎn)品,難道我們是在暗示Blackwell加上Vera Rubin的規(guī)模還不到1萬億嗎?不,情況恰恰相反。

任揚(yáng)

濟(jì)容投資聯(lián)合創(chuàng)始人

首先這個數(shù)字我覺得非常achievable(可實現(xiàn)的)。第二,這個數(shù)字是到現(xiàn)在為止它看到的實實在在的訂單,可能過幾個月咱們回頭再看這個數(shù)字,它還有新的訂單出來,這一萬億的數(shù)字還會往上走。

我覺得從財務(wù)分析角度來說,它的意義就是給2027年的營收和利潤劃了一個底,告訴你這個底在這兒了。然后把它這一萬億的數(shù)字放在模型里面,就能劃出來2027年十三、四塊錢的EPS(每股收益)的底。

而對于各大企業(yè)對算力的CapEx(資本支出),我們的嘉賓認(rèn)為是還將繼續(xù)上漲,一邊是推理需求會繼續(xù)上漲,另一邊的原因是隨著前沿模型的競爭趨于白熱化,訓(xùn)練這邊的需求也不會降低。

圖片來源:Business Insider

任揚(yáng)

濟(jì)容投資聯(lián)合創(chuàng)始人

我覺得百分比的增速會放慢,但是它肯定還是一個快速增長的狀態(tài),而且我覺得每年增長的絕對值數(shù)量不一定會變小。第一,Inference(推理) 的用量現(xiàn)在很明顯看到有一個inflection(拐點),大家對agent的用量和token的消耗量明顯提升。第二,我覺得從模型廠商的角度來說,這幾家前沿實驗室沒有誰能明顯地拉開和其他人的身位,都是在一個交替領(lǐng)先的狀態(tài),包括開源的這些大模型也沒有明顯地比閉源的proprietary(專有)模型落后非常遠(yuǎn)。

我覺得模型廠商后面可能只有兩條路:要不就是往上打,只有做了應(yīng)用之后,做出用戶粘性,通過應(yīng)用去收錢。另外一條路就是,花錢花得比別人更狠,用資產(chǎn)負(fù)債表或者現(xiàn)金流的優(yōu)勢,更大力度地懟算力、懟人才,希望在模型上能有一個突破。OpenAI之前有一段時間是想走這條路,包括去年Sam Altman喊出來1.4萬億這種數(shù)字。

我覺得這兩條路大家都還會繼續(xù)去做,所以對CapEx(資本開支)的投入一定不會小。

為什么黃仁勛今年不強(qiáng)調(diào)單芯片,連Rubin再下一代計算架構(gòu)Feynman也只是略微提了一點?除了老黃要把英偉達(dá)的企業(yè)敘事拔高到“AI factory”以及要給所有人賣token之外,其實還因為產(chǎn)能跟不上,市面上還是瘋狂缺卡?,F(xiàn)在市面上大家根本買不到最先進(jìn)的卡,就連兩三年前發(fā)布的舊卡,H100、H200用了幾年甚至能超原價賣,同時軟件生態(tài)和各種配置也都跟不上老黃的速度,所以他再強(qiáng)調(diào)單卡的性能提升,對市場來說根本沒有意義。

錢宇靖

GMI工程主管

現(xiàn)在市場上最成熟的平臺依然是Hopper最多,Blackwell在最近幾個月開始進(jìn)入大規(guī)模應(yīng)用的階段,并且軟件層也有比較好的進(jìn)步。但是回想一下,Blackwell是在兩年前就已經(jīng)被宣發(fā)了的,所以我覺得是因為現(xiàn)在的產(chǎn)能還是沒有辦法跟當(dāng)時老黃所預(yù)計的產(chǎn)能達(dá)到一致。

所以看起來,光是GPU的售賣,這一萬億美元的收入規(guī)模并不算過度樂觀,而是真有這樣的需求量。但顯然,黃仁勛是不滿足這一萬億的,他布局的是全生態(tài)。當(dāng)token成為大宗商品,“算力即收入”,黃仁勛接下來的動作,是想把他定義中的“AI五層蛋糕”給全部打透,讓英偉達(dá)持續(xù)成為AI產(chǎn)業(yè)線中,持續(xù)最賺錢的機(jī)器。

03 拆解五層蛋糕,同質(zhì)化博弈與生態(tài)護(hù)城河

Chapter 3.1:五層蛋糕與“同質(zhì)化”

黃仁勛定義的AI五層蛋糕,從下到上,分別是能源層(這里是電力等基礎(chǔ)供應(yīng)),之后是芯片層(英偉達(dá)的核心業(yè)務(wù):卡),再之上是基建層(包括云廠商及旗下的數(shù)據(jù)中心,再往細(xì)分就是土地、供電、冷卻系統(tǒng)、建筑工程、網(wǎng)絡(luò)通信等),前三層被統(tǒng)稱為AI工廠(AI factories)。

再往上,模型層有OpenAI、谷歌Gemini和Anthropic這樣的頂尖模型,也有包括英偉達(dá)自研的一系列開源模型。而在應(yīng)用層,則是英偉達(dá)針對不同的賽道研發(fā)技術(shù),包括機(jī)器人、自動駕駛、工業(yè)制造、編程和企業(yè)級AI Agent等等。

你是不是有點疑惑,老黃是在布一盤什么局呢?這五層蛋糕難道每一層英偉達(dá)都能吃透嗎?

任揚(yáng)

濟(jì)容投資聯(lián)合創(chuàng)始人

如果把其他這幾層能commoditize(同質(zhì)化)掉,或者說把他們的利潤打下來,讓利潤就集中到你這一層。這一層里到底誰是瓶頸,稀缺價值到底是集中在哪一層。之前幾年稀缺價值完全是集中在芯片這一層,所以Nvidia吃到了這一輪絕大部分的利潤和蛋糕,但是上面幾層都還是非常有實力的。

我們的嘉賓任楊認(rèn)為,每一層蛋糕中,如果每個玩家水平都差不多,沒有絕對領(lǐng)先或者絕對壟斷者,那么這一層的利潤就會被攤薄,這被稱為“being commoditized”(同質(zhì)化)。議價權(quán)最終還是回到有絕對領(lǐng)先和壟斷的這一層,也就是英偉達(dá)的芯片層。

也就是說,最終黃仁勛還是要靠賣芯片。但在其它層的蛋糕中,英偉達(dá)要扶持起自己的軟件生態(tài),定義規(guī)則。就像打造CUDA這樣的護(hù)城河一樣,一旦在新的市場定義了范式,當(dāng)市場爆發(fā),大家發(fā)現(xiàn)最好用的還是英偉達(dá)的平臺,那最后要買的依然是英偉達(dá)的算力和卡。

比如說,英偉達(dá)看到基建層,像谷歌云和AWS這樣的云廠商有強(qiáng)議價權(quán)之后,又扶持起了CoreWeave和Nebius這樣的Neocloud(新云平臺)來進(jìn)行競爭。再比如說,在模型層,英偉達(dá)各種大小模型開源了一大堆,而且這次黃仁勛專門組織了一場全球最核心的開源模型論壇,就是想在模型這一層,試圖在長期削弱SOTA(State of the Art,最頂尖)的頂級閉源模型的議價權(quán)。而在應(yīng)用層,英偉達(dá)也在研發(fā)自動駕駛和機(jī)器人,等待行業(yè)大規(guī)模爆發(fā),為的就是提前布局生態(tài)位。

任揚(yáng)

濟(jì)容投資聯(lián)合創(chuàng)始人

如果Nvidia能夠鼓勵或者帶領(lǐng)開源社區(qū)快速迭代,把token價格打下來。雖然說Anthropic和OpenAI在賣API、賣inference(推理)、賣token上是賺錢的,但如果開源模型能夠用10%的價格,做到現(xiàn)在的前沿實驗室的這些最先進(jìn)的模型的90%的性能,那這些token的價格一定會被打下來。然后就把賣模型、賣推理、賣token這一層commoditize(同質(zhì)化)掉,整個生態(tài)里面最后賺錢的又回到了Nvidia這邊。

所以老黃正在時刻關(guān)注的其他層級的蛋糕,但最賺錢的,始終還是芯片這一層。所以這一層也是黃仁勛盯得最緊的。而這次的GTC上,傳達(dá)出兩個信號。

Chapter 3.2:基于Groq的ASIC反擊戰(zhàn)

第一個信號就是在芯片層,老黃發(fā)布了基于Groq研發(fā)出的LPU。要知道,對Groq的非獨(dú)家技術(shù)授權(quán)交易是去年12月圣誕節(jié)前后才宣布的,花了200億美元現(xiàn)金,可以說是英偉達(dá)有史以來最大的一起交易。

Groq創(chuàng)始人Jonathan Ross在最新的福布斯雜志采訪中爆料說,和Groq的交易這件事情也是老黃只花了三周就迅速做的決定。

而到如今的GTC才3個月,產(chǎn)品就已經(jīng)出來了,只能說,老黃和英偉達(dá)卷起來真的沒其他人什么事兒了。那么,為什么要“收編”Groq呢?

簡單來說就是GPU架構(gòu),即使強(qiáng)如Vera Rubin,擅長的是高吞吐的并行計算,做prefill(上下文預(yù)處理)和attention(注意力計算)很厲害,但在超高速token生成(decode)這個任務(wù)上就沒那么給力了。因為token生成的特點是只能一個一個的生成,整個過程必然是串行鏈?zhǔn)降?,對每一步延遲極其敏感。

所以,“高吞吐”和“低延遲”本身互相矛盾,很難兩全。而Groq就是這個矛盾的解法。

Graham Steele

英偉達(dá)工作人員

LPX發(fā)揮作用的地方就在于那些極高交互率的場景。單獨(dú)的Rubin非常適合用來處理絕大多數(shù)的推理工作負(fù)載,當(dāng)涉及到超大模型、超長上下文以及極高交互性時,這就是LPX發(fā)揮作用的地方,它能為Vera Rubin提供額外的提升。

Groq通過SRAM(靜態(tài)隨機(jī)存取存儲器)設(shè)計,天生就適合做推理和token生成。就像Groq創(chuàng)始人Ross打動黃仁勛的那個類比,他說強(qiáng)大的GPU就像“18輪大卡車”,但推理任務(wù)就像“最后一公里配送”,本身就更適合更靈活高效的面包車。他對老黃說,如果你要為美國建立一個物流網(wǎng)絡(luò),最佳答案是,18輪卡車和面包車你都需要。

而在OpenClaw之后的Agent時代,老黃通過與Groq的深度技術(shù)與人才合作,解決了token生成的挑戰(zhàn),這是非常關(guān)鍵的一步。而Groq的新芯片融入英偉達(dá)體系后,英偉達(dá)宣稱這將解鎖3000億美金的增量市場,可以說,這200億花得值了。但還有個內(nèi)存上的小難題:SRAM缺點是第一很貴、第二很占面積、第三容量做不大。

單顆Groq 3 LPU只有500MB SRAM,而Rubin GPU是288GB HBM4,差了500多倍,根本存不下萬億參數(shù)的模型。英偉達(dá)的解法是用Dynamo軟件把推理過程拆成兩半,Vera Rubin這邊的GPU負(fù)責(zé)prefill和attention,而Groq負(fù)責(zé)之后decode和token生成。

所以我們看到,一顆Rubin GPU配上8顆Groq 3 LPU,統(tǒng)一為一個推理單元。而Groq 3 LPX整機(jī)把256顆LPU裝進(jìn)一個機(jī)架,能提供128GB SRAM、40PB/s帶寬、315 PFLOPS推理算力和640TB/s互連帶寬。

英偉達(dá)和Groq的這個交易目前還面臨反壟斷的一些潛在調(diào)查,因為涉嫌“變相收購”(雖然這個做法已經(jīng)是硅谷巨頭在AI時代的基本操作了)。但LPU已經(jīng)和三星在合作量產(chǎn)了,預(yù)計今年第三季度出貨,而Vera Rubin機(jī)架已經(jīng)在微軟Azure云上運(yùn)行。

同時,英偉達(dá)聯(lián)手Groq還有一個戰(zhàn)略上的意義,就是打出了ASIC反擊戰(zhàn)。我們之前文章說過,ASIC是專項芯片,雖然不如GPU那么通用,但如今卻是各大科技巨頭自研的重點,以及各個云廠商也都在扶持ASIC芯片的研發(fā)試圖蠶食英偉達(dá)GPU的利潤率和議價權(quán),包括谷歌的TPU也是ASIC芯片,Groq本身也是ASIC芯片。但英偉達(dá)這次告訴外界:我也可以做ASIC芯片,而且還跟我自己的GPU結(jié)合,性能更強(qiáng)哦!

黃仁勛

英偉達(dá)創(chuàng)始人&CEO

但是有了這種架構(gòu),我們將把我們的token生成速度、生成率從200萬提升到7億,實現(xiàn)了350倍的增長。這就是extreme co-design(極致協(xié)同設(shè)計),我們要在垂直方向上進(jìn)行整合與優(yōu)化,然后再在水平方向上將其開放,供所有人享有。

Chapter 3.3:枯木逢春的CPU與備受期待的CPX

我們再來看看芯片層的第二個關(guān)鍵詞:CPU,是不是有種“枯木逢春”的感覺。AI agent時代token經(jīng)濟(jì)的崛起不但救了Groq一命,連老古董CPU也重新成為了香餑餑。

雖然GPU擅長訓(xùn)練和運(yùn)行AI模型,但隨著Agent工作負(fù)載的不斷增長,這些系統(tǒng)需要傳輸海量數(shù)據(jù),并協(xié)調(diào)跨多個智能體的工作流程,這使得CPU在現(xiàn)代AI基礎(chǔ)設(shè)施中的重要性絲毫不亞于GPU。

所以,英偉達(dá)在這次GTC上發(fā)布了Vera CPU,被稱為“全球首款專為代理式AI與強(qiáng)化學(xué)習(xí)時代打造的處理器”,其效率是傳統(tǒng)機(jī)架級CPU的2倍,速度提升50%。包括AI編程明星公司Cursor也為Vera CPU站臺,說提升了他們的整體吞吐量和效率,給客戶帶來了更快速靈敏的編程agent體驗。

Praveen Menon

英偉達(dá)工作人員

這些CPU是專為AI工廠打造的。當(dāng)你們的GPU進(jìn)行推理或強(qiáng)化學(xué)習(xí)訓(xùn)練時,它們會生成大量的軟件代碼,這些代碼需要被評估正確與否,然后反饋需要傳回給GPU。CPU承擔(dān)了評估這些代碼的任務(wù),所以在那個階段,你需要一個非??斓腃PU來向GPU提供評估反饋,這樣GPU就不需要加權(quán)了。這就是為什么我們專門打造這款產(chǎn)品,它具備極高的單核性能以及極大的內(nèi)存帶寬,這樣數(shù)據(jù)就可以無縫移動,并且所有環(huán)節(jié)都能達(dá)到非常出色的機(jī)架級性能效率。所以,將所有這些結(jié)合在一起,就成就了一款非常適合智能體任務(wù)和AI工廠的理想CPU。

在芯片層這里,還有一個秘密武器就是CPX。

這是黃仁勛在去年9月的AI基礎(chǔ)設(shè)施峰會上推出的、專門針對長語境推理進(jìn)行優(yōu)化的芯片,可以說代表了GPU設(shè)計的一個全新類別。這款芯片能夠處理百萬級tokens的軟件編程和生成式視頻,在速度和效率方面實現(xiàn)突破性提升,被外界認(rèn)為能進(jìn)一步穩(wěn)固英偉達(dá)在推理上的優(yōu)勢。

有意思的是,老黃這次的演講中根本沒有提到CPX,也讓業(yè)界很好奇,英偉達(dá)目前在芯片層的這套組合拳:GPU、CPU、LPU、CPX,是否會進(jìn)一步拉開與競爭對手的差距。

任揚(yáng)

濟(jì)容投資聯(lián)合創(chuàng)始人

我的理解是,在根據(jù)不同類型的工作負(fù)載,英偉達(dá)都有能夠拿出來非常好用的產(chǎn)品,放到它的機(jī)柜里面。英偉達(dá)想要提供一個最完整、最全面的服務(wù),想要什么東西我都有,全都買我的東西最方便的感覺。

總結(jié)一下,這五層蛋糕互相支撐但又互相牽制,黃仁勛在做的是要整合這五層,確保英偉達(dá)在每一層都有話語權(quán),無論是扶持甲方的競爭對手,還是自研開源模型,還是在不同領(lǐng)域保持開放合作來定義行業(yè)入口和范式。

英偉達(dá)的敘事早已不是“芯片”而已了,黃仁勛在發(fā)布會上手握單芯片的那些名場面已經(jīng)成為過去。未來,是完整的AI factory,是更宏大的token經(jīng)濟(jì)學(xué)。這讓英偉達(dá)的護(hù)城河也早已超越CUDA,讓競爭對手們更難攻破它的生態(tài)帝國。

04 前沿技術(shù)布道:CPO、太空數(shù)據(jù)中心與Scale-across布局

黃仁勛一直在布局下一個即將爆發(fā)的產(chǎn)業(yè),也對前沿技術(shù)非常的敏銳。他這次在發(fā)布會上沒太多提共封裝光學(xué)CPO,以及數(shù)據(jù)中心中機(jī)組的Scale-up(縱向擴(kuò)容)和Scale-out(橫向擴(kuò)容)。

但英偉達(dá)在3月初分別向光子技術(shù)巨頭Lumentum和Coherent各注資20億美元,并鎖定數(shù)十億美元采購承諾及未來產(chǎn)能權(quán)益。這兩家公司都是CPO的核心供應(yīng)鏈,業(yè)內(nèi)人士認(rèn)為,黃仁勛這是在準(zhǔn)備為下一代“吉瓦級AI工廠”去鋪墊光互聯(lián)的底座。

Cathy Jiang

光學(xué)工程師

一個是Lumentum,它是現(xiàn)在唯一的高功率(400毫瓦)DFB激光器的一個供應(yīng)商,在最近的OFC會議上,它們也提到了一個更高參數(shù)的1瓦強(qiáng)功率的激光器。另外一個是Coherent,這是在硅光光子學(xué)中有很多技術(shù)積累的幾個公司合并在一起的一個公司。這兩家公司,一是他們是美國公司,二是有多年的技術(shù)積累和專利的積累,三是在整個產(chǎn)業(yè)鏈上,這種投資可以幫助這些公司在下一代的技術(shù)中做更多的革新。

這一次它們更多的技術(shù)革新是在封裝方面,比如說2.5D到3D的封裝。但是接下來這兩家公司還在進(jìn)行更多的新技術(shù)的研發(fā),比如說使用更多的光波長一起進(jìn)行通信,進(jìn)一步地增加它的帶寬的密度。還有使用一些更加先進(jìn)的技術(shù),比如說不同的放置激光器的方法,甚至探索一些不同的波段、不同光纖的參數(shù)等等更下一步的技術(shù)革新。

目前產(chǎn)業(yè)里面還在討論Scale-up(縱向擴(kuò)容)和Scale-out(橫向擴(kuò)容),而行業(yè)人士說,黃仁勛已經(jīng)在思考說再下一步,Scale-across(跨域擴(kuò)展),也就是不同數(shù)據(jù)中心的互聯(lián)怎么去解決了。

Cathy Jiang

光學(xué)工程師

對于不同的距離的場景,比如說Scale-up(縱向擴(kuò)容)談?wù)摰氖呛撩琢考墸琒cale-out(橫向擴(kuò)容)討論的是米量級,Scale-across(跨域擴(kuò)展)可能討論的是千米或者更遠(yuǎn)的量級。在這些不同量級之下,什么是一個最優(yōu)的技術(shù)路線?我們還是用現(xiàn)在的波長,還是要換成一個其他的波長?會不會有一個技術(shù)是用現(xiàn)在這種光纖,還是一種中間是空著的光纖?會不會有一個技術(shù)突然出現(xiàn)就砸了場子,把其他的技術(shù)都帶跑了?都是很有意思的一些討論。

當(dāng)然,還有更遙遠(yuǎn)的一些布局,包括在演講中黃仁勛提到的太空數(shù)據(jù)中心等等,我們也寫過一篇文章介紹。

在這篇文章的最后,我還想稍微聊聊整個芯片和數(shù)據(jù)中心供應(yīng)鏈目前的一個情況。如果大家還記得這五層蛋糕,可以看到能源和數(shù)據(jù)中心供應(yīng)鏈的基礎(chǔ)層,決定了芯片的產(chǎn)能,也決定了整個AI模型和應(yīng)用能否得到足夠的算力支撐,也決定了AI的進(jìn)程。

05 供應(yīng)鏈全面吃緊,內(nèi)存與能源的超級周期

我們在GTC期間跟供應(yīng)鏈的朋友聊天,得到的信息是:缺,什么都短缺。

Alex Yeh

GMI Cloud創(chuàng)始人

我們是了解所有的硬件的缺貨情況的,包括從各類元器件到內(nèi)存端的硬件,比如CX7等等子元器件?,F(xiàn)在每一個元器件都開始“亮紅燈”,就是指大缺貨、大漲價,DDR4的DRAM價格,是一年前的10倍?,F(xiàn)在CX7也在缺貨、電源供應(yīng)和CPU也開始在缺貨,各個供應(yīng)鏈都開始缺貨。我看到OpenClaw的起來、agent起來、多模態(tài)的起來以及編程的起來,剛好這三個是一個完美的風(fēng)暴,所有的供應(yīng)鏈就跟不上這個節(jié)奏。

Alex對我們表示,最近全球地緣政治,特別是中東的波動讓能源價格異常波動,這也給全球AI數(shù)據(jù)中心的能源供應(yīng)帶來了更高不確定性,但能源這一部分大概會占到token定價的10%左右,而讓token價格高居不下的,還是供應(yīng)鏈短缺帶來的價格飆升,特別是內(nèi)存方向。

Alex Yeh

GMI Cloud創(chuàng)始人

我覺得影響最大的還是服務(wù)器系統(tǒng)的內(nèi)存的漲價,從而造成token價格的增加。

而我們也在會展現(xiàn)場采訪到了內(nèi)存市場的決定性大贏家三星,他們認(rèn)為,緊缺的狀態(tài)至少要持續(xù)到27年年底。

Candice Hu

Samsung Memory產(chǎn)品營銷經(jīng)理

這個是我們從來沒有看到過的supercycle(超級周期),之前幾年也有,但是那個時候更多是手機(jī)、電腦、互聯(lián)網(wǎng)端的需求,但是今年整個就是AI。我們看到2026年已經(jīng)是完全的售罄,2027年我們認(rèn)為也還是會在緊缺的狀態(tài)。產(chǎn)線我們都已經(jīng)在投入了,但是大概率也要到2028年才能有實質(zhì)性的這么一個上漲。

這個超級周期,很多的采購方都是云端、數(shù)據(jù)中心,他們對于成本的敏感度是比較低的,也比較愿意花錢去買。所以整個內(nèi)存的短缺或者是需求量,我們認(rèn)為在接下來兩年還是會比較強(qiáng)的。

以上就是我們這次的參會體驗啦。給我的感覺是,隨著Agenic時代來臨,非常多的范式會發(fā)生變化,有機(jī)遇也有挑戰(zhàn),而GTC會依然是AI行業(yè)的指路標(biāo),我們也會為大家繼續(xù)關(guān)注以上我們的提到的這些產(chǎn)業(yè)和方向。不知道在一年后的GTC大會,我們的世界會被AI加速多少呢?

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

英偉達(dá)

8.6k
  • 黃仁勛罕見談生死:希望在工作中突然離世,重申不信任“繼任者計劃”
  • 中信證券:建議關(guān)注國內(nèi)頭部AI PCB/覆銅板廠商、存儲廠商等

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

深度解析2026 GTC:英偉達(dá)萬億訂單背后的AI大爆發(fā)、Token經(jīng)濟(jì)學(xué)與失衡供應(yīng)鏈

“AI的五層蛋糕”。

文 | 硅谷101 陳茜

1萬億美元,這是接下來21個月,英偉達(dá)GPU訂單的收入預(yù)期。

剛過去的GTC大會,黃仁勛開始停止了講芯片的故事。他開始瞄準(zhǔn)更大的敘事:token經(jīng)濟(jì),而這將是更有野心且更持久的市場蛋糕。

本篇文章,我們將拆解英偉達(dá)的五層蛋糕生態(tài)體系。一萬億美元收入是怎么算出來的?基于Groq的LPU將給英偉達(dá)帶來什么新的機(jī)會?還有黃仁勛在光通信上的提前布局與未來Scale-across(跨區(qū)域擴(kuò)展)的AI工廠機(jī)會。以及OpenClaw的里程碑后,英偉達(dá)押注的token經(jīng)濟(jì)學(xué)將會如何發(fā)展,給算力市場將帶來如何的挑戰(zhàn)呢?

01 推理拐點已至,多模態(tài)+OpenClaw

2026年的英偉達(dá)的GTC敘事建立在兩個背景和事件:一是AI應(yīng)用得到落地;二是OpenClaw的爆火帶動了全球的agent生態(tài)。這讓黃仁勛在GTC演講中高呼,推理拐點已經(jīng)到來。

新云(Neocloud)廠商GMI Cloud創(chuàng)始人Alex Yeh在跟我們對話中就透露,北美的需求暴增是來自多模態(tài)和編程,而OpenClaw帶來的token需求則主要來自中國。

Alex Yeh

GMI Cloud創(chuàng)始人

Token(詞元)的推理使用量一直在暴增,而且是以倍數(shù)的方式在增長。我們的客戶也從大型的訓(xùn)練客戶轉(zhuǎn)到很多推理需要的邊緣端的節(jié)點。(美國這邊)一個是以代碼生成為首的推理調(diào)量,另一個是多模態(tài)的視頻和圖片生成,這兩個發(fā)展的速度都太快了。我覺得在OpenClaw這一塊,美國的市場事實上還沒有意識到這個影響究竟有多大。

Alex的觀察和我們最近在硅谷與很多業(yè)內(nèi)人士的探討是相似的,因為北美用戶,特別是有技術(shù)背景的開發(fā)者已經(jīng)很適應(yīng)用Claude Cowork去做一些agent任務(wù)。所以雖然OpenClaw是從硅谷火出圈的,但遠(yuǎn)沒有到國內(nèi)那么卷的程度。

Alex Yeh

GMI Cloud創(chuàng)始人

我覺得OpenClaw是從國內(nèi)火到這邊來,可是國內(nèi)已經(jīng)先開始一波了,現(xiàn)在也是在Mac mini或者DGX Spark上跑,可是我覺得這不是一個常態(tài)。因為這東西絕對之后都是上云的,畢竟部署一個PC的成本實在是太高。而且我看到很多的硅谷公司已經(jīng)在做一個零代碼、用戶界面非常好用的OpenClaw。隨著開源和閉源的模型越來越好,它的調(diào)用量會越來越高。所以我覺得我們甚至連1%或5%都還沒有到??墒沁@才剛開始,全球(算力)就已經(jīng)沒了,token調(diào)用規(guī)模未來的發(fā)展是超級可怕的。

所以,以上是目前AI發(fā)展現(xiàn)狀的一個大背景。有了推理需求飆升和OpenClaw爆火這兩個趨勢,黃仁勛的整個演講的敘事邏輯就完全和去年不同了:以前英偉達(dá)賣芯片給云廠商和AI公司,而如今,老黃要賣token給全世界每一家公司。

黃仁勛

英偉達(dá)創(chuàng)始人&CEO

每一個企業(yè),全球的每一家軟件公司,都需要一套智能體系統(tǒng),需要一套智能體策略,需要擁有一套OpenClaw策略。

這也是我參加今年老黃keynote的最大感受,看看PPT上面的這些小心心,就知道黃仁勛的姿態(tài)是we love everybody(我們擁抱所有人)。所以,今年GTC的最關(guān)鍵主題是“生態(tài)”,而不是“芯片”。

早在GTC開會的幾天前,英偉達(dá)就放出了一篇名為“AI五層蛋糕”的文章來為大會造勢,預(yù)示黃仁勛在今年大會上強(qiáng)調(diào)的是垂直整合能力和生態(tài),而不是單芯片。

簡單來說,黃仁勛給外界畫了一個更大的餅。我們先來說黃仁勛在GTC演講中提到的一萬億這個數(shù)字。

02 一萬億美元,過于保守還是極度樂觀?

黃仁勛在去年的GTC上說,當(dāng)前和下一代的GPU架構(gòu)Blackwell和Vera Rubin的訂單收入,從當(dāng)時到2026年年底會達(dá)到5000億美元。這次,他將這個預(yù)期直接上調(diào)了一倍,說截止現(xiàn)在,到2027年年底,預(yù)計光是Blackwell和Vera Rubin的訂單收入,會直接到1萬億美元。

要注意,這個收入是不包括英偉達(dá)新發(fā)的CPU和基于Groq的LPU芯片等其他產(chǎn)品線的訂單收入,而光是GPU架構(gòu)的訂單。他在媒體閉門會上專門特別澄清,原因是因為這樣外界能直觀的感受到英偉達(dá)的GPU上的業(yè)務(wù)增長。

黃仁勛

英偉達(dá)創(chuàng)始人&CEO

如果我把這1萬億的業(yè)務(wù)范圍進(jìn)行更改,將CPU、Groq以及存儲包含在內(nèi),那就會把兩件不同的事情混為一談,這樣我在進(jìn)行比較時就不夠簡單直接了。然而,對其他人來說,理解這1萬億的復(fù)雜之處在于:既然英偉達(dá)今天能提供多得多的產(chǎn)品,難道我們是在暗示Blackwell加上Vera Rubin的規(guī)模還不到1萬億嗎?不,情況恰恰相反。

任揚(yáng)

濟(jì)容投資聯(lián)合創(chuàng)始人

首先這個數(shù)字我覺得非常achievable(可實現(xiàn)的)。第二,這個數(shù)字是到現(xiàn)在為止它看到的實實在在的訂單,可能過幾個月咱們回頭再看這個數(shù)字,它還有新的訂單出來,這一萬億的數(shù)字還會往上走。

我覺得從財務(wù)分析角度來說,它的意義就是給2027年的營收和利潤劃了一個底,告訴你這個底在這兒了。然后把它這一萬億的數(shù)字放在模型里面,就能劃出來2027年十三、四塊錢的EPS(每股收益)的底。

而對于各大企業(yè)對算力的CapEx(資本支出),我們的嘉賓認(rèn)為是還將繼續(xù)上漲,一邊是推理需求會繼續(xù)上漲,另一邊的原因是隨著前沿模型的競爭趨于白熱化,訓(xùn)練這邊的需求也不會降低。

圖片來源:Business Insider

任揚(yáng)

濟(jì)容投資聯(lián)合創(chuàng)始人

我覺得百分比的增速會放慢,但是它肯定還是一個快速增長的狀態(tài),而且我覺得每年增長的絕對值數(shù)量不一定會變小。第一,Inference(推理) 的用量現(xiàn)在很明顯看到有一個inflection(拐點),大家對agent的用量和token的消耗量明顯提升。第二,我覺得從模型廠商的角度來說,這幾家前沿實驗室沒有誰能明顯地拉開和其他人的身位,都是在一個交替領(lǐng)先的狀態(tài),包括開源的這些大模型也沒有明顯地比閉源的proprietary(專有)模型落后非常遠(yuǎn)。

我覺得模型廠商后面可能只有兩條路:要不就是往上打,只有做了應(yīng)用之后,做出用戶粘性,通過應(yīng)用去收錢。另外一條路就是,花錢花得比別人更狠,用資產(chǎn)負(fù)債表或者現(xiàn)金流的優(yōu)勢,更大力度地懟算力、懟人才,希望在模型上能有一個突破。OpenAI之前有一段時間是想走這條路,包括去年Sam Altman喊出來1.4萬億這種數(shù)字。

我覺得這兩條路大家都還會繼續(xù)去做,所以對CapEx(資本開支)的投入一定不會小。

為什么黃仁勛今年不強(qiáng)調(diào)單芯片,連Rubin再下一代計算架構(gòu)Feynman也只是略微提了一點?除了老黃要把英偉達(dá)的企業(yè)敘事拔高到“AI factory”以及要給所有人賣token之外,其實還因為產(chǎn)能跟不上,市面上還是瘋狂缺卡?,F(xiàn)在市面上大家根本買不到最先進(jìn)的卡,就連兩三年前發(fā)布的舊卡,H100、H200用了幾年甚至能超原價賣,同時軟件生態(tài)和各種配置也都跟不上老黃的速度,所以他再強(qiáng)調(diào)單卡的性能提升,對市場來說根本沒有意義。

錢宇靖

GMI工程主管

現(xiàn)在市場上最成熟的平臺依然是Hopper最多,Blackwell在最近幾個月開始進(jìn)入大規(guī)模應(yīng)用的階段,并且軟件層也有比較好的進(jìn)步。但是回想一下,Blackwell是在兩年前就已經(jīng)被宣發(fā)了的,所以我覺得是因為現(xiàn)在的產(chǎn)能還是沒有辦法跟當(dāng)時老黃所預(yù)計的產(chǎn)能達(dá)到一致。

所以看起來,光是GPU的售賣,這一萬億美元的收入規(guī)模并不算過度樂觀,而是真有這樣的需求量。但顯然,黃仁勛是不滿足這一萬億的,他布局的是全生態(tài)。當(dāng)token成為大宗商品,“算力即收入”,黃仁勛接下來的動作,是想把他定義中的“AI五層蛋糕”給全部打透,讓英偉達(dá)持續(xù)成為AI產(chǎn)業(yè)線中,持續(xù)最賺錢的機(jī)器。

03 拆解五層蛋糕,同質(zhì)化博弈與生態(tài)護(hù)城河

Chapter 3.1:五層蛋糕與“同質(zhì)化”

黃仁勛定義的AI五層蛋糕,從下到上,分別是能源層(這里是電力等基礎(chǔ)供應(yīng)),之后是芯片層(英偉達(dá)的核心業(yè)務(wù):卡),再之上是基建層(包括云廠商及旗下的數(shù)據(jù)中心,再往細(xì)分就是土地、供電、冷卻系統(tǒng)、建筑工程、網(wǎng)絡(luò)通信等),前三層被統(tǒng)稱為AI工廠(AI factories)。

再往上,模型層有OpenAI、谷歌Gemini和Anthropic這樣的頂尖模型,也有包括英偉達(dá)自研的一系列開源模型。而在應(yīng)用層,則是英偉達(dá)針對不同的賽道研發(fā)技術(shù),包括機(jī)器人、自動駕駛、工業(yè)制造、編程和企業(yè)級AI Agent等等。

你是不是有點疑惑,老黃是在布一盤什么局呢?這五層蛋糕難道每一層英偉達(dá)都能吃透嗎?

任揚(yáng)

濟(jì)容投資聯(lián)合創(chuàng)始人

如果把其他這幾層能commoditize(同質(zhì)化)掉,或者說把他們的利潤打下來,讓利潤就集中到你這一層。這一層里到底誰是瓶頸,稀缺價值到底是集中在哪一層。之前幾年稀缺價值完全是集中在芯片這一層,所以Nvidia吃到了這一輪絕大部分的利潤和蛋糕,但是上面幾層都還是非常有實力的。

我們的嘉賓任楊認(rèn)為,每一層蛋糕中,如果每個玩家水平都差不多,沒有絕對領(lǐng)先或者絕對壟斷者,那么這一層的利潤就會被攤薄,這被稱為“being commoditized”(同質(zhì)化)。議價權(quán)最終還是回到有絕對領(lǐng)先和壟斷的這一層,也就是英偉達(dá)的芯片層。

也就是說,最終黃仁勛還是要靠賣芯片。但在其它層的蛋糕中,英偉達(dá)要扶持起自己的軟件生態(tài),定義規(guī)則。就像打造CUDA這樣的護(hù)城河一樣,一旦在新的市場定義了范式,當(dāng)市場爆發(fā),大家發(fā)現(xiàn)最好用的還是英偉達(dá)的平臺,那最后要買的依然是英偉達(dá)的算力和卡。

比如說,英偉達(dá)看到基建層,像谷歌云和AWS這樣的云廠商有強(qiáng)議價權(quán)之后,又扶持起了CoreWeave和Nebius這樣的Neocloud(新云平臺)來進(jìn)行競爭。再比如說,在模型層,英偉達(dá)各種大小模型開源了一大堆,而且這次黃仁勛專門組織了一場全球最核心的開源模型論壇,就是想在模型這一層,試圖在長期削弱SOTA(State of the Art,最頂尖)的頂級閉源模型的議價權(quán)。而在應(yīng)用層,英偉達(dá)也在研發(fā)自動駕駛和機(jī)器人,等待行業(yè)大規(guī)模爆發(fā),為的就是提前布局生態(tài)位。

任揚(yáng)

濟(jì)容投資聯(lián)合創(chuàng)始人

如果Nvidia能夠鼓勵或者帶領(lǐng)開源社區(qū)快速迭代,把token價格打下來。雖然說Anthropic和OpenAI在賣API、賣inference(推理)、賣token上是賺錢的,但如果開源模型能夠用10%的價格,做到現(xiàn)在的前沿實驗室的這些最先進(jìn)的模型的90%的性能,那這些token的價格一定會被打下來。然后就把賣模型、賣推理、賣token這一層commoditize(同質(zhì)化)掉,整個生態(tài)里面最后賺錢的又回到了Nvidia這邊。

所以老黃正在時刻關(guān)注的其他層級的蛋糕,但最賺錢的,始終還是芯片這一層。所以這一層也是黃仁勛盯得最緊的。而這次的GTC上,傳達(dá)出兩個信號。

Chapter 3.2:基于Groq的ASIC反擊戰(zhàn)

第一個信號就是在芯片層,老黃發(fā)布了基于Groq研發(fā)出的LPU。要知道,對Groq的非獨(dú)家技術(shù)授權(quán)交易是去年12月圣誕節(jié)前后才宣布的,花了200億美元現(xiàn)金,可以說是英偉達(dá)有史以來最大的一起交易。

Groq創(chuàng)始人Jonathan Ross在最新的福布斯雜志采訪中爆料說,和Groq的交易這件事情也是老黃只花了三周就迅速做的決定。

而到如今的GTC才3個月,產(chǎn)品就已經(jīng)出來了,只能說,老黃和英偉達(dá)卷起來真的沒其他人什么事兒了。那么,為什么要“收編”Groq呢?

簡單來說就是GPU架構(gòu),即使強(qiáng)如Vera Rubin,擅長的是高吞吐的并行計算,做prefill(上下文預(yù)處理)和attention(注意力計算)很厲害,但在超高速token生成(decode)這個任務(wù)上就沒那么給力了。因為token生成的特點是只能一個一個的生成,整個過程必然是串行鏈?zhǔn)降?,對每一步延遲極其敏感。

所以,“高吞吐”和“低延遲”本身互相矛盾,很難兩全。而Groq就是這個矛盾的解法。

Graham Steele

英偉達(dá)工作人員

LPX發(fā)揮作用的地方就在于那些極高交互率的場景。單獨(dú)的Rubin非常適合用來處理絕大多數(shù)的推理工作負(fù)載,當(dāng)涉及到超大模型、超長上下文以及極高交互性時,這就是LPX發(fā)揮作用的地方,它能為Vera Rubin提供額外的提升。

Groq通過SRAM(靜態(tài)隨機(jī)存取存儲器)設(shè)計,天生就適合做推理和token生成。就像Groq創(chuàng)始人Ross打動黃仁勛的那個類比,他說強(qiáng)大的GPU就像“18輪大卡車”,但推理任務(wù)就像“最后一公里配送”,本身就更適合更靈活高效的面包車。他對老黃說,如果你要為美國建立一個物流網(wǎng)絡(luò),最佳答案是,18輪卡車和面包車你都需要。

而在OpenClaw之后的Agent時代,老黃通過與Groq的深度技術(shù)與人才合作,解決了token生成的挑戰(zhàn),這是非常關(guān)鍵的一步。而Groq的新芯片融入英偉達(dá)體系后,英偉達(dá)宣稱這將解鎖3000億美金的增量市場,可以說,這200億花得值了。但還有個內(nèi)存上的小難題:SRAM缺點是第一很貴、第二很占面積、第三容量做不大。

單顆Groq 3 LPU只有500MB SRAM,而Rubin GPU是288GB HBM4,差了500多倍,根本存不下萬億參數(shù)的模型。英偉達(dá)的解法是用Dynamo軟件把推理過程拆成兩半,Vera Rubin這邊的GPU負(fù)責(zé)prefill和attention,而Groq負(fù)責(zé)之后decode和token生成。

所以我們看到,一顆Rubin GPU配上8顆Groq 3 LPU,統(tǒng)一為一個推理單元。而Groq 3 LPX整機(jī)把256顆LPU裝進(jìn)一個機(jī)架,能提供128GB SRAM、40PB/s帶寬、315 PFLOPS推理算力和640TB/s互連帶寬。

英偉達(dá)和Groq的這個交易目前還面臨反壟斷的一些潛在調(diào)查,因為涉嫌“變相收購”(雖然這個做法已經(jīng)是硅谷巨頭在AI時代的基本操作了)。但LPU已經(jīng)和三星在合作量產(chǎn)了,預(yù)計今年第三季度出貨,而Vera Rubin機(jī)架已經(jīng)在微軟Azure云上運(yùn)行。

同時,英偉達(dá)聯(lián)手Groq還有一個戰(zhàn)略上的意義,就是打出了ASIC反擊戰(zhàn)。我們之前文章說過,ASIC是專項芯片,雖然不如GPU那么通用,但如今卻是各大科技巨頭自研的重點,以及各個云廠商也都在扶持ASIC芯片的研發(fā)試圖蠶食英偉達(dá)GPU的利潤率和議價權(quán),包括谷歌的TPU也是ASIC芯片,Groq本身也是ASIC芯片。但英偉達(dá)這次告訴外界:我也可以做ASIC芯片,而且還跟我自己的GPU結(jié)合,性能更強(qiáng)哦!

黃仁勛

英偉達(dá)創(chuàng)始人&CEO

但是有了這種架構(gòu),我們將把我們的token生成速度、生成率從200萬提升到7億,實現(xiàn)了350倍的增長。這就是extreme co-design(極致協(xié)同設(shè)計),我們要在垂直方向上進(jìn)行整合與優(yōu)化,然后再在水平方向上將其開放,供所有人享有。

Chapter 3.3:枯木逢春的CPU與備受期待的CPX

我們再來看看芯片層的第二個關(guān)鍵詞:CPU,是不是有種“枯木逢春”的感覺。AI agent時代token經(jīng)濟(jì)的崛起不但救了Groq一命,連老古董CPU也重新成為了香餑餑。

雖然GPU擅長訓(xùn)練和運(yùn)行AI模型,但隨著Agent工作負(fù)載的不斷增長,這些系統(tǒng)需要傳輸海量數(shù)據(jù),并協(xié)調(diào)跨多個智能體的工作流程,這使得CPU在現(xiàn)代AI基礎(chǔ)設(shè)施中的重要性絲毫不亞于GPU。

所以,英偉達(dá)在這次GTC上發(fā)布了Vera CPU,被稱為“全球首款專為代理式AI與強(qiáng)化學(xué)習(xí)時代打造的處理器”,其效率是傳統(tǒng)機(jī)架級CPU的2倍,速度提升50%。包括AI編程明星公司Cursor也為Vera CPU站臺,說提升了他們的整體吞吐量和效率,給客戶帶來了更快速靈敏的編程agent體驗。

Praveen Menon

英偉達(dá)工作人員

這些CPU是專為AI工廠打造的。當(dāng)你們的GPU進(jìn)行推理或強(qiáng)化學(xué)習(xí)訓(xùn)練時,它們會生成大量的軟件代碼,這些代碼需要被評估正確與否,然后反饋需要傳回給GPU。CPU承擔(dān)了評估這些代碼的任務(wù),所以在那個階段,你需要一個非常快的CPU來向GPU提供評估反饋,這樣GPU就不需要加權(quán)了。這就是為什么我們專門打造這款產(chǎn)品,它具備極高的單核性能以及極大的內(nèi)存帶寬,這樣數(shù)據(jù)就可以無縫移動,并且所有環(huán)節(jié)都能達(dá)到非常出色的機(jī)架級性能效率。所以,將所有這些結(jié)合在一起,就成就了一款非常適合智能體任務(wù)和AI工廠的理想CPU。

在芯片層這里,還有一個秘密武器就是CPX。

這是黃仁勛在去年9月的AI基礎(chǔ)設(shè)施峰會上推出的、專門針對長語境推理進(jìn)行優(yōu)化的芯片,可以說代表了GPU設(shè)計的一個全新類別。這款芯片能夠處理百萬級tokens的軟件編程和生成式視頻,在速度和效率方面實現(xiàn)突破性提升,被外界認(rèn)為能進(jìn)一步穩(wěn)固英偉達(dá)在推理上的優(yōu)勢。

有意思的是,老黃這次的演講中根本沒有提到CPX,也讓業(yè)界很好奇,英偉達(dá)目前在芯片層的這套組合拳:GPU、CPU、LPU、CPX,是否會進(jìn)一步拉開與競爭對手的差距。

任揚(yáng)

濟(jì)容投資聯(lián)合創(chuàng)始人

我的理解是,在根據(jù)不同類型的工作負(fù)載,英偉達(dá)都有能夠拿出來非常好用的產(chǎn)品,放到它的機(jī)柜里面。英偉達(dá)想要提供一個最完整、最全面的服務(wù),想要什么東西我都有,全都買我的東西最方便的感覺。

總結(jié)一下,這五層蛋糕互相支撐但又互相牽制,黃仁勛在做的是要整合這五層,確保英偉達(dá)在每一層都有話語權(quán),無論是扶持甲方的競爭對手,還是自研開源模型,還是在不同領(lǐng)域保持開放合作來定義行業(yè)入口和范式。

英偉達(dá)的敘事早已不是“芯片”而已了,黃仁勛在發(fā)布會上手握單芯片的那些名場面已經(jīng)成為過去。未來,是完整的AI factory,是更宏大的token經(jīng)濟(jì)學(xué)。這讓英偉達(dá)的護(hù)城河也早已超越CUDA,讓競爭對手們更難攻破它的生態(tài)帝國。

04 前沿技術(shù)布道:CPO、太空數(shù)據(jù)中心與Scale-across布局

黃仁勛一直在布局下一個即將爆發(fā)的產(chǎn)業(yè),也對前沿技術(shù)非常的敏銳。他這次在發(fā)布會上沒太多提共封裝光學(xué)CPO,以及數(shù)據(jù)中心中機(jī)組的Scale-up(縱向擴(kuò)容)和Scale-out(橫向擴(kuò)容)。

但英偉達(dá)在3月初分別向光子技術(shù)巨頭Lumentum和Coherent各注資20億美元,并鎖定數(shù)十億美元采購承諾及未來產(chǎn)能權(quán)益。這兩家公司都是CPO的核心供應(yīng)鏈,業(yè)內(nèi)人士認(rèn)為,黃仁勛這是在準(zhǔn)備為下一代“吉瓦級AI工廠”去鋪墊光互聯(lián)的底座。

Cathy Jiang

光學(xué)工程師

一個是Lumentum,它是現(xiàn)在唯一的高功率(400毫瓦)DFB激光器的一個供應(yīng)商,在最近的OFC會議上,它們也提到了一個更高參數(shù)的1瓦強(qiáng)功率的激光器。另外一個是Coherent,這是在硅光光子學(xué)中有很多技術(shù)積累的幾個公司合并在一起的一個公司。這兩家公司,一是他們是美國公司,二是有多年的技術(shù)積累和專利的積累,三是在整個產(chǎn)業(yè)鏈上,這種投資可以幫助這些公司在下一代的技術(shù)中做更多的革新。

這一次它們更多的技術(shù)革新是在封裝方面,比如說2.5D到3D的封裝。但是接下來這兩家公司還在進(jìn)行更多的新技術(shù)的研發(fā),比如說使用更多的光波長一起進(jìn)行通信,進(jìn)一步地增加它的帶寬的密度。還有使用一些更加先進(jìn)的技術(shù),比如說不同的放置激光器的方法,甚至探索一些不同的波段、不同光纖的參數(shù)等等更下一步的技術(shù)革新。

目前產(chǎn)業(yè)里面還在討論Scale-up(縱向擴(kuò)容)和Scale-out(橫向擴(kuò)容),而行業(yè)人士說,黃仁勛已經(jīng)在思考說再下一步,Scale-across(跨域擴(kuò)展),也就是不同數(shù)據(jù)中心的互聯(lián)怎么去解決了。

Cathy Jiang

光學(xué)工程師

對于不同的距離的場景,比如說Scale-up(縱向擴(kuò)容)談?wù)摰氖呛撩琢考?,Scale-out(橫向擴(kuò)容)討論的是米量級,Scale-across(跨域擴(kuò)展)可能討論的是千米或者更遠(yuǎn)的量級。在這些不同量級之下,什么是一個最優(yōu)的技術(shù)路線?我們還是用現(xiàn)在的波長,還是要換成一個其他的波長?會不會有一個技術(shù)是用現(xiàn)在這種光纖,還是一種中間是空著的光纖?會不會有一個技術(shù)突然出現(xiàn)就砸了場子,把其他的技術(shù)都帶跑了?都是很有意思的一些討論。

當(dāng)然,還有更遙遠(yuǎn)的一些布局,包括在演講中黃仁勛提到的太空數(shù)據(jù)中心等等,我們也寫過一篇文章介紹。

在這篇文章的最后,我還想稍微聊聊整個芯片和數(shù)據(jù)中心供應(yīng)鏈目前的一個情況。如果大家還記得這五層蛋糕,可以看到能源和數(shù)據(jù)中心供應(yīng)鏈的基礎(chǔ)層,決定了芯片的產(chǎn)能,也決定了整個AI模型和應(yīng)用能否得到足夠的算力支撐,也決定了AI的進(jìn)程。

05 供應(yīng)鏈全面吃緊,內(nèi)存與能源的超級周期

我們在GTC期間跟供應(yīng)鏈的朋友聊天,得到的信息是:缺,什么都短缺。

Alex Yeh

GMI Cloud創(chuàng)始人

我們是了解所有的硬件的缺貨情況的,包括從各類元器件到內(nèi)存端的硬件,比如CX7等等子元器件?,F(xiàn)在每一個元器件都開始“亮紅燈”,就是指大缺貨、大漲價,DDR4的DRAM價格,是一年前的10倍。現(xiàn)在CX7也在缺貨、電源供應(yīng)和CPU也開始在缺貨,各個供應(yīng)鏈都開始缺貨。我看到OpenClaw的起來、agent起來、多模態(tài)的起來以及編程的起來,剛好這三個是一個完美的風(fēng)暴,所有的供應(yīng)鏈就跟不上這個節(jié)奏。

Alex對我們表示,最近全球地緣政治,特別是中東的波動讓能源價格異常波動,這也給全球AI數(shù)據(jù)中心的能源供應(yīng)帶來了更高不確定性,但能源這一部分大概會占到token定價的10%左右,而讓token價格高居不下的,還是供應(yīng)鏈短缺帶來的價格飆升,特別是內(nèi)存方向。

Alex Yeh

GMI Cloud創(chuàng)始人

我覺得影響最大的還是服務(wù)器系統(tǒng)的內(nèi)存的漲價,從而造成token價格的增加。

而我們也在會展現(xiàn)場采訪到了內(nèi)存市場的決定性大贏家三星,他們認(rèn)為,緊缺的狀態(tài)至少要持續(xù)到27年年底。

Candice Hu

Samsung Memory產(chǎn)品營銷經(jīng)理

這個是我們從來沒有看到過的supercycle(超級周期),之前幾年也有,但是那個時候更多是手機(jī)、電腦、互聯(lián)網(wǎng)端的需求,但是今年整個就是AI。我們看到2026年已經(jīng)是完全的售罄,2027年我們認(rèn)為也還是會在緊缺的狀態(tài)。產(chǎn)線我們都已經(jīng)在投入了,但是大概率也要到2028年才能有實質(zhì)性的這么一個上漲。

這個超級周期,很多的采購方都是云端、數(shù)據(jù)中心,他們對于成本的敏感度是比較低的,也比較愿意花錢去買。所以整個內(nèi)存的短缺或者是需求量,我們認(rèn)為在接下來兩年還是會比較強(qiáng)的。

以上就是我們這次的參會體驗啦。給我的感覺是,隨著Agenic時代來臨,非常多的范式會發(fā)生變化,有機(jī)遇也有挑戰(zhàn),而GTC會依然是AI行業(yè)的指路標(biāo),我們也會為大家繼續(xù)關(guān)注以上我們的提到的這些產(chǎn)業(yè)和方向。不知道在一年后的GTC大會,我們的世界會被AI加速多少呢?

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。