四虎AV成人在线观看|免费免费特黄的欧美大片|人妻丝袜中文字幕一区三区|性爱一级二级三级|日本黄色视频在线观看免费|亚洲午夜天堂超碰大香蕉中出|国产日韩三级黄色AV一区二区三区|a片网站在线观看视频|人人AV播放日韩操在线|国产伦清品一区二区三区

壁仞發(fā)布上市后首份年報,Token變硬通貨,國產(chǎn)GPU廠商黃金窗口來了?

財報披露,壁仞計劃于2026年正式推出下一代BR20X芯片及全系列產(chǎn)品,該系列產(chǎn)品針對推理時代的指數(shù)級算力增長需求進行了優(yōu)化。

3月30日,壁仞科技(06082.HK)發(fā)布了其登陸港交所后的首份全年業(yè)績公告。作為“港股國產(chǎn)GPU第一股”上市后的第一份財報,這份數(shù)據(jù)不僅呈現(xiàn)出單家企業(yè)商業(yè)化能力,也反映出全球AI算力需求的結(jié)構(gòu)性變化。

財報數(shù)據(jù)顯示,2025年壁仞科技實現(xiàn)營業(yè)收入10.35億元人民幣,同比增長207.2%。同期,公司毛利達到5.57億元,同比增幅為210.8%,毛利率穩(wěn)定在53.8%。

在研發(fā)端,壁仞科技持續(xù)保持高壓投入,全年研發(fā)開支達14.76億元,同比增長78.5%。經(jīng)調(diào)整年內(nèi)虧損約為8.74億元,收入的大幅增長開始有效攤薄前期的龐大研發(fā)投入,經(jīng)營杠桿效應(yīng)初步顯現(xiàn)。

截至2025年底,公司持有的現(xiàn)金及金融資產(chǎn)共28.96億元,結(jié)合2026年初IPO凈額56.31億元,總資金儲備超過85億元,為后續(xù)的產(chǎn)能擴張與技術(shù)迭代構(gòu)筑了資金壁壘。

這份成績單之外,壁仞的業(yè)績增長正值全球AI算力需求正經(jīng)歷從“訓(xùn)練”向“推理”轉(zhuǎn)移的關(guān)鍵節(jié)點,當(dāng)行業(yè)競爭焦點從單卡算力轉(zhuǎn)向系統(tǒng)級全棧效率,率先完成“芯片+系統(tǒng)+生態(tài)”閉環(huán)的國產(chǎn)算力企業(yè),已跨越技術(shù)驗證期,正式步入商業(yè)化兌現(xiàn)的黃金窗口。

算力的重構(gòu):推理時代,Token為王

進入2026年,全球AI產(chǎn)業(yè)的底層邏輯正在經(jīng)歷一場結(jié)構(gòu)性重塑。最顯著的特征是,整個行業(yè)正從“訓(xùn)練主導(dǎo)”向“訓(xùn)推并重”的關(guān)鍵轉(zhuǎn)型。

在3月中旬的英偉達GTC 2026大會上,英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛明確指出,代理式(Agent)AI的拐點已經(jīng)到來。

Token也變成了一種硬通貨。

黃仁勛提出了“Token經(jīng)濟學(xué)”的概念,認為未來的數(shù)據(jù)中心不再是存儲文件的電子倉庫,而是不間斷生產(chǎn)Token的巨型工廠。在固定的功率下,誰的每瓦Token吞吐量最高,生產(chǎn)成本就最低。

隨著模型變大,Token的生成速率會降低,因此在這個Token工廠里,吞吐量和Token生成速度將直接轉(zhuǎn)化為企業(yè)明年的精確收入。

黃仁勛預(yù)測,受推理端需求爆發(fā)的驅(qū)動,到2027年全球AI基礎(chǔ)設(shè)施的市場規(guī)模將達到1萬億美元。

實際上,推理時代的核心特征,就是Token消耗量的指數(shù)級膨脹。隨著Agent的加速滲透,模型不再僅僅是進行簡單的單輪對話,而是需要自主規(guī)劃、調(diào)用外部工具、訪問數(shù)據(jù)庫并執(zhí)行多步復(fù)雜任務(wù)。單次Agent調(diào)用往往會觸發(fā)數(shù)十次模型推理,使得后臺的算力消耗呈幾何級數(shù)上升。

這種從“人類調(diào)度模型”向“模型自主運行”的范式轉(zhuǎn)移,構(gòu)成了推理算力需求陡增的底層邏輯。

3月30日,全球最大AI模型API聚合平臺OpenRouter數(shù)據(jù)顯示,上周(指3月23日至29日)全球模型調(diào)用量排名榜中,國產(chǎn)大模型調(diào)用量連續(xù)一個月超過海外模型。

上周模型調(diào)用前九名中,國產(chǎn)模型占六席,總調(diào)用量為9.82T,較此前一周的7.359T增長33.4%。小米MiMo V2 Pro、階躍星辰Step 3.5 Flash、MiniMax M2.5以及DeepSeek V3.2等國產(chǎn)大模型全面霸榜,海外模型上榜企業(yè)仍舊只有Anthropic與Google,總調(diào)用量為2.99T,較此前一周的3.536T降低15.4%。

這一龐大的調(diào)用量不僅是技術(shù)落地的體現(xiàn),更是國內(nèi)應(yīng)用層生態(tài)繁榮的直接反映,意味著海量推理請求正在倒逼底層算力基礎(chǔ)設(shè)施的快速擴容。

在這種結(jié)構(gòu)性變化中,下游客戶對算力的核心訴求發(fā)生了質(zhì)的改變。在過去,市場不計成本地追求高精度浮點運算的單卡峰值算力;在如今的推理時代,核心考量指標轉(zhuǎn)變?yōu)橄到y(tǒng)級全棧效率、能效比與長期運行的穩(wěn)定性。

壁仞2025年的業(yè)績爆發(fā),正是建立在精準卡位這一需求重構(gòu)的基礎(chǔ)之上。

報告期內(nèi),壁仞完成了旗艦通用GPU產(chǎn)品BR106及BR166的全形態(tài)量產(chǎn)與規(guī)模交付。其中,BR166系列于2025年8月開始量產(chǎn),在不到半年的銷售周期內(nèi)迅速落地。

同時,其也在2025年實現(xiàn)了多個千卡級智算集群的交付,包括2048卡光互連光交換GPU超節(jié)點集群和多個市場化的數(shù)千卡級智算集群,而且進一步拓展了高質(zhì)量的客戶群體。

旗艦通用GPU產(chǎn)品的規(guī)?;慨a(chǎn)及交付、多個千卡智算集群的交付以及高質(zhì)量客戶群體的拓展等,直接驅(qū)動了公司智能計算解決方案收入高達205.1%的同比增長,達到10.27億元。

算力通脹下的本土替代窗口

Token需求的爆發(fā)式增長,正向產(chǎn)業(yè)鏈上游傳導(dǎo),引發(fā)了全球范圍內(nèi)的算力通脹。

今年2月,國金證券發(fā)布的研報中預(yù)判,在供需雙側(cè)強邏輯的擠壓下,2026年算力產(chǎn)業(yè)鏈將進入“全鏈通脹”周期。行業(yè)景氣度將從核心芯片向AIDC、云與算力服務(wù)、配套電力設(shè)備及服務(wù)器等環(huán)節(jié)全面外溢。

這種通脹首先體現(xiàn)在云端算力服務(wù)的全面漲價。

2026年第一季度,全球頭部云廠商相繼啟動價格調(diào)整策略。亞馬遜云科技(AWS)將其EC2機器學(xué)習(xí)容量塊(Capacity Blocks for ML)的價格上調(diào)了約15%。谷歌云也宣布自2026年5月1日起,對AI與計算基礎(chǔ)設(shè)施服務(wù)、Cloud等進行全面提價,部分區(qū)域的數(shù)據(jù)傳輸價格漲幅甚至高達60%至100%。

在國內(nèi)市場,多家服務(wù)商也對特定高耗能套餐進行了幅度超過30%的價格上調(diào)。

在硬件核心端,自25Q4起,部分CPU大廠已步入漲價周期。據(jù)國金證券研報援引外媒消息,英特爾與AMD等廠商已正式通知客戶全面上調(diào)服務(wù)器CPU價格,平均漲幅達到10%至15%,且交貨周期大幅拉長。

云服務(wù)與底層硬件提價的根本驅(qū)動力,在于高端AI芯片供應(yīng)鏈的持續(xù)極度緊張。在SEMICON China 2026上,SEMI中國區(qū)總裁馮莉預(yù)測,2026年全球AI基礎(chǔ)設(shè)施支出將達到4500億美元,其中推理算力的占比將首次超過70%,由此將拉動對GPU、HBM及高速網(wǎng)絡(luò)芯片的強勁需求。

然而,供給端的產(chǎn)能擴張卻難以跟上需求的步伐。以HBM為例,2026年HBM市場規(guī)模預(yù)計增長58%至546億美元,盡管三星、SK海力士及美光三大原廠已將70%的新增/可調(diào)配產(chǎn)能傾斜至HBM,但全球HBM產(chǎn)能缺口依然高達50%至60%。

先進封裝與高端顯存的物理產(chǎn)能瓶頸,使得全球高端算力呈現(xiàn)出長期的結(jié)構(gòu)性短缺。

在這一大背景下,具備本土化交付能力與供應(yīng)鏈韌性的國產(chǎn)算力企業(yè),迎來了歷史性的替代窗口期。當(dāng)海外高端算力獲取成本急劇上升且存在供應(yīng)鏈不確定性時,國內(nèi)大模型及智算中心等客戶開始將目光大規(guī)模轉(zhuǎn)向已經(jīng)跨過“好用”拐點的國產(chǎn)算力底座。

壁仞科技在供應(yīng)鏈的前瞻性布局,也成為了其承接這一波替代紅利的護城河。

財報顯示,截至2025年末,壁仞科技的存貨余額達到9.49億元,較上年同期的1.52億元增長520.4%,以應(yīng)對下游旺盛的需求并確保供應(yīng)鏈韌性。

在半導(dǎo)體行業(yè)普遍面臨產(chǎn)能爭奪的當(dāng)下,近10億元的存貨儲備是企業(yè)通過戰(zhàn)略合作與多元化布局鎖定關(guān)鍵產(chǎn)能的直接體現(xiàn)。這種供應(yīng)鏈的韌性,為下游客戶持續(xù)、規(guī)?;乃懔π枨筇峁┝藦妱诺慕桓洞_定性保障。

與此同時,充裕的資金流也為國產(chǎn)算力企業(yè)在通脹周期中的規(guī)模化擴張?zhí)峁┝说讱?。壁仞科技超過85億元的資金儲備,不僅支撐了其龐大的日常研發(fā)開支,也為維持技術(shù)迭代速度與搶占市場份額形成了核心資本壁壘。

這種在資金與供應(yīng)鏈上的雙重保障,是在算力通脹窗口期不可或缺的先決條件。

閉環(huán)加速商業(yè)變現(xiàn)

然而,在算力通脹的搶位戰(zhàn)中,充足的產(chǎn)能與存貨僅僅是拿到了入場券。

在AI應(yīng)用步入推理階段、Agent處理海量數(shù)據(jù)時,單卡算力已無法決定全局。相反,集群互連帶寬、節(jié)點通信效率與底層軟件棧的成熟度,決定了算力系統(tǒng)的整體輸出效能。

算力競爭,已從早期的單點性能比拼轉(zhuǎn)變?yōu)橄到y(tǒng)級工程能力的較量。面對數(shù)千乃至上萬張計算卡組成的智算集群,如何解決數(shù)據(jù)在智能體流程協(xié)調(diào)中的傳輸瓶頸,是所有算力廠商面臨的嚴峻挑戰(zhàn)。

在這一系統(tǒng)級工程領(lǐng)域,壁仞科技2025年的交付數(shù)據(jù)提供了技術(shù)驗證。

報告期內(nèi),壁仞科技交付了多個大規(guī)模智算集群項目,包括2048卡光互連光交換GPU超節(jié)點集群和多個市場化的數(shù)千卡級智算集群。該集群采用了公司與生態(tài)伙伴聯(lián)合發(fā)布的“光躍 LightSphere X”超節(jié)點方案,基于光互連與分布式光交換(dOCS)技術(shù),從物理底層大幅降低了通信延遲并提升了互聯(lián)帶寬。

更為關(guān)鍵的是,在實際的高強度商業(yè)部署中,壁仞科技交付的千卡集群實現(xiàn)了30天無故障運行,且線性加速比超過95%,這一系列硬核指標,驗證了其在支撐大規(guī)模并行計算時的高可用性與系統(tǒng)穩(wěn)定性。

根據(jù)財報,其客戶群體已覆蓋國家級算力平臺、電信運營商、商業(yè)AIDC、AI/大模型公司及垂直領(lǐng)域企業(yè)客戶。

硬件架構(gòu)與集群互連之外,軟件生態(tài)與模型適配效率同樣是算力商業(yè)化的核心壁壘。

軟件生態(tài)建設(shè)上,壁仞科技不斷優(yōu)化對Pytorch、vLLM、SGLang等開源框架和Triton、TileLang等開源生態(tài)的支持,降低客戶遷移成本。同時,持續(xù)推動軟件開源戰(zhàn)略,構(gòu)建自有軟件棧BIRENSUPA?更加廣泛的生態(tài)。

目前,壁仞已全面支持DeepSeek V3/R1系列、MiniMax M2系列、智譜GLM系列以及阿里千問Qwen、階躍星辰Step系列、騰訊混元系列等頭部大模型,并在多個頂尖模型上實現(xiàn)了發(fā)布當(dāng)天的“Day 0”級別全棧適配。

壁仞還與大模型企業(yè)、國家級智算服務(wù)企業(yè)達成戰(zhàn)略合作,組建“國產(chǎn)AI聯(lián)合實驗室”,通過“芯-模-云”一體化的協(xié)同創(chuàng)新,共同攻堅降低AI應(yīng)用單位Token成本的難題。

在這樣一個算力基建加速向商業(yè)化兌現(xiàn)的窗口,壁仞也明確了下一階段的技術(shù)演進路徑。

根據(jù)財報,壁仞計劃于2026年正式推出下一代BR20X芯片及全系列產(chǎn)品。該系列產(chǎn)品專為精準卡位推理時代的指數(shù)級算力增長需求而優(yōu)化,不僅在算力密度、內(nèi)存容量和帶寬、以及互連能力全面升級,還將原生支持FP8與FP4等低精度計算,以期在性能與能效上實現(xiàn)雙重突破。

在集群擴展性層面,BR20X系列將基于自研互連協(xié)議Blink 2.0推出超節(jié)點方案,最大可支持千卡規(guī)模集群的Scale-up,為應(yīng)對未來更大規(guī)模的并行計算提前鋪路。

此外,壁仞科技還將在先進封裝、光互連等技術(shù)上持續(xù)投入,布局突破擴展性路徑的關(guān)鍵路徑。

從底層的自研芯片,到中層的超節(jié)點與光互連集群架構(gòu),再到上層的BIRENSUPA?軟件棧等,壁仞科技“芯片+系統(tǒng)+生態(tài)”的三位一體商業(yè)模式已經(jīng)完成嚴密的邏輯閉環(huán)。

疊加其在AI Agent/AI Coding、生成式AI、金融科技、智能制造、智能教育及智能政務(wù)等垂直領(lǐng)域的端到端場景交付能力,壁仞正以“算力底座”的姿態(tài)深度嵌入各類數(shù)字化轉(zhuǎn)型的真實業(yè)務(wù)中。

當(dāng)?shù)讓铀懔ㄕ嬲M入規(guī)模化的商業(yè)正循環(huán),率先完成全棧閉環(huán)的國產(chǎn)算力企業(yè),正成為托舉國產(chǎn)AI產(chǎn)業(yè)發(fā)展的核心底座。

未經(jīng)正式授權(quán)嚴禁轉(zhuǎn)載本文,侵權(quán)必究。

評論

暫無評論哦,快來評價一下吧!

壁仞發(fā)布上市后首份年報,Token變硬通貨,國產(chǎn)GPU廠商黃金窗口來了?

財報披露,壁仞計劃于2026年正式推出下一代BR20X芯片及全系列產(chǎn)品,該系列產(chǎn)品針對推理時代的指數(shù)級算力增長需求進行了優(yōu)化。

3月30日,壁仞科技(06082.HK)發(fā)布了其登陸港交所后的首份全年業(yè)績公告。作為“港股國產(chǎn)GPU第一股”上市后的第一份財報,這份數(shù)據(jù)不僅呈現(xiàn)出單家企業(yè)商業(yè)化能力,也反映出全球AI算力需求的結(jié)構(gòu)性變化。

財報數(shù)據(jù)顯示,2025年壁仞科技實現(xiàn)營業(yè)收入10.35億元人民幣,同比增長207.2%。同期,公司毛利達到5.57億元,同比增幅為210.8%,毛利率穩(wěn)定在53.8%。

在研發(fā)端,壁仞科技持續(xù)保持高壓投入,全年研發(fā)開支達14.76億元,同比增長78.5%。經(jīng)調(diào)整年內(nèi)虧損約為8.74億元,收入的大幅增長開始有效攤薄前期的龐大研發(fā)投入,經(jīng)營杠桿效應(yīng)初步顯現(xiàn)。

截至2025年底,公司持有的現(xiàn)金及金融資產(chǎn)共28.96億元,結(jié)合2026年初IPO凈額56.31億元,總資金儲備超過85億元,為后續(xù)的產(chǎn)能擴張與技術(shù)迭代構(gòu)筑了資金壁壘。

這份成績單之外,壁仞的業(yè)績增長正值全球AI算力需求正經(jīng)歷從“訓(xùn)練”向“推理”轉(zhuǎn)移的關(guān)鍵節(jié)點,當(dāng)行業(yè)競爭焦點從單卡算力轉(zhuǎn)向系統(tǒng)級全棧效率,率先完成“芯片+系統(tǒng)+生態(tài)”閉環(huán)的國產(chǎn)算力企業(yè),已跨越技術(shù)驗證期,正式步入商業(yè)化兌現(xiàn)的黃金窗口。

算力的重構(gòu):推理時代,Token為王

進入2026年,全球AI產(chǎn)業(yè)的底層邏輯正在經(jīng)歷一場結(jié)構(gòu)性重塑。最顯著的特征是,整個行業(yè)正從“訓(xùn)練主導(dǎo)”向“訓(xùn)推并重”的關(guān)鍵轉(zhuǎn)型。

在3月中旬的英偉達GTC 2026大會上,英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛明確指出,代理式(Agent)AI的拐點已經(jīng)到來。

Token也變成了一種硬通貨。

黃仁勛提出了“Token經(jīng)濟學(xué)”的概念,認為未來的數(shù)據(jù)中心不再是存儲文件的電子倉庫,而是不間斷生產(chǎn)Token的巨型工廠。在固定的功率下,誰的每瓦Token吞吐量最高,生產(chǎn)成本就最低。

隨著模型變大,Token的生成速率會降低,因此在這個Token工廠里,吞吐量和Token生成速度將直接轉(zhuǎn)化為企業(yè)明年的精確收入。

黃仁勛預(yù)測,受推理端需求爆發(fā)的驅(qū)動,到2027年全球AI基礎(chǔ)設(shè)施的市場規(guī)模將達到1萬億美元。

實際上,推理時代的核心特征,就是Token消耗量的指數(shù)級膨脹。隨著Agent的加速滲透,模型不再僅僅是進行簡單的單輪對話,而是需要自主規(guī)劃、調(diào)用外部工具、訪問數(shù)據(jù)庫并執(zhí)行多步復(fù)雜任務(wù)。單次Agent調(diào)用往往會觸發(fā)數(shù)十次模型推理,使得后臺的算力消耗呈幾何級數(shù)上升。

這種從“人類調(diào)度模型”向“模型自主運行”的范式轉(zhuǎn)移,構(gòu)成了推理算力需求陡增的底層邏輯。

3月30日,全球最大AI模型API聚合平臺OpenRouter數(shù)據(jù)顯示,上周(指3月23日至29日)全球模型調(diào)用量排名榜中,國產(chǎn)大模型調(diào)用量連續(xù)一個月超過海外模型。

上周模型調(diào)用前九名中,國產(chǎn)模型占六席,總調(diào)用量為9.82T,較此前一周的7.359T增長33.4%。小米MiMo V2 Pro、階躍星辰Step 3.5 Flash、MiniMax M2.5以及DeepSeek V3.2等國產(chǎn)大模型全面霸榜,海外模型上榜企業(yè)仍舊只有Anthropic與Google,總調(diào)用量為2.99T,較此前一周的3.536T降低15.4%。

這一龐大的調(diào)用量不僅是技術(shù)落地的體現(xiàn),更是國內(nèi)應(yīng)用層生態(tài)繁榮的直接反映,意味著海量推理請求正在倒逼底層算力基礎(chǔ)設(shè)施的快速擴容。

在這種結(jié)構(gòu)性變化中,下游客戶對算力的核心訴求發(fā)生了質(zhì)的改變。在過去,市場不計成本地追求高精度浮點運算的單卡峰值算力;在如今的推理時代,核心考量指標轉(zhuǎn)變?yōu)橄到y(tǒng)級全棧效率、能效比與長期運行的穩(wěn)定性。

壁仞2025年的業(yè)績爆發(fā),正是建立在精準卡位這一需求重構(gòu)的基礎(chǔ)之上。

報告期內(nèi),壁仞完成了旗艦通用GPU產(chǎn)品BR106及BR166的全形態(tài)量產(chǎn)與規(guī)模交付。其中,BR166系列于2025年8月開始量產(chǎn),在不到半年的銷售周期內(nèi)迅速落地。

同時,其也在2025年實現(xiàn)了多個千卡級智算集群的交付,包括2048卡光互連光交換GPU超節(jié)點集群和多個市場化的數(shù)千卡級智算集群,而且進一步拓展了高質(zhì)量的客戶群體。

旗艦通用GPU產(chǎn)品的規(guī)?;慨a(chǎn)及交付、多個千卡智算集群的交付以及高質(zhì)量客戶群體的拓展等,直接驅(qū)動了公司智能計算解決方案收入高達205.1%的同比增長,達到10.27億元。

算力通脹下的本土替代窗口

Token需求的爆發(fā)式增長,正向產(chǎn)業(yè)鏈上游傳導(dǎo),引發(fā)了全球范圍內(nèi)的算力通脹。

今年2月,國金證券發(fā)布的研報中預(yù)判,在供需雙側(cè)強邏輯的擠壓下,2026年算力產(chǎn)業(yè)鏈將進入“全鏈通脹”周期。行業(yè)景氣度將從核心芯片向AIDC、云與算力服務(wù)、配套電力設(shè)備及服務(wù)器等環(huán)節(jié)全面外溢。

這種通脹首先體現(xiàn)在云端算力服務(wù)的全面漲價。

2026年第一季度,全球頭部云廠商相繼啟動價格調(diào)整策略。亞馬遜云科技(AWS)將其EC2機器學(xué)習(xí)容量塊(Capacity Blocks for ML)的價格上調(diào)了約15%。谷歌云也宣布自2026年5月1日起,對AI與計算基礎(chǔ)設(shè)施服務(wù)、Cloud等進行全面提價,部分區(qū)域的數(shù)據(jù)傳輸價格漲幅甚至高達60%至100%。

在國內(nèi)市場,多家服務(wù)商也對特定高耗能套餐進行了幅度超過30%的價格上調(diào)。

在硬件核心端,自25Q4起,部分CPU大廠已步入漲價周期。據(jù)國金證券研報援引外媒消息,英特爾與AMD等廠商已正式通知客戶全面上調(diào)服務(wù)器CPU價格,平均漲幅達到10%至15%,且交貨周期大幅拉長。

云服務(wù)與底層硬件提價的根本驅(qū)動力,在于高端AI芯片供應(yīng)鏈的持續(xù)極度緊張。在SEMICON China 2026上,SEMI中國區(qū)總裁馮莉預(yù)測,2026年全球AI基礎(chǔ)設(shè)施支出將達到4500億美元,其中推理算力的占比將首次超過70%,由此將拉動對GPU、HBM及高速網(wǎng)絡(luò)芯片的強勁需求。

然而,供給端的產(chǎn)能擴張卻難以跟上需求的步伐。以HBM為例,2026年HBM市場規(guī)模預(yù)計增長58%至546億美元,盡管三星、SK海力士及美光三大原廠已將70%的新增/可調(diào)配產(chǎn)能傾斜至HBM,但全球HBM產(chǎn)能缺口依然高達50%至60%。

先進封裝與高端顯存的物理產(chǎn)能瓶頸,使得全球高端算力呈現(xiàn)出長期的結(jié)構(gòu)性短缺。

在這一大背景下,具備本土化交付能力與供應(yīng)鏈韌性的國產(chǎn)算力企業(yè),迎來了歷史性的替代窗口期。當(dāng)海外高端算力獲取成本急劇上升且存在供應(yīng)鏈不確定性時,國內(nèi)大模型及智算中心等客戶開始將目光大規(guī)模轉(zhuǎn)向已經(jīng)跨過“好用”拐點的國產(chǎn)算力底座。

壁仞科技在供應(yīng)鏈的前瞻性布局,也成為了其承接這一波替代紅利的護城河。

財報顯示,截至2025年末,壁仞科技的存貨余額達到9.49億元,較上年同期的1.52億元增長520.4%,以應(yīng)對下游旺盛的需求并確保供應(yīng)鏈韌性。

在半導(dǎo)體行業(yè)普遍面臨產(chǎn)能爭奪的當(dāng)下,近10億元的存貨儲備是企業(yè)通過戰(zhàn)略合作與多元化布局鎖定關(guān)鍵產(chǎn)能的直接體現(xiàn)。這種供應(yīng)鏈的韌性,為下游客戶持續(xù)、規(guī)?;乃懔π枨筇峁┝藦妱诺慕桓洞_定性保障。

與此同時,充裕的資金流也為國產(chǎn)算力企業(yè)在通脹周期中的規(guī)模化擴張?zhí)峁┝说讱?。壁仞科技超過85億元的資金儲備,不僅支撐了其龐大的日常研發(fā)開支,也為維持技術(shù)迭代速度與搶占市場份額形成了核心資本壁壘。

這種在資金與供應(yīng)鏈上的雙重保障,是在算力通脹窗口期不可或缺的先決條件。

閉環(huán)加速商業(yè)變現(xiàn)

然而,在算力通脹的搶位戰(zhàn)中,充足的產(chǎn)能與存貨僅僅是拿到了入場券。

在AI應(yīng)用步入推理階段、Agent處理海量數(shù)據(jù)時,單卡算力已無法決定全局。相反,集群互連帶寬、節(jié)點通信效率與底層軟件棧的成熟度,決定了算力系統(tǒng)的整體輸出效能。

算力競爭,已從早期的單點性能比拼轉(zhuǎn)變?yōu)橄到y(tǒng)級工程能力的較量。面對數(shù)千乃至上萬張計算卡組成的智算集群,如何解決數(shù)據(jù)在智能體流程協(xié)調(diào)中的傳輸瓶頸,是所有算力廠商面臨的嚴峻挑戰(zhàn)。

在這一系統(tǒng)級工程領(lǐng)域,壁仞科技2025年的交付數(shù)據(jù)提供了技術(shù)驗證。

報告期內(nèi),壁仞科技交付了多個大規(guī)模智算集群項目,包括2048卡光互連光交換GPU超節(jié)點集群和多個市場化的數(shù)千卡級智算集群。該集群采用了公司與生態(tài)伙伴聯(lián)合發(fā)布的“光躍 LightSphere X”超節(jié)點方案,基于光互連與分布式光交換(dOCS)技術(shù),從物理底層大幅降低了通信延遲并提升了互聯(lián)帶寬。

更為關(guān)鍵的是,在實際的高強度商業(yè)部署中,壁仞科技交付的千卡集群實現(xiàn)了30天無故障運行,且線性加速比超過95%,這一系列硬核指標,驗證了其在支撐大規(guī)模并行計算時的高可用性與系統(tǒng)穩(wěn)定性。

根據(jù)財報,其客戶群體已覆蓋國家級算力平臺、電信運營商、商業(yè)AIDC、AI/大模型公司及垂直領(lǐng)域企業(yè)客戶。

硬件架構(gòu)與集群互連之外,軟件生態(tài)與模型適配效率同樣是算力商業(yè)化的核心壁壘。

軟件生態(tài)建設(shè)上,壁仞科技不斷優(yōu)化對Pytorch、vLLM、SGLang等開源框架和Triton、TileLang等開源生態(tài)的支持,降低客戶遷移成本。同時,持續(xù)推動軟件開源戰(zhàn)略,構(gòu)建自有軟件棧BIRENSUPA?更加廣泛的生態(tài)。

目前,壁仞已全面支持DeepSeek V3/R1系列、MiniMax M2系列、智譜GLM系列以及阿里千問Qwen、階躍星辰Step系列、騰訊混元系列等頭部大模型,并在多個頂尖模型上實現(xiàn)了發(fā)布當(dāng)天的“Day 0”級別全棧適配。

壁仞還與大模型企業(yè)、國家級智算服務(wù)企業(yè)達成戰(zhàn)略合作,組建“國產(chǎn)AI聯(lián)合實驗室”,通過“芯-模-云”一體化的協(xié)同創(chuàng)新,共同攻堅降低AI應(yīng)用單位Token成本的難題。

在這樣一個算力基建加速向商業(yè)化兌現(xiàn)的窗口,壁仞也明確了下一階段的技術(shù)演進路徑。

根據(jù)財報,壁仞計劃于2026年正式推出下一代BR20X芯片及全系列產(chǎn)品。該系列產(chǎn)品專為精準卡位推理時代的指數(shù)級算力增長需求而優(yōu)化,不僅在算力密度、內(nèi)存容量和帶寬、以及互連能力全面升級,還將原生支持FP8與FP4等低精度計算,以期在性能與能效上實現(xiàn)雙重突破。

在集群擴展性層面,BR20X系列將基于自研互連協(xié)議Blink 2.0推出超節(jié)點方案,最大可支持千卡規(guī)模集群的Scale-up,為應(yīng)對未來更大規(guī)模的并行計算提前鋪路。

此外,壁仞科技還將在先進封裝、光互連等技術(shù)上持續(xù)投入,布局突破擴展性路徑的關(guān)鍵路徑。

從底層的自研芯片,到中層的超節(jié)點與光互連集群架構(gòu),再到上層的BIRENSUPA?軟件棧等,壁仞科技“芯片+系統(tǒng)+生態(tài)”的三位一體商業(yè)模式已經(jīng)完成嚴密的邏輯閉環(huán)。

疊加其在AI Agent/AI Coding、生成式AI、金融科技、智能制造、智能教育及智能政務(wù)等垂直領(lǐng)域的端到端場景交付能力,壁仞正以“算力底座”的姿態(tài)深度嵌入各類數(shù)字化轉(zhuǎn)型的真實業(yè)務(wù)中。

當(dāng)?shù)讓铀懔ㄕ嬲M入規(guī)模化的商業(yè)正循環(huán),率先完成全棧閉環(huán)的國產(chǎn)算力企業(yè),正成為托舉國產(chǎn)AI產(chǎn)業(yè)發(fā)展的核心底座。

未經(jīng)正式授權(quán)嚴禁轉(zhuǎn)載本文,侵權(quán)必究。