四虎AV成人在线观看|免费免费特黄的欧美大片|人妻丝袜中文字幕一区三区|性爱一级二级三级|日本黄色视频在线观看免费|亚洲午夜天堂超碰大香蕉中出|国产日韩三级黄色AV一区二区三区|a片网站在线观看视频|人人AV播放日韩操在线|国产伦清品一区二区三区

正在閱讀:

理論成本利潤率545%!DeepSeek 知乎發(fā)文引業(yè)內(nèi)震動

掃一掃下載界面新聞APP

理論成本利潤率545%!DeepSeek 知乎發(fā)文引業(yè)內(nèi)震動

該公司還首次公布了模型推理系統(tǒng)的核心優(yōu)化方案。

理論成本利潤率545%!DeepSeek 知乎發(fā)文引業(yè)內(nèi)震動

圖片來源:界面圖庫

3月1日,DeepSeek官方認(rèn)證賬號在知乎發(fā)布了《DeepSeek-V3/R1推理系統(tǒng)概覽》(下稱《概覽》)一文,首次公布模型推理系統(tǒng)的核心優(yōu)化方案,并披露理論成本利潤率高達(dá)545%,刷新了全球AI大模型領(lǐng)域的盈利高點(diǎn),引發(fā)業(yè)內(nèi)震動。

《概覽》顯示,DeepSeek-V3/R1推理系統(tǒng)的優(yōu)化目標(biāo)是更大的吞吐、更低的延遲。

為了實現(xiàn)上述兩個目標(biāo),DeepSeek使用大規(guī)模跨節(jié)點(diǎn)專家并行(EP)。首先EP使得批量尺寸大大增加,從而提高圖形處理器(GPU)矩陣乘法的效率,提高吞吐。其次 EP 使得專家分散在不同的 GPU上,每個GPU只需要計算很少的專家,因此更少的訪存需求,從而降低延遲。

EP同時也增加了系統(tǒng)的復(fù)雜性。因此,《概覽》就如何使用EP增大批量尺寸、如何隱藏傳輸?shù)暮臅r、如何進(jìn)行負(fù)載均衡等進(jìn)行了講解。

DeepSeek還披露了DeepSeek的理論成本和利潤率等關(guān)鍵信息。

文章稱,在北京時間2月27日12:00 至2月28日12:00,DeepSeekV3和R1推理服務(wù)占用節(jié)點(diǎn)總和,峰值占用為278個節(jié)點(diǎn),平均占用226.75個節(jié)點(diǎn)(每個節(jié)點(diǎn)為8 個H800 GPU)。假定GPU租賃成本為2美元/小時,總成本約為8.71萬美元/天。

如果所有tokens全部按照DeepSeek R1的定價計算,理論上一天的總收入大約56.20萬美元,成本利潤率為545%。

圖片來源:《DeepSeek-V3/R1 推理系統(tǒng)概覽》

DeepSeek此次披露的數(shù)據(jù),不僅驗證了其技術(shù)路線的商業(yè)可行性,也預(yù)示著AI大模型的盈利閉環(huán)已從理想照進(jìn)現(xiàn)實。此前發(fā)布的DeepSeek-V3模型訓(xùn)練成本僅557.6萬美元,是同類產(chǎn)品的1%-5%。

DeepSeek此次在知乎發(fā)布《概覽》,引來近600條評論、5000多點(diǎn)贊。有網(wǎng)友稱,今日發(fā)布的《概覽》技術(shù)文章是“開源周彩蛋”,直接亮出了底牌。有網(wǎng)友稱贊:“太強(qiáng)了,AI算力成為水電的基礎(chǔ)是要足夠便宜,Deepseek邁出了一大步”。

《概覽》發(fā)布也標(biāo)志著全球關(guān)注的“DeepSeek開源周”正式收官?!癉eepSeek開源周”自2月24日至2月28日,陸續(xù)開源最新技術(shù)進(jìn)展。其中,包括FlashMLA、DeepEP、DeepGEMM和3FS四個開源項目,以及DualPipe、EPLB等代碼庫。

 

 

 

 

 

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

知乎

3.4k
  • 美股中概股持續(xù)走強(qiáng),知乎漲超25%
  • 知乎:2025年第三季度凈虧損4670萬元

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

理論成本利潤率545%!DeepSeek 知乎發(fā)文引業(yè)內(nèi)震動

該公司還首次公布了模型推理系統(tǒng)的核心優(yōu)化方案。

理論成本利潤率545%!DeepSeek 知乎發(fā)文引業(yè)內(nèi)震動

圖片來源:界面圖庫

3月1日,DeepSeek官方認(rèn)證賬號在知乎發(fā)布了《DeepSeek-V3/R1推理系統(tǒng)概覽》(下稱《概覽》)一文,首次公布模型推理系統(tǒng)的核心優(yōu)化方案,并披露理論成本利潤率高達(dá)545%,刷新了全球AI大模型領(lǐng)域的盈利高點(diǎn),引發(fā)業(yè)內(nèi)震動。

《概覽》顯示,DeepSeek-V3/R1推理系統(tǒng)的優(yōu)化目標(biāo)是更大的吞吐、更低的延遲

為了實現(xiàn)上述兩個目標(biāo),DeepSeek使用大規(guī)模跨節(jié)點(diǎn)專家并行(EP)。首先EP使得批量尺寸大大增加,從而提高圖形處理器(GPU)矩陣乘法的效率,提高吞吐。其次 EP 使得專家分散在不同的 GPU上,每個GPU只需要計算很少的專家,因此更少的訪存需求,從而降低延遲。

EP同時也增加了系統(tǒng)的復(fù)雜性。因此,《概覽》就如何使用EP增大批量尺寸、如何隱藏傳輸?shù)暮臅r、如何進(jìn)行負(fù)載均衡等進(jìn)行了講解。

DeepSeek還披露了DeepSeek的理論成本和利潤率等關(guān)鍵信息。

文章稱,在北京時間2月27日12:00 至2月28日12:00,DeepSeekV3和R1推理服務(wù)占用節(jié)點(diǎn)總和,峰值占用為278個節(jié)點(diǎn),平均占用226.75個節(jié)點(diǎn)(每個節(jié)點(diǎn)為8 個H800 GPU)。假定GPU租賃成本為2美元/小時,總成本約為8.71萬美元/天。

如果所有tokens全部按照DeepSeek R1的定價計算,理論上一天的總收入大約56.20萬美元,成本利潤率為545%。

圖片來源:《DeepSeek-V3/R1 推理系統(tǒng)概覽》

DeepSeek此次披露的數(shù)據(jù),不僅驗證了其技術(shù)路線的商業(yè)可行性,也預(yù)示著AI大模型的盈利閉環(huán)已從理想照進(jìn)現(xiàn)實。此前發(fā)布的DeepSeek-V3模型訓(xùn)練成本僅557.6萬美元,是同類產(chǎn)品的1%-5%。

DeepSeek此次在知乎發(fā)布《概覽》,引來近600條評論、5000多點(diǎn)贊。有網(wǎng)友稱,今日發(fā)布的《概覽》技術(shù)文章是“開源周彩蛋”,直接亮出了底牌。有網(wǎng)友稱贊:“太強(qiáng)了,AI算力成為水電的基礎(chǔ)是要足夠便宜,Deepseek邁出了一大步”。

《概覽》發(fā)布也標(biāo)志著全球關(guān)注的“DeepSeek開源周”正式收官?!癉eepSeek開源周”自2月24日至2月28日,陸續(xù)開源最新技術(shù)進(jìn)展。其中,包括FlashMLA、DeepEP、DeepGEMM和3FS四個開源項目,以及DualPipe、EPLB等代碼庫。

 

 

 

 

 

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。