文|半導(dǎo)體產(chǎn)業(yè)縱橫
Trainium3 專(zhuān)為滿(mǎn)足下一代生成式 AI 工作負(fù)載的高性能需求而設(shè)計(jì)。
12月3日,亞馬遜旗下AWS CEO Matt Garman宣布,將推出全新 Trainium3,這是自家首款采用3nm制程的芯片,與上代 Trainium2 相比,計(jì)算能力增加2倍,能源效率提升40%,預(yù)計(jì)2025年底問(wèn)世。
Matt Garman 指出,Trainium3 專(zhuān)為滿(mǎn)足下一代生成式 AI 工作負(fù)載的高性能需求而設(shè)計(jì),有助客戶(hù)更快地建立更大的模型,并在部署模型時(shí)提供卓越的效能,且由 Trainium3 驅(qū)動(dòng)的 UltraServers 預(yù)計(jì)將比 Trn2 UltraServers 的效能高出四倍。
據(jù)Garman透露,目前包括Adobe、AI新創(chuàng)公司Poolside、數(shù)據(jù)平臺(tái)服務(wù)Databricks以及芯片大廠(chǎng)高通都通過(guò)Trainium2處理器訓(xùn)練其AI模型,其中,高通在云端計(jì)算AI模型后再將其傳送至邊緣端。
此前有報(bào)道稱(chēng),亞馬遜云計(jì)算部門(mén)的高管正在大舉投資定制芯片,希望提高其數(shù)十個(gè)數(shù)據(jù)中心的效率,最終降低其自身以及亞馬遜AWS客戶(hù)的成本。亞馬遜AWS目標(biāo)是與英偉達(dá)競(jìng)爭(zhēng),后者憑借在AI芯片市場(chǎng)的主導(dǎo)地位,成為全球最有價(jià)值的公司之一。
TechInsights分析師G Dan Hutcheson曾表示:“AWS的一大優(yōu)勢(shì)是他們的芯片可以使用更少的電量,他們的數(shù)據(jù)中心可能可以更高效”,從而降低成本。他說(shuō),如果英偉達(dá)的圖形處理單元(GPU)是強(qiáng)大的通用工具,那么亞馬遜可以針對(duì)特定任務(wù)和服務(wù)優(yōu)化其芯片。
蘋(píng)果開(kāi)始使用亞馬遜的定制人工智能芯片
蘋(píng)果目前使用亞馬遜網(wǎng)絡(luò)服務(wù)的定制人工智能芯片進(jìn)行搜索等服務(wù),并將評(píng)估該公司的最新人工智能芯片是否可以用于預(yù)訓(xùn)練其模型,如蘋(píng)果智能。
近日,蘋(píng)果在一年一度的AWS Reinvent大會(huì)上披露了其對(duì)亞馬遜專(zhuān)有芯片的使用。蘋(píng)果機(jī)器學(xué)習(xí)與人工智能高級(jí)總監(jiān)Benoit Dupin上臺(tái)介紹了蘋(píng)果是如何使用云服務(wù)的。這是公司正式允許供應(yīng)商將他們標(biāo)榜為客戶(hù)的罕見(jiàn)例子。
蘋(píng)果的Dupin說(shuō):“我們有很強(qiáng)的關(guān)系,基礎(chǔ)設(shè)施既可靠,又能為全球客戶(hù)服務(wù)?!?/p>
蘋(píng)果在亞馬遜的會(huì)議上亮相,并擁抱該公司的芯片,是在與微軟Azure和谷歌云爭(zhēng)奪人工智能支出之際,對(duì)云服務(wù)的大力支持。蘋(píng)果也使用這些云服務(wù)。
Dupin說(shuō),蘋(píng)果已經(jīng)使用AWS服務(wù)超過(guò)十年了,包括Siri,Apple Maps和Apple Music。例如,蘋(píng)果使用亞馬遜的Inferentia和Graviton芯片來(lái)服務(wù)搜索服務(wù),Dupin表示亞馬遜芯片提高了40%的效率。
但Dupin也暗示,蘋(píng)果將使用亞馬遜的Trainium2芯片對(duì)其專(zhuān)有車(chē)型進(jìn)行預(yù)訓(xùn)練。這表明,與英特爾和AMD的x86中央處理器相比,亞馬遜的處理器不僅是一種成本效益高的推理AI模型的方式,而且還可以用于開(kāi)發(fā)新的AI。亞馬遜宣布,其Trainium2芯片一般可供租賃。
Dupin說(shuō):“在評(píng)估Trainium2的早期階段,我們預(yù)計(jì)早期人數(shù)在預(yù)訓(xùn)練時(shí)效率會(huì)提高多達(dá)50%?!?/p>
AWS首席執(zhí)行官M(fèi)att Garman在周二接受CNBC采訪(fǎng)時(shí)表示,蘋(píng)果一直是該公司Trainium芯片的早期采用者和測(cè)試者。
AWS首席執(zhí)行官馬特·加曼告訴CNBC的凱特·魯尼說(shuō):“蘋(píng)果來(lái)找我們,對(duì)我們說(shuō),‘你們能幫助我們實(shí)現(xiàn)生成式人工智能的能力嗎?我們需要基礎(chǔ)設(shè)施來(lái)構(gòu)建’,他們對(duì)構(gòu)建蘋(píng)果智能有著這樣的愿景?!?/p>
今年早些時(shí)候,蘋(píng)果在一份研究論文中表示,它已經(jīng)使用谷歌云TPU芯片來(lái)訓(xùn)練其iPhone人工智能服務(wù),它稱(chēng)之為蘋(píng)果智能。
大多數(shù)人工智能訓(xùn)練都是在昂貴的英偉達(dá)圖形處理器上完成的。云提供商和初創(chuàng)公司正在競(jìng)相開(kāi)發(fā)降低成本的替代方案,并探索可能帶來(lái)更高處理效率的不同方法。蘋(píng)果使用定制芯片可能向其他公司發(fā)出信號(hào),表明非英偉達(dá)的培訓(xùn)方法可以奏效。
預(yù)計(jì) AWS 將在周二宣布有關(guān)提供基于 Nvidia Blackwell 的 AI 服務(wù)器以供出租的新細(xì)節(jié)。
今年秋天,蘋(píng)果發(fā)布了其首個(gè)主要生成式人工智能產(chǎn)品。Apple Intelligence是一系列服務(wù),可以匯總通知、重寫(xiě)電子郵件和生成新的表情符號(hào)。該公司表示,本月晚些時(shí)候,它將與OpenAI的ChatGPT集成,明年,Siri將獲得控制應(yīng)用程序和自然說(shuō)話(huà)的新能力。
與領(lǐng)先的聊天機(jī)器人,如OpenAI的ChatGPT不同,蘋(píng)果的人工智能方法不是基于云中的大量基于Nvidia的服務(wù)器。相反,蘋(píng)果使用iPhone、iPad或Mac芯片來(lái)盡可能多地完成處理,然后將復(fù)雜的查詢(xún)發(fā)送給使用其M系列芯片的蘋(píng)果操作服務(wù)器。

