四虎AV成人在线观看|免费免费特黄的欧美大片|人妻丝袜中文字幕一区三区|性爱一级二级三级|日本黄色视频在线观看免费|亚洲午夜天堂超碰大香蕉中出|国产日韩三级黄色AV一区二区三区|a片网站在线观看视频|人人AV播放日韩操在线|国产伦清品一区二区三区

正在閱讀:

李開復:相信很多中美公司都在往o1方向狂奔,包括零一萬物

掃一掃下載界面新聞APP

李開復:相信很多中美公司都在往o1方向狂奔,包括零一萬物

李開復直言,他預計五個月后就會有不少類似o1模型的能力出現(xiàn)在各個公司,包括零一萬物。

李開復:相信很多中美公司都在往o1方向狂奔,包括零一萬物

圖片來源:界面圖庫

界面新聞記者 | 伍洋宇

界面新聞編輯 | 文姝琪

在外界對大模型開始失去信心的情況下,國內大模型創(chuàng)業(yè)公司“六小虎”均受到不同程度的質疑,零一萬物更是在行業(yè)傳聞中被直指放棄了預訓練。

作為創(chuàng)始人兼CEO,李開復在微信朋友圈發(fā)文辟謠稱,零一萬物一直在做預訓練,當公司新的預訓練模型推出時,這番謠言會不攻自破。

10月16日,零一萬物正式發(fā)布最新旗艦模型Yi-Lightning,繼續(xù)向大模型的更高性能發(fā)起沖擊。

LMSYS盲測競技場總榜(用戶對一組大模型回答進行盲投)上,Yi-Lightning位列第六,僅次于OpenAI的GPT-4o、o1系列,以及Google的Gemini 1.5 pro系列,并且與馬斯克xAI旗下Grok-2打平。這是中國大模型廠商目前在該榜單上取得的最好成績。 

單項能力上,Yi-Lightning的中文能力和多輪對話分別與其他模型并列分榜第二和第三,數(shù)學和代碼能力并列分榜第三和第四,在艱難提問和長提問兩個分榜上也是并列第四。

此次,零一萬物格外強調Yi-Lightning在推理速度上的提升。據(jù)其提供的內部評測數(shù)據(jù),在 8xH100算力基礎下,以同樣的任務規(guī)模進行測試,Yi-Lightning的首包時間(從接收到任務請求到系統(tǒng)開始輸出響應結果之間的時間)為Yi-Large的一半,最高生成速度提升了近四成。

這一方面是基于團隊此前在AI Infra層的投入,另一方面是由于其模型從Dense Model(稠密模型)架構改為采用MoE(Mixture of Experts/混合專家模型)架構。而這種架構是大模型行業(yè)在提升模型速度時的共識性選擇。

不過,MoE架構通常存在激活參數(shù)規(guī)模與推理速度及成本的平衡問題。為此,零一萬物在Yi-Lightning的架構中引入了三種技術思路,分別是混合注意力機制、動態(tài)ToP路由以及多階段訓練。

其中,混合注意力機制指的是在模型的部分層次中將傳統(tǒng)的全注意力(Full Attention)替換為滑動窗口注意力(Sliding Window Attention),平衡模型在處理長序列數(shù)據(jù)時的性能和計算資源消耗;動態(tài)ToP路由的作用在于靈活根據(jù)任務的難度調整激活的專家網(wǎng)絡數(shù)量;多階段訓練則是在不同訓練階段,有側重地搭配訓練數(shù)據(jù)類型,進行針對性強化。

目前,公司將Yi-Lightning定價在0.99元/百萬tokens,李開復對此表示,這并不是一個虧本的價格,公司仍有相對理想的利潤空間。 

另外,在ToB(企業(yè)端)戰(zhàn)略下,零一萬物首次發(fā)布了針對零售和電商等場景的行業(yè)應用產(chǎn)品AI 2.0數(shù)字人,并已在彈幕互動、商品信息提取、實時話術生成等環(huán)節(jié)接入了Yi-Lightning。

盡管沒有直接提及“開箱即用”這個概念,但李開復表示,目前這一數(shù)字人產(chǎn)品已相對完善,在沒有大模型專家或系統(tǒng)集成商幫助的情況下,具備一定IT能力的客戶可以相對高效完成部署。

據(jù)零一萬物披露,公司已有合作案例涉及餐飲連鎖、酒旅類客戶、水果連鎖店等,其中某頭部酒旅企業(yè)在接入該數(shù)字人產(chǎn)品后,直播GMV較此前上升170%。

零一萬物目前已形成有鮮明差異的海內外商業(yè)布局。其ToC(用戶)業(yè)務選擇在國外,因為用戶成本更低、變現(xiàn)能力更高,以Pop AI為代表的產(chǎn)品在海外已有正向收入,國內的機會還要根據(jù)用戶成本等維度持續(xù)關注,公司目前將繼續(xù)維護AI工作平臺“萬知”的正常運營。

ToB業(yè)務則以國內為主,李開復表示,這類業(yè)務在海外對供應商本土化要求高,并不適合現(xiàn)階段的零一萬物,而公司當前在國內已找到一些破局空間(即電商、零售場景下的數(shù)字人解決方案)。在國內ToB業(yè)務產(chǎn)品矩陣上,除了已經(jīng)發(fā)布的AI 2.0數(shù)字人、API之外,零一萬物還有AI Infra解決方案、私有化定制模型等其他業(yè)務將在近期對外發(fā)布。

一個大模型公司同時做to B和to C是很辛苦的,因為兩個團隊的基因不一樣,做事的方法和衡量KPI的方法也不一樣,需要多元化的管理方式。”李開復說,“我在這兩個領域有經(jīng)驗,也在試著做,但是也絕對不能什么都做?!?/span>

Yi-Lightning發(fā)布之際,李開復再次對“大模型行業(yè)將逐步放棄預訓練”這一業(yè)界推測作出回應。 

他表示,做預訓練通用大模型是一個系統(tǒng)性技術活,需要眾多懂芯片、模型、推理、架構、算法的人才,做這件事的成本也非常高,不是每家公司都可以做成?!?/span>以后可能會有越來越少的大模型公司做預訓練。”他判斷稱。 

不過李開復也表示,據(jù)他所知,“六小虎”均有足夠的融資額度,都付得起預訓練模型Production Run(投產(chǎn)運行)三四百萬美金一次的訓練成本,只要有足夠好的人才和做預訓練的決心,資金和算力資源不會是問題。

面對通用大模型的下一技術進程,OpenAI o1是一個繞不開的話題。

李開復直言,他預計五個月后就會有不少類似o1模型的能力出現(xiàn)在各個公司,包括零一萬物。這基本代表了零一萬物將要效仿o1范式繼續(xù)推進模型性能的技術戰(zhàn)略決策。“感謝OpenAI點醒我們這一點(指post-train同樣重要),現(xiàn)在我相信很多中美公司都在往o1方向狂奔?!?/span> 

李開復還根據(jù)自己與OpenAI相關人員溝通得到的信息透露道,OpenAI目前仍對一些先進技術有所保留,不急于公布,要等到領先行業(yè)足夠多、到一定的業(yè)務節(jié)點后才會釋放。

事實上,追逐OpenAI是中國大模型公司共同的長線任務,而縮短中美大模型差距的技術時間差是一個直觀的判斷標準。以零一萬物為例,Yi-Lightning追擊GPT-4o性能水平的周期從上一代的六個月縮短到了五個月,但這個數(shù)字要如何繼續(xù)縮小? 

李開復的看法是,國內大模型公司不需要具有這種焦慮,因為從算力基礎、技術差距等維度來看,這種落后是客觀事實,但國內公司憑借數(shù)據(jù)處理、訓推優(yōu)化等方法論已經(jīng)有相對成熟的打法,而這套方法對于盡快了解新技術核心并復現(xiàn)在自己的產(chǎn)品中,能保持六個月左右的追趕周期已經(jīng)是很好的結果。 

“我們千萬不要認為落后六個月是一個很羞恥的事情,或者一定是要追趕的事情。”李開復說,“如果期待破局,可能需要一個前所未有的算法才有機會。”

未經(jīng)正式授權嚴禁轉載本文,侵權必究。

李開復

  • 零一萬物高管換血,李開復梭哈To B
  • AI早報 | 李開復:如果十年后回顧DeepSeek如何讓中國未落后美國,答案一定是開源;騰訊發(fā)布并開源新一代生圖模型“混元圖像3.0”

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

李開復:相信很多中美公司都在往o1方向狂奔,包括零一萬物

李開復直言,他預計五個月后就會有不少類似o1模型的能力出現(xiàn)在各個公司,包括零一萬物。

李開復:相信很多中美公司都在往o1方向狂奔,包括零一萬物

圖片來源:界面圖庫

界面新聞記者 | 伍洋宇

界面新聞編輯 | 文姝琪

在外界對大模型開始失去信心的情況下,國內大模型創(chuàng)業(yè)公司“六小虎”均受到不同程度的質疑,零一萬物更是在行業(yè)傳聞中被直指放棄了預訓練。

作為創(chuàng)始人兼CEO,李開復在微信朋友圈發(fā)文辟謠稱,零一萬物一直在做預訓練,當公司新的預訓練模型推出時,這番謠言會不攻自破。

10月16日,零一萬物正式發(fā)布最新旗艦模型Yi-Lightning,繼續(xù)向大模型的更高性能發(fā)起沖擊。

LMSYS盲測競技場總榜(用戶對一組大模型回答進行盲投)上,Yi-Lightning位列第六,僅次于OpenAI的GPT-4o、o1系列,以及Google的Gemini 1.5 pro系列,并且與馬斯克xAI旗下Grok-2打平。這是中國大模型廠商目前在該榜單上取得的最好成績。 

單項能力上,Yi-Lightning的中文能力和多輪對話分別與其他模型并列分榜第二和第三,數(shù)學和代碼能力并列分榜第三和第四,在艱難提問和長提問兩個分榜上也是并列第四。

此次,零一萬物格外強調Yi-Lightning在推理速度上的提升。據(jù)其提供的內部評測數(shù)據(jù),在 8xH100算力基礎下,以同樣的任務規(guī)模進行測試,Yi-Lightning的首包時間(從接收到任務請求到系統(tǒng)開始輸出響應結果之間的時間)為Yi-Large的一半,最高生成速度提升了近四成。

這一方面是基于團隊此前在AI Infra層的投入,另一方面是由于其模型從Dense Model(稠密模型)架構改為采用MoE(Mixture of Experts/混合專家模型)架構。而這種架構是大模型行業(yè)在提升模型速度時的共識性選擇。

不過,MoE架構通常存在激活參數(shù)規(guī)模與推理速度及成本的平衡問題。為此,零一萬物在Yi-Lightning的架構中引入了三種技術思路,分別是混合注意力機制、動態(tài)ToP路由以及多階段訓練。

其中,混合注意力機制指的是在模型的部分層次中將傳統(tǒng)的全注意力(Full Attention)替換為滑動窗口注意力(Sliding Window Attention),平衡模型在處理長序列數(shù)據(jù)時的性能和計算資源消耗;動態(tài)ToP路由的作用在于靈活根據(jù)任務的難度調整激活的專家網(wǎng)絡數(shù)量;多階段訓練則是在不同訓練階段,有側重地搭配訓練數(shù)據(jù)類型,進行針對性強化。

目前,公司將Yi-Lightning定價在0.99元/百萬tokens,李開復對此表示,這并不是一個虧本的價格,公司仍有相對理想的利潤空間。 

另外,在ToB(企業(yè)端)戰(zhàn)略下,零一萬物首次發(fā)布了針對零售和電商等場景的行業(yè)應用產(chǎn)品AI 2.0數(shù)字人,并已在彈幕互動、商品信息提取、實時話術生成等環(huán)節(jié)接入了Yi-Lightning。

盡管沒有直接提及“開箱即用”這個概念,但李開復表示,目前這一數(shù)字人產(chǎn)品已相對完善,在沒有大模型專家或系統(tǒng)集成商幫助的情況下,具備一定IT能力的客戶可以相對高效完成部署。

據(jù)零一萬物披露,公司已有合作案例涉及餐飲連鎖、酒旅類客戶、水果連鎖店等,其中某頭部酒旅企業(yè)在接入該數(shù)字人產(chǎn)品后,直播GMV較此前上升170%。

零一萬物目前已形成有鮮明差異的海內外商業(yè)布局。其ToC(用戶)業(yè)務選擇在國外,因為用戶成本更低、變現(xiàn)能力更高,以Pop AI為代表的產(chǎn)品在海外已有正向收入,國內的機會還要根據(jù)用戶成本等維度持續(xù)關注,公司目前將繼續(xù)維護AI工作平臺“萬知”的正常運營。

ToB業(yè)務則以國內為主,李開復表示,這類業(yè)務在海外對供應商本土化要求高,并不適合現(xiàn)階段的零一萬物,而公司當前在國內已找到一些破局空間(即電商、零售場景下的數(shù)字人解決方案)。在國內ToB業(yè)務產(chǎn)品矩陣上,除了已經(jīng)發(fā)布的AI 2.0數(shù)字人、API之外,零一萬物還有AI Infra解決方案、私有化定制模型等其他業(yè)務將在近期對外發(fā)布。

一個大模型公司同時做to B和to C是很辛苦的,因為兩個團隊的基因不一樣,做事的方法和衡量KPI的方法也不一樣,需要多元化的管理方式。”李開復說,“我在這兩個領域有經(jīng)驗,也在試著做,但是也絕對不能什么都做。”

Yi-Lightning發(fā)布之際,李開復再次對“大模型行業(yè)將逐步放棄預訓練”這一業(yè)界推測作出回應。 

他表示,做預訓練通用大模型是一個系統(tǒng)性技術活,需要眾多懂芯片、模型、推理、架構、算法的人才,做這件事的成本也非常高,不是每家公司都可以做成。“以后可能會有越來越少的大模型公司做預訓練。”他判斷稱。 

不過李開復也表示,據(jù)他所知,“六小虎”均有足夠的融資額度,都付得起預訓練模型Production Run(投產(chǎn)運行)三四百萬美金一次的訓練成本,只要有足夠好的人才和做預訓練的決心,資金和算力資源不會是問題。

面對通用大模型的下一技術進程,OpenAI o1是一個繞不開的話題。

李開復直言,他預計五個月后就會有不少類似o1模型的能力出現(xiàn)在各個公司,包括零一萬物。這基本代表了零一萬物將要效仿o1范式繼續(xù)推進模型性能的技術戰(zhàn)略決策?!案兄xOpenAI點醒我們這一點(指post-train同樣重要),現(xiàn)在我相信很多中美公司都在往o1方向狂奔。” 

李開復還根據(jù)自己與OpenAI相關人員溝通得到的信息透露道,OpenAI目前仍對一些先進技術有所保留,不急于公布,要等到領先行業(yè)足夠多、到一定的業(yè)務節(jié)點后才會釋放。

事實上,追逐OpenAI是中國大模型公司共同的長線任務,而縮短中美大模型差距的技術時間差是一個直觀的判斷標準。以零一萬物為例,Yi-Lightning追擊GPT-4o性能水平的周期從上一代的六個月縮短到了五個月,但這個數(shù)字要如何繼續(xù)縮?。?/span> 

李開復的看法是,國內大模型公司不需要具有這種焦慮,因為從算力基礎、技術差距等維度來看,這種落后是客觀事實,但國內公司憑借數(shù)據(jù)處理、訓推優(yōu)化等方法論已經(jīng)有相對成熟的打法,而這套方法對于盡快了解新技術核心并復現(xiàn)在自己的產(chǎn)品中,能保持六個月左右的追趕周期已經(jīng)是很好的結果。 

“我們千萬不要認為落后六個月是一個很羞恥的事情,或者一定是要追趕的事情。”李開復說,“如果期待破局,可能需要一個前所未有的算法才有機會。”

未經(jīng)正式授權嚴禁轉載本文,侵權必究。