四虎AV成人在线观看|免费免费特黄的欧美大片|人妻丝袜中文字幕一区三区|性爱一级二级三级|日本黄色视频在线观看免费|亚洲午夜天堂超碰大香蕉中出|国产日韩三级黄色AV一区二区三区|a片网站在线观看视频|人人AV播放日韩操在线|国产伦清品一区二区三区

商湯日日新發(fā)布并開源空間智能模型,性能超越GPT-5、Geminil

商湯科技近日在空間智能領(lǐng)域取得重大突破,發(fā)布并開源了SenseNova-SI系列模型,其性能在多項權(quán)威評測中超越了同量級開源模型及國際頂尖閉源模型如GPT-5和Gemini 2.5 Pro。該系列模型在空間理解和推理任務(wù)上表現(xiàn)出色,尤其在空間智能短板問題上,解決了現(xiàn)有大模型難以處理的空間結(jié)構(gòu)理解問題。

今天,商湯日日新在空間智能領(lǐng)域?qū)崿F(xiàn)重要突破,正式發(fā)布并開源SenseNova-SI系列模型。在多項權(quán)威評測的空間理解和推理任務(wù)上,SenseNova-SI 不僅大幅度領(lǐng)先同量級開源多模態(tài)大模型,還超越了 GPT-5 和 Gemini 2.5 Pro 等國際頂尖閉源模型的表現(xiàn)。

空間智能短板與系統(tǒng)性解決

當(dāng)下行業(yè)領(lǐng)先的大模型,雖然在知識、寫作、推理、編程等方面展示了突出的性能,但是普遍存在一個重要的缺陷,就是對空間結(jié)構(gòu)的理解和推理存在很嚴(yán)重的短板,而這恰恰是具身智能體與世界交互所需要的關(guān)鍵基礎(chǔ)能力。

我們來看一個例子,左圖源自最強大腦的圖形推理題,對人類都具有相當(dāng)?shù)碾y度,GPT-5能夠輕松破解,可見它在非空間智能問題上已具備很強能力。反觀右圖,是一道人類兒童都能輕易解決的簡單空間問題,要求選擇正確俯視圖,GPT-5卻令人意外地犯起了難,錯誤地選擇了"A”。

以上例子恰好暴露了當(dāng)前大模型在空間理解上的短板。因此要讓AI真正"看懂"三維世界,空間智能一直是關(guān)鍵的試金石。

商湯圍繞空間智能進(jìn)行了深入創(chuàng)新探索,找到了提升空間智能的系統(tǒng)性訓(xùn)練方法,打造了日日新·空間智能大模型系列 SenseNova-SI 并正式開源。

評測表現(xiàn)多項任務(wù)超越GPT-5,顯著領(lǐng)先同量級開源模型

這次開源的SenseNova-SI空間智能大模型系列包括 2B 和 8B 兩個規(guī)格。

最新評測數(shù)據(jù)顯示,SenseNova-SI系列模型在空間智能多個基準(zhǔn)測試(VSI、MMSI、MindCube、ViewSpatial)中表現(xiàn)突出,具體如下:

數(shù)據(jù)來源:https://github.com/OpenSenseNova/SenseNova-SI

其中SenseNova-SI-8B模型在四個基本評測中獲得 60.99 的平均成績,不僅大幅領(lǐng)先Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等開源通用多模態(tài)模型,以及 SpatialMLLM(35.05)、ViLaSR-7B(36.41) 等專門的空間智能模型,還以相對輕量的模型規(guī)格實現(xiàn)了對GPT-5(49.68)、Gemini-2.5-Pro(48.81)等頂級閉源模型的超越。這里顯著的性能提升反映了模型在空間智能上獲得了質(zhì)的突破,而不是簡單的性能改善。

基于"尺度效應(yīng)"的訓(xùn)練范式,實現(xiàn)能力系統(tǒng)性提升?

SenseNova-SI的性能飛躍,源于商湯從訓(xùn)練數(shù)據(jù)到方法上的系統(tǒng)性方案。依托商湯提出的空間能力分類體系和過往多樣化的數(shù)據(jù)的積累,團隊采用系統(tǒng)化的方法擴充空間理解數(shù)據(jù)的規(guī)模,首次在空間智能領(lǐng)域驗證了“尺度效應(yīng)”,即通過高質(zhì)量、大規(guī)模數(shù)據(jù)訓(xùn)練,可顯著提升模型的空間認(rèn)知能力。

商湯提出的訓(xùn)練范式具備通用性,能夠針對不同架構(gòu)的基模型(如InternVL等)進(jìn)行有效增強,使其在空間智能六大核心維度上——包括空間測量、空間重構(gòu)、空間關(guān)系、視角轉(zhuǎn)換、空間形變與空間推理——實現(xiàn)一致性的能力提升。

商湯稍后將發(fā)布詳細(xì)的技術(shù)報告,詳細(xì)闡述具體的技術(shù)方案。

以下為GPT-5和SenseNova-SI-8B模型面對空間智能問題,給出的答案對比。

??給出的立方體組合圖形,要求選擇正確俯視圖。GPT-5選擇答案D,SenseNova-SI-8B選擇答案B,正確答案為B。(例題源自SITE-Bench)
假設(shè)我站在手持相機人的位置,并且面朝他現(xiàn)在面朝的方向。摩托車是位于我的左側(cè)還是右側(cè)? GPT-5選擇答案A(左側(cè)),SenseNova-SI-8B選擇答案B,??正確答案為B(右側(cè))。(例題源自SITE-Bench)
多車道道路場景,判斷黃色汽車的后續(xù)動作(如直行、轉(zhuǎn)向等)。GPT-5選擇答案C(靜止),SenseNova-SI-8B選擇答案(D),??正確答案為D(右轉(zhuǎn))??。(例題源自SITE-Bench)
同一戶外場景,通過視角變化判斷移動方向。GPT-5選擇答案C,SenseNova-SI-8B選擇答案D,正確答案為向左前方移動(選項D)。(例題源自MindCube)
同一室內(nèi)空間,包含白板、椅子和沙發(fā)等,通過物體位置變化分析移動方向。GPT-5選擇答案D,SenseNova-SI-8B選擇答案A,正確答案為向左前方移動(選項A)。(例題源自MindCube)
從不同角度拍攝帶黑色衣物的桌子,從正面視角(圖1)判斷桌子右側(cè)物體。GPT-5選擇答案B,SenseNova-SI-8B選擇答案C,正確答案為門(選項C)。(例題源自MindCube)

推動世界模型和具身智能生態(tài)發(fā)展

空間智能是世界模型與具身智能理解物理世界的基礎(chǔ)能力。今年7月,商湯正式發(fā)布“悟能”具身智能平臺,該平臺以商湯“開悟”世界模型為核心引擎,旨在為機器人和智能設(shè)備提供在物理世界中自主探索和進(jìn)化的能力。

此次發(fā)布的空間智能大模型SenseNova-SI,與“開悟”世界模型相輔相成,將更好地解決多模態(tài)模型從數(shù)字空間走向物理世界的基礎(chǔ)挑戰(zhàn),并在未來進(jìn)一步推動AI在自動駕駛、機器人等場景的應(yīng)用。

此外,商湯還同步開源了空間智能測評平臺 EASI(https://github.com/EvolvingLMMs-Lab/EASI)與“英雄榜”,旨在推動空間智能技術(shù)評估標(biāo)準(zhǔn)的統(tǒng)一,持續(xù)跟蹤并展示開源和閉源模型的性能進(jìn)展,為學(xué)術(shù)界和工業(yè)界提供權(quán)威的評估基準(zhǔn),促進(jìn)協(xié)同創(chuàng)新。

商湯SenseNova-SI的推出標(biāo)志著AI在三維世界理解能力上邁出關(guān)鍵一步,也為下一代通用人工智能技術(shù)融入物理世界打下堅實基礎(chǔ)。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

商湯科技

2.5k
  • 商湯日日新Seko系列模型與寒武紀(jì)成功適配,國產(chǎn)算力&多模態(tài)AI實現(xiàn)關(guān)鍵跨越
  • 2026年AI應(yīng)用生態(tài)提速,港股通科技ETF嘉實(520670)布局AI科技企業(yè)價值重估機會

評論

暫無評論哦,快來評價一下吧!

商湯日日新發(fā)布并開源空間智能模型,性能超越GPT-5、Geminil

商湯科技近日在空間智能領(lǐng)域取得重大突破,發(fā)布并開源了SenseNova-SI系列模型,其性能在多項權(quán)威評測中超越了同量級開源模型及國際頂尖閉源模型如GPT-5和Gemini 2.5 Pro。該系列模型在空間理解和推理任務(wù)上表現(xiàn)出色,尤其在空間智能短板問題上,解決了現(xiàn)有大模型難以處理的空間結(jié)構(gòu)理解問題。

今天,商湯日日新在空間智能領(lǐng)域?qū)崿F(xiàn)重要突破,正式發(fā)布并開源SenseNova-SI系列模型。在多項權(quán)威評測的空間理解和推理任務(wù)上,SenseNova-SI 不僅大幅度領(lǐng)先同量級開源多模態(tài)大模型,還超越了 GPT-5 和 Gemini 2.5 Pro 等國際頂尖閉源模型的表現(xiàn)。

空間智能短板與系統(tǒng)性解決

當(dāng)下行業(yè)領(lǐng)先的大模型,雖然在知識、寫作、推理、編程等方面展示了突出的性能,但是普遍存在一個重要的缺陷,就是對空間結(jié)構(gòu)的理解和推理存在很嚴(yán)重的短板,而這恰恰是具身智能體與世界交互所需要的關(guān)鍵基礎(chǔ)能力。

我們來看一個例子,左圖源自最強大腦的圖形推理題,對人類都具有相當(dāng)?shù)碾y度,GPT-5能夠輕松破解,可見它在非空間智能問題上已具備很強能力。反觀右圖,是一道人類兒童都能輕易解決的簡單空間問題,要求選擇正確俯視圖,GPT-5卻令人意外地犯起了難,錯誤地選擇了"A”。

以上例子恰好暴露了當(dāng)前大模型在空間理解上的短板。因此要讓AI真正"看懂"三維世界,空間智能一直是關(guān)鍵的試金石。

商湯圍繞空間智能進(jìn)行了深入創(chuàng)新探索,找到了提升空間智能的系統(tǒng)性訓(xùn)練方法,打造了日日新·空間智能大模型系列 SenseNova-SI 并正式開源。

評測表現(xiàn)多項任務(wù)超越GPT-5,顯著領(lǐng)先同量級開源模型

這次開源的SenseNova-SI空間智能大模型系列包括 2B 和 8B 兩個規(guī)格。

最新評測數(shù)據(jù)顯示,SenseNova-SI系列模型在空間智能多個基準(zhǔn)測試(VSI、MMSI、MindCube、ViewSpatial)中表現(xiàn)突出,具體如下:

數(shù)據(jù)來源:https://github.com/OpenSenseNova/SenseNova-SI

其中SenseNova-SI-8B模型在四個基本評測中獲得 60.99 的平均成績,不僅大幅領(lǐng)先Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等開源通用多模態(tài)模型,以及 SpatialMLLM(35.05)、ViLaSR-7B(36.41) 等專門的空間智能模型,還以相對輕量的模型規(guī)格實現(xiàn)了對GPT-5(49.68)、Gemini-2.5-Pro(48.81)等頂級閉源模型的超越。這里顯著的性能提升反映了模型在空間智能上獲得了質(zhì)的突破,而不是簡單的性能改善。

基于"尺度效應(yīng)"的訓(xùn)練范式,實現(xiàn)能力系統(tǒng)性提升?

SenseNova-SI的性能飛躍,源于商湯從訓(xùn)練數(shù)據(jù)到方法上的系統(tǒng)性方案。依托商湯提出的空間能力分類體系和過往多樣化的數(shù)據(jù)的積累,團隊采用系統(tǒng)化的方法擴充空間理解數(shù)據(jù)的規(guī)模,首次在空間智能領(lǐng)域驗證了“尺度效應(yīng)”,即通過高質(zhì)量、大規(guī)模數(shù)據(jù)訓(xùn)練,可顯著提升模型的空間認(rèn)知能力。

商湯提出的訓(xùn)練范式具備通用性,能夠針對不同架構(gòu)的基模型(如InternVL等)進(jìn)行有效增強,使其在空間智能六大核心維度上——包括空間測量、空間重構(gòu)、空間關(guān)系、視角轉(zhuǎn)換、空間形變與空間推理——實現(xiàn)一致性的能力提升。

商湯稍后將發(fā)布詳細(xì)的技術(shù)報告,詳細(xì)闡述具體的技術(shù)方案。

以下為GPT-5和SenseNova-SI-8B模型面對空間智能問題,給出的答案對比。

??給出的立方體組合圖形,要求選擇正確俯視圖。GPT-5選擇答案D,SenseNova-SI-8B選擇答案B,正確答案為B。(例題源自SITE-Bench)
假設(shè)我站在手持相機人的位置,并且面朝他現(xiàn)在面朝的方向。摩托車是位于我的左側(cè)還是右側(cè)? GPT-5選擇答案A(左側(cè)),SenseNova-SI-8B選擇答案B,??正確答案為B(右側(cè))。(例題源自SITE-Bench)
多車道道路場景,判斷黃色汽車的后續(xù)動作(如直行、轉(zhuǎn)向等)。GPT-5選擇答案C(靜止),SenseNova-SI-8B選擇答案(D),??正確答案為D(右轉(zhuǎn))??。(例題源自SITE-Bench)
同一戶外場景,通過視角變化判斷移動方向。GPT-5選擇答案C,SenseNova-SI-8B選擇答案D,正確答案為向左前方移動(選項D)。(例題源自MindCube)
同一室內(nèi)空間,包含白板、椅子和沙發(fā)等,通過物體位置變化分析移動方向。GPT-5選擇答案D,SenseNova-SI-8B選擇答案A,正確答案為向左前方移動(選項A)。(例題源自MindCube)
從不同角度拍攝帶黑色衣物的桌子,從正面視角(圖1)判斷桌子右側(cè)物體。GPT-5選擇答案B,SenseNova-SI-8B選擇答案C,正確答案為門(選項C)。(例題源自MindCube)

推動世界模型和具身智能生態(tài)發(fā)展

空間智能是世界模型與具身智能理解物理世界的基礎(chǔ)能力。今年7月,商湯正式發(fā)布“悟能”具身智能平臺,該平臺以商湯“開悟”世界模型為核心引擎,旨在為機器人和智能設(shè)備提供在物理世界中自主探索和進(jìn)化的能力。

此次發(fā)布的空間智能大模型SenseNova-SI,與“開悟”世界模型相輔相成,將更好地解決多模態(tài)模型從數(shù)字空間走向物理世界的基礎(chǔ)挑戰(zhàn),并在未來進(jìn)一步推動AI在自動駕駛、機器人等場景的應(yīng)用。

此外,商湯還同步開源了空間智能測評平臺 EASI(https://github.com/EvolvingLMMs-Lab/EASI)與“英雄榜”,旨在推動空間智能技術(shù)評估標(biāo)準(zhǔn)的統(tǒng)一,持續(xù)跟蹤并展示開源和閉源模型的性能進(jìn)展,為學(xué)術(shù)界和工業(yè)界提供權(quán)威的評估基準(zhǔn),促進(jìn)協(xié)同創(chuàng)新。

商湯SenseNova-SI的推出標(biāo)志著AI在三維世界理解能力上邁出關(guān)鍵一步,也為下一代通用人工智能技術(shù)融入物理世界打下堅實基礎(chǔ)。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。