商湯日日新發(fā)布并開(kāi)源空間智能模型，性能超越GPT-5、Geminil

商湯科技近日在空間智能領(lǐng)域取得重大突破，發(fā)布并開(kāi)源了SenseNova-SI系列模型，其性能在多項(xiàng)權(quán)威評(píng)測(cè)中超越了同量級(jí)開(kāi)源模型及國(guó)際頂尖閉源模型如GPT-5和Gemini 2.5 Pro。該系列模型在空間理解和推理任務(wù)上表現(xiàn)出色，尤其在空間智能短板問(wèn)題上，解決了現(xiàn)有大模型難以處理的空間結(jié)構(gòu)理解問(wèn)題。

來(lái)源：界面新聞

今天，商湯日日新在空間智能領(lǐng)域?qū)崿F(xiàn)重要突破，正式發(fā)布并開(kāi)源SenseNova-SI系列模型。在多項(xiàng)權(quán)威評(píng)測(cè)的空間理解和推理任務(wù)上，SenseNova-SI 不僅大幅度領(lǐng)先同量級(jí)開(kāi)源多模態(tài)大模型，還超越了 GPT-5 和 Gemini 2.5 Pro 等國(guó)際頂尖閉源模型的表現(xiàn)。

空間智能短板與系統(tǒng)性解決

當(dāng)下行業(yè)領(lǐng)先的大模型，雖然在知識(shí)、寫(xiě)作、推理、編程等方面展示了突出的性能，但是普遍存在一個(gè)重要的缺陷，就是對(duì)空間結(jié)構(gòu)的理解和推理存在很?chē)?yán)重的短板，而這恰恰是具身智能體與世界交互所需要的關(guān)鍵基礎(chǔ)能力。

我們來(lái)看一個(gè)例子，左圖源自最強(qiáng)大腦的圖形推理題，對(duì)人類(lèi)都具有相當(dāng)?shù)碾y度，GPT-5能夠輕松破解，可見(jiàn)它在非空間智能問(wèn)題上已具備很強(qiáng)能力。反觀(guān)右圖，是一道人類(lèi)兒童都能輕易解決的簡(jiǎn)單空間問(wèn)題，要求選擇正確俯視圖，GPT-5卻令人意外地犯起了難，錯(cuò)誤地選擇了"A”。

以上例子恰好暴露了當(dāng)前大模型在空間理解上的短板。因此要讓AI真正"看懂"三維世界，空間智能一直是關(guān)鍵的試金石。

商湯圍繞空間智能進(jìn)行了深入創(chuàng)新探索，找到了提升空間智能的系統(tǒng)性訓(xùn)練方法，打造了日日新·空間智能大模型系列 SenseNova-SI 并正式開(kāi)源。

評(píng)測(cè)表現(xiàn)多項(xiàng)任務(wù)超越GPT-5，顯著領(lǐng)先同量級(jí)開(kāi)源模型

這次開(kāi)源的SenseNova-SI空間智能大模型系列包括 2B 和 8B 兩個(gè)規(guī)格。

最新評(píng)測(cè)數(shù)據(jù)顯示，SenseNova-SI系列模型在空間智能多個(gè)基準(zhǔn)測(cè)試（VSI、MMSI、MindCube、ViewSpatial）中表現(xiàn)突出，具體如下：

數(shù)據(jù)來(lái)源：https://github.com/OpenSenseNova/SenseNova-SI

其中SenseNova-SI-8B模型在四個(gè)基本評(píng)測(cè)中獲得 60.99 的平均成績(jī)，不僅大幅領(lǐng)先Qwen3-VL-8B（40.16）、BAGEL-7B（35.01）等開(kāi)源通用多模態(tài)模型，以及 SpatialMLLM（35.05）、ViLaSR-7B（36.41）等專(zhuān)門(mén)的空間智能模型，還以相對(duì)輕量的模型規(guī)格實(shí)現(xiàn)了對(duì)GPT-5（49.68）、Gemini-2.5-Pro（48.81）等頂級(jí)閉源模型的超越。這里顯著的性能提升反映了模型在空間智能上獲得了質(zhì)的突破，而不是簡(jiǎn)單的性能改善。

基于"尺度效應(yīng)"的訓(xùn)練范式，實(shí)現(xiàn)能力系統(tǒng)性提升?

SenseNova-SI的性能飛躍，源于商湯從訓(xùn)練數(shù)據(jù)到方法上的系統(tǒng)性方案。依托商湯提出的空間能力分類(lèi)體系和過(guò)往多樣化的數(shù)據(jù)的積累，團(tuán)隊(duì)采用系統(tǒng)化的方法擴(kuò)充空間理解數(shù)據(jù)的規(guī)模，首次在空間智能領(lǐng)域驗(yàn)證了“尺度效應(yīng)”，即通過(guò)高質(zhì)量、大規(guī)模數(shù)據(jù)訓(xùn)練，可顯著提升模型的空間認(rèn)知能力。

商湯提出的訓(xùn)練范式具備通用性，能夠針對(duì)不同架構(gòu)的基模型（如InternVL等）進(jìn)行有效增強(qiáng)，使其在空間智能六大核心維度上——包括空間測(cè)量、空間重構(gòu)、空間關(guān)系、視角轉(zhuǎn)換、空間形變與空間推理——實(shí)現(xiàn)一致性的能力提升。

商湯稍后將發(fā)布詳細(xì)的技術(shù)報(bào)告，詳細(xì)闡述具體的技術(shù)方案。

以下為GPT-5和SenseNova-SI-8B模型面對(duì)空間智能問(wèn)題，給出的答案對(duì)比。

??給出的立方體組合圖形，要求選擇正確俯視圖。GPT-5選擇答案D，SenseNova-SI-8B選擇答案B，正確答案為B。（例題源自SITE-Bench）

假設(shè)我站在手持相機(jī)人的位置，并且面朝他現(xiàn)在面朝的方向。摩托車(chē)是位于我的左側(cè)還是右側(cè)？ GPT-5選擇答案A（左側(cè)），SenseNova-SI-8B選擇答案B，??正確答案為B（右側(cè)）。（例題源自SITE-Bench）

多車(chē)道道路場(chǎng)景，判斷黃色汽車(chē)的后續(xù)動(dòng)作（如直行、轉(zhuǎn)向等）。GPT-5選擇答案C（靜止），SenseNova-SI-8B選擇答案（D），??正確答案為D（右轉(zhuǎn)）??。（例題源自SITE-Bench）

同一戶(hù)外場(chǎng)景，通過(guò)視角變化判斷移動(dòng)方向。GPT-5選擇答案C，SenseNova-SI-8B選擇答案D，正確答案為向左前方移動(dòng)（選項(xiàng)D）。（例題源自MindCube）

同一室內(nèi)空間，包含白板、椅子和沙發(fā)等，通過(guò)物體位置變化分析移動(dòng)方向。GPT-5選擇答案D，SenseNova-SI-8B選擇答案A，正確答案為向左前方移動(dòng)（選項(xiàng)A）。（例題源自MindCube）

從不同角度拍攝帶黑色衣物的桌子，從正面視角（圖1）判斷桌子右側(cè)物體。GPT-5選擇答案B，SenseNova-SI-8B選擇答案C，正確答案為門(mén)（選項(xiàng)C）。（例題源自MindCube）

推動(dòng)世界模型和具身智能生態(tài)發(fā)展

空間智能是世界模型與具身智能理解物理世界的基礎(chǔ)能力。今年7月，商湯正式發(fā)布“悟能”具身智能平臺(tái)，該平臺(tái)以商湯“開(kāi)悟”世界模型為核心引擎，旨在為機(jī)器人和智能設(shè)備提供在物理世界中自主探索和進(jìn)化的能力。

此次發(fā)布的空間智能大模型SenseNova-SI，與“開(kāi)悟”世界模型相輔相成，將更好地解決多模態(tài)模型從數(shù)字空間走向物理世界的基礎(chǔ)挑戰(zhàn)，并在未來(lái)進(jìn)一步推動(dòng)AI在自動(dòng)駕駛、機(jī)器人等場(chǎng)景的應(yīng)用。

此外，商湯還同步開(kāi)源了空間智能測(cè)評(píng)平臺(tái) EASI（https://github.com/EvolvingLMMs-Lab/EASI）與“英雄榜”，旨在推動(dòng)空間智能技術(shù)評(píng)估標(biāo)準(zhǔn)的統(tǒng)一，持續(xù)跟蹤并展示開(kāi)源和閉源模型的性能進(jìn)展，為學(xué)術(shù)界和工業(yè)界提供權(quán)威的評(píng)估基準(zhǔn)，促進(jìn)協(xié)同創(chuàng)新。

商湯SenseNova-SI的推出標(biāo)志著AI在三維世界理解能力上邁出關(guān)鍵一步，也為下一代通用人工智能技術(shù)融入物理世界打下堅(jiān)實(shí)基礎(chǔ)。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文，侵權(quán)必究。

商湯科技

2.5k

星聯(lián)未來(lái)完成數(shù)千萬(wàn)元A輪融資8天前
中國(guó)AI崛起的隱秘戰(zhàn)線(xiàn)22天前

評(píng)論

暫無(wú)評(píng)論哦，快來(lái)評(píng)價(jià)一下吧！

商湯科技

商湯日日新發(fā)布并開(kāi)源空間智能模型，性能超越GPT-5、Geminil

2025/11/11 11:31來(lái)源：界面新聞

空間智能短板與系統(tǒng)性解決

以上例子恰好暴露了當(dāng)前大模型在空間理解上的短板。因此要讓AI真正"看懂"三維世界，空間智能一直是關(guān)鍵的試金石。

評(píng)測(cè)表現(xiàn)多項(xiàng)任務(wù)超越GPT-5，顯著領(lǐng)先同量級(jí)開(kāi)源模型

這次開(kāi)源的SenseNova-SI空間智能大模型系列包括 2B 和 8B 兩個(gè)規(guī)格。

基于"尺度效應(yīng)"的訓(xùn)練范式，實(shí)現(xiàn)能力系統(tǒng)性提升?

商湯稍后將發(fā)布詳細(xì)的技術(shù)報(bào)告，詳細(xì)闡述具體的技術(shù)方案。

以下為GPT-5和SenseNova-SI-8B模型面對(duì)空間智能問(wèn)題，給出的答案對(duì)比。

推動(dòng)世界模型和具身智能生態(tài)發(fā)展

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文，侵權(quán)必究。

歷史搜索全部刪除

熱門(mén)搜索

商湯日日新發(fā)布并開(kāi)源空間智能模型，性能超越GPT-5、Geminil

空間智能短板與系統(tǒng)性解決

評(píng)測(cè)表現(xiàn)多項(xiàng)任務(wù)超越GPT-5，顯著領(lǐng)先同量級(jí)開(kāi)源模型

基于"尺度效應(yīng)"的訓(xùn)練范式，實(shí)現(xiàn)能力系統(tǒng)性提升?

推動(dòng)世界模型和具身智能生態(tài)發(fā)展

商湯科技

評(píng)論

商湯日日新發(fā)布并開(kāi)源空間智能模型，性能超越GPT-5、Geminil

空間智能短板與系統(tǒng)性解決

評(píng)測(cè)表現(xiàn)多項(xiàng)任務(wù)超越GPT-5，顯著領(lǐng)先同量級(jí)開(kāi)源模型

基于"尺度效應(yīng)"的訓(xùn)練范式，實(shí)現(xiàn)能力系統(tǒng)性提升?

推動(dòng)世界模型和具身智能生態(tài)發(fā)展

商湯日日新發(fā)布并開(kāi)源空間智能模型，性能超越GPT-5、Geminil

空間智能短板與系統(tǒng)性解決

評(píng)測(cè)表現(xiàn)多項(xiàng)任務(wù)超越GPT-5，顯著領(lǐng)先同量級(jí)開(kāi)源模型

基于"尺度效應(yīng)"的訓(xùn)練范式，實(shí)現(xiàn)能力系統(tǒng)性提升?

推動(dòng)世界模型和具身智能生態(tài)發(fā)展

商湯科技

評(píng)論

商湯日日新發(fā)布并開(kāi)源空間智能模型，性能超越GPT-5、Geminil

空間智能短板與系統(tǒng)性解決

評(píng)測(cè)表現(xiàn)多項(xiàng)任務(wù)超越GPT-5，顯著領(lǐng)先同量級(jí)開(kāi)源模型

基于"尺度效應(yīng)"的訓(xùn)練范式，實(shí)現(xiàn)能力系統(tǒng)性提升?

推動(dòng)世界模型和具身智能生態(tài)發(fā)展

商湯日日新發(fā)布并開(kāi)源空間智能模型，性能超越GPT-5、Geminil

評(píng)測(cè)表現(xiàn)多項(xiàng)任務(wù)超越GPT-5，顯著領(lǐng)先同量級(jí)開(kāi)源模型

商湯日日新發(fā)布并開(kāi)源空間智能模型，性能超越GPT-5、Geminil

評(píng)測(cè)表現(xiàn)多項(xiàng)任務(wù)超越GPT-5，顯著領(lǐng)先同量級(jí)開(kāi)源模型

基于"尺度效應(yīng)"的訓(xùn)練范式，實(shí)現(xiàn)能力系統(tǒng)性提升?