文 | 聶益南
2026 年,隨著英偉達(dá) GTC 大會(huì)將 “Token” 確立為 AI 推理時(shí)代的產(chǎn)業(yè)宏圖錨點(diǎn),這一詞匯的出現(xiàn)頻率已超越了單純的技術(shù)范疇,成為衡量算力經(jīng)濟(jì)的核心標(biāo)尺。
然而,在中國 AI 產(chǎn)業(yè)高歌猛進(jìn)之時(shí),作為 AI 處理信息最小單元的 “Token”,至今缺乏一個(gè)既能精準(zhǔn)承載其概念內(nèi)涵,又符合漢語美學(xué)的中文譯名。雖然全國科學(xué)技術(shù)名詞審定委員會(huì)(全國名詞委)2026年3月25日,正式發(fā)布《關(guān)于發(fā)布試用人工智能領(lǐng)域名詞 token 中文名 “詞元” 的公告》,優(yōu)先推薦 “詞元” 為 AI 領(lǐng)域 token 的標(biāo)準(zhǔn)中文名并面向全社會(huì)試用。但爭議并未平息,清華大學(xué)楊斌教授等業(yè)內(nèi)人士堅(jiān)持 “模元”的譯名, 這是學(xué)界 / 產(chǎn)業(yè)界極具影響力的學(xué)術(shù)提議,此外還有“智元”等提議。在筆者看來,這場討論遠(yuǎn)未結(jié)束,現(xiàn)有譯名均存在難以忽視的一個(gè)本質(zhì)性問題,即缺乏語言學(xué)理論的支撐,沒有認(rèn)識(shí)到token這樣一個(gè)AI時(shí)代的高頻詞是我們構(gòu)建漢語AI話語體系大廈的基石,我們亟需一個(gè)兼具國際化和漢語特點(diǎn)、有語言學(xué)理論支撐、適配 AI 全產(chǎn)業(yè)發(fā)展的全新譯名 —— “圖根”。
一、現(xiàn)有譯名之弊:詞元與模元的先天局限與適配困境
當(dāng)前圍繞 Token 形成的 “詞元”、“模元”等譯名方案,均從單一維度切入定義這一 AI 核心概念,既無法匹配其技術(shù)本質(zhì)與產(chǎn)業(yè)屬性,也難以適配多模態(tài)大模型的發(fā)展趨勢,成為中文 AI 話語體系構(gòu)建的明顯桎梏。
1、官方定名“詞元”具有領(lǐng)域窄化與本質(zhì)偏移的雙重硬傷

全國名詞委基于計(jì)算語言學(xué)傳統(tǒng)將 Token 定名為 “詞元”,雖具備術(shù)語規(guī)范的初始價(jià)值,但從 AI 產(chǎn)業(yè)發(fā)展與技術(shù)本質(zhì)來看,存在兩大無法調(diào)和的核心問題:
—— 領(lǐng)域窄化,適配性缺失:“詞元”的 “詞”字將概念嚴(yán)格限定在自然語言處理(NLP)領(lǐng)域,指向文本、語言這一單一信息形態(tài)。但在多模態(tài)大模型時(shí)代,Token 的處理對(duì)象已拓展至圖像、音頻、視頻的 “視覺塊” “音頻幀”,甚至在具身智能中成為物理空間的坐標(biāo)映射,這些顯然并非傳統(tǒng)意義上的“詞”,用 “詞元”描述非文本類信息處理,在邏輯上存在根本性硬傷。
—— 本質(zhì)偏移,內(nèi)涵殘缺:Token 在 AI 時(shí)代的屬性早已超越單純的 “信息單元”,更是 AI 推理的 “算力消耗單元” 和算力經(jīng)濟(jì)的 “經(jīng)濟(jì)計(jì)價(jià)單位”,是支撐智能處理的核心載體。而 “詞元”的 “元”字僅能體現(xiàn)其“單元”屬性,無法充分承載其作為算力燃料的經(jīng)濟(jì)屬性和智能處理的本體屬性,內(nèi)涵表達(dá)嚴(yán)重殘缺。
2、業(yè)內(nèi)提議的“模元”:表意模糊與產(chǎn)業(yè)適配不足的先天缺陷
清華大學(xué)楊斌教授等業(yè)內(nèi)人士提出的 “模元”譯名,試圖突破“詞元”的文本局限,適配大模型的技術(shù)背景,但該譯名同樣存在顯著問題,難以成為最優(yōu)解:
—— 表意模糊,核心內(nèi)涵缺失:“模元”的“模”字僅簡單指向“模型”,未能精準(zhǔn)錨定 Token 作為 AI 處理最小基本單元的核心特征,也無法體現(xiàn)其對(duì)世界認(rèn)知的表征屬性,與 Token 的技術(shù)本質(zhì)存在明顯脫節(jié),難以讓行業(yè)與大眾形成清晰、統(tǒng)一的概念認(rèn)知。
—— 產(chǎn)業(yè)包容性弱,缺乏前瞻性:“模”字的指向性仍較為單一,僅聚焦于大模型這一技術(shù)載體,未能覆蓋 AI 全產(chǎn)業(yè)的發(fā)展場景,也無法適配算力經(jīng)濟(jì)、具身智能等 AI 未來演進(jìn)方向,缺乏對(duì) AI 產(chǎn)業(yè)生態(tài)的整體包容性。
3、現(xiàn)有譯名的共同癥結(jié):脫離AI通用智能的發(fā)展本質(zhì)
無論是“詞元”還是 “模元”,其核心癥結(jié)均在于未能立足 AI 作為通用技術(shù)的發(fā)展本質(zhì):前者受限于計(jì)算語言學(xué)的傳統(tǒng)視角,后者局限于大模型的單一技術(shù)維度,均未從 Token 的跨領(lǐng)域技術(shù)本質(zhì)、全產(chǎn)業(yè)屬性、未來演進(jìn)趨勢進(jìn)行綜合定義。這種單一維度的命名邏輯,不僅無法準(zhǔn)確描述 Token 的核心內(nèi)涵,更可能束縛中國 AI 產(chǎn)業(yè)的想象力,阻礙中文 AI 話語體系的構(gòu)建。
從語言學(xué)的角度看,“詞元”和“模元”的翻譯都扔掉了“音譯”這個(gè)思路,也就是丟棄了語音作為詞語的物質(zhì)外殼,完全生造的兩個(gè)漢語詞和“token”在語音上沒有任何聯(lián)系,這受到業(yè)內(nèi)人士的嚴(yán)厲詬病,也是他們堅(jiān)持用token原詞的重要原因。音譯是外來詞漢化的重要途徑,如“可口可樂”這樣音義俱佳的范例不勝枚舉。放棄token譯名語音的聯(lián)系,其一大弊端是嚴(yán)重的損害了這個(gè)譯名本應(yīng)具有的國際化色彩,在漢語日益國際化的今天,可以預(yù)見到“詞元”后續(xù)將嚴(yán)重制約其作為AI高頻詞的國際交際功能和國際影響力。
二、核心定名提議:圖根 —— 適配 AI 時(shí)代的 Token 最優(yōu)譯名
在剖析現(xiàn)有譯名先天局限的基礎(chǔ)上,結(jié)合 Token 的技術(shù)本質(zhì)、產(chǎn)業(yè)屬性、多模態(tài)發(fā)展趨勢,以及中文的語言學(xué)特征與文化傳承,筆者提議將 Token漢譯名正式定名為圖根(Tu-ken)。這一譯名實(shí)現(xiàn)了音義兼顧、神形兼?zhèn)?,既精?zhǔn)承載了 Token 的核心內(nèi)涵,又適配 AI 全產(chǎn)業(yè)的發(fā)展需求,更接續(xù)了中國計(jì)算文明的文化基因,且深度契合語言的約定俗成性,是重構(gòu) AI 時(shí)代中文技術(shù)話語權(quán)的最優(yōu)選擇。
1 、音之天成:貼合原詞發(fā)音,符合漢語語音美學(xué)
翻譯的至高境界在于音義兼顧,“圖根”在語音層面與Token實(shí)現(xiàn)了高度契合,兼具自然度與辨識(shí)度:
Token 源自古英語 tāc (e) n,其首音節(jié)“To”與 “圖”的漢語發(fā)音完全同音,擲地有聲,易讀易記;
尾音節(jié) "Ken" 與 "根" 的聲母 /k/ 在發(fā)音部位(軟腭)與發(fā)音方法(塞音)上完全一致,僅送氣與否存在微小差別,聽感渾然一體,符合漢語的語音習(xí)慣。
這種音韻上的高度契合,是“詞元”、“模元”等譯名無法企及的,為其在行業(yè)與大眾間的傳播奠定了語音基礎(chǔ)。
2、義之深邃:精準(zhǔn)定義技術(shù)本質(zhì),覆蓋全產(chǎn)業(yè)核心屬性
“圖根” 二字各有深意和淵源,合璧之后則精準(zhǔn)錨定了 Token 的技術(shù)本質(zhì)、產(chǎn)業(yè)屬性與發(fā)展趨勢,實(shí)現(xiàn)了內(nèi)涵表達(dá)的完整性與精準(zhǔn)性:
“圖”:升維覆蓋,適配多模態(tài)與全產(chǎn)業(yè):“圖”并非單純指圖畫,而是拓展為圖譜、宏圖、表征,既指向 AI 對(duì)世界認(rèn)知的表征(Representation) 核心功能,又能覆蓋圖像、音頻、視頻等多模態(tài)信息處理場景,突破了“詞”的文本局限;同時(shí),“圖”指向“圖靈”開啟的計(jì)算文明,呼應(yīng)了 AI 的技術(shù)本源,具備極強(qiáng)的產(chǎn)業(yè)包容性與前瞻性。
“根”:錨定核心,體現(xiàn)本體與單元屬性:“根”既指根源、本體,精準(zhǔn)體現(xiàn) Token 作為 AI 智能處理本體屬性的核心地位,又在語言學(xué)中代表構(gòu)詞的最小單位(詞根、根詞,亦稱語素),完美契合 Token 作為 AI 處理最小基本單元的技術(shù)特征;同時(shí),“根”也暗含其作為 AI 產(chǎn)業(yè)基石的屬性,是算力經(jīng)濟(jì)、智能涌現(xiàn)的底層支撐。
二者結(jié)合,將“圖根”精準(zhǔn)定義為承載智能表征的最小基本單元,既體現(xiàn)了其技術(shù)本質(zhì),又覆蓋了其作為算力消耗單元、經(jīng)濟(jì)計(jì)價(jià)單位的產(chǎn)業(yè)屬性,實(shí)現(xiàn)了內(nèi)涵的全方位匹配。
3 、俗之契合:根植語言約定俗成,擁有深厚群眾基礎(chǔ)
“圖”和 “根”作為構(gòu)成“圖根”這一雙音節(jié)詞的兩個(gè)核心語素,不僅與 Token 在語音相近、語義存在深度內(nèi)在聯(lián)系,更在中文語境中擁有相當(dāng)深厚的群眾基礎(chǔ),選擇 “圖根”更是基于語言約定俗成性的必然結(jié)果。
“圖”的約定俗成:天然表意屬性與民間使用共識(shí):漢字作為表意文字,發(fā)軔于象形文字的孳生與演化,與“圖”有著與生俱來的天然聯(lián)系,其表意屬性與 Token 的表征功能高度契合;而網(wǎng)絡(luò)流行語(熱梗)“圖樣圖森破”更是將英語 “too/tu:/ ”直譯為“圖”的經(jīng)典實(shí)例,成為民間層面英語譯中“圖”字使用的約定俗成,讓大眾對(duì)“To”與“圖”的語音對(duì)應(yīng)形成了自然認(rèn)知。
“根”的約定俗成:科技領(lǐng)域的高頻通用語素:“根”是語言學(xué)、數(shù)學(xué)領(lǐng)域的重要專業(yè)詞匯,更是計(jì)算機(jī)科學(xué)、互聯(lián)網(wǎng)和人工智能領(lǐng)域中最重要的常用語素之一,如“詞根、根詞、根服務(wù)器、根節(jié)點(diǎn)、根目錄”等詞匯已成為科技行業(yè)與大眾的通用認(rèn)知,其作為技術(shù)領(lǐng)域基礎(chǔ)、核心、底層單元的內(nèi)涵早已深入人心,與 Token 的技術(shù)定位高度匹配。
4、 域之兼容:規(guī)避跨領(lǐng)域譯名沖突,構(gòu)建專屬術(shù)語空間
在計(jì)算機(jī)編譯原理和網(wǎng)絡(luò)安全領(lǐng)域,“Token” 長期被譯為 "記號(hào)" 或 "令牌",且已被行業(yè)廣泛接受,形成了固定的術(shù)語認(rèn)知。
“詞元”試圖在 AI 領(lǐng)域另立譯名,卻與傳統(tǒng)領(lǐng)域形成割裂,增加了跨領(lǐng)域交流的認(rèn)知成本;而“圖根”則完美規(guī)避了這一問題,既與“記號(hào)”“令牌”等傳統(tǒng)譯名形成明確區(qū)分,不產(chǎn)生跨領(lǐng)域概念混淆,又為 AI 時(shí)代的 Token 創(chuàng)造了全新的、專屬的術(shù)語空間,實(shí)現(xiàn)了跨領(lǐng)域術(shù)語的和諧兼容。
三、圖根的產(chǎn)業(yè)與文化價(jià)值:重構(gòu)AI時(shí)代中文技術(shù)話語權(quán)的核心基石
“圖根”并非單純的譯名創(chuàng)新,更是立足 AI 產(chǎn)業(yè)發(fā)展、中國文化傳承與語言使用習(xí)慣的術(shù)語構(gòu)建,其背后承載著適配產(chǎn)業(yè)發(fā)展、接續(xù)文化基因、凝聚行業(yè)共識(shí)的多重價(jià)值,是重構(gòu) AI 時(shí)代中文技術(shù)話語權(quán)的核心基石。
1、 產(chǎn)業(yè)包容性:適配多模態(tài)趨勢,成為算力經(jīng)濟(jì)的全新專用計(jì)量單位
在多模態(tài)已成為大模型標(biāo)配、算力經(jīng)濟(jì)成為 AI 產(chǎn)業(yè)核心邏輯的今天,“圖根” 的“圖”字實(shí)現(xiàn)了對(duì)全信息形態(tài)、全 AI 產(chǎn)業(yè)場景的升維覆蓋,無論是視覺塊、音頻幀,還是物理空間坐標(biāo)映射,均可通過“圖根”進(jìn)行精準(zhǔn)描述,徹底擺脫了現(xiàn)有譯名的場景局限。
從產(chǎn)業(yè)經(jīng)濟(jì)學(xué)視角來看,“圖根”不僅是 AI 的處理單元,更能成為智能經(jīng)濟(jì)的全新計(jì)量單位—— 正如工業(yè)時(shí)代以“用電量”衡量產(chǎn)業(yè)發(fā)展,AI 時(shí)代可以“圖根消耗量”衡量算力需求、推理效率與產(chǎn)業(yè)價(jià)值,這種命名邏輯為 AI 算力經(jīng)濟(jì)提供了清晰、統(tǒng)一的中文表達(dá),適配產(chǎn)業(yè)發(fā)展的核心需求。
2、 文化傳承性:接續(xù)圖靈計(jì)算文明,構(gòu)建中文 AI 話語體系
語言是文明的載體,術(shù)語的構(gòu)建離不開文化基因的傳承。計(jì)算機(jī)界的最高榮譽(yù)是 “圖靈獎(jiǎng)”, “圖靈”二字早已深植于中國科技界的文化基因之中,成為中國計(jì)算文明的重要符號(hào)。
將 Token 譯為“圖根”,便與“圖靈”形成了完美的邏輯閉環(huán):圖靈定義了計(jì)算的靈魂,圖根定義了智能的本體。這一譯名讓 AI 核心術(shù)語與中國計(jì)算文明的文化符號(hào)實(shí)現(xiàn)了深度綁定,擺脫了對(duì)英文術(shù)語的單純依附,為構(gòu)建具有中國文化特色的 AI 話語體系奠定了重要基礎(chǔ)。
3 、共識(shí)凝聚性:破解譯名割裂困境,實(shí)現(xiàn)全圈層認(rèn)知統(tǒng)一
當(dāng)前 Token 譯名存在“學(xué)術(shù)圈用、產(chǎn)業(yè)圈棄、大眾圈混”的三層分化:學(xué)術(shù)圈強(qiáng)制落地“詞元”,產(chǎn)業(yè)圈因適配性問題堅(jiān)守英文原詞,大眾圈因譯名混亂加深對(duì)英文的依賴。這種割裂不僅阻礙了術(shù)語的傳播,更影響了中文 AI 話語體系的構(gòu)建。
“圖根”憑借其音義雙美的特征、精準(zhǔn)的技術(shù)表達(dá)、全產(chǎn)業(yè)的適配性,以及根植于語言約定俗成的群眾基礎(chǔ),能夠打破學(xué)術(shù)、產(chǎn)業(yè)、大眾之間的認(rèn)知壁壘:既符合學(xué)術(shù)界對(duì)術(shù)語規(guī)范性、內(nèi)涵精準(zhǔn)性的要求,又滿足產(chǎn)業(yè)界對(duì)多模態(tài)適配、跨領(lǐng)域兼容的需求,還能讓大眾輕松理解、快速接受,從而破解譯名割裂的現(xiàn)實(shí)困境,實(shí)現(xiàn)全圈層的認(rèn)知統(tǒng)一,凝聚起行業(yè)與社會(huì)的共識(shí)。
四、現(xiàn)有譯名的產(chǎn)業(yè)實(shí)踐困境:官方定名與民間應(yīng)用的深度割裂
現(xiàn)有“詞元、模元”等譯名的先天局限,直接導(dǎo)致了 Token 譯名在產(chǎn)業(yè)實(shí)踐中出現(xiàn)官方定名與民間應(yīng)用深度割裂的現(xiàn)實(shí)圖景,這一現(xiàn)狀也從側(cè)面印證了全新譯名“圖根”的必要性與緊迫性。
1 、三層分化的現(xiàn)實(shí)圖景
學(xué)術(shù)圈:強(qiáng)制落地,形式化普及:在教材、論文及官方出版物中,“詞元”因全國名詞委的行政約束力實(shí)現(xiàn)了形式化普及,學(xué)術(shù)期刊、國家數(shù)據(jù)局統(tǒng)計(jì)口徑及權(quán)威媒體均嚴(yán)格使用該譯名,但這種普及僅停留在表面,并未真正被學(xué)界從內(nèi)心認(rèn)可。
產(chǎn)業(yè)圈:頑固抵抗,堅(jiān)守英文原詞:在技術(shù)文檔、API 計(jì)費(fèi)及產(chǎn)品界面中,英文 “Token”仍是絕對(duì)主流?!霸~元”的 “詞”字帶來的文本枷鎖,讓企業(yè)無法接受用其描述圖像、音頻等非文本信息的處理單元,而“模元”也因表意模糊無法滿足產(chǎn)業(yè)需求,導(dǎo)致產(chǎn)業(yè)界寧愿保留英文原詞,也不愿接受現(xiàn)有不準(zhǔn)確的中文名。
大眾圈:認(rèn)知混亂,依賴英文術(shù)語:科普內(nèi)容中出現(xiàn)了 “詞元、模元 、智元”等各說各話的局面,缺乏像“字節(jié)”那樣的唯一共識(shí)。普通用戶面對(duì)雜亂的譯名時(shí)極易產(chǎn)生困惑,不僅無法形成清晰的概念認(rèn)知,反而進(jìn)一步加深了對(duì)英文 “Token”的依賴,不利于 AI 知識(shí)的大眾傳播。
2 、割裂的本質(zhì):語言學(xué)本位與 AI 通用智能本位的核心沖突
現(xiàn)有譯名的產(chǎn)業(yè)實(shí)踐困境,其本質(zhì)是語言學(xué)本位與 AI 通用智能本位的核心沖突:全國名詞委基于計(jì)算語言學(xué)的傳統(tǒng)視角進(jìn)行定名,屬于“語言學(xué)本位”的邏輯;而產(chǎn)業(yè)界與反對(duì)者則著眼于 AI 作為通用技術(shù)的未來演進(jìn),從技術(shù)本質(zhì)、產(chǎn)業(yè)屬性、多模態(tài)趨勢出發(fā)提出訴求,屬于“AI 通用智能本位”的邏輯。
兩種本位的沖突,讓現(xiàn)有譯名無法實(shí)現(xiàn)學(xué)術(shù)與產(chǎn)業(yè)的同頻,也無法滿足 AI 產(chǎn)業(yè)的發(fā)展需求,這也意味著,Token 的譯名重構(gòu),本質(zhì)上是一次打破“語言學(xué)本位” 和“AI 通用智能本位”的行業(yè)視界的認(rèn)知局限,取二者之長形成全民共識(shí)的努力,而“圖根”正是這一努力的核心成果。
五、結(jié)語:約之以名,名正言順,以圖根構(gòu)建中國 AI 話語體系
荀子曰:“名無固宜,約之以命?!泵~的最終確立,不在于單一機(jī)構(gòu)的審定,而在于學(xué)界、產(chǎn)業(yè)界、社會(huì)大眾的共同共識(shí),語言的生命力終究在于使用?;仡櫄v史,“邏輯”、“經(jīng)濟(jì)”等許多經(jīng)典術(shù)語的最終定型,無不是經(jīng)過了學(xué)界與業(yè)界的反復(fù)推敲與大眾的自然選擇。
Token 作為 AI 時(shí)代的底層基石,其譯名不僅是一個(gè)簡單的語言問題,更是中國 AI 話語體系構(gòu)建的核心環(huán)節(jié),需要一個(gè)既能承載技術(shù)本質(zhì)、適配產(chǎn)業(yè)發(fā)展,又能接續(xù)文化文脈、契合語言習(xí)慣、凝聚全民共識(shí)的名字?!皥D根”取“圖”之表征,承“根”之本源,音義雙美、神形兼?zhèn)?,既精?zhǔn)定義了Token 的核心內(nèi)涵,又適配了多模態(tài)大模型與算力經(jīng)濟(jì)的發(fā)展趨勢,更接續(xù)了圖靈開啟的計(jì)算文明基因,且根植于中文語境的約定俗成,擁有深厚的群眾基礎(chǔ)。
在此,筆者呼吁產(chǎn)業(yè)界、學(xué)術(shù)界與媒體同仁,共同參與token漢譯名的討論,打破現(xiàn)有譯名的局限,大膽試用“圖根”,讓這一譯名在實(shí)踐中接受檢驗(yàn)、形成共識(shí)。讓我們以“圖根” 為基石,擺脫對(duì)英文術(shù)語的依附,重構(gòu) AI 時(shí)代的中文技術(shù)話語權(quán),讓智能涌現(xiàn)的未來,從這一個(gè)個(gè)堅(jiān)實(shí)的圖根開始,生根發(fā)芽,開花結(jié)果。
作者簡介:聶益南,西北大學(xué)中文系漢語言文學(xué)專業(yè)學(xué)士(1982);四川大學(xué)現(xiàn)代漢語專業(yè)碩士(1988);原中華工商時(shí)報(bào)記者


