文|產(chǎn)業(yè)家 斗斗
編輯 | 皮爺
數(shù)據(jù)庫的角色正在被徹底重寫:不再只是數(shù)據(jù)倉庫、事務(wù)賬本、分析引擎,而是智能系統(tǒng)中真正可信的核心。AI成為組織大腦,數(shù)據(jù)庫就是數(shù)據(jù)調(diào)度的中樞——誰掌握數(shù)據(jù)流,誰就掌握智能流。
數(shù)據(jù)庫,這個長期“藏在后臺”的基礎(chǔ)設(shè)施,正被AI時代推向臺前。
客服想更精準(zhǔn)地回答用戶問題,推薦系統(tǒng)希望更快做出響應(yīng),風(fēng)控模型則需要更實(shí)時地識別風(fēng)險(xiǎn)——這些智能能力的背后,離不開數(shù)據(jù)庫提供持續(xù)、結(jié)構(gòu)化、具備上下文的數(shù)據(jù)支撐。
“以前數(shù)據(jù)庫是倉庫,現(xiàn)在更像是中樞?!盌atabend CEO 張雁飛這樣對產(chǎn)業(yè)家形容。
這一角色轉(zhuǎn)變,正重新定義數(shù)據(jù)庫在企業(yè)系統(tǒng)中的位置:它不僅要存數(shù)據(jù),還要參與推理、支撐決策、響應(yīng)模型調(diào)用,成為智能系統(tǒng)的“實(shí)時大腦”。
與此同時,問題也隨之而來。
“原先的權(quán)限系統(tǒng)正在失效?!蹦成鲜衅髽I(yè)數(shù)據(jù)安全產(chǎn)品部總經(jīng)理陳宇耀對產(chǎn)業(yè)家直言。
一個事實(shí)是,性能跟不上、權(quán)限不好管、安全邊界模糊……尤其在AI大量接入后,傳統(tǒng)數(shù)據(jù)庫架構(gòu)和管理方式正面臨重壓。
數(shù)據(jù)庫,正在經(jīng)歷一次深層的升級。
這一輪變化,對廠商、客戶、產(chǎn)品、安全體系,都是一次重新洗牌。
一、AI,讓數(shù)據(jù)庫正在“走向前臺”
“過去數(shù)據(jù)庫偏向后臺靜態(tài)數(shù)據(jù)倉庫,而今天,它更像一個前臺實(shí)時系統(tǒng)?!睆堁泔w告訴產(chǎn)業(yè)家,“數(shù)據(jù)庫,終于有新故事了。”
過去,數(shù)據(jù)庫的核心職責(zé)是存儲和查詢,主要被用于記錄訂單、交易、庫存等結(jié)構(gòu)化數(shù)據(jù)。但隨著AI模型進(jìn)入客服、搜索、推薦、分析等業(yè)務(wù)流程,數(shù)據(jù)庫的角色正在發(fā)生變化。
越來越多企業(yè)意識到,要讓AI系統(tǒng)“理解業(yè)務(wù)”,必須讓它獲取實(shí)時的、結(jié)構(gòu)化的數(shù)據(jù)上下文。而這些數(shù)據(jù),大多存放在數(shù)據(jù)庫中。數(shù)據(jù)庫逐漸成為AI模型背后的信息源,也成為支撐企業(yè)自動化流程的關(guān)鍵基礎(chǔ)設(shè)施。
在搜索增強(qiáng)生成(RAG)、Agent系統(tǒng)、實(shí)時推薦等場景中,數(shù)據(jù)庫被用于:存儲模型調(diào)用所需的上下文信息,如用戶歷史、商品屬性、產(chǎn)品知識;支持向量檢索,用于語義搜索、相似內(nèi)容匹配;記錄AI Agent的狀態(tài)和決策流程,確保自動化行為可追蹤、可回溯。
數(shù)據(jù)庫的調(diào)用方式也在變化。
以往是人操作系統(tǒng)時觸發(fā)數(shù)據(jù)庫查詢,現(xiàn)在是模型或Agent自動生成請求。這些請求頻率高、鏈路復(fù)雜、語義模糊,對數(shù)據(jù)庫的性能和響應(yīng)能力提出更高要求。
多位數(shù)據(jù)庫從業(yè)者跟產(chǎn)業(yè)家提到,客戶正在要求數(shù)據(jù)庫“不僅能存數(shù)據(jù),還要能理解語義”。這意味著數(shù)據(jù)庫需要支持更豐富的索引結(jié)構(gòu)、更靈活的數(shù)據(jù)格式,以及與AI系統(tǒng)之間更高效的接口。
“一個客戶將數(shù)據(jù)庫接入AI客服系統(tǒng),每一次用戶提問,模型都需要查詢產(chǎn)品信息、用戶偏好、訂單狀態(tài)等多個字段。過去一分鐘調(diào)用幾次數(shù)據(jù)庫就足夠,現(xiàn)在幾秒鐘可能就要處理上百次請求?!睆堁泔w告訴產(chǎn)業(yè)家。
除了性能壓力,客戶也希望數(shù)據(jù)庫能兼容多種數(shù)據(jù)類型。
一些新應(yīng)用需要同時處理結(jié)構(gòu)化數(shù)據(jù)(如用戶表)、非結(jié)構(gòu)化數(shù)據(jù)(如文本記錄)、向量數(shù)據(jù)(如語義嵌入)。數(shù)據(jù)庫產(chǎn)品也開始集成更多原本由搜索引擎、緩存系統(tǒng)、特征平臺承擔(dān)的功能。
這種變化不只是企業(yè)需求上的提升,也帶動數(shù)據(jù)庫產(chǎn)品形態(tài)的演進(jìn)。傳統(tǒng)數(shù)據(jù)庫的設(shè)計(jì)假設(shè)是“人操作系統(tǒng)”,現(xiàn)在則必須適應(yīng)“AI操作系統(tǒng)”的需求。
一些主流數(shù)據(jù)庫產(chǎn)品已開始做出回應(yīng)。
例如,PostgreSQL 社區(qū)涌現(xiàn)出多個兼容 LLM 的擴(kuò)展模塊;Databend 等云原生數(shù)倉則在底層集成向量與結(jié)構(gòu)化數(shù)據(jù)的混合檢索能力。
尤其是 Databend,其優(yōu)勢在新一輪洗牌中愈發(fā)凸顯。
張雁飛告訴產(chǎn)業(yè)家:“我們并不是在給傳統(tǒng)數(shù)據(jù)庫加AI插件,而是在為AI生態(tài)造數(shù)據(jù)庫?!?/p>
在研發(fā)一線,這種變化也體現(xiàn)在團(tuán)隊(duì)討論方式的轉(zhuǎn)變。
過去數(shù)據(jù)庫團(tuán)隊(duì)主要關(guān)注寫入性能、查詢優(yōu)化、事務(wù)一致性,現(xiàn)在越來越多話題圍繞“模型能不能讀得快、Agent調(diào)得穩(wěn)、上下文能否持續(xù)更新”。
總的來說,數(shù)據(jù)庫的“用戶”已經(jīng)從人,變成了模型和Agent。
這是一個看似細(xì)微、實(shí)則根本的變化。
它不僅改變了數(shù)據(jù)庫的訪問方式,也意味著數(shù)據(jù)庫必須承擔(dān)更多“推理輔助”和“協(xié)同管理”的責(zé)任。
二、技術(shù)轉(zhuǎn)型的挑戰(zhàn)和安全隱憂,集體爆發(fā)
數(shù)據(jù)庫“走向前臺”的轉(zhuǎn)變,不只是性能優(yōu)化的問題,更是一場架構(gòu)重構(gòu)和安全重塑的系統(tǒng)性挑戰(zhàn)。
在AI時代,數(shù)據(jù)庫廠商面臨的核心問題不再是單點(diǎn)能力的提升,而是如何適應(yīng)更復(fù)雜、更動態(tài)的智能應(yīng)用需求。
首先,數(shù)據(jù)庫形態(tài)正在發(fā)生根本性變化。過去,系統(tǒng)按“專一能力”劃分——做事務(wù)處理就專注OLTP,做分析就服務(wù)于數(shù)據(jù)倉庫。
但今天的企業(yè),越來越傾向于“一庫多能”。既要結(jié)構(gòu)化查詢,也要圖譜檢索、向量搜索、流式處理,甚至希望能原生支持Prompt編排與自然語言接口。
“客戶經(jīng)常問我們,能不能一個數(shù)據(jù)庫同時做推薦、搜索,還能配合Copilot?!?張雁飛說,“這不是簡單的功能疊加,而是要求我們從內(nèi)核設(shè)計(jì)上支持多模態(tài)融合?!?/p>
為了支撐AI系統(tǒng)復(fù)雜的調(diào)用鏈,數(shù)據(jù)庫廠商正在底層架構(gòu)上做出調(diào)整。例如,在索引體系中引入倒排索引、向量索引和混合檢索模塊;在查詢引擎中兼容SQL與自然語言解析;在執(zhí)行邏輯上犧牲部分一致性,以保證實(shí)時響應(yīng)。
張雁飛表示:“客戶不關(guān)心數(shù)據(jù)庫叫什么名字,他們關(guān)心的是,這個數(shù)據(jù)庫能不能支撐AI系統(tǒng)實(shí)時運(yùn)行?!?/p>
但這讓一些問題逐漸顯現(xiàn)。
一個事實(shí)是,盡管國內(nèi)數(shù)據(jù)庫廠商在OLTP與OLAP領(lǐng)域已有突破,但面對AI原生場景,依然存在架構(gòu)短板。向量檢索、多模融合、Agent友好型接口等新需求,對廠商的系統(tǒng)設(shè)計(jì)靈活性和技術(shù)積累提出更高要求。
“我們一開始就以Serverless和云原生為基礎(chǔ),這才讓我們有機(jī)會在底層集成向量和圖譜等能力。”張雁飛坦言,“如果從關(guān)系型出發(fā),中途再轉(zhuǎn),幾乎不可能?!?/p>
與此同時,數(shù)據(jù)庫的安全模型也面臨前所未有的挑戰(zhàn)。
過去,安全重點(diǎn)是“防人出錯”——通過權(quán)限配置、訪問控制、加密等手段保護(hù)數(shù)據(jù)。但如今,數(shù)據(jù)庫頻繁被AI模型與Agent程序調(diào)用,這些系統(tǒng)具備“類人”的主動性,傳統(tǒng)的權(quán)限體系正在失效。
“以前權(quán)限是基于角色或崗位來配置的。但現(xiàn)在,一個Agent可能同時代表多個角色,每秒發(fā)起成百上千次請求,我們根本不知道它在查什么。”陳宇耀對產(chǎn)業(yè)家說。
權(quán)限失控已不再是預(yù)警,而是現(xiàn)實(shí)問題。
許多企業(yè)在部署AI系統(tǒng)時,忽略了對Agent行為的審計(jì)和限制。例如,在RAG系統(tǒng)中,若缺乏權(quán)限過濾,用戶可能通過Prompt調(diào)取數(shù)據(jù)庫中的敏感信息。
“問題不在模型本身,而在于數(shù)據(jù)庫缺乏識別‘訪問者身份’與‘訪問動機(jī)’的能力?!标愑钜赋?。
更值得警惕的是,向量數(shù)據(jù)庫還引入了新的安全風(fēng)險(xiǎn):攻擊者可能反推訓(xùn)練語料,或通過注入“污染數(shù)據(jù)”操控檢索結(jié)果,進(jìn)而影響模型輸出。
“我們已經(jīng)看到一些攻擊案例:在知識庫中混入歪曲內(nèi)容,讓模型輸出出現(xiàn)偏差?!标愑钜嬖V產(chǎn)業(yè)家,“傳統(tǒng)的數(shù)據(jù)防泄漏系統(tǒng)在這里幾乎無效,因?yàn)樗鼰o法識別語義層的攻擊?!?/p>
這也意味著,數(shù)據(jù)庫安全的定義正在被重寫。
過去關(guān)注的是“存儲安全”,而AI時代,更需要關(guān)注調(diào)用鏈路的可見性、訪問行為的可解釋性,以及上下文權(quán)限的動態(tài)調(diào)整能力。
“數(shù)據(jù)不再固定在一個庫里,它在多個Agent之間流動?!标愑钜偨Y(jié)道,“未來需要一種新型安全組件,它不再圍繞‘系統(tǒng)邊界’,而是圍繞‘?dāng)?shù)據(jù)本體’建立權(quán)限策略——權(quán)限要隨數(shù)據(jù)走。”
三、數(shù)據(jù)庫+AI怎么走?走到哪了?
面對AI引發(fā)的結(jié)構(gòu)重構(gòu)與安全沖擊,企業(yè)開始嘗試通過“補(bǔ)能力、調(diào)權(quán)限、改架構(gòu)”的方式應(yīng)對,但這些嘗試大多仍處在探索初期。
第一步嘗試,集中在產(chǎn)品能力的擴(kuò)展上。
企業(yè)希望數(shù)據(jù)庫能原生支持文本、圖像、向量等多模數(shù)據(jù)處理,減少對中間件的依賴?!翱蛻粼絹碓较M粋€系統(tǒng)處理多種數(shù)據(jù)結(jié)構(gòu),而不是東拼西湊。”張雁飛直言。
然而,從實(shí)際來看,這一能力尚未標(biāo)準(zhǔn)化。
一些系統(tǒng)僅支持簡單的向量相似度計(jì)算,難以勝任復(fù)雜語義檢索;也有廠商雖引入向量模塊,但與主查詢引擎耦合度低,存在性能瓶頸與一致性問題?!皵?shù)據(jù)庫+向量”更多是“接上了”,距離“融合好用”仍有距離。
與此同時,“上下文管理”機(jī)制也尚不成熟。當(dāng)前多依賴緩存或臨時表來提供上下文信息,缺乏一套高效統(tǒng)一的調(diào)用模型。多位業(yè)內(nèi)人士坦言,目前尚無數(shù)據(jù)庫在AI上下文支持方面形成行業(yè)共識。
第二類應(yīng)對,聚焦于安全模型的重構(gòu)。
AI系統(tǒng)頻繁調(diào)用數(shù)據(jù)庫,但原有權(quán)限設(shè)計(jì)與審計(jì)機(jī)制并未同步升級。一些企業(yè)嘗試通過Agent側(cè)的訪問白名單、上下文窗口等方式,限制其可訪問字段范圍。
“以前權(quán)限是‘人對人’,現(xiàn)在得變成‘Agent對字段’。但很多企業(yè)甚至搞不清自己用了多少數(shù)據(jù)庫調(diào)用、有哪些Agent在跑?!标愑钜f道。
雖然部分企業(yè)已引入運(yùn)行時加密、動態(tài)權(quán)限調(diào)整、審計(jì)網(wǎng)關(guān)等機(jī)制,但這些組件多為外掛,無法與數(shù)據(jù)庫主系統(tǒng)統(tǒng)一策略、協(xié)同運(yùn)行,反而增加了系統(tǒng)復(fù)雜度。
更大的問題在于,大多數(shù)數(shù)據(jù)庫并不具備原生的“身份鏈路”和“行為路徑”可視能力。AI調(diào)用鏈路層層嵌套、日志分散,企業(yè)即使發(fā)現(xiàn)風(fēng)險(xiǎn)事件,也難以準(zhǔn)確追溯全過程。
第三類嘗試,則是在整體架構(gòu)上做取舍與隔離。
部分企業(yè)選擇將敏感數(shù)據(jù)保留在本地,僅在云端運(yùn)行非核心AI任務(wù);也有企業(yè)部署數(shù)據(jù)庫一體機(jī),封閉Agent接口以強(qiáng)化管控。
“一家金融客戶把Agent的訪問范圍限制在每日自動銷毀的只讀表內(nèi),雖然安全,但代價(jià)是靈活性和實(shí)時性大打折扣?!睆堁泔w說。
當(dāng)前,混合部署與權(quán)限隔離是相對可行的務(wù)實(shí)策略,但也帶來數(shù)據(jù)同步壓力、接口維護(hù)成本高、系統(tǒng)響應(yīng)延遲等一系列副作用。而要真正實(shí)現(xiàn)“安全與效率兼顧”,企業(yè)還需在數(shù)據(jù)庫引擎層構(gòu)建具備策略調(diào)度能力的原生機(jī)制,目前這一能力尚屬空白。
更現(xiàn)實(shí)的問題是,即使某些數(shù)據(jù)庫在功能上實(shí)現(xiàn)替代,仍可能在復(fù)雜SQL優(yōu)化、多模協(xié)同、Agent狀態(tài)一致性等細(xì)節(jié)上出現(xiàn)不穩(wěn)定。這種技術(shù)缺口導(dǎo)致AI應(yīng)用在測試階段表現(xiàn)良好,但一旦接入真實(shí)業(yè)務(wù)流量,常常暴露出查詢卡頓、語義漂移、權(quán)限錯配等問題。
“AI改變了數(shù)據(jù)庫的角色,但技術(shù)體系還沒跟上。”一位制造企業(yè)CIO對產(chǎn)業(yè)家直言,公司目前采用的是“加一層、補(bǔ)一段、設(shè)幾個限”的方案。
他還說:“這聽起來安全,其實(shí)只是感覺安全?!?/p>
四、未來走向,誰能造出 AI 時代的“數(shù)據(jù)引擎”?
目前,業(yè)界普遍認(rèn)為,AI時代的數(shù)據(jù)庫將沿著三個方向持續(xù)演進(jìn):一體化、智能化、安全內(nèi)生化。
具體來看,首先是數(shù)據(jù)庫將走向架構(gòu)一體化。
過去,企業(yè)往往需要部署多個數(shù)據(jù)庫來分別處理結(jié)構(gòu)化、日志、向量或圖譜數(shù)據(jù)。這不僅造成架構(gòu)冗余,還帶來數(shù)據(jù)同步、權(quán)限治理和審計(jì)合規(guī)的額外負(fù)擔(dān)。
“未來的數(shù)據(jù)庫,應(yīng)該能統(tǒng)一處理結(jié)構(gòu)化、文檔、圖數(shù)據(jù)和向量數(shù)據(jù),并提供一致的查詢接口與權(quán)限體系?!盌atabend CEO 張雁飛表示,“我們希望把過去五個工具才能完成的任務(wù),壓縮成一個產(chǎn)品來實(shí)現(xiàn)?!?/p>
然而,這種一體化仍面臨技術(shù)挑戰(zhàn)。
不同數(shù)據(jù)類型在存儲格式、索引結(jié)構(gòu)、查詢語義上差異顯著,要在同一引擎內(nèi)高效支持并不容易。目前多數(shù)所謂的“融合型數(shù)據(jù)庫”,仍是關(guān)系型架構(gòu)上外掛功能模塊,缺乏真正的底層融合。
其次,數(shù)據(jù)庫將更加“懂AI”,也將“用AI”。
AI正倒逼數(shù)據(jù)庫“前臺化”,同時也成為其自身能力升級的關(guān)鍵工具。目前,已有廠商借助大模型生成SQL、構(gòu)造測試用例、優(yōu)化查詢計(jì)劃,大幅提升開發(fā)與運(yùn)維效率。
“我們已經(jīng)用AI自動生成上萬組查詢語句,覆蓋各種業(yè)務(wù)場景,這在人力時代幾乎不可能?!睆堁泔w指出,未來數(shù)據(jù)庫優(yōu)化器的演進(jìn)也將依賴大模型,“AI會成為數(shù)據(jù)庫研發(fā)流程中的標(biāo)配工具?!?/p>
但“懂AI”還不夠,數(shù)據(jù)庫必須“適配AI”,解決上下文管理、Agent狀態(tài)維護(hù)、調(diào)用路徑壓縮等新場景問題。目前,行業(yè)尚缺乏統(tǒng)一的接口規(guī)范和調(diào)用語義標(biāo)準(zhǔn),數(shù)據(jù)庫之間的協(xié)同能力仍有壁壘。
第三,安全能力必須內(nèi)嵌進(jìn)數(shù)據(jù)庫系統(tǒng)本身。
AI應(yīng)用對數(shù)據(jù)訪問模式的改變,使“外掛式安全”逐漸失效。頻繁自動化調(diào)用、行為不透明、權(quán)限動態(tài)變化,要求數(shù)據(jù)庫具備原生的權(quán)限管理、行為審計(jì)、訪問透明和運(yùn)行時加密等能力。
“權(quán)限系統(tǒng)不能只是配置文件或外置引擎,它必須嵌入數(shù)據(jù)庫核心邏輯?!标愑钜赋?。真正“安全內(nèi)生”的數(shù)據(jù)庫,應(yīng)深度融合身份體系、行為模型與策略引擎,為AI調(diào)用提供全過程可控的信任機(jī)制。
目前,僅有少數(shù)產(chǎn)品嘗試將權(quán)限、調(diào)用路徑與敏感字段識別“綁定”在引擎層,大多數(shù)仍停留在網(wǎng)關(guān)封堵、合規(guī)對接階段,距“安全即設(shè)計(jì)”還有不小差距。
誰能率先完成這三重轉(zhuǎn)型,有望成為AI時代新的基礎(chǔ)設(shè)施提供者。
值得注意的是,這場變革也為新興玩家提供了窗口。傳統(tǒng)數(shù)據(jù)庫廠商架構(gòu)包袱沉重、演進(jìn)緩慢,而一些新項(xiàng)目則從AI場景出發(fā),繞過舊范式,直接構(gòu)建面向Agent、向量與上下文的底層邏輯。
“AI對數(shù)據(jù)庫的重構(gòu),不是插件升級或功能擴(kuò)展,而是理念轉(zhuǎn)變——從存儲轉(zhuǎn)向協(xié)同,從記錄轉(zhuǎn)向參與?!睆堁泔w強(qiáng)調(diào)。
從這個視角看,數(shù)據(jù)庫的角色也在徹底重寫:不再只是數(shù)據(jù)倉庫、事務(wù)賬本、分析引擎,而是智能系統(tǒng)中真正可信的核心。AI成為組織大腦,數(shù)據(jù)庫就是數(shù)據(jù)調(diào)度的中樞——誰掌握數(shù)據(jù)流,誰就掌握智能流。
當(dāng)然,這一進(jìn)化仍在進(jìn)行中。一體化架構(gòu)仍在調(diào)試,智能能力受限于應(yīng)用場景,安全機(jī)制尚未標(biāo)準(zhǔn)化落地。要真正成為AI系統(tǒng)的“實(shí)時引擎”,數(shù)據(jù)庫還需穿越長坡厚雪。

