本報(bào)記者 袁傳璽
近期,布局AI智能體的熱潮正席卷各行業(yè)。AI智能體正以前所未有的速度融入日常的工作與生活場景中。
而這場熱潮的背后,是呈指數(shù)級(jí)爆發(fā)的算力需求——個(gè)人AI智能體的大規(guī)模落地帶來了海量Token(計(jì)算機(jī)領(lǐng)域數(shù)字標(biāo)識(shí)符)消耗,迅速擊穿了大模型廠商原有的成本防線。
近期,北京智譜華章科技股份有限公司(以下簡稱“智譜”)、騰訊云等國內(nèi)AI廠商密集發(fā)布AI算力產(chǎn)品漲價(jià)通知,部分產(chǎn)品漲幅甚至超過400%。這場從“燒錢換增長”到“以價(jià)補(bǔ)量”的戰(zhàn)略急轉(zhuǎn),不僅標(biāo)志著行業(yè)告別野蠻生長,更折射出AI智能體時(shí)代算力供需關(guān)系的深刻變局。
大模型定價(jià)體系再造
大模型行業(yè)的定價(jià)體系正在經(jīng)歷系統(tǒng)性再造,國內(nèi)廠商也在加速上調(diào)相關(guān)產(chǎn)品價(jià)格。這番漲價(jià)現(xiàn)象,與兩年前的價(jià)格戰(zhàn)形成鮮明對(duì)比。
2024年5月份,字節(jié)跳動(dòng)率先打響價(jià)格戰(zhàn)第一槍,豆包Pro模型定價(jià)0.0008元/千Token,較行業(yè)均價(jià)低99.3%。隨后阿里云通義千問主力模型降價(jià)97%,百度文心大模型兩大主力模型全面免費(fèi),騰訊混元大模型價(jià)格降幅最高達(dá)87.5%。一時(shí)間,行業(yè)陷入降價(jià)潮。
“那時(shí)候的邏輯很簡單:先讓開發(fā)者用起來,市場份額比什么都重要。”一位從業(yè)三年的AI產(chǎn)品經(jīng)理對(duì)《證券日報(bào)》記者透露,2024年某頭部廠商內(nèi)部曾定下三年內(nèi)不考慮盈利的激進(jìn)目標(biāo),產(chǎn)品定價(jià)甚至低于算力成本。
然而,低價(jià)策略的邊際效應(yīng)迅速遞減。有行業(yè)分析師對(duì)《證券日報(bào)》記者表示,2024年至2025年的價(jià)格戰(zhàn)雖加速了AI大模型的市場普及度,但也導(dǎo)致行業(yè)普遍陷入“高投入、低回報(bào)”的困境。當(dāng)模型調(diào)用量從千億級(jí)躍升至萬億級(jí),算力成本呈指數(shù)級(jí)放大,單純依靠資本輸血已難以為繼。2025年下半年起,部分中小廠商開始悄然收縮免費(fèi)額度。
“這不是簡單的漲價(jià),而是成本結(jié)構(gòu)變化的必然結(jié)果。”一位頭部云廠商技術(shù)負(fù)責(zé)人向《證券日報(bào)》記者分析,“以前行業(yè)是用虧損換市場份額,2026年必須考慮可持續(xù)經(jīng)營。”
Token通脹
要理解國產(chǎn)大模型集體漲價(jià),必須先理解“Token通脹”這個(gè)概念。
Token是大模型處理文本的最小單位,可以理解為AI的工作量單位。當(dāng)行業(yè)談?wù)揟oken通脹時(shí),實(shí)際上指的是AI處理任務(wù)的復(fù)雜度激增,導(dǎo)致同樣的服務(wù)需要消耗更多的算力資源。就像以前開一盞小燈,現(xiàn)在要開一個(gè)工廠,電費(fèi)自然水漲船高。
這股“通脹”壓力首先來自海外市場需求的爆發(fā)。2026年2月份,OpenRouter平臺(tái)(全球主流的大模型API分發(fā)平臺(tái))數(shù)據(jù)顯示,當(dāng)月全球前十AI模型的Token總消耗量突破27萬億,其中中國大模型貢獻(xiàn)了14萬億,占比超過50%。
“這意味著國產(chǎn)大模型正從內(nèi)需驅(qū)動(dòng)轉(zhuǎn)向全球輸出。”廣州艾媒數(shù)聚信息咨詢股份有限公司CEO張毅在接受《證券日報(bào)》記者采訪時(shí)表示,“海外用戶的調(diào)用習(xí)慣與國內(nèi)截然不同。”歐美開發(fā)者更傾向?qū)⒋竽P颓度肷a(chǎn)級(jí)工作流,單次請求往往伴隨多輪工具調(diào)用、長上下文檢索與代碼生成,“同樣一次API(應(yīng)用程序編程接口)調(diào)用,海外場景的Token消耗可能是國內(nèi)的三倍到五倍”。
如果說海外市場是外因,那么AI智能體的規(guī)?;涞?,則是推高算力成本的內(nèi)因。
與早期聊天機(jī)器人時(shí)代的單次問答不同,AI智能體具備“感知-決策-執(zhí)行”的閉環(huán)能力,能夠自主完成復(fù)雜任務(wù)。以金融風(fēng)控場景為例:一個(gè)AI智能體完成單筆信貸審批,需經(jīng)歷用戶畫像檢索(長上下文)、征信數(shù)據(jù)調(diào)用(工具使用)、風(fēng)險(xiǎn)評(píng)估計(jì)算(推理鏈)、報(bào)告生成(輸出)四大環(huán)節(jié),全程消耗Token量可達(dá)數(shù)十萬級(jí)別。
諸多因素相互疊加,數(shù)據(jù)表現(xiàn)驚人。國聯(lián)民生證券測算顯示,中國整體日均Token消耗從2024年初的1000億級(jí),飆升至2026年2月份的180萬億級(jí)。且隨著AI智能體向多模態(tài)、多智能體協(xié)作演進(jìn),這一數(shù)字仍在加速膨脹。
供需關(guān)系的逆轉(zhuǎn),最終傳導(dǎo)至價(jià)格體系。2025年以來,全球AI算力基礎(chǔ)設(shè)施面臨產(chǎn)能荒,受HBM顯存(高帶寬內(nèi)存,AI訓(xùn)練的核心部件)、先進(jìn)制程GPU(圖形處理器)供應(yīng)緊張影響,服務(wù)器采購成本同比大幅上升。
比如,3月17日,阿里云發(fā)布公告稱,因全球AI需求爆發(fā)、供應(yīng)鏈漲價(jià),阿里云AI算力、存儲(chǔ)等產(chǎn)品最高漲價(jià)34%。
當(dāng)大模型廠商從“賣水人”變成“喝水人”,漲價(jià)成為維持服務(wù)質(zhì)量的剛性選擇。智譜AI在調(diào)價(jià)公告中直言:“用戶規(guī)模與調(diào)用量快速提升,公司需同步加大算力投入。”
商業(yè)模式重構(gòu)
漲價(jià)撕開的不僅是成本缺口,更是整個(gè)行業(yè)商業(yè)邏輯的深層重構(gòu)。
“價(jià)格戰(zhàn)結(jié)束時(shí),價(jià)值戰(zhàn)才真正開始。”前述云廠商技術(shù)負(fù)責(zé)人判斷,2026年將成為AI大規(guī)模商業(yè)化應(yīng)用元年,行業(yè)競爭焦點(diǎn)正從單純擁有算力,轉(zhuǎn)向能否提供高效、穩(wěn)定、低成本的模型服務(wù)與AI應(yīng)用。
當(dāng)下,大模型行業(yè)正在從“流量補(bǔ)貼”轉(zhuǎn)向“價(jià)值篩選”。早期低價(jià)策略吸引了大量試錯(cuò)型用戶,造成算力資源的低效占用,某廠商曾統(tǒng)計(jì),其免費(fèi)額度消耗中40%來自無實(shí)際業(yè)務(wù)場景的測試調(diào)用。而通過適度漲價(jià),企業(yè)既能過濾非剛性需求,又能為優(yōu)質(zhì)客戶保障服務(wù)穩(wěn)定性。智譜、騰訊云等廠商產(chǎn)品大幅漲價(jià)的背后,實(shí)則是將價(jià)格錨定于企業(yè)級(jí)客戶的支付意愿與ROI(投資回報(bào)率)平衡點(diǎn)。這種“以價(jià)補(bǔ)量”的精細(xì)化運(yùn)營,標(biāo)志著中國大模型產(chǎn)業(yè)正從互聯(lián)網(wǎng)式的規(guī)模擴(kuò)張,邁向軟件行業(yè)的價(jià)值定價(jià)。
工業(yè)和信息化部信息通信經(jīng)濟(jì)專家委員會(huì)委員盤和林對(duì)《證券日報(bào)》記者表示,漲價(jià)并不會(huì)抑制真實(shí)需求,反而會(huì)加速“良幣驅(qū)逐劣幣”的進(jìn)程。企業(yè)級(jí)客戶對(duì)穩(wěn)定性、合規(guī)性的高要求,使其付費(fèi)意愿與生命周期價(jià)值遠(yuǎn)超長尾用戶,這正是大模型廠商從“流量思維”轉(zhuǎn)向“價(jià)值定價(jià)”的底氣所在。
這種轉(zhuǎn)變,正在重塑整個(gè)產(chǎn)業(yè)鏈的利益格局。上游算力廠商(如英偉達(dá))持續(xù)受益;中游云廠商(如阿里云、騰訊云)則在賣模型與賣算力之間尋找平衡——既想通過AI服務(wù)吸引客戶,又不愿被高昂的算力成本拖垮;下游應(yīng)用層則出現(xiàn)明顯分化:具備自研能力的大廠(如字節(jié)跳動(dòng)、百度)可在集團(tuán)內(nèi)部靈活調(diào)配算力資源,來對(duì)沖漲價(jià)風(fēng)險(xiǎn),而純靠調(diào)用API的中小創(chuàng)業(yè)公司則面臨成本暴漲、被迫關(guān)停的困境。
企業(yè)級(jí)大模型廠商也開始關(guān)注Token經(jīng)濟(jì)的深層變革。滴普科技股份有限公司聯(lián)合創(chuàng)始人、執(zhí)行董事楊磊對(duì)《證券日報(bào)》記者表示:“未來,Token即產(chǎn)能。隨著Skill-based Model(基于技能的模型)重塑軟件開發(fā)、數(shù)據(jù)分析、客服外包等行業(yè),傳統(tǒng)的單人單天的計(jì)價(jià)方式必將被‘Token消耗’計(jì)價(jià)取代。這不僅是計(jì)量單位的變更,更是生產(chǎn)力范式的飛躍。”
張毅表示,站在全球競爭視角,Token通脹亦是國產(chǎn)模型技術(shù)躍遷的副產(chǎn)品。漲價(jià)不是終點(diǎn),而是新一輪效率革命的起點(diǎn)。誰能在這場算力軍備競賽中持續(xù)優(yōu)化成本結(jié)構(gòu),誰就能在AI智能體時(shí)代的全球牌桌上保留席位。
回望2024年的價(jià)格戰(zhàn),再看今日的集體漲價(jià),中國大模型產(chǎn)業(yè)正經(jīng)歷痛苦的成人禮。那個(gè)依靠骨折價(jià)博眼球的時(shí)代已然落幕,依靠技術(shù)效率、客戶價(jià)值與生態(tài)閉環(huán)取勝的新紀(jì)元,正在Token經(jīng)濟(jì)洪流中徐徐展開。
新一輪以舊換新落地 激發(fā)消費(fèi)新動(dòng)能
首先,一些地方在出臺(tái)與消費(fèi)品以舊換新相關(guān)的……[詳情]
| 14:13 | 中科宇航力箭一號(hào)遙十二運(yùn)載火箭完... |
| 14:11 | 上海國家會(huì)計(jì)學(xué)院以專業(yè)能力護(hù)航民... |
| 14:10 | 2026“天樞杯”青少年人工智能安全... |
| 14:09 | 產(chǎn)品金屬量增加疊加伴生銀價(jià)格上漲... |
| 14:07 | 賽美特赴港IPO最新進(jìn)展:中信里昂... |
| 14:06 | 星展銀行(中國)鄧志堅(jiān):建議投資... |
| 14:03 | 泡泡瑪特在內(nèi)蒙古成立文化傳播公司... |
| 14:02 | 五糧液成立數(shù)智營銷公司 注冊資本1... |
| 13:58 | 海爾消費(fèi)金融公司增資至31.2億元 |
| 13:58 | 長安天樞智能機(jī)器人公司完成工商登... |
| 13:58 | 健合集團(tuán)發(fā)布2025年可持續(xù)發(fā)展報(bào)告... |
| 13:57 | 松延動(dòng)力增資至約409萬元 |
版權(quán)所有《證券日報(bào)》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號(hào)京ICP備19002521號(hào)
證券日報(bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。
證券日報(bào)社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注