深圳新聞網(wǎng)2026年4月9日訊(深圳特區(qū)報(bào)記者 曾逸敏)近日,國家數(shù)據(jù)局有關(guān)負(fù)責(zé)人在國務(wù)院新聞辦新聞發(fā)布會(huì)上表示,到今年3月,我國日均詞元(Token)的調(diào)用量已經(jīng)超過了140萬億。隨著AI視頻創(chuàng)作的爆發(fā)、OpenClaw部署熱潮的到來,詞元調(diào)用量出現(xiàn)指數(shù)級(jí)增長,“如何減少詞元的消耗”也成了許多大模型用戶的熱議話題。為此,深圳特區(qū)報(bào)邀請(qǐng)到了業(yè)內(nèi)專家從實(shí)操技巧、輸出管控等方面,分享減少詞元消耗的方法,讓你“養(yǎng)龍蝦”不花冤枉錢。
詞元為什么消耗得這么快?
詞元,大模型處理信息的最小信息單元。假如你問ChatGPT:“今天天氣怎么樣?”這句話可能會(huì)被切成5個(gè)詞元——“今天”是1個(gè)詞元,“天氣”是1個(gè)詞元,“怎么樣”可能被切成2個(gè)詞元,句末的問號(hào)可能又是1個(gè)詞元。
在AI眼里,不論是文字、音頻、圖片還是視頻都是一個(gè)個(gè)詞元。同樣的,AI輸出的答案,在它的標(biāo)準(zhǔn)里,也是一堆大小不等的詞元。
伴隨著AI視頻創(chuàng)作的爆發(fā)、OpenClaw部署熱潮的到來,詞元調(diào)用量出現(xiàn)指數(shù)級(jí)增長。原因在于,此前用戶與大模型的交互方式多局限于一問一答,只要用戶停止回復(fù),那么任務(wù)也隨之終止。而OpenClaw的核心差異在于,它接收指令后會(huì)自動(dòng)拆解任務(wù)并執(zhí)行全流程——從搜集資料、編寫代碼,到調(diào)試程序、優(yōu)化方案,每一步都需與大模型完成多輪交互,詞元消耗隨之倍增。在不久前舉行的國務(wù)院新聞辦新聞發(fā)布會(huì)上,國家數(shù)據(jù)局有關(guān)負(fù)責(zé)人表示,到今年3月,我國日均詞元的調(diào)用量已經(jīng)超過了140萬億,相比2024年初的1000億增長了1000多倍,相比2025年底的100萬億,3個(gè)月的時(shí)間又增長了40%。
而詞元巨大調(diào)用量的背后,是使用費(fèi)用的快速增長。打開社交平臺(tái),詞元消耗“大爆炸”的討論密集涌來。一位中國開發(fā)者在阿里云開發(fā)者社區(qū)分享了自己的經(jīng)歷:使用OpenClaw進(jìn)行自動(dòng)化任務(wù)處理,2個(gè)小時(shí)就花費(fèi)了100美元的詞元消耗費(fèi)。
初創(chuàng)企業(yè)AlayaDB架構(gòu)師、南方科技大學(xué)和香港理工大學(xué)博士生游正新表示,詞元的計(jì)費(fèi)公式為輸入詞元數(shù)量×輸入單價(jià)+輸出詞元數(shù)量×輸出單價(jià)+其他特殊費(fèi)用。同時(shí),大模型采用的是“非對(duì)稱計(jì)費(fèi)”,即輸入詞元、輸出詞元的單價(jià)并不一樣,“通常輸入價(jià)要比輸出價(jià)低很多,這也很符合我們的認(rèn)知——輸出內(nèi)容要比理解觀點(diǎn)困難得多。”
這些技巧幫助你 精準(zhǔn)“控本”
近期,第一批“養(yǎng)龍蝦”的用戶開始發(fā)現(xiàn),這個(gè)AI牛馬比想象中“貴”太多了,“如何減少詞元消耗”自然也成了熱議話題。作為詞元消耗大戶,游正新透露,自身每月詞元調(diào)用量約600萬至800萬,僅購買各大主流模型API調(diào)用套餐,月均花費(fèi)就達(dá)500元至1000元。
為此,他總結(jié)出了自己的一套減少詞元消耗的方法:固化流程減少探索,將成功完成的復(fù)雜任務(wù)轉(zhuǎn)化為可復(fù)用的skill和工具,后續(xù)可改用小模型驅(qū)動(dòng),替代高成本大模型;復(fù)用上下文,同一主題或文件的對(duì)話集中在同一個(gè)對(duì)話框進(jìn)行,避免大模型需要重復(fù)學(xué)習(xí)而導(dǎo)致詞元的大量消耗;提前替大模型規(guī)劃好行動(dòng)計(jì)劃,減少它的額外思考甚至“走彎路”;清晰地表達(dá)需求,必要時(shí)讓大模型優(yōu)化提示詞;給大模型明確的輸出要求,減少整體詞元的消耗。
“同時(shí),對(duì)文字、圖片、音頻、視頻進(jìn)行預(yù)處理,也能減少AI在讀取時(shí)的詞元消耗?!庇握卤硎?,對(duì)于文字輸入,可精簡指令與拆分對(duì)話,去掉禮貌用語、僅保留結(jié)構(gòu)性指令;圖片輸入時(shí)預(yù)先裁切空白畫面,不使用過高分辨率的圖片;對(duì)于音頻,可以剔除空白片段縮短時(shí)長,或者優(yōu)先轉(zhuǎn)成文字后再提交;視頻則主打極簡采樣,將采樣頻率調(diào)至每5秒1幀,或提取關(guān)鍵幀以圖片組形式提交,“這些小細(xì)節(jié)的處理,都可以大大減少詞元的消耗?!彼f。
值得關(guān)注的是,深圳正通過多重政策進(jìn)一步降低用戶詞元使用成本:羅湖區(qū)對(duì)經(jīng)認(rèn)定的人工智能OPC,提供年度最高100萬元的算力與模型調(diào)用支持;前海OPC國際社區(qū)則為入駐企業(yè)提供“零成本”算力福利——每年最高50P算力免費(fèi)服務(wù),同時(shí)開放主流大模型免費(fèi)試用通道。與此同時(shí),全市還推出了“模型券”“智能券”,可直接抵扣詞元消耗費(fèi)用。