AI圈迎来重磅官宣:困扰业内已久的Token中文名,终于有了官方定论——词元!
近日,国家数据局在官方公告中首次启用“词元”作为Token的标准译名。这标志着,这一AI核心术语在中文人工智能领域正式“定调”,从此告别翻译混乱的局面。
更让人震撼的是,在国新办3月24日的新闻发布会上,国家数据局局长刘烈宏披露了一组亮眼的数据:截至今年3月,我国日均词元调用量已突破140万亿!

(图片来源:新浪微博)
这个数字有多惊人?对比一下就懂了:相比2024年初的1000亿,增长了1000多倍;就连对比2025年底的100万亿,短短三个月也实现了40%以上的增长。中国AI的发展速度,肉眼可见的迅猛。
刘烈宏表示,词元调用量的爆发式增长,正是中国人工智能进入快速增长阶段的最好证明。如今AI的应用场景不断深化,早已从简单的对话升级到了能决策、能执行的智能体。而备受关注的词元出海,更是我国AI产业竞争力增强的直接体现。
可能有人会问,到底什么是词元?这个理解起来一点都不复杂,《人民日报》早在今年1月就发布科普文章,将词元定义为“处理文本的最小数据单元”。
简单来说,就是AI大模型处理数据时,拆分出的“最小信息载体”,可以是一个字、一个词片段,甚至一个符号。
举个通俗的例子:“我爱中国!”这句话,在AI眼里就会被拆分成“我”、“爱”、“中国”、“!”四个词元,是不是一下子就懂了?
值得一提的是,目前苹果中国官网、央视新闻、中国计算机学会等,都已统一使用“词元”这一表述,足以见得它的权威性。
其实不难发现,互联网时代的核心度量是流量,而到了人工智能时代,词元正在成为新的关键指标。我们给AI输入的每一个字,AI生成的每一段话、识别的每一幅图像,本质上都在消耗词元。
从术语统一到调用量爆发,这背后是中国AI产业的稳步崛起,也是智能时代加速到来的信号。未来,随着词元相关体系的不断完善,中国AI还会带来哪些惊喜?值得我们共同期待!
END
