本报讯(记者 周春柏)在人工智能浪潮中,一个看不见却至关重要的计量单位正在幕后忙碌地工作——它就是Token。Token即通常所说的词元,是处理文本的最小数据单元。近期,江苏电信以“Token运营”为导向,基于数智中台构建Token运营体系,较好地解决了大模型故障定位慢、处置难、成本计算不清等痛点问题。截至目前,江苏电信内部大模型月调用量突破2000万次,每月消耗Token量超300亿。
基于AI的Token运营主要围绕消耗、优化、成本控制与价值转化展开,关键在于将Token消耗转化为实际的业务价值。江苏电信打造大模型精准流控体系,从故障发生后被动限流转向事前主动管控,纳管全省18个统一供给大模型,精准管控并发请求数、Token使用量,支持高、中、低优先级的差异化调度。流控系统上线后,DeepSeek等7个核心大模型累计拦截异常调用超百万次,有效避免模型阻塞,在当前算力条件下保障全省核心AI应用平稳运行。
江苏电信构建智能体自动化计费机制,从人工统计转向智能度量。以Token用量统计为基础,结合省内AI应用共享、独享算力等模式,构建动态成本测算机制,自动生成应用级Token使用量和成本分摊账单。据统计,江苏电信已完成135个AI应用接入和统计,后续将持续推动全量智能体覆盖和纳管。
此外,江苏电信升级大模型精细化运营能力,故障定位从模型级转向应用级。传统运维依托显存利用率、等待队列等模型层指标,仅能识别模型级异常,难以定位异常应用。引入Token明细数据后,优化告警处置与运维管控手段,实现应用级故障快速精准定位,时长由5分钟降至2分钟,效率提升了60%。