每经记者|朱成祥 每经编辑|陈旭
当下,AI大模型正处于从生成式AI走向代理式AI的关键时刻。在此背景下,腾讯、阿里等厂商不惜大发红包以争夺用户。
在大模型厂商红包大战尚未分出胜负之际,算力租赁厂商却成为当下实实在在的赢家。正如服饰品牌李维斯的故事那般,最终赢家不是在加州挖金子的矿工,而是卖牛仔裤的李维斯。在这一轮大模型红包大战中,算力租赁赚得盆满钵满。
近日,云服务商优刻得宣布涨价。在被问及具体哪些产品涨价时,优刻得相关工作人员告诉《每日经济新闻》记者(以下简称每经记者),“全线产品(都会上涨),具体会根据客户资源使用情况给出方案。”
2015年除夕,微信支付凭借摇一摇抢红包,迅速爆发。而这一波,腾讯元宝发红包之后,阿里巴巴、百度、字节跳动也纷纷下场。
红包大战,也使得对AI基础设施的需求大增。
近日,国内云服务厂商优刻得宣布,因全球供应链波动持续加剧,核心硬件采购等基础设施成本出现显著、结构性的上涨,经过慎重评估,公司决定自2026年3月1日起,对续签及新签用户的全线产品与服务进行价格上浮调整。
涨价缘由是硬件成本提升,还是推理侧需求过于旺盛而导致供不应求?优刻得上述工作人员回复称:“两方面(原因)都有,主要是硬件成本上升,近期需求也在增加。当前的价格调整,也是行业从‘资源出租’向‘能力服务’转变的体现。”
不仅仅是国内厂商在涨价。1月23日,全球云计算巨头亚马逊云科技宣布对其面向大模型训练的EC2机器学习容量块实施约15%的价格上调,这是AWS(亚马逊云计算服务)约20年来首次打破“只降不涨”的定价传统。机器学习容量块是AWS为应对高性能GPU(图形处理器)等稀缺计算资源供需失衡所推出的定制化服务模式,用户可提前预订指定型号的GPU实例,确保关键算力资源的稳定供给。
开源证券认为,AWS作为亚马逊核心的公有云平台,此次涨价一方面再次确认了全球AI算力需求端的高景气度,另一方面从供给角度来看,AI云产业链资源稀缺性或日益凸显。
对于公有云涨价,云服务商派欧云(PPIO)工作人员告诉每经记者,主要原因是推理需求的爆发式增长,其中Agent(智能体)的需求是主要增长因素;其次推理成本的上涨动力还来自服务质量的持续提高,高SLA(服务等级协议)、低时延、长上下文、多模态等服务会产生支付溢价。
如果说红包大战带来的是用户人数增加从而带来算力需求提升,那么Agent的盛行,对推理算力需求的提升则更为庞大。
优刻得上述工作人员表示:“算力需求已从训练驱动的单一模式,转变为训练+推理双轮驱动且推理占比不断上升的新模式。Agent的实时交互、多轮推理、工具调用与自主规划等能力,使得单次任务所需的推理次数呈指数级上升。”
PPIO工作人员也对每经记者表示:“Agent的广泛应用放大了Token(词元)的消耗,进而推高算力需求,一方面Agent推理上下文逐渐增加到200K以上,另一方面由于计算复杂度与上下文长度是平方关系,长上下文对算力的需求呈指数级增长。据我们估算,Agent场景下单用户的Token消耗量是普通Chat的10倍至50倍,此外Agent对内存的需求也在持续增加,主要体现在Agent工具的数据记忆需求。”
值得注意的是,AI推理不仅有云端,也有边缘侧、端侧设备。那么,即时性的要求是否会助推边缘侧、端侧AI推理需求增长?
对此,PPIO工作人员表示:“至于边缘和端侧,我认为会增加部署,但会是“云—边—端协同”的混合架构:实时性强、隐私要求高、网络不稳定的场景会下沉到端和边缘,用小模型或本地推理保证响应;而需要最强通用能力、快速迭代的大模型能力,仍会集中在云端。关键不在把所有算力搬到端上,而在把任务链路切分得更合理。”
优刻得工作人员也表示:“我们会根据客户的需求来部署我们的产品和资源。根据不同业务场景对延迟、成本、合规性的差异化要求,灵活调度云端、边缘与端侧算力资源。”
封面图片来源:每经媒资库