近日,2026中国国际金融展在上海开幕。海光信息携CPU+DCU双芯亮相。
当前,金融AI应用从单纯的“模型应用”迈向“智能体落地”的新阶段。从知识问答、文本生成进一步深入到制度查询、智能运维、合规风控等业务流程中,金融智能体正成为效率革新的新抓手。
然而,深入核心场景也带来了重重挑战:一方面,核心系统升级对安全合规提出更高要求;另一方面,智能体高并发推理带来算力成本与能耗压力持续攀升。如何在性能、安全与成本之间取得平衡,成为行业共性难题。
围绕这一趋势,海光信息副总裁吴宗友指出:“过去金融数智化建设往往需要在性能与安全之间权衡取舍。面向AI时代,海光的作用就是让金融机构无需再做‘选择题’,真正释放AI生产力价值。”
面对上述挑战,海光信息以CPU+DCU双芯协同架构给出系统性解法。海光CPU采用C86架构,兼顾高性能与高安全,负责统筹调度、复杂工作流编排与知识库调用,稳固核心交易与合规底线;海光DCU专注于大模型高效智算,大幅降低Token推理成本与能耗。
海光信息展台 图源:观察者网“CPU+DCU,能够完整地完成一个Agent AI的全部任务,由两颗芯片一起完成。为什么要两颗芯片一起做呢?因为芯片和芯片之间有些需要协同的地方。比方说芯片里面,CPU的带宽要够,算力要够,GPU也得够,两边的也得合起来。否则一边大,一边小,那肯定对算力会造成浪费。”海光信息副总裁应志伟在展会现场对观察者网说道。
安全是金融的生命线。海光基于芯片级内生安全机制,通过CSV技术构建硬件保护的机密计算环境,打造了“机密Token”方案。
“我们在CPU里面做了很多安全技术,比较可信。CPU启动的时候,从第一条指令,就开始度量。没有认证过的程序就没法执行。插一个后门进来,是非常困难的。”应志伟表示。
同时,针对前沿安全威胁,海光联合国泰海通证券、格尔软件正式发布了抗量子密码平滑迁移解决方案。该方案将高安全强度算法全面嵌入核心环节。实测数据显示,该系统可稳定支撑10000-30000TPS的高并发连接,业务平均时延低至48-61ms。
展会期间,海光信息联合北京国家金融标准化研究院、国泰海通证券正式启动“面向数智金融的芯片级内生安全与创新发展研究”。
海光信息副总裁李一昂表示,“该研究旨在攻克智能体落地中的安全与工程化难题,探索并构建起一条‘自主算力底座—芯片级安全心脏—智能体平台—业务场景’的全栈落地范式,为银保证细分场景提供具象化的实践指引,让金融智能体真正‘敢办事’。”
智能体要“办好事”,算力是基础,安全是底线,但真正让金融机构“办得顺手、办得放心”的,是一个开放、灵活、可选择的生态。
海光依托光合组织,构建全栈开放、灵活可组合的生态体系。与此同时,海光DAP智能体平台已实现360+大模型全面适配,覆盖DeepSeek、GLM、Kimi、Qwen等主流模型,敏捷支撑Agent开发与工作流编排。