阿里千问最强模型重磅亮相:性能媲美GPT-5.2、Gemini 3 Pro
创始人
2026-01-27 00:04:03
0

快科技1月26日消息,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking,创下数项权威评测全球新纪录,性能媲美GPT-5.2、Gemini 3 Pro,成为迄今为止最接近国际顶尖模型的国内最强AI大模型。

通过总参数、强化学习、推理计算的极致规模扩展,千问新模型实现了性能的大幅飞跃,刷新科学知识(GPQA Diamond)、数学推理(IMO-AnswerBench)、代码编程(LiveCodeBench)等多项关键性能基准测试的全球纪录。

Qwen3-Max-Thinking是目前阿里规模最大、能力最强的千问推理模型,其总参数量超万亿(1T),预训练数据量高达36T Tokens。

此前,预览版Qwen3-Max-Thinking斩获数学推理AIME 25和HMMT 25的国内首个双满分,推理性能已让人惊艳;在此基础上,阿里通义团队进行了更大规模的强化学习后训练,全面提升了正式版Qwen3-Max-Thinking性能。

在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19个公认的大模型基准测试中,千问旗舰推理模型刷新了数项最佳表现(SOTA)纪录,整体性能可媲美GPT-5.2-Thinking-xhigh、Claude Opus 4.5和Gemini 3 Pro 。

在关键的模型推理能力提升中,千问新模型采用了一种全新的测试时扩展(Test-time Scaling)机制,推理性能提升的同时还更经济。

业界普遍的推理时计算,只会简单增加并行推理路径,重复推导已知结论,造成冗余推理效率低下;而千问采用的这一新机制,可对此前推理的结果进行“经验提取”式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算,获得更智能的推理结果。

基于这一推理技术创新,千问推理性能和推理效率大为提升,比如在启用工具的“人类最后的测试”HLE中,千问得分58.3,大幅超过GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8,录得当前所有模型的最高分。

面向即将到来的智能体Agent时代,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。

具体而言,在完成初步的工具使用微调后,通义团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练,使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。

这种自适应的工具调用能力可在QwenChat上完整体验,模型自主选用搜索、个性化记忆和代码解释器等三个核心的Agent工具功能,提供专业人士一样水平的回答,更合用户心意、更智能、更流畅;同时,模型幻觉也大为降低,为解决真实复杂任务打下基础。

目前,开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务,普通用户也可通过千问PC端和网页端试用模型。据了解,千问APP也即将接入新模型,所有用户都可免费体验千问最强模型。

相关内容

对话轻舟智航CEO于骞:2...
  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力...
2026-01-27 20:04:29
湖南发展收购四家水电资产事...
湖南能源集团发展股份有限公司(以下简称“湖南发展”)发行股份购买资...
2026-01-27 20:03:22
新股暗盘|鸣鸣很忙暗盘收涨...
格隆汇1月27日|内地连锁零食商鸣鸣很忙(1768.HK)将于明日...
2026-01-27 20:02:16
航天控股(00031.HK...
格隆汇1月27日丨航天控股(00031.HK)公告,内容有关公司直...
2026-01-27 20:01:09
ST联合:2025年预亏2...
人民财讯1月27日电,ST联合(维权)(600358)1月27日公...
2026-01-27 20:00:00
3.6亿港元!许健康之孙接...
乐居财经李兰 1月27日,宝龙地产(01238.HK)发布公告,宣...
2026-01-27 19:58:54
陆凯枫:5100直接拿下 ...
1月27日,国际现货黄金不仅直接破位5000整数关口,甚至冲击到了...
2026-01-27 19:57:47
“信不信让你走不掉” 野保...
1月27日,长期从事野生动物保护工作的黄泓翔,向记者讲述了他近日在...
2026-01-27 19:56:38
福鞍股份:预计2025年归...
福鞍股份1月27日公告,预计2025年年度实现归属于母公司所有者的...
2026-01-27 19:55:22

热门资讯

对话轻舟智航CEO于骞:202...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:每日经济新闻...
湖南发展收购四家水电资产事项获... 湖南能源集团发展股份有限公司(以下简称“湖南发展”)发行股份购买资产并募集配套资金事项近日收到深圳证...
新股暗盘|鸣鸣很忙暗盘收涨76... 格隆汇1月27日|内地连锁零食商鸣鸣很忙(1768.HK)将于明日(1月28日)在港上市,富途行情显...
航天控股(00031.HK)附... 格隆汇1月27日丨航天控股(00031.HK)公告,内容有关公司直接全资附属公司航科新世纪向其联营公...
ST联合:2025年预亏280... 人民财讯1月27日电,ST联合(维权)(600358)1月27日公告,预计2025年度实现归属于上市...
3.6亿港元!许健康之孙接盘宝... 乐居财经李兰 1月27日,宝龙地产(01238.HK)发布公告,宣布拟以3.61亿港元向关联方出售宝...
陆凯枫:5100直接拿下 黄金... 1月27日,国际现货黄金不仅直接破位5000整数关口,甚至冲击到了5100上方,单日涨幅又再次给了1...
“信不信让你走不掉” 野保志愿... 1月27日,长期从事野生动物保护工作的黄泓翔,向记者讲述了他近日在老挝的经历。黄泓翔介绍,今年一月,...
福鞍股份:预计2025年归母净... 福鞍股份1月27日公告,预计2025年年度实现归属于母公司所有者的净利润5,000.00万元至3,6...
GDP6万亿大省披露今年财政收... 该省今年财政资金重点支持九大领域。 经济总量首次站上6万亿元台阶的福建省,披露了最新的财政收支状况。...