MIT携手英伟达开发TLT技术,推理大模型训练效率最高提速210%
创始人
2026-02-28 10:43:03
0

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:IT之家)

IT之家 2 月 28 日消息,MIT News 于 2 月 26 日发布博文,报道称麻省理工学院(MIT)联合英伟达等机构,发布“驯服长尾”(TLT)技术,可以大幅提升推理大语言模型(LLM)的训练效率。

IT之家援引博文介绍,推理大模型擅长通过拆解步骤来解决复杂问题,但在强化学习(RL)的训练过程中,算力与能耗的消耗极为巨大。

研究团队发现,生成多个备选答案的“推演”(rollout)阶段占据了高达 85% 的训练时间。由于不同处理器生成回答的长度不一,完成较快的处理器只能被迫闲置,等待其他处理器完成长文本任务,从而形成了严重的效率瓶颈。

MIT 研究人员为解决该痛点,联合英伟达、苏黎世联邦理工学院等机构,提出了一种名为“驯服长尾(TLT)”的自适应解决方案。

该方案的核心在于创新性地运用“投机解码”技术,即训练一个较小的“草稿模型”(drafter)来快速预测大模型的未来输出,随后由大模型批量验证这些猜测。这样一来,大模型无需逐个顺序生成输出,从而大幅加快了处理进程。

在传统的投机解码中,草稿模型通常只训练一次并保持静态。然而在强化学习中,主模型需要更新数千次,静态草稿模型会迅速失效。

因此,TLT 系统引入了“自适应草稿训练器”。一旦部分处理器完成短查询进入闲置状态,系统会立即调度它们实时训练草稿模型。

同时,“自适应推演引擎”会根据工作负载特征自动调整解码策略,确保草稿模型始终与目标大模型保持高度同步,且不增加额外算力开销。

基于真实世界数据集的测试表明,TLT 技术在保持模型准确率完全无损的情况下,将多个推理大语言模型的训练速度提升了 70% 到 210%。

不仅如此,训练得到的轻量级草稿模型还可以作为免费的副产品,直接用于后期的高效部署。研究团队未来计划将该技术融入更多训练与推理框架中,进一步降低 AI 开发成本并提升能源利用率。

参考

相关内容

专利权纠纷案一审败诉,华东...
转自:贝壳财经华东医药股份有限公司(简称“华东医药”)全资子公司杭...
2026-02-28 12:08:20
3月2日起,下调至0!央行...
(来源:科技金融时报)中国人民银行决定自2026年3月2日起,将远...
2026-02-28 12:08:13
2025年国民经济和社会发...
2月28日,国家统计局发布《中华人民共和国2025年国民经济和社会...
2026-02-28 12:08:08
19号线南延、三大公园联通...
京津冀协同发展进入“十五五”新周期,地处京南的大兴区正在抢抓新机遇...
2026-02-28 12:08:03
2月“科学”流言榜发布,涉...
来源:北京日报客户端2026年地球会失重7秒致千万人死亡?脑机接口...
2026-02-28 12:07:58
基层警事:铁轨边的归途守护...
来源:央广网泉州动车站站台,人流如织,列车平稳驶入又缓缓开出,与南...
2026-02-28 12:07:53
北京辟谣 │孩子太早戴眼镜...
孩子太早戴眼镜不好?脑机接口技术能够直接读取人的思想和记忆?……2...
2026-02-28 12:07:48
峰岹科技2025年归母净利...
.ct_hqimg {margin: 10px 0;} .hqim...
2026-02-28 12:07:42
微泰医疗-B于2月27日斥...
.ct_hqimg {margin: 10px 0;} .hqim...
2026-02-28 12:07:38

热门资讯

专利权纠纷案一审败诉,华东医药... 转自:贝壳财经华东医药股份有限公司(简称“华东医药”)全资子公司杭州中美华东有限公司(简称“中美华东...
3月2日起,下调至0!央行这一... (来源:科技金融时报)中国人民银行决定自2026年3月2日起,将远期售汇业务的外汇风险准备金率从20...
2025年国民经济和社会发展统... 2月28日,国家统计局发布《中华人民共和国2025年国民经济和社会发展统计公报》。初步核算,全年国内...
19号线南延、三大公园联通等,... 京津冀协同发展进入“十五五”新周期,地处京南的大兴区正在抢抓新机遇。2月26日,大兴区召开重点工作推...
2月“科学”流言榜发布,涉开车... 来源:北京日报客户端2026年地球会失重7秒致千万人死亡?脑机接口技术能够直接读取人的思想和记忆?老...
基层警事:铁轨边的归途守护人 来源:央广网泉州动车站站台,人流如织,列车平稳驶入又缓缓开出,与南来北往的旅客身影一同汇成一幅流动的...
北京辟谣 │孩子太早戴眼镜不好... 孩子太早戴眼镜不好?脑机接口技术能够直接读取人的思想和记忆?……2026年2月“科学”流言榜发布。“...
峰岹科技2025年归母净利润约... .ct_hqimg {margin: 10px 0;} .hqimg_wrapper {text-a...
微泰医疗-B于2月27日斥资1... .ct_hqimg {margin: 10px 0;} .hqimg_wrapper {text-a...
2026护肤理性升级:科学眼霜... 2026年度眼周组织架构重建力与皮下 0.5mm 渗透转化率排行榜 TOP10在 2026 年,理性...