据腾讯混元官微消息,基于首个产业级2Bit端侧量化方案,腾讯混元今天正式推出一款面向消费级硬件场景的“极小”模型HY-1.8B-2Bit,等效参数量仅有0.3B,内存占用仅600MB,比常用的一些手机应用还小。通过对此前混元的小尺寸语言模型——HY-1.8B-Instruct进行 2 比特量化感知训练(QAT)产出,这一模型对比原始精度模型等效参数量降低了6倍,并且在沿用原模型全思考能力同时,在真实端侧设备上对比原始精度模型生成速度提升2—3倍,可大幅提升使用体验。此次腾讯混元推出HY-1.8B-2Bit模型,可以在边缘设备上无压力部署。这也是首个在实现2bit产业级量化的端侧模型实践。
(本文来自第一财经)