首页科技快讯腾讯掀桌！0.4G翻译模型，手机断网都能跑，比谷歌翻译得好

腾讯掀桌！0.4G翻译模型，手机断网都能跑，比谷歌翻译得好

来源：晰数塔互联网快讯时间：2026年04月30日 22:36

智东西

作者 | 程茜

编辑 | 云鹏

0.4G、离线也能跑的翻译模型，开源了！

智东西4月29日报道，今日，腾讯混元开源翻译模型Hy-MT1.5-1.8B-1.25bit。该模型仅0.4G，就实现了33种语言高质量互译，且下载后可直接在手机本地离线运行，翻译表现优于谷歌翻译。

这一原始模型的参数规模为1.8B，为降低用户手机内存压力，腾讯混元团队通过量化压缩推出了适配中高性能手机的2-bit、全系列手机的1.25-bit两种方案，模型体积分别被压缩至574MB、440MB。

▲开源项目主页

此次开源，腾讯混元团队还制作了一个实际可用的腾讯混元翻译Demo版，并适配“后台取词模式”。用户在本地查看邮件、浏览网页时，都能随时调用混元翻译，且无需网络、订阅，翻译过程都在本地处理、不涉及个人信息的采集和上传，一次下载永久免费使用。该Demo暂时只支持安卓体验，后续正式版会添加对IOS等平台的支持。

▲演示设备：高通骁龙7+gen2，16GB内存

Hy-MT1.5是腾讯混元团队打造的专业翻译大模型，原生支持33种语言、5种方言及1056个翻译方向，包含中英互译以及对法语、日语、阿拉伯语、俄语，甚至藏语、蒙古语等各种语言的翻译。

▲翻译模型演示，设备：高通骁龙865，8GB内存

腾讯混元的基准测试结果显示，Hy-MT1.5的翻译效果可比肩商业翻译API和235B级大模型的翻译效果，且翻译质量在基准测试中超过了谷歌翻译等主流系统。

原始1.8B模型在FP16精度下会占用3.3GB内存，为了不占用手机内存，研究人员进行了量化压缩。

其将模型里原本用16位数字（16-bit）表示的参数转用更低位数字储存。这就像把一幅高清照片压缩成缩略图，虽然文件小但还是能看清楚内容。

此外，针对不同的手机用户，腾讯还推出了2-bit与1.25-bit两种量化压缩方案。其实测显示，量化压缩后的两款模型表现效果远超同体积或更大体积大模型的翻译效果。

2-bit适用的中高端机型，模型体积压缩至574MB。

根据官方介绍，2-bit模型采用拉伸弹性量化（SEQ），将模型参数量化至{-1.5，-0.5，0.5，1.5}，并结合量化感知蒸馏，在将模型体积压缩至574MB的同时，实现了几乎无损翻译质量，效果超越上百GB的大模型。在支持Arm SME2技术的移动设备上，2-bit模型能够实现更快速、更高效的推理。