英伟达刷新DeepSeek V4推理纪录:单Token成本降至1/5
(来源:IT之家)
IT之家 7 月 1 日消息,英伟达昨日(6 月 30 日)发布博文,宣布在英伟达 Blackwell 平台上,通过优化全栈推理,相比较 DeepSeek V4 模型 1 个月前上线初期,单 Token 成本最多降至五分之一。

IT之家注:单 Token 成本(Cost Per Token)指模型生成或处理单个 token 的成本指标,常用于比较不同硬件、软件栈或部署方式的推理成本表现。
英伟达在博文中表示已将单 Token 成本列为 AI 总拥有成本的核心指标,并表示针对 DeepSeek v4 模型,Blackwell 平台已将其降低至行业最低水平。
在技术实现方面,英伟达通过生产运营层、应用加速层、基础设施访问层 3 层来优化推理:

性能方面,英伟达通过分离式服务、大规模专家并行、基于 NVIDIA NVLink 的并行通信、NVFP4 精度以及多 token 预测等技术,叠加优化后,Blackwell 平台单 GPU 的 token 吞吐量最高可提升 20 倍。


相关推荐
DeepSeek V4 抛弃英伟达!GPT-6 也要来了?
刚刚,梁文锋被曝史上首次融资!DeepSeek V4彻底摆脱英伟达
“在飞行中的飞机上更换引擎”:DeepSeek V4与华为昇腾芯片的历史性对接令世界屏息
DeepSeek V4背后,梁文锋的转身
连崩三天、核心离职、抛弃英伟达:DeepSeek V4 定档 4 月下旬!
再一次感谢梁文锋!DeepSeek V4双版本开源,中国AI迎来历史性一刻
DeepSeek V4,梁文锋给国产AI的“投名状”
DeepSeek V4的五个关键信号
高盛:DeepSeek V4对中国AI意味着什么?
首发被华为抢了!英伟达急眼:当天火速官宣适配DeepSeek V4
网址: 英伟达刷新DeepSeek V4推理纪录:单Token成本降至1/5 https://www.xishuta.cn/newsview151083.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 95792
- 2报告:抖音海外版下载量突破1 25736
- 3人类唯一的出路:变成人工智能 25175
- 4人类唯一的出路: 变成人工智 24611
- 5移动办公如何高效?谷歌研究了 24309
- 6华为 nova14深度评测: 13155
- 7滴滴出行被投诉价格操纵,网约 11888
- 82023年起,银行存取款迎来 10774
- 9五一来了,大数据杀熟又想来, 9794
- 10手机中存在一个监听开关,你关 9519
