Kaiyun(中国官方网站) - 专业认证服务中心

前沿动态

消息称DeepSeek R2单位成本下降973%无需英伟达芯片

作者:小编 日期:2025-04-30 17:44:41 点击数: 

  据量子位消息,DeepSeek R2最新爆料,单位成本下降97.3%,并且摆脱了对英伟达芯片的依赖。具体详情如下。

  ●单位成本暴降97.3%:训练和推理的单位成本,比GPT-4o下降了惊人的97.3%。传言是输入0.07美元/每百万tokens,输出是0.27美元。

  ●参数量和训练数据:R2模型参数量达1.2万亿,是R1的两倍。其中活跃参数为78亿,走的是混合专家模型(MoE)路线PB,覆盖范围极广。

  ●摆脱英伟达芯片:整个训练完全没用英伟达显卡,而是全部基于华为的Ascend 910B集群。团队自主搭建了分布式训练框架,在浮点16位(FP16)精度下,实测集群算力达到512 PetaFLOPS,集群利用率高达82%,整体性能约为英伟达A100集群的91%。

  ●性能方面:在最新的C-Eval 2.0评测中,R2取得了89.7%的得分,云开网站 开云网址在COCO图像测试中则实现了92.4%的准确率,展现出强大的综合性能。

  ●量化压缩技术:DeepSeek R2在8bit精度下,模型体积压缩了83%,而精度损失不到2%,大幅提升了端侧部署的可行性。

输入店铺信息,获取专业全方面分析

* 您的信息将被严格保密,请放心填写