新闻中心 >> 公司新闻 >>

DeepSeek-V3.1发布！国产算力将迎来哪些突破？

2025-09-17 09:00:11

【导语】在AI算力成为发展核心的当下，DeepSeek发布V3.1版本，采用专为提升AI计算效率设计的UE8M0 FP8参数精度，为国产AI算力自主化开辟新路径。该版本不仅在算力优化上取得进展，推动模型进入智能体时代，更助力国产芯片追赶国际水平，是AI算力产业自主化的关键一步。

在人工智能快速发展的时代，算力已成为决定AI技术前进速度的核心要素。近年来，在市场需求和政策支持的驱动下，国内众多企业开始积极探索自主可控的算力解决方案。DeepSeek最新发布的V3.1版本，通过一系列技术创新，在提升模型自身的性能的同时，也为AI算力产业的自主化探索了一条切实可行的路径。

不久前，DeepSeek正式发布其最新版本DeepSeek-V3.1，该版本采用了UE8M0 FP8 Scale的参数精度。DeepSeek官微在置顶留言称，UE8M0 FP8是针对即将发布的下一代国产芯片设计。

UE8M0 FP8的创新价值

UE8M0 FP8是一项专为提升AI计算效率，尤其是在算力受限环境下，而设计的低精度计算技术。其核心是在不显著损失模型精度的前提下，大幅降低内存占用和提升计算速度。

具体来说，FP8表明它是一种8位浮点数，类似于我们熟知的FP16或INT8，但位数更少，能显著降低内存占用和计算资源需求。而UE8M0则精确定义了其格式，U代表无符(Unsigned)，只能表示正数和零;E8代表8位指数(Exponent)，决定了数值的大小范围;M0代表0位尾数(Mantissa)，意味着它没有用于存储精度的尾数位。因此，一个UE8M0格式的数值，其实际表示的数值是2的整数次幂，这使得它的数值分布是离散的指数形式，而非连续的。

可以借助一个比喻来理解，就像会议记录不必逐字抄写，只需记下关键思路与逻辑关系，就能在保留核心信息的同时极大提升效率、节省篇幅。UE8M0在AI芯片中发挥类似作用，以最快速度、最小空间处理对结果影响最大的数值信息，从而在保障准确性的同时实现效率的提升。

目前，已量产的国产AI芯片多数仍以FP16或INT8为主要计算格式，尚未在硬件层面原生支持FP8。然而这一局面正在改变。预计于2025年下半年发布的摩尔线程MUSA 3.1 GPU、芯原VIP9000 NPU等新一代国产芯片，已在宣传中明确列出对原生FP8或Block FP8的支持，并与DeepSeek、华为等15家企业联合验证UE8M0格式。这意味着国产芯片正在计算精度与算力层面加速追赶国际先进水平。

尽管如此，带宽仍是当前国产芯片面临的主要挑战。与国际顶尖芯片相比，下一代国产芯片在HBM等高速内存带宽方面仍存在差距。而UE8M0凭借其块缩放(Block Scaling)机制有效应对这一瓶颈，通过将多个FP8数值成组处理(lǐ)，共(gòng)用(yòng)同(tóng)一(yī)缩(suō)放(fàng)因(yīn)子(zi)，而(ér)非(fēi)逐(zhú)个(gè)配(pèi)置(zhì)，大(dà)幅(fú)降(jiàng)低(dī)了(le)数(shù)据(jù)传(chuán)输(shū)需(xū)求(qiú)。

在(zài)有(yǒu)限(xiàn)带(dài)宽(kuān)条(tiáo)件(jiàn)下(xià)，UE8M0显(xiǎn)著(zhe)减少了非必要的数据搬运开销，使带宽资源更集中于核心运算，因而被视为下一代芯片架构的关键优化方向。对正处于追赶阶段的国产芯片来说，支持并优化UE8M0这类高效格式，无疑是通过算法创新弥补硬件短板、实现弯道超车的重要路径。

迈向智能体新时代

DeepSeek-V3.1不仅在算力优化方面取得了进展，还在模型能力上实现了重要突破，推动其进入智能体时代。智能体是一种比普通对话模型更高级的形态，能够像人类一样判断任务、调用工具并自主思考。

1、混合推理架构的创新

以往的模型通常只能擅长简单回答或复杂问题中的一种，而V3.1实现了同一模型同时支持两种模(mó)式(shì)，并(bìng)能(néng)自(zì)动(dòng)判(pàn)断(duàn)使(shǐ)用(yòng)哪(nǎ)种(zhǒng)模(mó)式(shì)。例(lì)如(rú)，对(duì)于(yú)简(jiǎn)单(dān)查(chá)询(xún)，模(mó)型(xíng)会(huì)使(shǐ)用(yòng)快(kuài)速(sù)响(xiǎng)应(yīng)模(mó)式(shì);而(ér)对(duì)于(yú)复(fù)杂(zá)任(rèn)务(wu)，则(zé)会(huì)启(qǐ)用(yòng)深(shēn)度(dù)思(sī)考(kǎo)模(mó)式(shì)进(jìn)行(xíng)推理。这种混合架构不仅降低了响应时间，还减少了计算资源消耗，从而降低了运营成本。

2、增强企业级服务能力

DeepSeek-V3.1在企业级应用方面表现出色。其支持严格模式的函数调用功能(néng)，确保模型在调用外部工具(如查询企业数据库)时输出的结果完全符合预设格式，避免了数据错误，满足了企业用户对稳定性和准确性的核心需求。同(tóng)时(shí)，V3.1兼(jiān)容(róng)国(guó)际(jì)主流(liú)API格(gé)式(shì)，这(zhè)意(yì)味(wèi)着(zhe)原(yuán)本(běn)使(shǐ)用(yòng)其(qí)他(tā)框(kuāng)架(jià)的(de)企(qǐ)业(yè)可(kě)以(yǐ)无(wú)缝(fèng)切(qiè)换(huàn)到(dào)DeepSeek，无(wú)需(xū)修(xiū)改(gǎi)现(xiàn)有(yǒu)系(xì)统(tǒng)，从(cóng)而(ér)帮(bāng)助(zhù)DeepSeek吸(xī)引(yǐn)更(gèng)多(duō)企(qǐ)业(yè)用户。

3、基础性能的全面提升

V3.1在V3的基础上新增8400亿tokens训练，显著提升了模型的能力。其上下文长度达到128k，并同时支持快速模式和深度思(sī)考(kǎo)模(mó)式(shì)。尽(jǐn)管(guǎn)性(xìng)能(néng)大(dà)幅(fú)提(tí)升(shēng)，但(dàn)DeepSeek依(yī)然(rán)坚(jiān)持(chí)高(gāo)性(xìng)价(jià)比(bǐ)路线(xiàn)，价格进一步下调，巩固了其在国内AI开源领域的领先地位。

因此，DeepSeek-V3.1不仅在技术层面实现了重要突破，更在推动国产算力生态建设、降低对外部硬件依赖方面展现了切实的推动(dòng)力(lì)。

写在最后：

DeepSeek-V3.1的发布不仅仅是一次技术升级，更是AI算力产业自主化探索的关键一步。对DeepSeek自身而言，V3.1推动其从基础大模型迈入智能体时代，增强了在企业市场的竞争力;对AI产业来说，低精度技术创新为国产芯片的高效运行提供了可能。

供稿单位：重庆天极网络有限公司

审核专家：李志高

声明：除原创内容及特别说明之外，部分图片来源网络，非商业用途，仅作为科普传播素材，版权归原作者所有，若有侵权，请联系删除。

上一篇：给工业装上“最强大脑” ？工业软件专业了解一下下一篇：AI攻克物理奥赛！超过人类金牌选手平均分？

DeepSeek-V3.1发布！国产算力将迎来哪些突破？

相关新闻

中国“人造太阳”找到突破密度极限方法

中国“人造太阳”找到突破密度极限方法

中国“人造太阳”找到突破密度极限方法

产品中心

产品应用

新闻中心

服务与支持

关于