新闻中心 >> 公司新闻 >>

我们为什么仍然需要十万卡集群?——管窥“后DeepSeek时代”算力芯片市场的变与不变

2025-04-11 15:00:15

【导(dǎo)语(yǔ)】DeepSeek-V3以(yǐ)2048张(zhāng)H800GPU的(de)训(xun)练(liàn)规(guī)模(mó)震(zhèn)撼(hàn)智(zhì)能(néng)算(suàn)力(lì)市(shì)场(chǎng),引(yǐn)发(fā)了(le)关于(yú)算(suàn)力(lì)集群(qún)Scaling Law(尺(chǐ)度(dù)规(guī)律(lǜ))的(de)广(guǎng)泛(fàn)讨(tǎo)论(lùn)。尽(jǐn)管(guǎn)这(zhè)一(yī)消(xiāo)息(xi)对(duì)智(zhì)算(suàn)行(xíng)业(yè)传(chuán)统(tǒng)信(xìn)念(niàn)产(chǎn)生(shēng)动(dòng)摇(yáo),但业界对尺度规律的认可度依然坚挺。与此同时,DeepSeek的发布推动了推理算力市场的迅猛增长,多家国产算力芯片公司将业务发展重点转向推理领域。然而,未来的算力集群部署将形成训练与推理的双重路线竞争,呈现出“双轨并行”的新格局。一方面,头部企业将继续加码超大规模集群,实现训练性能突破;另一方面,地方和中小企业则将着眼算法高效化与推理优化,以更低成本参与竞争。

算力集群Scaling Law(尺度规律)还奏效么?万卡级智算集群还是全球AI大模型竞争的“入场券”么?十万卡智算集群仍然是算力备战的目标么?

今年年初,DeepSeek-V3训练只使用了2048张H800GPU的消息传出,像一颗核弹(dàn),给(gěi)长(zhǎng)期(qī)信(xìn)奉规模取胜的智能算力市场带来了不小的震憾。智算行业曾经坚信不移的Scaling Law——智算集群规模将沿着千卡、万卡、十万卡顺序部署的路线,也因此产生了动摇。但几个月过去,记者发现,DeepSeek的出现的确给算力芯片市场带来了不小的变化,但业界对尺度规律的认可度仍然坚挺。

推理算力市场迎猛增

毫无疑问,DeepSeek给推理芯片和推理算力市场注入了一针强心剂。

某业内人士表示,2024年,多地建设的智算中心普遍存在空置的现象。但在DeepSeek发布后,各地算力中心资源的利用率实现了大幅提升。

市场报告.png

图片来源:2025 中国人工智能计算力发展评估报告

市场分析机构发布数据显示,中国人工智能服务器工作负载中,推理算力的占比将在未来几年大幅增长,预计(jì)到(dào) 2028 年(nián)中(zhōng)国(guó)推(tuī)理(lǐ)算(suàn)力(lì)的(de)市(shì)场(chǎng)份(fèn)额(é)将(jiāng)从(cóng)2024年(nián)的(de)65%增(zēng)长(zhǎng)到(dào)73%。

浪(làng)潮(cháo)高(gāo)级(jí)副(fù)总(zǒng)裁(cái)刘(liú)军(jūn)也(yě)表(biǎo)示(shì) :“在(zài) DeepSeek 发(fā)布(bù)后(hòu),推(tuī)理(lǐ)算(suàn)力(lì)的(de)需(xū)求(qiú)量(liàng)正(zhèng)在(zài)迅(xùn)速(sù)超(chāo)过(guò)训(xun)练(liàn)算(suàn)力(lì),市(shì)场(chǎng)结(jié)构(gòu)发(fā)生(shēng)了(le)根(gēn)本(běn)性(xìng)变(biàn)化(huà)。”

感(gǎn)受(shòu)到(dào)市(shì)场(chǎng)需(xū)求(qiú)的(de)牵(qiān)引(yǐn),多(duō)家(jiā)国(guó)产(chǎn)算(suàn)力(lì)芯(xīn)片(piàn)公(gōng)司(sī)今(jīn)年(nián)将(jiāng)业(yè)务(wu)发(fā)展(zhǎn)重(zhòng)点放在了推理领域。例如,今年2月,燧原宣布其庆阳智算中心部署的万卡集群为美图AI推理业务提供算力;今年3月,沐曦科技宣布联合清华大学KVCache.AI团队加速DeepSeek满血版单卡C500异构推理等。

但截至目前,推理市场实际上并不存在对“真万卡集群”的刚需。根据阿里研究院副院长安筱鹏的理解,只有一万张AI加速卡部署在同一个数据中心,并且能通过大规模资源调度技术,让万卡作为“一台”计算机,支持单一模型在一万张卡上同时进行训练,才能被认为是“真万卡集群”。但推理任务更多是分布式实现的,其算力规模需求远低于万卡。[XZ1]

规模定律仍在训练领域奏效

“大模型本地部署有望成为国产算力芯片(piàn)的(de)重(zhòng)要(yào)增(zēng)长拉动力。” 联通元景大模型负责人在接受《中国电子报》记者采访时如是说。

DeepSeek之所以能撬动巨大的推理算力市场,本质上得益于其底层基础模型V3的高质量训练。而强大的算力,是支撑该模型乃至后续其他模(mó)型(xíng)迭(dié)代(dài)的(de)基(jī)础(chǔ)。

联(lián)通(tōng)云(yún)相(xiāng)关负(fù)责(zé)人(rén)介(jiè)绍(shào),大(dà)模(mó)型(xíng)参(cān)数(shù)规(guī)模(mó)从(cóng)千(qiān)亿(yì)级(jí)迈(mài)向(xiàng)万(wàn)亿(yì)级(jí),训(xun)练(liàn)数(shù)据(jù)量(liàng)也(yě)呈(chéng)指(zhǐ)数(shù)级(jí)增(zēng)长(zhǎng)。大(dà)规(guī)模(mó)训(xun)练(liàn)集群(qún)能(néng)够(gòu)通(tōng)过(guò)并(bìng)行(xíng)计(jì)算(suàn)和(hé)分(fēn)布(bù)式(shì)处(chù)理(lǐ),显(xiǎn)著(zhe)缩(suō)短(duǎn)训(xun)练(liàn)周(zhōu)期(qī),为(wèi)模(mó)型(xíng)快(kuài)速(sù)迭(dié)代(dài)提(tí)供(gōng)基(jī)础(chǔ)设(shè)施(shī)支(zhī)撑(chēng)。但(dàn)从(cóng)当(dāng)前(qián)的(de)情况来(lái)看(kàn),万(wàn)卡(kǎ)集群(qún)在(zài)训(xun)练(liàn)效(xiào)率(lǜ)上(shàng)已(yǐ)经(jīng)不(bù)足(zú)以(yǐ)支(zhī)持(chí)大(dà)模(mó)型(xíng)的(de)迭(dié)代(dài)速(sù)度(dù)。而(ér)十(shí)万(wàn)卡(kǎ)集群(qún),能(néng)够(gòu)通(tōng)过(guò)更(gèng)高(gāo)并(bìng)行(xíng)度(dù)和(hé)分(fēn)布(bù)式(shì)优(yōu)化(huà),在(zài)万(wàn)卡(kǎ)集群(qún)基(jī)础(chǔ)上(shàng)实(shí)现(xiàn)训(xun)练(liàn)效(xiào)率的再度提升。

但建设大规模训练集群,仍存在诸多待解的技术问题。多地域部署、多芯混训、集群稳定性都给集群建设带来了挑战。集群稳定性要求高,快速容错和恢复是关键;能耗与散热、数据管理和运维管理等问题同样重要——集群每日能耗甚至将高达300万千瓦时,与一个小型机械厂一年的用电量相当。

在中国联通相关业务人员看来,综合考虑企业需求、行业应用和区域分布,中国可能需要3—5个“真十万卡集群”,这些集群应具备高效能、低能耗、高稳定性的特点,并支持多任务并发和动态资源调度,以最大化算力利用率。

双重路线竞争

可以预见,未来的算力集群部署,将以训练与推理为界,形成巨大分野,呈现出“双轨并行”新格局:

一方面,头(tóu)部企业持续加码超大规模集群,集中力量实现训练性能突破。

调度方面,百度、腾讯等企业开发了面向超大集群的自动切分、任务容错系统;能源管理上,液冷、浸没式等新型(xíng)冷(lěng)却(què)技(jì)术(shù)成(chéng)为(wèi)数(shù)据(jù)中(zhōng)心(xīn)标(biāo)配(pèi),PUE(能(néng)源(yuán)利(lì)用(yòng)效(xiào)率(lǜ))持(chí)续(xù)优(yōu)化(huà);多(duō)芯(xīn)融(róng)合(hé)层(céng)面(miàn),一(yī)些(xiē)平(píng)台(tái)已(yǐ)实(shí)现(xiàn)“国(guó)产(chǎn)+进(jìn)口(kǒu)”GPU、NPU、ASIC的(de)调(diào)度(dù)统(tǒng)一(yī),个(gè)别(bié)厂商甚至宣布支持六芯异构协同训练。

与此同时,“以训练反哺调度优化”成为技术演进的新方向。通过AI自身参与任务调度、负载均衡,集群可以实现自动化资源编排——这正是AI基础设施向“智能化操作系统”演进的表现。某种意义上,十万卡不再只是“计算力的集合”,而是“算力+AI控制力”的系统体。

“十万卡集群”的比拼,最终将落脚于如何将堆卡用好、用足、用出性价比。

另一方面,各地方、中小企业在智算赛道的着眼点将转向算法高效化与推理优化。越来越多企业开始选择用数百张卡构建私有化小型训练集群,结合开源模型做定制化微调。通过模型蒸馏、芯片定制和边缘算力部署,在特定场景下以更低成本参与竞争,推动AI技术下沉至垂直领域。

400-85643322
广东省广州市番禺区长沙路103号
PR:com@czzscl.com; Sales:ccm@czzscl.com
粤ICP备19042278号 | © 2025 汽车芯片科技有限公司官方网站【登录入口】. All rights reserved. | 网站地图