新闻中心 >> 公司新闻 >>

DeepSeek成国内半导体产业链新引擎?

2025-02-20 11:03:45

在人工智能领域,人们对训练模型的固有印象就是对算力的需求极大。因此,长期以来,诸如英伟达H100 GPU等高算力芯片几乎成为行业标配,使得国内芯片厂商难以施(shī)展(zhǎn)拳(quán)脚(jiǎo),也制约了我国人工智能的在地化发展。而DeepSeek的出现打破了这一困境,使尖端GPU不再是大模型训练的唯一解法,让越来越多的的国内半导体厂商有机会与全球领先的AI模型适配,有望成为驱动国内半导体全产业链发展的新引擎。

当前,每天都有像华为昇腾、沐曦、天数智芯、燧原科技、昆仑芯等国内半导体厂商宣布与DeepSeek旗下不同模型展开适配工作的消息,据不完全统计,参与其中的国内厂商已经超过了20家。

DeepSeek提供技术验证“实练场”

对于国内芯片行业来说,缺乏实际应用场景和技术验证机会是其发展过程中的一大难题。而DeepSeek为国内芯片提供了宝贵的技术验证场景。

据了解,DeepSeek在架构创新方面,采用了经DeepSeek-V2验证的MLA和DeepSeekMoE技术,并引入了无辅助损失负载均衡策略。这种架构优化使得模型在训练过程中能够更高效地利用计算资源,减少了对特定高端芯片的依赖。同时,在训练效率上,DeepSeek设计了专门的FP8训练混合精度框架,以实现训练效率和数值稳定性的平衡,还开发了DualPipe算法实现高效的流水线并行处理,降低训练过程中的通信开销。

业内专家表示,这些技术创新使得DeepSeek能够适配国内芯片架构,并且在适配过程中,国内芯片企业可以深入了解模型对芯片性能的需求,从而针对性地进行优化和改进。例如,通过观察DeepSeek模型在国产芯片上的运行情况,芯片企业可以发现芯片在计算速度、能耗、稳定性等方面存在的问题,并及时调整研发方向,改进芯片设计和制造工艺。这种实际应用中的反馈和优化,对于国内芯片技术的提升至关重要。

目前,华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、燧原科技、昆仑芯等厂商,相继宣布适配或上架DeepSeek模型服务,让国内芯片能够在实际应用中发挥作用,展示自身的性能和潜力。

例如,天数智芯和合作伙伴仅用时一天,便完成了与DeepSeek R1的适配工作,并且已正式上线多款大模型服务,包括15亿、70亿、140亿参数的蒸馏版Qwen模型等。天数智芯表示,适配完成之后,公司将重点推动基于国内算力资源的DeepSeek大模型应用落地:一是持续优化软硬件,开发高性能、高性价比的算力产品方案,支持合作伙(huǒ)伴(bàn)在(zài)平(píng)台(tái)上(shàng)推(tuī)出(chū)DeepSeek各(gè)大(dà)模(mó)型(xíng)在(zài)线(xiàn)服(fú)务(wu),广(guǎng)泛(fàn)提(tí)供(gōng)预(yù)训(xun)练(liàn)、微(wēi)调(diào)和(hé)推(tuī)理(lǐ)服(fú)务(wu);二(èr)是(shì)与(yǔ)合(hé)作(zuò)伙(huǒ)伴(bàn)开(kāi)发(fā)基(jī)于(yú)DeepSeek模(mó)型(xíng)的(de)一(yī)体(tǐ)机(jī)、工(gōng)作(zuò)站(zhàn),将(jiāng)DeepSeek模(mó)型(xíng)接(jiē)入(rù)到(dào)各(gè)类(lèi)AI应(yīng)用(yòng)服(fú)务(wu),提(tí)供(gōng)更(gèng)多(duō)个(gè)性(xìng)化(huà)、边(biān)侧(cè)、端(duān)侧(cè)的(de)服(fú)务(wu)。当(dāng)然(rán),天(tiān)数(shù)智(zhì)芯(xīn)始(shǐ)终(zhōng)将(jiāng)通(tōng)用(yòng)GPU创(chuàng)新(xīn)突(tū)破(pò)作(zuò)为(wèi)首(shǒu)要(yào)任(rèn)务(wu),发(fā)挥(huī)自(zì)主通(tōng)用(yòng)芯(xīn)片(piàn)架(jià)构(gòu)优(yōu)势(shì),根(gēn)据(jù)DeepSeek带(dài)动(dòng)的(de)需(xū)求(qiú)变(biàn)化(huà)来(lái)研(yán)发(fā)更(gèng)高(gāo)算(suàn)效(xiào)的(de)通(tōng)用(yòng)GPU产(chǎn)品(pǐn)。

燧(suì)原(yuán)科(kē)技(jì)和壁仞科技则是已完成对DeepSeek全系列模型的优化,支持从1.5B到70B参数规模的DeepSeek R1蒸馏模型推理部署,覆盖能源、金融等垂直场景。在这些实际应用场景中,国内芯片的性能得到了充分验证,也为其在更多领域的应用积(jī)累(lèi)了(le)经(jīng)验(yàn)。通过与DeepSeek的合作,国内芯片在技术验证和优化方面取得了显著进展,为其未来的发展奠定了坚实基础。

2月2日,Gitee AI宣布上线1.5B、7B、14B、32B四个尺寸的DeepSeek R1模型,均部署在沐曦曦云GPU上。2月5日,又确认DeepSeek-V3全精度满血版(671B)可在沐曦训推一体GPU上成功运行,并将V3满血版上线到平台。沐曦通过与DeepSeek的适配,不仅验证了自身芯片在AI推理中的性能,也让更多AI应用开发者看到本土GPU支持大规模模型运行的潜力。

寒武纪作为国内知名的AI芯片厂商,与南京智算中心合作,借助DeepSeek实现了技术与应用场景的有效对接。通过在零售业务场景中的应用,寒武纪芯片的性能得到了实际检验,也为其进一步优化产品、拓展市场提供了宝贵经验。

华为昇腾、海光信息、龙芯中科等GPU/CPU厂商也在积极行动,通过参与DeepSeek模型的训练优化,提升产品在AI推理市场的竞争力。

同时,DeepSeek的开源特性也为国内芯片的技术验证提供了便利。众多开发者基于DeepSeek模型进行二次开发和应用探索,使国内芯片可以在不同的应用场景、不同的算法需求等多样化的环境下接受检验,从而不断完善自身的性能和功能。

上海天数智芯半导体股份有限公司副总裁郭为告诉《中国电子报》记者,从行业角度看,以DeepSeek为代表的自主大模型创新突破,有助于推动国内算力技术的发展。国内GPU厂商已相继完成与DeepSeek的适配,实现了深度学习框架与国内硬件的融合,以进一步发挥算力优势。在适配过程中,AI产业链中的芯片厂商与模型开发者之间加强合作,促进了上下游企业的协同发展,共同构建(jiàn)从(cóng)硬(yìng)件(jiàn)到(dào)软件的完整生态闭环,完善了库和框架等工具,有助于构建更加完整、健康的自主AI产业生态。DeepSeek的开源特性可降低开发门槛,吸引更多开发者和上(shàng)下(xià)游(yóu)企(qǐ)业(yè)加(jiā)入(rù),降(jiàng)低(dī)了(le)AI应(yīng)用(yòng)开(kāi)发(fā)的(de)门(mén)槛(kǎn)和(hé)成(chéng)本(běn),促(cù)进(jìn)AI技(jì)术(shù)在(zài)更(gèng)多(duō)行(xíng)业(yè)的(de)落(luò)地(de)和(hé)普(pǔ)及(jí)。

带(dài)动(dòng)供(gōng)应(yīng)链(liàn)创(chuàng)新(xīn)发(fā)展(zhǎn)

DeepSeek也(yě)助(zhù)推(tuī)了(le)边(biān)缘(yuán)计(jì)算(suàn)与(yǔ)低(dī)成(chéng)本(běn)芯(xīn)片(piàn)的(de)发(fā)展(zhǎn)。它(tā)推(tuī)出(chū)的(de)小(xiǎo)型(xíng)模(mó)型(xíng),如(rú)7B参(cān)数(shù)版(bǎn)本(běn),可(kě)在(zài)笔(bǐ)记(jì)本(běn)电(diàn)脑(nǎo)运(yùn)行(xíng),且(qiě)性(xìng)能(néng)接(jiē)近(jìn)大(dà)模(mó)型(xíng)。这(zhè)种(zhǒng)“小(xiǎo)而(ér)美(měi)”模(mó)式(shì)的(de)兴(xìng)起(qǐ),使(shǐ)得(de)端(duān)侧(cè)小(xiǎo)模(mó)型(xíng)迎(yíng)来(lái)了(le)快(kuài)速发展,也带动了低功耗、高能效芯片的市场需求。

以手机、平板电脑、蓝牙耳机和智能眼镜等智能终端设备为例,为了满足用户对AI语音交互、图像识别等功能的需求,这些设备需要搭载具备一定算力的芯片。而DeepSeek的应用,使得这些设备能够更好地运行端侧小模型,实现更高效的AI处理。这就促使了设备制造商加大对国内算力芯片和存储芯片的采购,推动了国内芯片在智能终端市场的应用。

在服务器领域,随着企业加速开发和部署人工智能应用,如(rú)智(zhì)能(néng)客(kè)服(fú)、智(zhì)慧(huì)政(zhèng)府(fǔ)、数(shù)据(jù)分(fēn)析(xī)等(děng),对(duì)服(fú)务(wu)器(qì)的(de)算(suàn)力(lì)要(yào)求(qiú)也(yě)越(yuè)来(lái)越(yuè)高(gāo)。DeepSeek的出现,让企业能够在国内算力芯片的支持下,构建高效的人工智能服务平台,有望带动国内算力芯片在服务器市场(chǎng)的(de)发(fā)展(zhǎn)。

半导体行业专家池宪念表示,目前引发的对国内算力需求的增长,如同一条强有力的纽带,将半导体产业链上的各个环节紧密联系在一起。从芯片设计、制造到封装测试,再到最终的应用市场,每个环节都因DeepSeek的出现而获得了新的发展动力。未来,整个国内半导体供应链将在DeepSeek的带动下,形成一个良性循环。但这一趋势也对国内半导体厂商提出了更多挑战。从技术迭代角度来看,人工智能技术发展日新月异,新的模型和算法不断涌现。DeepSeek需要不断优化自身模型,以保(bǎo)持(chí)技术领先地位。国内芯片技术也需要加速升级、及时适配,确保模型与芯片之间的协同效应。

400-85643322
广东省广州市番禺区长沙路103号
PR:com@czzscl.com; Sales:ccm@czzscl.com
粤ICP备19042278号 | © 2025 汽车芯片科技有限公司官方网站【登录入口】. All rights reserved. | 网站地图