新闻中心 >> 公司新闻 >>

第三代昆仑芯万卡集群点亮,全版本适配DeepSeek训练推理

2025-02-10 11:00:39

两周之内,DeepSeek成为全球增速最快的AI应用。2月6日,昆仑芯宣布,已完成DeepSeek训练推理全版本适配,在追求低成本、高效率的基础上支持卓越性能,能(néng)够(gòu)实(shí)现(xiàn)一(yī)键部(bù)署(shǔ),为(wèi)广(guǎng)大(dà)开(kāi)发(fā)者(zhě)提(tí)供(gōng)更(gèng)快(kuài)、更(gèng)强(qiáng)、更(gèng)省(shěng)的(de)训(xun)练(liàn)推(tuī)理(lǐ)体(tǐ)验(yàn)。

强(qiáng)力(lì)适(shì)配(pèi)DeepSeek,轻(qīng)松(sōng)完(wán)成(chéng)全版(bǎn)本(běn)训(xun)练(liàn)推(tuī)理(lǐ)任(rèn)务(wu)

昆仑芯表示,其在DeepSeek-V3/R1上线后不久便(biàn)率(lǜ)先(xiān)完(wán)成(chéng)全版(bǎn)本(běn)模(mó)型(xíng)适(shì)配(pèi),其(qí)中(zhōng)包(bāo)括(kuò)V3系(xì)列(liè)的(de)DeepSeek-V3和(hé)DeepSeek-V3-Base,R1系(xì)列(liè)的(de)DeepSeek-R1、DeepSeek-R1-Zero等(děng)8个(gè)不(bù)同(tóng)版(bǎn)本(běn),MoE(混(hùn)合(hé)专(zhuān)家(jiā))模(mó)型(xíng)及(jí)其(qí)蒸(zhēng)馏(liú)的(de)Llama/Qwen等(děng)小(xiǎo)规(guī)模(mó)dense(稠(chóu)密(mì))模(mó)型(xíng)。不(bù)仅(jǐn)如(rú)此(cǐ),昆(kūn)仑(lún)芯(xīn)已(yǐ)全面(miàn)适(shì)配文心系列、Llama、Qwen、ChatGLM、Baichuan等各类大模型的推理和训练任务,性能优势明显。

昆仑芯 小.jpg

昆仑芯训练推理全版本适配DeepSeek

P800是昆仑芯厚积薄发推出的第三代产品,也是昆仑芯现阶段最具代表性的算力产品,可以较好地支撑DeepSeek系列MoE模型大规模训练任务,全面支持MLA(多头潜注意力)、多专家并行等特性,仅需32台即可支持模型全参数训练,高效完成模型持续训练和微调。

与此同时,P800显存规格优于同类主流GPU20%~50%,对MoE架构更加(jiā)友(you)好(hǎo),且(qiě)率(lǜ)先(xiān)支(zhī)持(chí)8bit推(tuī)理(lǐ),单(dān)机(jī)8卡(kǎ)即(jí)可(kě)运(yùn)行(xíng)671B模(mó)型(xíng)。正(zhèng)因(yīn)如(rú)此(cǐ),昆(kūn)仑(lún)芯(xīn)相(xiāng)较(jiào)同(tóng)类(lèi)产(chǎn)品(pǐn)更(gèng)加(jiā)易(yì)于(yú)部署,同时(shí)可(kě)显(xiǎn)著(zhe)降(jiàng)低(dī)运(yùn)行(xíng)成(chéng)本(běn),轻(qīng)松(sōng)完(wán)成(chéng)DeepSeek-V3/R1全版(bǎn)本(běn)推(tuī)理(lǐ)任(rèn)务(wu)。

P800生(shēng)态(tài)完(wán)备(bèi),易(yì)用(yòng)性(xìng)强(qiáng),可(kě)以(yǐ)实(shí)现(xiàn)对(duì)训(xun)练(liàn)和推理任务的快速适配。P800快速适配支持了DeepSeek-V3/R1的持续全参数训练,LoRA(低秩自适应)等PEFT(参数高效微调)能力,提供给用户“开箱即用”的训练体验。基于昆仑芯完整的软件栈生态,两个(gè)步(bù)骤(zhòu)即(jí)可(kě)轻(qīng)松(sōng)实现在昆仑芯P800上进行DeepSeek-V3/R1推理部署,对广大开发者十分友好。

深耕AI加速十余年,大模型时代实力凸显

昆仑芯前身为百度智能芯片及架构部,在百度内部真实业务场景中深耕十年,于2021年4月完成独立融资。十余年的成长过程中,昆仑芯始终秉承着“让计算更智能”的使命,专注AI加速,打造拥有强大通用性、易用性和高性能(néng)的(de)通(tōng)用(yòng)AI芯(xīn)片(piàn)。

昆仑芯2 小.jpg

昆仑芯P800算力集群(效果图)

昆仑芯与智能产业的上下游企业建立了良好的合作生态,通过向不同行业提供以AI芯片为基础的智能算力,在互联网、交通、金融、工业、教育等领域广泛部署应用,促进了千行百业的智能化转型。

现如今,昆仑芯已完成三代AI芯片产品的设计研发和规模应用,并于2月5日宣布成功点亮第三代芯片P800万卡集群。在各个行业客户、合作伙伴的业务场景中,昆仑芯已实际上线运行各类大模型任务,通过千卡和万卡集群为客户提供了稳定的服务和优秀的性能表现。

“万卡集群”被认为是新一轮大模型竞赛的“入场券”,要想真正进行人工智能技术较量,万卡集群是必备的基础设施需求。昆仑芯万卡集群的成功点亮,意味着在以算力为基础的人工智能比拼中,昆仑芯将助力产业合作伙伴迈上算力规模建设的新台阶。昆仑芯表示,将于近期进一步点亮3万卡集群。

昆仑芯之所以能够在大模型算力竞争中展现优势,得益于前瞻的产品定义、十余年软硬件技术积累和持续不断的产业合作。在生成式人工智能和大模型时代,昆仑芯将更加充分发挥自研优势,秉持共生共赢的理念,与产业链上下游携手创造更大的经济和社会价值。

400-85643322
广东省广州市番禺区长沙路103号
PR:com@czzscl.com; Sales:ccm@czzscl.com
粤ICP备19042278号 | © 2025 汽车芯片科技有限公司官方网站【登录入口】. All rights reserved. | 网站地图