新闻中心 >> 公司新闻 >>

具身智能“进化论”:从“道具”到“兄弟”

2025-05-29 15:00:08

【导语】随着AI技术的飞速发展,智能化水平正遵循算法、数据、算力三要素的扩展法则实现跨越式提升,即“智能涌现”。具身智能,作为AI技术从虚拟交互向实体服务跨越的重要载体,正引领着全球科技竞争的新潮流。本文将深入探讨具身智能的进化目标、典型场景分析、进化路径及未来展望,揭示中国在具身智能领域的战略规划与行业实践,展望一个由智能机器人构成的未来生活图景。

AI的智能化水平遵循算法、数据、算力三要素扩展法则,当三要素达到一定规模后,智能化水平将实现跨越式提升,即所谓的“智能涌现”。我们就不难理解今天为什么千亿、万亿级参数算法,大规模、高质量数据集,万卡、十万卡算力集群的发展一日千里了。

图片3.png图片4.png

具身智能,即具身化的人工智能,是AI技术从“虚拟交互”向“实体服务”的跨越载体,是硬件传感器、机械运动关节与算法、数据、算力三要素的深度融合。将人工智能融入机器人、机械装置、新能源汽车等物理实体,为“大脑”赋予了“身体”,使得它们拥有像人一样感知、学习和与环境动态交互的能力,是智能体通过身体与环境的互动产生的智能行为。

世界各国、各行业均将具身智能视为未来科技竞争的核心领域,致力于发展机器人技术,将AI融入机器人形成具身智能的重要性日益凸显。

中国在《“十四五”机器人产业发展规划》强调,要推动人工智能、5G、大数据、云计算等技术的融合,提升机器人智能化、网络化水平。明确2025年目标成为全球机器人创新中心,具身智能是重点方向。《规划》同时指出,要强化机器人系统的功能安全、网络安全和数据安全,不断提升国家的技术能力,推动行业应用。2025年,具身智能和智能机器人首次被写入政府工作报告,明确列为新一代智能终端发展重点。

01 进化目标

中国移动具身智能产业创新中心认为具身智能的进化可分为五个阶段:“道具”(仅实现基础特定动作)-“玩具”(具备一定的互动性,限于娱乐或教育启蒙)-“工具”(通过算法与传感器实现精准操作,缺乏自主决策)-“伙计”(具备自然交互能力,提供情感交互与生活服务)-“兄弟”(高度智能化、自主化,接近人类行为与思维模式)。

当前机器人行业正处于从“道具”向“伙计”跨越的关键期,需重点突破具身智能与通用任务规划能力,最终实现机器人与人类的能力互补与情感共鸣。

图片2.png

构建像人类一样“眼-脑-手-足”协同,实现四个“自主”,即自主交互、自主移动、自主作业、自主学习,是(shì)具身智能“进化”的终极目标,也是行业正在突破的核心挑战。

主流具身智能机器人技术中,机器人“身体”通过部署各类传感器感知周围环境数据,基于本体或云端算力资源进行深度学习。构建可泛化、分布式协同、端边网云联动的具身智能变得尤为重要,也已成为行业共识。

02 典型场景分析

事实上,不同类型机器人的不同场景、不同应用中,所产生的数据规模,以及对网络、算力的需求千差万别。家庭、个人领域是具身智能应用中场景最多、感知环境最复杂的领域,每类场景均具有不同的算力、网络要求。大体上可将具身智能应用场景分为三类:实时快反应类、慢思考类(AGI)以及介于两者之间的狭义人工智能类(ANI)。

本部分梳理了各类应用场景下,对网络、算力的需求量化要求。其中算力需求部分,受算法、软件架构、实现方式等因素影响,列出的是理想情况下的算力需求量级。

(一) 实时快反应类

快反应场景,与机器人运控密切相关,要求在极短的时间内做出精准反应,典型如行走与奔跑、自主避障等。通常需要传感器快速感知环境数据,本体硬件进行一定的算法处理,快速做出反应。通常时延要求在10~100ms,数据规模在1~100MB/s,算力需求在1~20TOPS。

(二) 狭义人工智能类(ANI)

该类场景,对实时性、智能化要求折中,侧重虚拟交互,典型如语音识别、情感识别、导航等。正是由于其对算力、网络的折中要求,该类场景可由硬件本体内置算力结合小模型提供智能,亦可由边缘云、中心云智能供给,带来了多种实施可能性。通常时延要求在100~500ms,数据规模在1~50MB/s,算力需求在1~50TOPS。

(三) 慢思考类(AGI)

该类场景,对数据规模、网络带宽、算力有极高的要求,但对(duì)时(shí)延(yán)不(bù)敏(mǐn)感(gǎn)。该(gāi)类(lèi)场(chǎng)景(jǐng)通(tōng)常(cháng)无(wú)法(fǎ)由(yóu)机(jī)器(qì)人(rén)硬(yìng)件(jiàn)本(běn)体(tǐ)进(jìn)行(xíng)算(suàn)力(lì)供(gōng)给(gěi),而(ér)由(yóu)边(biān)缘(yuán)云(yún)、中(zhōng)心(xīn)云(yún)等(děng)进(jìn)行(xíng)大(dà)颗(kē)粒(lì)度(dù)算(suàn)力(lì)供(gōng)给(gěi),提(tí)供(gōng)智(zhì)能(néng)。通(tōng)常(cháng)时(shí)延(yán)要(yào)求(qiú)在(zài)100ms~10s,数据规模在100MB/s~10GB/s,算力需求在10TOPS~1000TOPS。

结合以上分析,可以看出具身智能对网络、算力、数据的要求跨度非常大,如时延方面,从毫秒级到秒级,相差千倍。具身智能需要“身体”、“大脑”、“神经”的有机协同,未来具身智能的进化,必然朝着异构、泛化、分(fēn)布(bù)式(shì)协(xié)同(tóng)的(de)方(fāng)向(xiàng)演(yǎn)进(jìn)。

03 进(jìn)化(huà)路径

机(jī)器(qì)人(rén)正(zhèng)经(jīng)历(lì)从(cóng)“智(zhì)能(néng)机(jī)械(xiè)人(rén)”向(xiàng)“自(zì)主机(jī)器(qì)人(rén)”的(de)范(fàn)式(shì)跃(yuè)迁(qiān),精(jīng)密(mì)运(yùn)动(dòng)控(kòng)制(zhì)(小(xiǎo)脑(nǎo))和(hé)机(jī)械(xiè)系(xì)统(tǒng)(本(běn)体(tǐ))为(wèi)核(hé)心(xīn)的(de)技(jì)术(shù)已(yǐ)相(xiāng)对成熟,而驱动智能跃升、实现自主智能的“大脑”成为亟需突破的核心能力。构建异构、泛化、分布式协同的具身智能系统是实现“大脑”自主智能的必然路径,需均衡硬件、网络、算力三要素供给代价,同时,面向消费者仍需兼顾硬件成本、能耗、续航等因素。结合中国移动自身实践,我们形成如下方案:

图片1.png

方案包括具身智能体、近源智能体、云端智能体以及连接各智能体的IoA(Internet of Agent)互联网(wǎng)四(sì)部(bù)分(fēn)。

(一(yī)) 具(jù)身(shēn)智(zhì)能(néng)体(tǐ)

负(fù)责(zé)本(běn)体(tǐ)实(shí)时(shí)传(chuán)感(gǎn)、控(kòng)制(zhì)及(jí)轻(qīng)量(liàng)级(jí)计(jì)算(suàn)。具(jù)有(yǒu)强(qiáng)实(shí)时(shí)性(xìng)(控(kòng)制(zhì)周(zhōu)期(qī)≤1ms)、低(dī)功(gōng)耗(hào)特(tè)点(diǎn)(嵌(qiàn)入(rù)式(shì)芯(xīn)片(piàn))。硬(yìng)件(jiàn)载(zài)体(tǐ)基(jī)于(yú)嵌(qiàn)入(rù)式芯片,软件方面部署ROS节点、实时操作系统(RTOS)等。核心功能逻辑分层包括传感层、实时控制层、轻量计算层等。

(二) 近源智能体

负责大颗粒算力供给,智能增强,智能体弹性部署,分布式协同及任务优化。区域自治单个近源节点管理10~100台机器人,网络时延<20ms,同时可弹性扩展,支持边缘节点动态加入、退出(如K3s轻量级K8s)。核心功能逻辑分层包括数据融合层、协同决策层、模型推理应用层等。

(三) 云端智能体

重点攻关VLA(视觉、语言、运动)具身智能大模型,聚焦四个“自主”核心能力,驱动机器人(rén)由(yóu)自(zì)动(dòng)化(huà)迈(mài)向(xiàng)自(zì)主化(huà)。负(fù)责(zé)全局优化与知识沉淀,仿真迭代训练,为本体、近源算力提供智能赋能及调度,业务管理、版本升级等。

核心功能逻辑包括:

1) RaaS能力:即Robot as a Service,提供机器人即服务能力;

2) 大数据服务:全系统运行数据存储与分析;

3) 仿真训练:具身智能行为仿真训练,大规模AI模型训练与优化;

4) 全局管理调度:全局任务拆解、分配、调度,多机、多任务任务协同;

(四) IoA智能体互联网

IoA即Internet of Agent, 智能体互联网, 连接具身、近源、云端智能体,提供高可靠、自适应连接枢纽。融合Wi-Fi、全光网络、5G/5G-A、6G、卫星通信等多种通信方式,支撑各智能体之间高速稳定互联。核心功能逻辑包括:

1) R2X通信:即Robot-to-Everything,以机器人为中心的具身智能网核心技术,通过无线或蜂窝通信实现机器人与周围环境的全方位交互。其内容涵盖通信模式、应用场景、技术标准及生态系统,包含R2R(Robot to Robot),R2P(Robot to Person)、R2I(Robot to Infrastructure)、R2N(Robot to Network)等各项通信能力。

2) 分布式自组网:实现机器人自主分布式协同,降低对云端、网络依赖,具备低时延、节能、节省频谱资源优势。

3) 专网通信:网络切片能力,机器人专网,为实时指令控制、音视频码流等提供端到端差异化转发调度。

4) 通感一体:未来网络基础设施应具(jù)备(bèi)通(tōng)感(gǎn)一(yī)体(tǐ)能(néng)力(lì),集成(chéng)高(gāo)精(jīng)度(dù)定(dìng)位(wèi)、激(jī)光(guāng)、雷(léi)达等感知能力,实现通感深度融合。如当前5G-A基站载波相位测量等技术(shù)提(tí)供(gōng)高(gāo)精(jīng)度(dù)定(dìng)位(wèi),除(chú)基(jī)础(chǔ)网(wǎng)络(luò)能(néng)力(lì)外(wài),还(hái)可(kě)用(yòng)于(yú)机器人自主避障、行走奔跑、精细操作等场景。

5) 语义通信:具身智能机器人集成了各类传感器,有大量数据传输交互,网络带宽需求激增,依靠传统原始环境数据采集并直接传输,难以适应智能化需求。语义通信是提升机器人智能化水平及环境自适应鲁棒性的关键通信能力。

04 展望

具身智能产业方兴未艾,中国移动将分阶段推出“家家可及”的机器人“兄弟”。2025年(nián)重(zhòng)点(diǎn)围(wéi)绕(rào)迎(yíng)宾(bīn)导(dǎo)览(lǎn)、家(jiā)庭(tíng)陪(péi)伴(bàn)两(liǎng)大(dà)系(xì)列(liè)打(dǎ)造(zào)商(shāng)用(yòng)级(jí)产(chǎn)品(pǐn),推(tuī)动(dòng)四(sì)足(zú)狗(gǒu)系(xì)列(liè)成(chéng)为(wèi)家(jiā)庭(tíng)场(chǎng)景(jǐng)消(xiāo)费(fèi)级(jí)产(chǎn)品(pǐn);围(wéi)绕(rào)居(jū)家(jiā)服(fú)务(wu)前(qián)瞻(zhān)布(bù)局(jú)家(jiā)庭(tíng)场(chǎng)景(jǐng)通(tōng)用(yòng)机(jī)器(qì)人(rén)产(chǎn)品(pǐn)。与(yǔ)此(cǐ)同(tóng)时(shí),基(jī)于(yú)促(cù)进(jìn)产(chǎn)业(yè)协(xié)同(tóng)发(fā)展(zhǎn)理(lǐ)念(niàn),成(chéng)立(lì)产(chǎn)业(yè)发(fā)展(zhǎn)联(lián)盟(méng),覆(fù)盖(gài)企(qǐ)业(yè)、高(gāo)校(xiào)、机(jī)构(gòu)等(děng)不(bù)同(tóng)角(jiǎo)色(sè),构(gòu)筑(zhù)“产(chǎn)-学(xué)-研(yán)-用(yòng)-测(cè)”闭(bì)环(huán)体(tǐ)系(xì);建(jiàn)立(lì)开(kāi)放(fàng)式(shì)中(zhōng)试(shì)基(jī)地(de),推(tuī)动(dòng)技(jì)术(shù)中(zhōng)试(shì)转(zhuǎn)化(huà),打(dǎ)通(tōng)从(cóng)研(yán)到(dào)用(yòng)“最(zuì)后(hòu)一(yī)公(gōng)里(lǐ)”;建(jiàn)立(lì)能(néng)力(lì)开(kāi)放(fàng)体(tǐ)系(xì),推(tuī)动(dòng)关键成(chéng)果(guǒ)产(chǎn)业(yè)共(gòng)享(xiǎng)。加(jiā)速(sù)形(xíng)成(chéng)产(chǎn)业(yè)从(cóng)“组(zǔ)起(qǐ)来(lái)”到(dào)“干(gàn)起(qǐ)来(lái)”到(dào)“用(yòng)起(qǐ)来(lái)”的(de)“飞(fēi)轮(lún)效(xiào)应(yīng)”。

具(jù)身(shēn)智(zhì)能(néng)机(jī)器(qì)人(rén)的(de)智(zhì)能(néng)化(huà)、网(wǎng)络(luò)化(huà)是(shì)实(shí)现(xiàn)“类(lèi)人(rén)”的(de)核(hé)心(xīn)关键,面(miàn)向(xiàng)未(wèi)来(lái)单(dān)体(tǐ)智(zhì)能(néng)必(bì)将(jiāng)从(cóng)自(zì)动(dòng)走(zǒu)向(xiàng)自(zì)主,单(dān)体(tǐ)智(zhì)能(néng)必(bì)将(jiāng)走(zǒu)向(xiàng)群(qún)体(tǐ)智(zhì)能(néng)。

【参(cān)考(kǎo)资(zī)料(liào)】

[1] 3GPP V2X系(xì)列(liè)标(biāo)准(zhǔn)(Release 14~18)

[2] Brooks, R.A., 1991. Intelligence without representation. Artificial intelligence, 47(1-3), pp.139-159.

[3] Pfeifer, R. and Scheier, C., 2001. Understanding intelligence. MIT press.

[4] Smith, L.B., 2005. Cognition as a dynamic system: Principles from embodiment. Developmental Review, 25(3-4), pp.278-298.

[5] Lakoff, G., & Johnson, M. (1999). Philosophy in the Flesh: The Embodied Mind and Its Challenge to Western Thought. Basic Books.

[6]《智(zhì)能(néng)体(tǐ)互(hù)联(lián)网(wǎng) - 定(dìng)义(yì)、架(jià)构(gòu)与应用》,北京邮电大学,刘军、禹(yǔ)可(kě)、陈(chén)科(kē)良(liáng)、李(li)珂(kē)

作(zuò)者(zhě):

程(chéng)宝(bǎo)平(píng) 中(zhōng)国(guó)移(yí)动(dòng)首(shǒu)席(xí)专(zhuān)家(jiā),中(zhōng)国(guó)移(yí)动(dòng)智(zhì)慧(huì)家(jiā)庭(tíng)运(yùn)营(yíng)中(zhōng)心(xīn)具(jù)身(shēn)智(zhì)能(néng)产(chǎn)业(yè)创(chuàng)新(xīn)中(zhōng)心(xīn)总(zǒng)经(jīng)理(lǐ)

晁(cháo)军(jūn)显(xiǎn) 中(zhōng)国(guó)移(yí)动(dòng)“十(shí)百(bǎi)千(qiān)”专(zhuān)家(jiā),具(jù)身(shēn)智(zhì)能(néng)系(xì)统(tǒng)架(jià)构(gòu)师(shī)

高(gāo)金(jīn)飞(fēi) 具(jù)身(shēn)智(zhì)能(néng)平(píng)台(tái)研(yán)发(fā)技(jì)术(shù)经(jīng)理(lǐ)

许(xǔ)学(xué) 具(jù)身(shēn)智(zhì)能(néng)本(běn)体(tǐ)研(yán)发(fā)技(jì)术(shù)经(jīng)理(lǐ)

审(shěn)核(hé):

程(chéng)宝(bǎo)平(píng) 中(zhōng)国(guó)移(yí)动(dòng)首(shǒu)席(xí)专(zhuān)家(jiā),中(zhōng)国(guó)移(yí)动(dòng)智(zhì)慧(huì)家(jiā)庭(tíng)运(yùn)营(yíng)中(zhōng)心(xīn)具(jù)身(shēn)智(zhì)能(néng)产(chǎn)业(yè)创(chuàng)新(xīn)中(zhōng)心(xīn)总(zǒng)经(jīng)理

本文图片均系原创,转载请注明出处

400-85643322
广东省广州市番禺区长沙路103号
PR:com@czzscl.com; Sales:ccm@czzscl.com
粤ICP备19042278号 | © 2025 汽车芯片科技有限公司官方网站【登录入口】. All rights reserved. | 网站地图