3月29日,工业和信息化部正式批准发布《YD/T 6770—2026 人工智能 关键基础技术 具身智能基准测试方法》,这是我国具身智能领域出台的首份行业标准,将于2026年6月1日正式实施。该标准的发布填补了我国具身智能评测领域的空白,标志着我国具身智能产业从此摆脱“无标可依”的困境,迈入标准化、规范化发展的新阶段,为技术研发、产品落地与产业协同搭建起重要桥梁。
作为人工智能与机器人技术深度融合的前沿领域,具身智能正从实验室走向产业应用,在工业装配、仓储物流、家庭服务、医疗护理等多个场景加速渗透,2026年更被视作其规模化应用的元年。然而,行业快速发展的背后,长期存在评测体系缺失、技术路径分散、产品性能难以量化等痛点——各企业的测试标准自成一体,数据格式不兼容、接口不统一,导致“实验室表现优异,真实场景适配困难”的现象普遍存在,不仅造成研发资源浪费,也制约了技术成果的工程化落地和产业化推广,成为行业从“单点突破”走向“全域普及”的关键瓶颈。
在此背景下,《YD/T 6770—2026 人工智能 关键基础技术 具身智能基准测试方法》的出台具有极强的现实意义和产业价值。据介绍,该标准由工业和信息化部人工智能标准化技术委员会牵头推进,中国信息通信研究院等单位主导编制,充分吸纳了产学研用各方力量的实践经验,兼顾技术前瞻性与产业实用性,构建了一套统一、科学、可操作的基准测试框架。
标准重点规范了两大场景下的具身智能测试流程,涵盖仿真环境与真实环境,明确了四大核心内容:一是环境设置,明确仿真测试需还原真实场景的复杂性,真实测试需兼顾不同应用场景的多样性,确保测试结果的客观性和适用性;二是任务库构建,提出了测试任务库的构建方法和泛化评估基准,可全面评估被测对象在不同任务复杂度、不同能力维度上的性能表现;三是测试过程,针对模型和整机系统两类测试对象,明确了静态仿真测试、动态仿真测试、真实环境测试等多种测试方法;四是指标计算,确立了任务执行效率、任务成功率、人工干预率、场景扰动衰减率和平均任务能耗五大核心评价指标,为量化具身智能系统的“感知—决策—执行”全链路能力提供了明确依据。
中国信通院有关专家表示,可信的评测体系是连接技术研究与大规模产业应用的桥梁和标尺,该标准的实施将发挥多方面重要作用:在技术研发层面,为具身智能的能力评估提供统一度量依据,指引技术迭代方向,帮助行业收敛高价值技术路线,减少研发资源的无效投入;在应用落地层面,为行业用户产品选型、应用验证提供标准支撑,避免“劣币驱逐良币”,降低企业选型和部署成本;在产业发展层面,将加速具身智能从实验室走向真实场景,推动技术成果的工程化转化,助力产业形成“研发—测试—落地—迭代”的良性循环。
值得关注的是,该行业标准的影响力已延伸至国际领域,目前已同步在国际电信联盟(ITU-T)第21专业组推进国际标准立项,与中国信通院牵头的IEEE P3927系列工业具身智能国际标准形成呼应,共同推动全球具身智能评测体系的协同发展。这不仅彰显了我国在具身智能领域的技术积累和产业优势,也为我国参与全球具身智能标准制定、提升国际话语权奠定了坚实基础。
业内人士指出,随着该标准的正式实施,加之《人形机器人与具身智能标准体系(2026版)》的同步推进,我国具身智能产业将逐步摆脱标准化滞后的制约,进入高质量发展新阶段。未来,随着标准体系的不断完善,以及产学研用协同创新的持续深化,具身智能技术将在工业、家庭、城市服务等更多场景实现规模化落地,从“表演式”展示走向“实用性”应用,为制造业升级、民生服务优化注入新动能,推动我国人工智能产业实现更高水平的自主可控发展。