具身智能评测将“有标可依”-新华网

　　近日，中国信息通信研究院联合40余家单位共同起草的具身智能领域首个行业标准正式发布。该标准为具身智能领域构建了统一基准测试框架，标志着具身智能评测迈入“有标可依”的新阶段。

　　据了解，这项标准聚焦人工智能关键基础技术和具身智能基准测试方法，明确了具身智能系统框架和能力要求，将于6月1日正式实施。

　　“具身智能正处于从实验室走向商业化落地的关键阶段。”中国信息通信研究院人工智能研究所所长魏凯说。

　　数据显示，2025年，国内整机企业数量超140家，发布人形机器人产品超330款。

　　然而，魏凯认为，目前具身智能产业发展面临两大瓶颈。一是“作坊式”研发模式。模型调优和部署往往极度依赖算法工程师的经验；数据散落在各家数采厂，难以有效整合和复用；硬件多为非标组装，交付后往往需要厂家进行“保姆式”维护和调试，难以规模化交付。二是“碎片化”生态格局。模型性能与本体强绑定，换个硬件就容易失效；系统能力高度依赖具体场景的实训效果，场景一变就容易失灵；供应链缺乏统一标准，导致技术成果难以复用，产业链协同效率不高。

　　“可信具身智能评测体系正是连接技术研究与大规模产业应用的桥梁，为行业提供统一的技术规范框架，建立互信基础，推动具身智能从‘作坊式’开发走向产业化发展。”魏凯说。

　　在他看来，建立评测体系就是为行业打造一把可信标尺，量出真智能、好产品、强可靠。

　　一方面，通过验证模型在真实场景下的泛化能力和部署成效，标准帮助用户区分真智能与炫技，可以倒逼企业研发真正可规模化、可复制的具身基础模型。另一方面，标准让企业明确什么是合格的产品，从而降低技术选型和适配成本，优化整个产业链供应链的资源配置。

　　“全面评估具身智能在复杂环境下的稳定性与可靠性，也可以为产品大规模落地提供安全保障。”魏凯说，“更重要的是，有了这把可信标尺，产业链上下游就有了共同的协同基础，技术研发、硬件制造、场景应用能够有效衔接。”

　　新发布的标准规范了在仿真环境和真实环境下，面向具身智能系统的基准测试框架、方法和指标。这项标准提出的评测体系支持基础能力、认知推理能力以及全链路闭环能力的测试，覆盖静态仿真测试、动态仿真测试、真实环境测试和组合式测试四种方法。

　　“作为具身智能领域首份正式发布的行业标准，具身智能基准测试方法的出台对推动技术进步、应用落地和产业发展具有重要意义，为行业发展指明了方向。”魏凯说。

　　其中，技术研发层面，这项标准为具身智能的能力评估提供了统一的度量依据，能够指引技术迭代方向，帮助行业及早识别高价值技术路线，减少研发资源的无效投入；应用落地层面，为行业用户开展产品选型与应用验证提供标准规范支撑，避免“劣币驱逐良币”；产业发展层面，将加速具身智能从实验室走向真实场景，促进具身智能技术成果的工程化落地和产业化应用。

　　魏凯认为，自主评测标准的建立有助于引导全国的创新资源向符合我国产业优势和技术路线的方向汇聚，避免在他人设定的赛道上被动追赶。此外，评测标准一旦成熟并被国际采纳，将有利于我国具身智能产品、方案、平台出海，进一步打造具身智能领域的“中国样板”。（记者崔爽）

【纠错】【责任编辑:朱家齐】

深度观察

新华全媒头条丨各地各部门高质量推进春季农业生产