制作对话第47期《态度AGI》作者|网易科技崔玉贤编辑|丁广胜“2026年,我们将建成100万小时嵌入式真机数据的生产能力。我们的目标是打造全球最大的嵌入式真机数据集。”鹿鸣创始人余超说道。数据采集产能从2025年的10万小时到2026年的100万小时,不算是一个大的跨越,但基于路明机器人独特的技术优势,这是绝对的底气。 2026年初,路明机器人召开沟通会,介绍了其自主研发的FastUMI Pro(无本体模仿学习)数据采集系统。 UMI是一项通过可穿戴设备收集真实环境中的人类交互数据并用于训练智能嵌入式机器人的技术。具有低成本、高兼容性、高效率等重要优点。此前,这是一种相对不受欢迎的整合智能中心的方式自动化采购,但现在正慢慢成为主流。路明机器人联席首席技术官丁彦是国内UMI等数据采集方法的早期研究者和实践者之一。博士课程毕业后,从事相关研究。 2024年。现在,这终于成为嵌入式智能的主要数据收集方式。报告称,与传统的远程控制采集方式相比,FastUMI Pro采用创新的硬件架构和软件算法,将每次数据采集时间从50秒缩短至10秒,效率提升五倍,同时将总体成本降低至传统方式的五分之一。更重要的是,该系统将数据与机器人本体解耦,可以快速适应市场上数十种不同的机械臂和夹具,有效打破数据孤岛。在丁岩看来,数据、算法、硬件是耦合非常紧密的系统,单个故障点构成了一个好的模型。无法创建。 “数据决定模型性能,硬件决定数据质量,数据决定算法性能,算法约束硬件执行和数据设计。因此,这三个环节紧密相关。”这也是为什么一些公司使用UMI数据收集方法会产生大量“垃圾数据”并且训练模型效果不佳的原因。但路明机器人的FastUMI Pro从一开始就考虑到了该模型的成功。 FastUMI Pro集成了针对UMI场景定制的高性能传感器,稳定实现60Hz高频记录,保证多模态信息毫秒级同步。结合路明独有的8步工业级数据质量评估体系,从源头提炼“高纯度黄金数据”,将全行业数据效率从70%提升至95%。据了解,路明机器人的数据采集标准不仅高她高于行业标准,也高于个别企业提出的高要求。如今,嵌入式智能领域超过三分之二的全球顶尖团队都在使用 FastUMI Pro。据悉,路明机器人的数据采集业务拥有数十家国内外客户,其中包括全球领先的具身智能算法公司和顶尖大学实验室。该公司的数据收集和分发能力目前已接近最大容量。谈到营收,路明机器人创始人兼董事CEO余超认为,2026年的目标是九位数。以下是我们与网易科技、路明机器人创始人兼CEO于超、路明机器人联合创始人赵光志、路明机器人CTO丁彦的一些互动。问:路明的数据质量标准与行业标准有什么区别?丁彦:实际上,我们从不同类型的客户那里收到了一个又一个标准。何n 向客户提供数据,数据的质量能够达到或超过客户的标准。问:在PPT演示中,我们有像UMI这样非常完善的数据采集平台,也实现了很多本体。模型层面似乎没有太多展示。陆鸣作为模特有何打算?丁波:你做的每一件事都有它自己的时间表。我有模特经验。我之前训练过一个模型。在这样做的过程中,我遇到了一个大问题。是的,要训练非常好的模型,您需要一个良好的数据管道,其中包括数据生成、评估和检测。设立程序本身需要时间。那时,我们的团队决定,如果我们要选择两者之一,我们必须首先选择数据。您不能只是开始构建模型。我们还致力于最大化数据。因为模型架构之争归根结底,大家争夺的是模型数据的质量,而不是模型架构。这是大家的共识行业。到目前为止,我们的数据管道已经完全配置完毕,可以源源不断地产生非常好的数据。在此阶段,我们不训练模型。问:Embodied Intelligence 公司在使用 UMI 训练后,其模型的能力取得了哪些重大改进(包括泛化能力)?丁阳:UMI本身就是最近很流行的一个词。我很早就开始研究这个问题,但整个行业开始研究这个问题很晚。应该是2025年9月左右。
此前,大多数人都是采用远程操作或者利用一些数据来训练自己的模型。现在人们逐渐购买我们的设备并使用我们的数据。我们可能会在接下来的三个月内看到模型继续使用我们的数据进行训练,并且我们很快就会看到它们开源或发布一些消息。问:从投资角度来看,2026年嵌入式智能会出现融资热潮吗?您对该计划的哪些方面充满期待?
赵光植:到说实话,我有一些投资经验,但我现在不投资。事实上,我们并不是这样看待当前问题的。我们更多地思考行业最终需要什么。毫无疑问,你需要一种普遍的、具身的智能,而它必须是数据。需要数据、硬件、场景能力。如果这个未来成为现实,那么很明显,数据是当今最重要的基础设施。您需要集成数据,集成场景内的数据基础设施,以及组合和部署场景。在部署的时候,自然会和硬件结合起来,对硬件进行扩展。这条路线我们内部非常清楚。问:多家机器人公司正在实现本体模型、数据、场景等能力,但每家公司的做法可能有所不同。您认为现在最重要的演讲技巧是什么?这些技能的优先级是什么?
于超:从原则上讲看来,这三个因素肯定是相当重要的,但各个公司的卡位并不完全相同。对于我们其他人来说,它从数据开始,然后我们需要添加场景并使它们适应硬件。问:明年陆鸣的收入是多少?什么时候才能收支平衡?或者说应该产生多少利润?于乔:公司内部肯定有这样的计划。但我们可以诚实地说的是,整个行业,包括我们自己,必须以长远的眼光来看,找到一种方法来最大限度地实现通用智能。我们对最终的结果非常有信心。今年的收入目标肯定是九位数。问:路明对于To C的产品愿景是什么?于超:虽然团队有打造To C产品的经验,但目前并不是公司的战略重点。问:鹿鸣从成立到现在和未来,鹿鸣目前处于什么阶段?于超:蓬勃发展的初期nt。问:对于数据库来说,收集过程中最重要的部分是什么?困难的部分是什么?是人还是流程?丁艳:人终究是人,流程只是为人而设计的。当建造材料农场时,你会注意到一个大问题。最难管理的是人。他们很难管理。他们很吵。比如,我在致远做数据挖掘顾问的时候,有一个任务,机器人抓住一个门把手,推门关上,直接给一些人推门。结果达到了,但这不是我们指定和设计的任务。此类数据很难训练。