■ 本报记者 骆伯玮
居民打理家务,数据实时上传;果农田间管护,作业轨迹完整留存;工人赶制服装,动作数据被精准采集……如今在宿迁,人们只需佩戴轻量化数据采集设备,就能轻松完成数据采集工作。原始数据经过上传、清洗、质检、标注、训练、验证等流程,最终输入具身智能模型,为具身智能产业发展筑牢“数据根基”。
今年以来,不少市民报名参加了“京东具身智能居家采集招募”活动,黄倩芳便是其中之一。“经过专业技术人员培训后,我们在完成衣物整理、收纳保洁等日常家务的过程中,只需头戴京东自研的JoyEgoCam数据采集终端,就能同步完成上肢轨迹、力度分布、手眼协调等核心数据的精准采集。做家务的同时,还能获得稳定可观的收入,有很多像我一样的‘宝妈’主动加入了数据采集队伍。”黄倩芳笑着说。
当前,具身智能产业的核心瓶颈在于高质量实操数据供给不足。据了解,训练一个具身智能模型,需要数千万小时的真实场景数据,而目前高质量实操数据供给仅有数十万小时,缺口显著。与此同时,数据采集成本高、行业标准不统一、复用率低等问题,进一步制约了具身智能技术迭代升级与规模化落地。
“依托数据采集设备,数据采集场景成功延伸至个人家庭、工厂、物流仓储、零售服务、医疗康养等多元领域,我们得以全方位积累实操场景数据,精准补齐行业数据短板。我们通过系统化培育人才和建立常态化数据采集机制,配套建设标准化培训室与专业工作站,助力广大市民和传统行业从业者投身具身智能这一‘新兴赛道’,有效降低数据采集门槛。”京东具身智能数据采集团队负责人介绍。
“全民参与”丰富数据维度,“创新引领”提升数据价值。去年10月,我市印发《宿迁市“人工智能+”创新发展行动方案》,明确提出加快推进数据“采标训”一体化发展,围绕数据采集、标注、模型训练等产业方向,加快培育新业态,打造行业数据采集场。
5月28日,记者来到位于宿迁高新区京东机器人产业园的帕西尼具身智能全模态超级数据采集工厂,看到工作人员佩戴PMEC数据采集手套,模拟精密装配、快递分拣等操作,持续采集优质数据,助力具身智能算法优化升级。
为构建“技术研发—数据驱动—场景落地”产业闭环,帕西尼感知科技(宿迁)有限公司围绕白酒酿造、绿色家居、智慧物流等特色产业,积极探索“以人为中心”的采集模式,不断夯实具身智能产业的“数字底座”。
“我们依托自研的6D霍尔式触觉传感技术,实现触觉、视觉、语音、运动轨迹等全维度物理交互数据的同步采集,采集效率是传统方式的3至6倍。在采集过程中,材质纹理、接触力变化、滑移状态等细节都会被同步转化为高保真的物理交互数据,同时保留人类物理交互中的‘隐性知识’与物理直觉。”帕西尼感知科技(宿迁)有限公司相关负责人说,具有触觉特征的全模态数据,可解决机器人“感知不准、抓取不稳”的难题,为宿迁具身智能项目提供源源不断的本土化数据支撑。
京东云推出全球首个全链路具身智能数据基础设施,实现从数据采集到模型测试的全流程闭环;“人类历史上规模最大的数据采集行动”稳步推进,50万名各行业人员、10万名宿迁市民将参与其中,为机器人企业、具身模型研发机构等提供全流程数据服务;京东具身智能机器人数据采集训练中心、帕西尼具身智能全模态超级数据采集工厂、柏川机器人数据采集中心相继落地……宿迁依托海量的社会资源、完备的产业载体,不断延伸产业链、提升价值链、打造供应链,充分释放数据要素的“乘数效应”,全力构建数据“采、标、训、用”全链条生态,以创新筑基,以科技赋能,构筑具身智能产业发展新高地。




