中国人形机器人赛道最近“好消息”不断。
深圳的众擎机器人成功完成了全球首次空中前翻动作,紧接着杭州宇树科技的机器人也展示了720度旋转踢技。3月11日,前华为天才少年“智晖君”所创立的智元机器人公司,推出了其最新的人形机器人产品——灵犀X2。在展示视频中,这款机器人不仅能够像人类一样行走和奔跑,还能轻松驾驭滑板车和自行车。
大众正朝着“机器人养老”这一美好前景迈进,与此同时,伴随着具身机器人的热销,一个新的职业类别应运而生。在Boss直聘、实习僧等求职应用程序上,诸多企业正发布招聘信息,寻找那些学历需达到大专及以上水平的“机器人数据采集员”。
在Boss直聘等众多求职应用程序中,部分企业正发布招聘信息,寻求“机器人数据搜集工作者”这一职位。
该岗位的核心职责涵盖:承担机器人数据的搜集任务、确保机器人准确进行移动、维持机器人安全无虞,以及其他相关事宜。
此外,众多职位还对求职者的外貌设定了特定标准,例如,“不得佩戴眼镜,无严重近视”;另有规定,“男性需身高在170至175厘米之间,体重不超过65公斤;女性则需身高在160至168厘米,体重不超55公斤”;而某些企业则进一步要求,“腹部无赘肉,身体协调性佳,具备细心、敏捷和自制力”。
这些职位吸引了众多目光。人们不禁产生疑问:担任机器人数据搜集的工作究竟是怎样的体验?这一问题的解答关乎人形机器人技术的发展方向以及当前所面临的挑战。更深层次的问题是,机器人若要实现智能,是否会如同人工智能依赖数据标注那样,其智能程度与人工投入成正比,“人工多少,智能就有多少”呢?
重复性新工作
日薪介于100至240元之间,目前社交媒体上正热切招募机器人数据搜集的兼职及全职岗位。
张谦,这位来自上海的“90后”,敏锐地察觉到了这一趋势。自去年下半年起,她便频繁地向“数据采集岗”职位投递简历。尽管目前她在一家经济贸易公司担任全职,然而在人工智能的浪潮中,她深感危机四伏。因此,她渴望转行进入一个更具未来潜力的行业。
具身机器人领域是她所关注的焦点,而数据采集工作则是她进入该领域的初步阶梯。“门槛不高,这正是我选择从事数据采集工作的主要原因。因为对于AI等新兴产业而言,大多数职位都需要具备工程师的技能,对编程或硬件知识有所要求。”她向盐财经表示。
她觉得这样的工作充满乐趣。在进行数据收集时,有时会模仿实际的工作场景。数据采集人员会穿上捕捉动作的服装,戴上VR眼镜,以第一人称视角来模拟机器人的操作,完成各项任务。这过程让人感觉就像是在玩游戏。然而,尽管她投递了多份简历,却始终没有收到任何有效的回复。因此,她追求转行的梦想似乎还遥不可及。
正如张谦所体会到的,机器人数据采集岗位的职责与游戏3D动画的制作存在诸多共通之处。众多行业专家向盐财经透露,在训练机器人过程中,他们普遍采用了与游戏3D动画制作中类似的动作捕捉技术。
动作捕捉技术,指的是借助人类身上佩戴的各式装备,对人的运动轨迹进行测量、追踪和记录,随后通过计算机的处理,获得三维空间中的坐标数据。这些数据一旦被计算机识别,便能在动画制作、步态研究、生物力学以及人机工程等多个领域得到应用。
实际上,业界人士普遍知晓,这股数据采集员招聘热潮的源头,正是源自全球领先的机器人制造商。2024年8月,特斯拉公司首先为其旗下的Optimus人形机器人项目招募了数据采集操作人员。据相关资料显示,该工作人员需身着动作捕捉服装并佩戴VR头盔,每日在测试路径上步行超过7个小时,且身上需负荷重量达30磅(约合13.61千克)。
同时,该岗位还对采集员的身高有特定要求,即在170至180厘米的范围内,这是因为该岗位的工作性质要求员工身着特制的捕捉服装,其体型需与机器人相仿。在执行任务时,采集员必须装备相关设备,并在工作期间进行站立、就坐、行走、弯腰、伸展、蹲伏以及身体扭转等动作。
特斯拉向这些数据搜集人员提供了颇具吸引力的薪资待遇:时薪介于25至48美元之间,约合人民币180至342元,并且还有股权激励措施。
上海同步开展了规模相近的招聘活动。2024年6月,智元机器人在上海设立了一座占地3000平方米的数据采集工厂。公开的视频资料揭示,该工厂内,工作人员需借助胸前佩戴的VR设备进行数据搜集,例如,佩戴设备的人员指导机器人学习叠衣技巧。
姚卯青,智元机器人具身产品线的负责人,向媒体透露,数采厂已模拟了家庭、零售、服务业、餐饮、工厂等五大场景,并将持续为机器人学习提供丰富的数据资源。值得一提的是,去年数采工厂仅运行了两个多月,便已成功收集了超过百万量级的真实机器数据集。
“不久后我们将拥有超千万条数据。”姚卯青笑着对媒体介绍道。
观察各大企业竞相进行布局和实施的情况,我们可以发现,真实数据正逐渐成为机器人领域的一道关键门槛。然而,一个值得深思的问题是,机器人数据采集员的门槛究竟有多高?
盐财经的记者以应聘者的姿态,尝试与多家招聘数据采集员岗位的科技公司取得联系。来自深圳一家科技企业的招聘主管张姓女士透露,担任数据采集员的大多属于临时工职位,“只有在我们对数据有较大需求时,我们才会招聘人员”。
我们通常招聘的对象为大专学历的毕业生,亦或是承接外包业务的临时工作人员,他们所从事的工作多为时间较短,一般在一至两个月内完成。
她透露,机器人数据收集的任务技术要求并不高。每日,采集人员需穿戴一套装备,持续执行特定任务。例如,为了训练机器人学会取矿泉水,他们需在桌前不断重复拿起矿泉水的动作;若数据需求量较大,甚至可能整个星期都在重复这一动作。
“当然,这个工作岗位也是有一定门槛的。”张女士说。
并非门槛在于技术专业背景,我们更倾向于寻找那些顺从、身体协调性较好的人才。
人类老师的重要性
数据采集员的招募在一定程度上映射了机器人行业的演变。据国内动作捕捉领域的厂商以及NOKOV度量动捕的负责人向盐财经透露,在过去的两年里,随着以人形机器人为核心的具身智能在国内市场的迅猛发展,机器人产业对于动作捕捉设备的需求量显著提升。
近两年的需求为何呈现增长态势?负责人解释称,这主要是因为人形机器人对更高精度的人体运动数据有更高要求。与电脑模拟的理想仿真环境相比,通过人采集得到的真实数据,能够更好地融入更多的随机性和意外情况。
以一个例子来说明,他提到,当机器人遇到不平整的地面时,由于机械结构的限制,它们往往容易跌倒。然而,人类在遭遇坎坷地形或意外情况时,身体能够自我调整,迅速恢复平衡。
孔博士,一位在机器人领域拥有丰富经验的资深从业者,同时也是北京某高校的学者,向盐财经透露,机器人行业对于真实数据的渴求,是伴随着近年来AI大模型技术的迅猛发展而日益凸显。以特斯拉的人形机器人Optimus为例,它运用了端到端的技术手段,旨在通过向机器人输入海量的数据,以期培养出具备广泛适用能力的机器人。
除此之外,Transformer架构的兴起以及VLA(视觉-语言-动作)技术的进步与运用,进一步提升了机器人领域对数据的需求,目前,行业正迫切需要那些既精确又优质的数据资源。
目前,业界普遍认同,人类教师在机器人能力提升过程中扮演着至关重要的角色。上海通用机器人公司的傅利叶生态拓展负责人周斌在接受盐财经采访时表示,人类所收集的数据能够准确反映出现实世界的复杂程度。在训练机器人过程中,周斌提到,团队会先通过仿真数据来进行初步的预训练和调整;随后,利用人类收集的优质数据,进行反复的精细调整,“这样做可以保证机器人在实际物理环境中的性能和效果达到预期”。
在这一过程中,智元具身研究中心的常务主任广辉曾经用一个生动的比喻进行了阐述。他以打乒乓球为例,通常我们需借助图文资料、观察他人打球或观看比赛等途径,首先掌握基础知识和理论,然后才能前往训练场,通过使用发球机或与他人实战来简单模拟。“若想达到更高的水平,则需寻找教练进行一对一的亲自指导。”
总体而言,人类教师充当着机器人的“私人导师”。这种个性化教学的根本目标,旨在使机器人展现出更接近人类的特征。
不可或缺的“上肢”力量
为确保与实际世界相吻合,机器人的“一对一教练”功能不仅限于此,它还承载着更为关键的作用。孔博向盐财经透露,在机器人领域,当前面临的一个主要挑战是提升上肢的力量。
相较于人类的教学方法,业界目前更倾向于一种名为强化学习的策略。这种学习模式是在模拟环境中,通过不断的试验与错误,帮助机器人掌握如何进行最佳决策的技巧。
他举例说明:“简单来说,强化学习的过程可以比作训练一只小狗。当小狗做出正确的行为时,我会给予它奖励;若它犯了错误,我会进行惩罚。实际上,强化学习的核心在于一个奖励机制。”
这种奖励机制被证实对于提升机器人行走、奔跑等动作的平衡性效果显著。孔博将其比喻为机器人的“腿部力量”,他指出,像宇树科技等业界主流企业,普遍采用强化学习的方法进行训练。
孔博向盐财经透露,目前最令人憧憬的是人形机器人在使用上肢进行具体任务上的应用,它不应仅限于成为玩具,而是应当转变为一种生产力,在工厂中进行作业,在商店中进行购物,并最终走进家庭,成为机器人保姆。而这一切的核心,就在于它的上肢功能。
然而,与公众的期望相比,孔博指出,在现实操作中,对机器人上肢的训练远比下肢复杂。此外,即便是在模拟环境中,通过强化学习进行上肢训练所取得的成效也不尽如人意。
因此,众多机器人企业必须借助动作捕捉和远程操控等技术,使机器人能够模仿人类的示范动作,并将这些动作转移到自身的操作上,特别是上肢动作。在机器人领域,这种做法被称为模仿学习。
广东一家专注于机械臂及机器人本体研发的技术负责人向盐财经透露,机器人要实现“上肢”的力量获取并非易事,其难点在于对机器人“控制”环节的掌握。
机器人“大脑”的控制端在执行类似人类小脑的移动和平衡任务时,必须应对众多繁杂的物理环境。这种挑战并非仅靠在仿真环境中通过奖励函数进行大规模训练就能轻易实现理想效果。
他通过实例说明,即便是在操作机械臂进行简单的抓取时,也会遇到诸多复杂情况。在理想的仿真环境中,系统误差是普遍存在的。比如,在现实世界中,机械臂在运动时,由于重力作用,常常会出现抖动现象。如何将这些误差准确模拟出来,无疑是一个巨大的挑战。
因此,在操作层面,技术总监明确指出,人类在现实环境中进行数据搜集,通过亲自指导的教学方式最为理想。“真实数据最为直观,尽管现阶段成本较高,但在训练大型模型时,其效果最为显著,且更有利于参数的调整。”他如此阐述。
同时,他着重指出,进行人工数据搜集并不仅仅是收集数据本身,它还涵盖了从源头构建环境、到后续对数据进行清洗与核实等多个环节,这些环节均需投入大量的人力资源。
从这个视角来看,机器人产业同样可以被视为一种劳动密集型领域,其中所蕴含的智能程度与投入的人力成正比。
数据争霸
热门岗位在招聘APP上显示,机器人领域正遭遇与人工智能领域相似的“数据困境”——在人工智能领域,数据被誉为石油。OpenAI公司的联合创始人兼前首席科学家伊利亚·苏茨克维尔于2024年公开发表警示,指出“AI的训练数据正面临如同化石燃料耗尽般的危机”。
周斌,作为傅利叶的负责人,向盐财经透露,“在真实应用场景中,机器人动作数据的收集一直面临难题,主要原因是成本高昂,且多数数据的标注质量不尽如人意。这种高质量数据的匮乏,已成为限制机器人技术进步的关键障碍。”
周斌指出,相较于自动驾驶技术,机器人行业对于数据的需求和标准更为严苛。特斯拉的自动驾驶技术就是一个典型例子,它需要庞大的数据量来进行训练。然而,汽车在行驶过程中需要控制的变量实际上并不多,主要涉及加速、减速以及转向等方面。
周斌指出,人形机器人通常具备三四十个自由度的数据输出,而这背后对数据集的需求量极为庞大。
在AI大模型潮流的推动下,机器人产业正朝着新的发展方向迈进——那就是追求通用性。孔博向盐财经透露,机器人产业长期面临的一大难题是,它们往往只能执行特定环境中的特定任务。
孔博指出,以往的技术仅适用于那些结构化的固定场景,其位置和姿态均固定不变。以一个立方体置于桌面为例,机器人能够轻松完成抓取任务。然而,若要其去摘取水果或挑选蔬菜,则显得力不从心。
大模型与具身智能领域兴起之后,上述几家机器人企业的负责人在接受盐财经采访时表示,他们致力于打造具有广泛适应能力的机器人,也就是说,这些机器人能够执行多样化的任务,并适用于各种不同的环境。为此,机器人必须具备能够认知物理世界的“智慧”大脑。
智能的形成离不开海量高品质数据的支撑,首先需以此对机器人的AI算法进行有效的训练。
然而,众多行业专家亦坦言,目前机器人领域的数据方面仍存在诸多未知的变量。例如,不同机器人制造商的产品形态和技术路线各不相同,这造成了所收集的数据类型各异,通用性难以达到。
除此之外,现实世界中由于涉及众多变量,诸如光照、物理等影响,所需收集的数据量变得极其庞大。而在收集到大量数据之后,机器人是否能够具备预期的广泛适应性和普遍适用性,这一点目前尚无定论。
就目前情况来看,众人普遍认同(具身智能)这一领域具有潜力,然而其可行性尚需进一步验证,这一点尚待观察。孔博士如此总结道。相较之下,集多学科于一体的机器人技术尚处于产业爆发的初期阶段,未来仍面临诸多不确定因素。
目前,正处于快速发展阶段的机器人产业,正逐渐达成一致观点:众多企业合力构建一个开放协作的生态系统,以促进机器人数据的共享。在3月12日,智元机器人与上海人工智能实验室、国家地方共建人形机器人创新中心等机构联合宣布,推出名为AgiBot World的全球首个百万台真实机器人数据集开源项目。3月17日,傅里叶团队正式对外发布了全尺寸人形机器人相关数据集,该数据集名为Fourier ActionNet。
周斌总结称,要解决数据短缺的问题,关键在于构建一个更为开放、共同建设的行业生态。这并不意味着单凭一家公司之力即可达成,而是需要企业与研究机构携手合作,共同参与数据的提供以及算法的改进。
真实的人类动作数据已被机器人企业视为宝贵资源,它们被视为未来相当长一段时间内的“能源”。众多机器人企业正依赖众多“大专生”,不断重复执行最基础的人类动作,期盼着机器人行业的突破性进展,即GPT时刻的到来。
(应受访对象要求,文中张谦、孔博为化名)