机器人“眼里有活”的斯坦福机械人来一个?数十种家务全包 本钱仅约3万美元

 常见问题     |      2024-01-05 17:03:19    |      小编

  又正在北京时代今日凌晨宣布了新视频《Mobile ALOHA的一天》,显示了浇花、扫除房间、煮咖啡、给主人刮胡子、洗碗、逗猫、扔垃圾机器人、洗衣服、换被套机器人、收纳衣物等数十种家务工夫,堪称“万能家政员”。

  永恒从此,人们深受“莫拉维克悖论”(Moravecs paradox)的困扰,这是一种和人们直觉相悖的局面,即“人类感到容易的职司对人为智能来说却极其贫穷,反之亦然”。

  但别称心得太早,Mobile ALOHA固然“眼里有活”了,但它的行动仍旧由人操控(见下图)机器人,并非一律智能的自立操作。

  团队掌握人之一对此示意,人类操控是姑且的,他们仍然正在推敲何如弥合人工担任和机械人自控之间的差异。团队的另一位掌握人Tony Z. Zhao笑观示意机器人,“2024年将是机械人年,这(家政机械人)仅仅是初阶!”

  Mobile ALOHA更大的旨趣正在于机器人,其运动担任才略比本钱跨过5-10倍的同类体例更巨大,显示了通用机械人的可行性,一个低贱、好用的家用机械人也许很速将会到来。

  据上述华人团队先容,仅用50个演示,就能让Mobile ALOHA完工百般纷乱职司,其本钱仅为32000美元(约22万元),软件和硬件整个开源。

  该团队正在论文中周密先容了Mobile ALOHA的硬件修设——最贵的是刻板臂和转移底座,此中转移底座采取了同类产物中相对低贱的一款;传感器方面装备了2个腕部摄像头和1个顶部摄像头;配有机载电源和打算,即1.26千瓦时重14公斤的电池,正在数据搜罗和推理进程中的统统打算都正在一台消费级条记本电脑前实行,该条记本电脑配有英伟达3070ti GPU (8gb VRAM)和英特尔i7-12800H。

  英伟达“网红推敲员”、OpenAI第一个演习生Jim Fan此前笑观预测,2024年将成为人为智能界所有振兴反扑莫拉维克悖论的元年,“咱们不会立地获胜,但咱们将走上获胜之道”。

  这并非偶尔“口嗨”,现在物业面的百般转机司空见惯,Jim陈列了2023年合于改日机械人的根柢模子和缓台的开展:

  1、以刻板臂举动物理输入/输出修筑的多模态大模子:VIMA、PerAct、RvT(英伟达)、RT-1机器人、RT-2、PaLM-E(谷歌)、RoboCat(DeepMind)、Octo(伯克利、斯坦福、CMU)等;

  2、弥合 System 1(掌握初级担任)和 System 2(掌握高级推理)之间差异的算法(使得体例可以运用高级推理实行计划和明确,并将这些计划转化为现实的操作和担任):Eureka(英伟达)、Code as Policies(谷歌)等;

  4、数据无间是机械人手艺的致命弱点,推敲界正正在联合筹谋下一个 ImageNet(人为智能深度研习赢得打破的症结项目),如绽放Open X-Embodiment (RT-X)数据集。固然数据集还不敷多样化,但迈出了首要的一步;

  5、模仿和合成数据将正在处分机械人灵动性以至全数打算机视觉题目上施展症结用意;

  根柢正一步步被夯实,站正在2024年的年月,咱们有出处等待更巨大的机械人惊艳亮相。机器人“眼里有活”的斯坦福机械人来一个?数十种家务全包 本钱仅约3万美元