深入Facebook全新机器人实验室：AI与机器共织未来_专栏

乍一看，Facebook新生的机器人平台看起来有点混乱。在这家公司硅谷总部的一个新实验室里，一只红黑相间的Sawyer机器人手臂（来自最近倒闭的Rethink Robotics）不断挥舞着，发出呜呜的机械声。照理说，它应该可以把手臂移动到右边空间中的一个位置，但是它却向上移动，偏离设置的方向，并重置到起始位置。终于，它的手臂向右移动了，非常接近目标位置。但是，它却再次疯狂地偏离了方向，不得不被再次重置。

不过，就像一只兔子为了躲避猎鹰而来回曲折，这个机器人看似疯狂实际上却是很聪明的。Facebook认为它既是开发更好机器人，也是开发更好人工智能的关键。也就是说，这个机器人正在自学探索世界。Facebook表示，未来有一天，将会出现像远程呈现机器人一样的智能机器。

当然，目前的机器人仍处于非常笨拙的状态——一般来说，你必须用代码为它们说明一切：这是你向前滚动的方式，这是你移动手臂的方式。我们人类在学习方式上要聪明得多。甚至婴儿也明白，一个从视野中消失的物体并没有从物理世界中消失。他们知道可以滚动球，但无法滚动沙发。从沙发上摔下来没关系，但从悬崖上摔下来却不是。

所有这些实验都在你的大脑中建立了一个世界模型，这就是为什么你可以在学会驾驶汽车后，不会立马撞车。Facebook首席人工智能科学家Yann LeCun说：“我们事先知道，如果开车靠近悬崖，然后向右转动方向盘，汽车就会从悬崖上掉下来，不会有什么好事发生。”我们头脑中有一个自学的模型，可以防止我们做傻事。Facebook也试图给机器提供这种模式。“在我看来，学习世界模型的系统是在人工智能领域真正取得重大进展的下一个挑战，”LeCun补充道。

不过，Facebook的研究小组并不是第一个试图让机器人自学移动的团队。在加州大学伯克利分校，一组研究人员使用了一种叫做强化学习的技术，来教一个名叫Brett的双臂机器人把一个方钉塞进一个方孔里。简而言之，机器人尝试了许许多多的随机运动。如果在一次移动中更接近目标，系统会给它一个数字“奖励”。如果它搞砸了，它会被数字“记过”。经过多次反复，寻求奖励的机器人会让它的手越来越靠近那个方孔，最后把钉子放进去。

让机器人拥有“好奇心”

Facebook正在做的实验有点不同。“我们想要尝试的是灌输这种好奇心的观念，”Facebook人工智能研究科学家Franziska Meier说。人类就是这样学会操纵物体的：孩子们被对世界的好奇心所驱使。他们尝试新的东西，比如拽猫的尾巴，并不是因为他们必须这么做，而是他们想知道如果这样做了会发生什么。

因此，尽管像Brett这样的机器人会一点一点地完善自己的动作，但Facebook的机械臂却可能会出现靠近目标时偏离方向的现象。这是因为研究人员没有奖励它增量成功，而是给予它尝试非最佳动作的自由。它在尝试新的东西，即使这些东西现在看起来并不特别理性。

每次移动都为系统提供数据。在每个关节上施加扭矩是为了把手臂移动到那个特定的位置。Meier说：“虽然没有完成任务，但它给了我们更多的数据，我们通过这样的探索获得的数据种类比不探索时要多。”这个概念被称为自我监督学习——机器人尝试新事物并更新软件模型，这可以帮助它预测其行为的后果。

这个想法是为了让机器更灵活，对一项任务不那么专一。我们可以把它想象成完成一个迷宫。也许机器人知道它需要朝哪个方向前进才能找到出口。它可能会一次又一次地尝试到达那里，即使它不可避免地会在那次追逐中陷入死胡同。奥斯陆大学机器人专家T?nnes Nygaard说：“由于你如此专注于向那个方向移动，你可能会走进角落。”他已经开发出一种四足机器人，可以自己学会走路。（Facebook也在尝试让一个六腿机器人自己行走，但是在我参观实验室的时候该公司尚未能进行展示。）“与其如此专注于说，我想朝着我知道解决方案所在的方向前进，不如我试着专注于探索。我将尝试寻找新的解决方案。”

所以Facebook的机器人手臂做出的那些看似不连贯的动作实际上是一种好奇心，正是这种好奇心可以让机器更容易适应环境。想象一下一个家用机器人正试图填装洗碗机。也许它认为把杯子放在顶部架子上最有效的方法是从侧面拿过来，在这种情况下杯子会碰到架子的边缘。从某种意义上说，这是确定性的：一次又一次的反复尝试，让它走上这条不太理想的道路，在这条道路上，它试图更好地侧向装载，但现在它无法备份并尝试新的东西。另一方面，一个充满好奇心的机器人可以通过实验和学习，了解到从上面进来实际上是最好的方法。它是灵活的，不是决定性的，这在理论上允许它更容易适应动态的人类环境。

模拟无法替代现实

现在，一种更简单、更快捷的教机器人做事的方法是模拟。也就是说，建立一个数字世界，比如说，一个动画棒形人物，让它教自己用同样的试错法运行。这种方法相对较快，因为当数字“机器”不受现实物理定律的约束时，迭代会快得多。
尽管模拟可能更有效，但它并不是真实世界的完美表现——你无法完全模拟动态人类环境的复杂性。因此，尽管研究人员已经能够训练机器人首先在模拟中做一些事情，然后将这些知识传递给现实世界中的机器人，但这种转变极其混乱，因为数字世界和物理世界是不匹配的。

在现实世界中做任何事情可能会更慢、更费力，但从某种意义上来说，你得到的数据更纯粹。Facebook人工智能研究科学家Roberto Calandra说：“如果它在现实世界中有效，那它实际上就是有效的。”如果你在设计极其复杂的机器人，你无法模拟他们将要应对的人类世界的混乱。但它们必须继续生存下去。随着我们给机器人的任务变得越来越复杂，这一点尤为重要。在工厂生产线上提升车门的机器人相对来说很容易编码，但却无法在混乱的家庭中导航。机器人将不得不凭借创造力自行适应，这样它就不会被困在反馈回路中。一个程序员不能对每一个障碍都进行编程。

Facebook的项目是人工智能和机器人完美结合的一部分。传统上，这些世界很大程度上是封闭的。是的，机器人总是需要人工智能来自主操作，就像使用机器视觉来感知世界一样。但是，尽管像谷歌、亚马逊和Facebook这样的科技巨头推动了纯数字环境下人工智能发展的重大进步——让计算机识别图像中的物体，例如，让人类先给这些物体贴上标签——但机器人仍然相当愚笨，因为研究人员一直专注于让物体在不摔倒的情况下移动。

随着人工智能研究人员开始使用机器人作为平台来完善软件算法，这种情况开始改变。例如，Facebook可能想教机器人自己解决一系列任务。这反过来可能会为人工智能助手的发展提供信息，它们可以更好地为你、为用户，计划一系列的行动。“这是同一个问题，”LeCun说。“如果你能在一个环境中解决它，那么你也可以在另一个环境中解决。”

换句话说，人工智能正在使机器人变得更聪明，但是机器人现在也在帮助推进人工智能。“许多与人工智能相关的有趣问题——特别是人工智能的未来，比如我们如何才能达到人类水平的人工智能——目前正由机器人领域的工作人员来解决，”LeCun说。“因为你不能用机器人作弊。你不能让成千上万的人给你贴标签。”

当然，我们仍然有疑问，像Facebook这样的数字巨兽想要机器人做什么？目前，该公司表示这项研究与特定的产品渠道无关。
但是请记住，Facebook从事于人际关系业务（也从事广告销售业务）。“我们认为机器人技术将是其中的一个重要组成部分——想想远程呈现之类的东西，”LeCun说。毕竟，Facebook已经是一家硬件公司，生产了视频会议设备Oculus VR系统和Portal。“这种逻辑上的连续性也许是你可以从远处控制的事情。”

但我们正在超越自己。迄今为止，除了Roomba，每一个家庭机器人都失败了，部分原因是这些机器不够智能或不够有用。是的，没有机器人能够特别聪明，但是，也许Facebook这个挥动的机械臂可以帮助解决这个问题。

深入Facebook全新机器人实验室：AI与机器共织未来

A-小鲸鱼

审核成功

审核失败