作者|理查德马斯兰德译者|邓子恒如果你不知道目的地在哪里,你可能要设定其他的目标。约吉贝拉3354号
00-1010每天都听说机器学习可以完成需要感知的任务:自动驾驶汽车、人脸识别等等。也有人担心失控的智能机带来的危险。他们害怕有一天会用远超人类的智能控制整个世界。然而,这些讨论大多没有看到明显的一点:机器学习确实可以完成一些伟大的任务,但所有研究人工智能的家伙都深深明白,最好的人工智能还不如四岁的孩子。
原因是大多数著名的人工智能算法在学习技能时都需要教授,同时需要使用庞大的数据库,并且必须在超级计算机上执行。四岁的孩子只要知道几个例子就可以自学。说实话,教孩子某些技能和概念确实很痛苦,但他们所知道的大部分都是基于基本的感知机制,教自己的结果是用他们的小脑袋就能完成的。其实就算是一个带反向传播的多级感知器也离我的小孙子很远。他不需要无数的例子和老师来认可他的爷爷。只要几次拥抱,你很快就会学会说“爷爷”这个词。
四岁的孩子只要知道几个例子就可以自学。图/PEPEPELES人工智能研究人员区分了有监督学习和无监督学习。你要记住前面说的标准传感器是需要老师的。还需要苹果的语音识别软件和诺斯基的会说话的电脑。注重隐私的人害怕的人脸识别软件也是需要的。你需要大量带有身份标签的人脸照片,才能教会软件识别人脸。计算机可以做到,因为计算速度非常快。事实上,近年来机器学习的成就主要来自于最近(五年)训练数据库和大规模定制计算机的出现。大脑中的神经元运行速度非常慢,无法与这些计算机相比。
但是大脑远不止这些电脑。在Herber最初的概念中,创建细胞群的方式是无监督学习:边缘上的连续点本来会一起出现,大脑中的边缘敏感细胞也会自己出现。目前,计算机科学家的紧迫任务之一是建造一台用于训练大脑等过程的机器。
监督学习与无监督学习
我很快会回来谈大脑,但首先,让我解释另一个机器学习的例子,它将神经网络与一种新方法结合起来。计算机科学家们慷慨地用神经科学的术语来称呼这种策略:强化原理。第一个系统研究这方面的人是伟大的俄罗斯生理学家巴甫洛夫,哈佛大学的B. F .斯金纳和其他发现细节的继任者。科学家称这种算法为“强化学习”。“增强”是指某种行为会得到奖励,如果计算机得到奖励,那种行为就会重复。这个过程使得正确的行为更容易被重复,神经网络中的突触也会得到加强。你可以说这是一种反向传播。强化学习类似于感知学习,只不过计算机可以自己做老师。
增强原理适用于——斯金纳盒。图//维基百科电脑也可以打赏。在强化学习的过程中,计算机要找一个目标,它会随机猜测,一开始会错,但如果某个猜测结果稍微接近目标,就会得到奖励。对电脑的奖励不是一块电脑狗粮,而是一条信息:“干得好,加强你刚才做这个猜测时使用的突触。接下来,计算机将继续猜测,这次它将使用新的权重。你可以想象下一步:计算机会继续猜测,每次都调整权重,直到学会完成任务的方式。
00-1010强化学习掌握了一个极其难的技术:下棋,更难的是围棋。现在计算机的棋力超级强,完全优于人类,还在自学下棋。我想到的一个算法是Alpha Zero,它在2018年圣诞节前夕将研究成果发表在杂志《自然》上。研究人员只教Alpha Zero围棋规则:棋盘外观,下棋方式等。然后算法会下棋或者自己走。这听起来违反直觉。重点是每个“自己”都不知道对方“自己”在想什么,只知道对方的举动。没有老师,只有一些预先输入的规则,让计算机知道下一步棋是好是坏,输赢的标准。四个小时后,计算机已经达到世界一流水平。
这真是一个伟大的成就。况且Alpha Zero不仅能下各种棋,还能做其他事情。谷歌人工智能团队的大卫吉尔巴(David Girba)向Alpha Zero展示了如何使用遥控器控制玩具直升机进行飞行特技。看到直升机在做滚桶动作,人们真的相信它是有能力的。
ript>
但是 Alpha Zero 真的比我的孙子聪明吗?差得远了(除非我孙子和它较量西洋棋)。电脑对于任务定义的範围非常狭隘,而且体积要比我孙子的脑大多了,也不能光靠巧克力夹心饼乾就能运作。史密森尼学会(Smithsonian)的吴凯萨琳(Katherine Wu)估计,Alpha Zero 硬体运作功率约为一百万瓦,我孙子的脑只需二十瓦。会在这里提到神经网络和增强学习,是因为这两者都属于概念验证(Alpha Zero 内部採用了神经网络),证明了这种逻辑运算的结果虽然距离脑还差得远,但的确比较接近脑。
人类的脑部是否也採用了类似深度神经网络或是 Alpha Zero 所运作的方式?当然有,只是慢得不得了。人脑这种电脑是演化经由无数时光打造而成,其中的突触和连结都缩小到极致。如果由一堆计算晶片组成的笨重电脑能够办得到,人脑也可以。
人工智慧领域中的人很清楚我的孙子远胜过他们的电脑,并且也正在努力改进。每个人都猜电脑会有多聪明。我认为电脑最后会很聪明,我绝对不会想要和电脑竞争。有各种巧妙的无监督学习模式应用在电脑中,唯一的问题是要花多少时间才能追得上人脑,以及机器完成任务的方式和真正的人脑有多相近。更重要的是,机器完成任务的经济效率能够比得上人脑吗,我会屏息以待这些结果。事实上就目前来说,光是超越人类的电脑所需要消耗的能量之高,就让我无须担心会电脑会掌控世界了。
- 台湾杰出女科学家系列专访,持续更新中!
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/188454.html