机器究竟如何学习?详解人工智能的“左右互搏术”

金庸武侠小说《射雕英雄传》里,有这样一段经典场景:“老顽童”周伯通在被困桃花岛期间,创造了“左右互搏术”,即用自己的左手跟自己的右手打架,在两手互搏中提高功力。

金庸武侠小说《射雕英雄传》里,有这样一段经典场景:“老顽童”周伯通在被困桃花岛期间,创造了“左右互搏术”,即用自己的左手跟自己的右手打架,在两手互搏中提高功力。

如今,这样的桥段在人工智能领域真实上演。它,就是深度学习。

“左右互搏术”与深度学习中的一种对抗训练原理相仿,即有两个角色——生成器和判别器。生成器类似于左手,扮演攻方;判别器类似于右手,扮演守方。

判别器的目的是正确区分真实数据和生成数据,从而最大化判别准确率;生成器则是尽可能逼近真实数据的潜在分布。二者需要不断提高各自的判别能力和生成能力来取胜,从而实现目标优化。

今天,让我们打开这个“神秘魔盒”。

深度学习的概念,最早是由杰弗里·辛顿在2006年提出的。这是一门用于学习和利用“深度”人工神经网络的机器学习技术。作为人工智能领域中最热的研究方向,深度学习迅速受到学术界和工业界的关注。

目前,深度学习已得到广泛应用。如在博弈领域,AlphaGo通过深度学习,以4∶1的比分战胜韩国棋手李世石,成为第一个击败人类职业围棋选手的电脑程序;在医学影像识别中,以深度学习为核心技术的X光、核磁、CT、超声等医疗影像多模态大数据的分析技术,可提取二维或三维医疗影像中隐含的疾病特征;在图像处理中,最成功的领域是计算机视觉,如图像风格迁移、图像修复、图像上色、人脸图像编辑以及视频生成等。

一种特殊的机器学习方法

今天的人工智能,其实是把现实生活中的问题量化成了可计算的问题,然后用计算机算出来。数学模型则架起了中间的桥梁。

现实生活中,很多问题都可以通过建模解决。比如计算远程火炮弹道问题,计算日食、月食出现的时间和地点等。我们只要把相应公式用计算机语言写一遍,再代入参数,就能计算出来。

然而,更多问题的解决方法是不确定的。即使我们找到了相应的数学模型,也不知道应该代入什么参数。比如语音识别、人脸识别和机器翻译等。因此,我们需要让计算机通过自主学习,从大量数据中得到相应参数。这个过程,就是机器学习。

机器学习旨在发现数据存在和利用的模式,并用它们进行学习及做出预测。机器学习的过程,就是用计算机算法不断地优化模型,让它越来越接近真实情况的过程。它与人类学习的道理如出一辙。

考察人的学习通常方式是考试,如果分数不及格,就需要进一步学习。机器学习也要这样来衡量,它的目标用专业术语来说,就是“期望值最大化”。

机器学习的效果取决于两个方面:一方面是学习的深度。机器学习并不能“一口吃成个胖子”,它的训练算法需要迭代执行。这如同人在学习时要通过复习来“温故而知新”一样。机器学习迭代的次数越多,即学习得越深入,得到的数学模型效果越好。另一方面是数据的质与量。正如我们做大量优质习题,成绩就会提高。机器学习也是如此,训练数据量越大,学习效果就会越好。

根据数学模型的特点,机器学习有两种方法:一种是利用已知模型进行训练;另一种是在模型未知的情况下,设计一些简单通用的模型结构,然后使用大量的数据进行训练,训练成什么样就是什么样。这便是我们常听到的人工智能“黑箱”问题,即使训练有效,也不清楚里面是什么。

深度学习就是后一种机器学习的方法。人工智能涵盖的领域十分广泛,深度学习只是其中的一个分支,属于机器学习的范畴。人工智能需要有“独立思考”能力与机器学习技术的支持,深度学习便是帮助机器实现“独立思考”的一种方式。

深度学习迎来革命性突破

人工神经网络,简称神经网络,是一种模仿动物中枢神经系统结构和功能的数学模型,是用大量简单处理单元经广泛连接而组成的人工网络。它其实是一个特殊的分类器,用于对函数进行估计等。

神经网络为许多问题的研究提供了新思路,特别是迅速发展的深度学习,能发现高维数据中的复杂结构,取得比传统机器学习更好的效果。

20世纪50年代,人类第一次设计出计算机能运行的神经网络算法。此时的神经网络,虽然给了人们很多遐想空间,却解决不了实际问题,因此被打入“冷宫”。

到了20世纪80年代末期,人们提出反向传播算法,可让一个神经网络模型从大量样本中学习统计规律,从而对未知事件做出预测。随后,支持向量机等各种各样的机器学习方法被相继提出。不过,这些模型的结构均为浅层学习方法,处理复杂问题的能力受到一定制约。因此,神经网络再进“冷宫”。

2006年,加拿大教授辛顿和他的学生提出深度学习神经网络的“快速学习”算法,使深度学习迎来了革命性突破。深度学习通过学习一种深层非线性网络结构,展现出了从少数样本中集中学习数据及本质特征的强大能力。

从此,神经网络学会了反复分类以及识别物体的方法,并展现出乎意料的精准度。

计算能力成为推动深度学习的利器

人工神经网络在被提出的50年间,都没能很好地解决智能问题。究其原因,除了算法本身不完善外,还在于计算机绝对速度不够快,而且单位计算能力的能耗太高,无法通过大量服务器搭建并行计算系统,来达成深度人工神经网络。

那么,靠什么加以突破?答案就是摩尔定律。

摩尔定律是英特尔联合创始人戈登·摩尔在1965年提出的一项观察结论,即计算机的总体处理能力大约每2年就会翻一番。经历近50年的历史检验,摩尔定律展现出惊人的准确性。摩尔定律带来的结果是,在过去的半个多世纪里,计算机处理器性能增长了上亿倍,耗电量却降到了百分之一。

从能量角度看,摩尔定律反映出了人类在单位能耗下,所能完成信息处理能力的大幅提升。而这正是实现人工智能的基础所在。

从某种意义上说,不仅是深度学习技术,今天的人工智能都是靠算力成就的。

人工智能的崛起,有3个技术要素:一是它解决了可计算问题,即在算法上的突破;二是它积累了大量数据,形成了可学习的原材料;三是摩尔定律所推测的,处理能力得到持续提高。

算力是推动深度学习的利器。计算能力越强,同样时间内积累的经验就越多、迭代速度也越快,深度学习的性能也就越高。

不断进化的深度学习之道

1997年,“深蓝”在国际象棋比赛中战胜加里·卡斯帕罗夫;2016年,AlphaGo在围棋比赛中战胜李世石。

虽然这两种人工智能系统都学会了下棋,但教授它们的方式以及它们如何比赛,则大相径庭。

“深蓝”的核心评估函数对给定盘面进行数字“排序”,而且函数是手工设计的。这种比赛风格,实际上是一种“蛮力”。“深蓝”将其评估函数应用到许多备选的未来状态,对每个棋手预先搜索七八步,以2亿次/秒的速度进行局面评估。

AlphaGo的学习方法则迥然不同。它通过一种双管齐下的深度学习方法“学习”,用“价值网络”评估局面,用“策略网络”选择走棋。

深度学习神经网络的训练,一部分通过使用人类高手对弈数据集的监督学习进行(总出棋数约为3000万步),另一部分通过对自我对弈非监督强化学习进行(模拟成千上万场随机比赛)。它不使用预测搜索,走棋是单个“围棋局面”整体评估的结果。

2017年5月,在中国乌镇围棋峰会上,AlphaGo的升级版AlphaGo Zero,与世界排名第一的围棋冠军柯洁对战,结果以3∶0的总比分完胜。

令人震惊的是,AlphaGo Zero一开始并没接触过人类棋谱。它使用了新的强化学习方法,从单一神经网络开始,通过神经网络强大的搜索算法,进行自我对弈训练。随着自我对弈次数的增加,神经网络逐渐调整,提升预测下一步的能力,最终成为具备超强棋力的“选手”。更为厉害的是,随着训练的深入,AlphaGo Zero还独立发现了游戏规则,走出了新策略,为围棋这项古老游戏带来了新见解。

目前,深度学习在许多领域取得了技术性突破,并展示了极佳效果。然而,它仍存在一些局限:理论研究缺乏、无监督学习能力弱、缺少逻辑推理和记忆能力等。

深度学习对未来社会发展具有重要意义,需要不断深入研究,从多方向多角度更全面地开发深度学习的潜在价值。面对复杂的战场,以深度学习为代表的人工智能技术也已逐步渗透到军事领域,深刻影响着人类战争。

可以推断,未来作为“左右互搏术”的深度学习,必将继续升级演化,开启更高深的境界。

来源:解放军报

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/70220.html

(0)

相关推荐

  • 血糖高人千万不能吃七大食物,关于血糖的问题

    我经常会遇到有不同的朋友,向我寻求设计一份适合他的饮食配方,其实这个很难回答,我往往会给一个大概的食物范围,具体那种组合感觉最好,真的需要自己去尝试,因此,这也需要每个人具备一定的营养学或者生理学素养。这个世界上的确没有适合所有人的万能饮食,我们每个人对食物的反应往往会超出用食物本身的常用营养素含量来解释的范畴。比如你可能对香蕉反应良好,但是你吃米饭时又会有一个很大的峰值,而其他人可能会有相反的反应。很吃惊吗? 这就是个体差异,这很可能取决于我们肠道微生物的组成、身体的营养素状态、睡眠质量、承受的压力水平、身体活动量和个体基因等因素的不同,都会导致这些独特的反应。

    生活 2021年12月14日
  • 百度地图真的太差

    我不是要故意黑百度地图,而是怒其不争!

    科技 2021年11月10日
  • 苹果打算在iPhone机型引入自研5G基带,明年将推出自助维修计划

    目前苹果仍然在iPhone 13系列里使用高通的骁龙X60 5G调制解调器,不过这种情况似乎不会持续太长时间。据Wccftech报道,近期高通首席财务官Akash Palkhiwala表示,预计苹果在2023年出货的iPhone机型里,使用高通5G调制解调器的比例仅为20%,苹果很快会大规模生产定制基带芯片。

    科技 2021年11月18日
  • 摄入水果多少克,水果每天建议的摄入量是多少克

    健康的饮食都要讲究均衡,水果也是,需要适量吃。如果宝宝一次吃太多水果,可能会导致正餐吃不够,影响其他必需营养素的摄取。而且水果中的含糖量很高,会给宝宝提供不必要热量,导致越吃越胖。那宝宝每天大概需要吃多少水果呢?

    生活 2021年10月26日
  • 我可爱的宝宝叫红豆,妈妈有你就够了。

    我有个可爱宝贝女儿叫红豆,我是79年的当我怀孕时是39岁,生宝宝是40岁实属高龄产妇了。所以一怀孕产检时就不上班了,一心好好在家保养。其实现在想起来也没啥,主要当时心情激动又怕有意外。我的产检历程一路很顺利,我的身体情况还不错。国家现在注重优生优育,实现了好多免费产检项目,第一年免费无创让我刚好赶上了,还有社区的几项免费项目,还有个免费耳聋,还有啥记不清了 。还有个羊水穿刺我没做,这个好像挺贵的,而且感觉也危险,就没做。孕晚期时血压血糖孩子都挺好正常,因为是高龄产妇就没想能顺生,到39周时就决定剖了。当时正赶上疫情刚开始最严重时候,早晨去医院的路上都没人,医院只允许两个人陪床,不让探视。由于疫情原因老公单位不能请假,剖宫产约的时间是上午10点,还好医院有我们个熟人朋友,帮我忙前忙后把我推进了手术室,当手术室门关上的刹那间,我听见了老公的声音,他下班过来的。正赶上签字。我躺在那心里感觉不是很紧张,但是医生在我胳膊上扎什么针时说我抖的不能扎,我说我冷。然后开始手术,身体麻木脑子清醒,感觉到医生在一层一层隔开肚子上肉,我还问了句这得拉几层啊,但是没人理我。后来感觉他们在往外掏东西,等一会还不行,然后听见有人在我肚子上方胸下方按一下出来了,那人还说看就差这一下。他们像平时聊天一样。宝宝出来了吧,医生抱着给我看了下屁股说:“女孩啊”,我说让我看看脸吧,又给我看一眼,我近视看不清,但是感觉好丑。我的剖宫产是竖口,特别难看,我是临进手术室才知道要给我做竖刀,医生都说竖的好,当时也不懂也不敢说别的了。现在疤痕很明显,可能我是疤痕体吧!剖宫产住院七天,请了护工照顾孩子。回家后傻眼了,一点不会哪也不敢动。一点点慢慢学慢慢摸索慢慢适应。我婆婆本来是从老家来了照顾我们的,但是老公的姥姥,婆婆的妈妈突然身体不好,我还没出院婆婆就回去了。就让我妈妈来照顾我月子了。说实话刚开始我没有那么喜欢这个孩子,也没有电视上演的生个孩子多激动的多喜欢。我嫌她又是哭又是拉长的又丑,我以前幻想的她应该是浓眉大眼双眼皮,可是她长的小眼睛肉胞眼又黑,唉哈哈。不过现在越长越好看了,可能习惯了吧哈哈。哎呀太多了明天再说吧!

    生活 2021年10月30日