本篇文章6674字,读完约17分钟
人工智能的迅速发展历史
邓洲(作者单位:中国社会科学院工业经济研究所)
新科学技术的新产业影响未来(二)
深度学习是机器学习研究的新行业,其过程是建立人脑,模拟进行分解学习的神经网络,是模仿人脑机制读取和分解数据。 深度学习被认为是目前最接近人工智能的机器学习方法。
年初,使用神经网络和深度学习的alphago战胜了人类围棋高手,年末年初,假名master的alphago在互联网平台上席卷了中日韩棋坛,取得了60连胜的辉煌战绩。
在阿尔法go之前,深度学习开始应用于图像、语音、副本识别和机器翻译。 人工智能提出半个世纪后,人们终于看到了人工智能进入应用阶段的曙光。
从人机战争说起
从体力上来说,机器早就比人类优秀了,但骄傲的人在智力上感觉更优秀。 这种情况似乎正在变化。 在人类智力的对抗中,人类开始下风。
第一轮:人类获胜
人与计算机的对抗可以追溯到20世纪70年代,最初计算机技术人员在实验室里休闲娱乐。 随着电脑速度的提高,20世纪80年代和90年代的家用电视游戏机和电脑游戏有很多对抗电脑的棋牌游戏,普通玩家和电脑的对决输了赢了,但专业选手和专业业余的
1996年2月,ibm开发的超级计算机深蓝挑战国际象棋世界冠军卡斯帕罗夫,经过7天的比赛,深蓝以2:4输了。 这是历史上第一次人工智能挑战世界顶级棋手,深蓝色输了比赛,但世界关注人工智能的迅速发展。 这台冰冷的机器在比赛中没有取悦世界冠军。 卡斯帕罗夫最终赢得了比赛,但在人机对抗中宣布人类胜利的历史结束了。
第二回合:人类完败
从1996年到20年的20年间,人类和机器之间进行了3次象征性的竞争,但都以人类失败告终。
1997年,ibm绀再次挑战卡斯帕罗夫,距上次比赛只有一年,但世界冠军这次没能撑住。 最终,深蓝以3.5:2.5赢得比赛,成为第一个在标准比赛时限内打破国际象棋世界冠军的计算机系统,这表明在人机智能对抗中,机器发生了逆转。
年,ibm开发的由90台power 750服务器组成的集成服务器沃森参加了美国有名综艺的猜谜节目“危险边缘”。 在三天的比赛中,华生最终击败了最高奖金获得者路德和连胜记录保持者詹宁斯,获得了一百万美元的奖金。 人工智能在综艺节目中击败人类选手获得最高奖金还是第一次。 对于深蓝,华生要解决的消息更多,在表示一点消息也少的问题面前确实比不上人类,但依赖于强大的数据解决能力和计算速度的特征,人类冠军终究不敌华生。
如果说1997年深蓝的胜利和华生的胜利最依赖于机器的高速计算能力,那么人类依然在模糊的数据识别和解决、交流、感情表达等方面胜过机器。 特别是人的学习能力依然是机器难以掌握的技能。 但是到了年纪,这一切都变了。 年初,谷歌宣布伦敦子公司deepmind开发的alphago机器人以5:0战胜了欧洲围棋冠军樊麿,然后以4:1战胜了世界冠军韩国围棋名人李世石。
从年底开始,谷歌就跟世界开了个大玩笑。 alphgo假名master因围棋网络平台而闻名,在马下斩中日韩顶级棋手,取得了60连胜的辉煌战果。 围棋是迄今为止最多、最复杂的国际象棋游戏,如果机器能在围棋中战胜人类顶尖选手,至少意味着在国际象棋游戏中实现了对人类的全面超越。
参加神经网络的alphago和前辈纾青、华生的显着区别是,深蓝色和华生“告诉”,ibm的设计师和程序员们从国际象棋大师那里得到象棋的各种消息,用一系列算法凝结特定的法则, 沃森也可以通过预先设定的逻辑运算理解主题的意思,得出正确的答案。
相比之下,alphago自己“学习”的——deepmind的程序员模拟的不是逻辑规则和做法,而是人脑的学习能力。 alphago通过自己的持续训练和研究学习围棋,掌握各种妙招,比赛中也根据对方的棋路评价最佳战略。 这个过程就像人类学习围棋,成为名人一样。
第三回合:停战,共赢
今后,人与机器的比赛将以更愉快的形式出现在各种各样的场合,alphago承认人工智能的时代即将到来,机器没有必要超越人类智慧的现实,在人与机器之间继续比赛,合作是人与机器关系的未来。
无论是深蓝色、华生还是alphago,其研究开发的目的都不仅仅是赢得比赛。 ibm将深蓝色和华生系统应用于药物开发、金融风险计算等行业。 关于输给深蓝的卡斯帕罗夫,虽然没有因失败而沮丧,但之后他获得了大部分有名的国际象棋比赛的冠军,最后退出国际象棋界进入了政界。 输给alphago的李世石人气高涨,参加了各种各样的采访和综艺节目,围棋在韩国年轻人之间进一步高涨。 人机战争在比分上表现为人类的完败,但最终大家都受益了。
计算机怎么想:控制派vs仿生
alphago和深蓝色、华生的区别在于使用神经网络实现了深入的学习。 那么,神经网络和深度学习是什么呢? 这些出现对计算机和人工智能的迅速发展起着多大的作用呢?
要知道计算机是怎么想的,必须提出著名的“图灵实验”,即使出生于20世纪初,42岁早世时,也不要看到真正意义上的计算机数学天才。 也就是说,如果第三者不能判别人与人工智能的机械反应的差异,就可以论断出该机器具备人工智能。
图灵后,人工智能的研究分化为两大派系:一是强调构想模拟的控制派二是强调自我意识的仿生。 简单来说,控制派认为人工智能就像专家会议,想用完美的逻辑实现思考。 仿生机器人认为人工智能是人脑,人脑是怎么想的,电脑大脑是怎么想的。
1948年,美国应用数学家诺伯特·威纳的着作《控制论》出版,他开创的控制论( cybernetics )被称为20世纪最伟大的科学成果之一,作为人工智能中控制派的祖先受到尊敬。 维纳的学生迈克尔·阿布出版了控制论科学读物《大脑、机械、数学》,创立了麻省理工大学的计算机系。
1951年,后来获得第一届图灵奖的美国科学家马文·明斯基创造了学习机——snare,发现了当时神经网络的致命弱点。 明斯基的另一个重要贡献是与计算机行业知名的另外两名人物麦卡锡、香农创立了第一个体工智能学术团体“达特茅斯会议”。 年初,明斯基去世,享年89岁,三天后,谷歌宣布将使用深造的alphago战胜欧洲围棋冠军。
追溯仿生机器人的起源,在图灵实验提出前的1943年,美国科学家麦卡洛和皮茨发表了模拟神经网络的论文。 1949年,加拿大心理学家赫布提出了有名的“赫布理论”。 也就是说,突触前神经元对突触后神经元的持续重复刺激会带来突触传播性能的增加,这一理论直到2000年才被动物实验证实。 1958年,美国实验心学家罗森巴托成功地模拟了被称为“感知机”的神经网络模型。 探测器可以解决一点简单的视觉信号,虽然还非常粗糙,初级,但是可以说是第一次实现了人脑的成功模拟。
遗憾的是,罗森巴托发明“感知机”20多年来,神经科学和新闻科学没有很好地结合,两者各有成果,但仿生人并不与控制派作对。 到1980年代,仿生机器人进入繁荣期,其中以1982年霍普菲尔德提出了递归的神经网络,1986年鲁哈特和麦克莱因提出了具有里程碑意义的bp神经网络为代表
20世纪90年代,网络兴起和普及,许多计算机科学家投入了巨大的市场和经济效益的网络相关研究,控制派和仿生机器人都隐藏在网络的迅速发展中,当然,网络作为新的新闻技术手段
2006年,杰弗里·辛顿提出了反向传递算法和分布式算法——“深度学习”,突破了明斯基半个世纪前提出的神经网络存在的界限。 年,斯坦福大学和谷歌秘密x实验室使用了1000台电脑构建了世界上最大的电子模拟神经网络。 这个网络有10亿个连接的人工神经网络“谷歌大脑”。 实验者在神经网络上展示了从youtube随机提取的图像1000万断(张),最后,系统在没有外界干预的情况下识别了“猫”是什么,成功识别了猫的照片,准确率超过80%是人工智能的
挂的机器学老板
真正理解神经网络、深度学习的原理需要高度的生物学、数学、电子新闻知识,可以通过很多专业性强的书、复印件找到答案。 在这里,我想用简单的语言通俗易懂地记述神经网络、深度学习等相关概念。
1 .对人脑的仿生:人工神经网络的构建
大脑神经元(神经细胞)由三个主要部分组成:树突负责新闻的输入,细胞解决新闻,轴突解决后新闻的输出。 神经元受到外部刺激时,经过内部新闻解决输出结果的过程看起来非常简单,但这是人脑思维形成的最基本的过程。 将算法提供给电子部件(例如cpu ),通过信号路径将这些电子部件与传感器、输入设备和相互之间链接,就可以模拟大脑的神经互联网。 计算机硬件技术发展迅速,可以构建大规模的人工神经网络,将来有可能出现与人脑匹敌的人工神经网络。
用最简单的苹果还是梨的评价来说明神经网络的工作原理。 颜色、形状、气味是评价水果是苹果还是梨所必需的最基本的特征,这些消息通过视觉、味觉或传感器进入神经元,大脑(或计算机)根据过去的经验,新闻是红、圆形、苹果的
这个过程看起来非常简单,但在未经训练的人工神经互联网上,不可避免地会发生错误。 比如,不是所有的苹果都是红色的。 有些苹果是黄色的,非常接近梨的颜色。 有些梨的形状和接近苹果。嫁接的新品种苹果梨是苹果还是梨等。 这些因素出现时,对人工神经网络来说是一个巨大的考验,容易给出错误的答案。
如何减少这些情况引起的错误,需要深入学习的帮助。
2 .对学习的仿生:深度学习的展开方法
在一系列残酷的动物实验后,生物学家发现人脑对外界刺激的认识是一个抽象而反复的过程。 例如,一个静止图像的识别最初是图像主体物的边缘的识别,接下来抽象到具体的特征,最后抽象各种特征并概念化,得到正确的意思。 这一生物学发现意义重大,促进了人工智能在21世纪取得了划时代的迅速发展。
人脑工作的原理从“浅层”的认识开始,如果把浅层认识的结果作为更高层认识的输入新闻,计算机构建的人工神经网络也能模仿人脑工作吗? 答案是肯定的。 1996年,康奈尔大学从收集到的大量黑白风景照片中随机抽取16~16像素的方格,从其中一张风景照片中抽取16~16像素的方格进行比较,结果发现,包含物体边缘的方格最容易找到接近的方格。 换句话说,“边缘”是识别风景图像的起点。 这个实验表明,识别许多杂乱的东西从最基本的“浅层”新闻开始是有效的,是可行的。 同样的实验后来应用于语音识别,同样,“边缘”是语音识别最基本的“浅层”新闻。
在单一的神经网络中,从新闻输入到新闻输出之间有多个神经元,但都在同一“层次”,所以我们首先称为“浅层神经网络”,与“深层神经网络”区别开来。 识别苹果和梨好像很简单,但人工神经网络需要很多复杂的过程。 如果想让一个层次的神经网络发挥作用,一个是人类告诉计算机的形状、颜色和味道的消息,神经网络只有最后的评价。 这种方法好像很奇怪,但并不是完全没用。
新闻管理和数据挖掘多采用浅层神经网络,前提是新闻管理专业的学生手工或准备使用软件挖掘数据的材料。 这就像人工神经网络评价水果的形状、颜色和味道,通过人工参与来弥补浅层神经网络的界限。 人工智能的应用范围扩大了,需要人工智能帮助的人很多不是新闻管理专业的学生,浅层神经网络跟不上形势和需要了。 2006年,人工神经网络的快速发展有了转折点,华盛顿等研究者提出了一个深刻的信念网络( deep belief network,dbn ),实现了脑多层神经网络新闻解决、分解和学习的模拟
多级神经网络是实现深入学习的基础,但与以前传来的神经网络相比,深层神经网络有那些优点吗? 深度学习是如何在深层神经网络上开展的?
和以前传来的神经网络一样,深层神经网络也包含输入层、隐层、输出层,只有相邻阶层间的神经元具有链接通道,同一阶层和层间没有链接。 不同的是,深层神经互联网具有越来越多的层次数量,同时具有更有效的算法,接近大脑结构,深层神经互联网可以解决更多复杂的输入新闻,深度学习是这种多层次的人工神经彝
在明确深层神经网络如何进行深度学习之前,有必要区分监督学习和非监督学习两个重要概念。 简单来说,监督学习是指出学习结果是否正确的学习。 想象一下幼儿第一次看到苹果时,建立包含苹果各种特征的概念。 下次看苹果时,加入苹果的新概念。 比如,苹果都不是红色的,是黄色、白色、绿色的苹果,还有多种颜色混合的苹果。 在这期间,可能会看到梨、橙子、乒乓球等和苹果特征相似的东西。 幼儿可能也认为这些东西是苹果。 家长指出了错误,幼儿调整了对苹果的认识,评价越来越正确。 简单与否,这也是半个多世纪前“感知机”的商业原理,通过不断优化不同输入新闻的权重,实现了更正确的评价。
监督上述学习的过程容易忽视重要的前提条件。 机器为什么知道根据形状和颜色来评价物体是否是苹果? 形状、颜色、气味是人类根据经验赋予苹果的“特征”属性,但机器不知道这些是苹果的特征。 以往,有人帮助机器最初定义“特征”,但人参与“特征”的选择是极其复杂且耗时的工作,同时面对未知的东西时,最初也可以不规则地服从。 在输入新闻变得越来越复杂的情况下,人工选择特征已经很困难了,机器自动学习特征就像是更好的方法,在多层神经网络上进行的非监视学习可以达到这个过程。
非监督就像父母不在身边指导的幼儿的学习过程,目的是推断新闻的内在数据规则。 例如,幼儿在多次看到苹果后,将具有有点圆形、红色、特殊味道的东西分成一个等级(不知道但称为苹果),与其他水果区别开来。 这个过程之一是实现聚类,更重要的是完成特征学习,幼儿知道应该抓住它们的“特征”来评价一个物体是否是苹果。 机器的非监视学习有同样的过程,在多层人工神经网络中对各阶层进行非监视学习,这是深度学习和以前传来的神经网络的最大区别,这个过程称为特征学习。
我们可以总结简单的深度学习过程。 在深层神经网络中,可以使用无监视学习逐个训练各层,让机器继续学习在这个水平上应该认识的特征。 各级训练的结果将作为一组最高级别的输入新闻使用到最高级别。在最高级别,使用监视学习自上而下地微调各层次的参数、权重、模型、算法。 这个过程反复进行直到达到一定的精度。 与传统的机器学习相比,深度学习不需要人类的帮助就可以提取特征,提高了学习的自主性和学习效果。
在实际应用中,图像的识别、语音的识别、或者像alpha go那样学习使用围棋的具体做法很多,但大致原理相同,过程和算法更多复杂。
能学习的机器有多智能
这么多科学家的努力,投入了巨额的研究开发费,结果是3岁孩子有熟练的技能——区分苹果和梨,不是有点代价吗? 千万不要低估这一点。 如果没有人介入,你应该让机器正确区分苹果和梨,知道几代科学家已经奋斗了半个多世纪,至今不能百分之百正确。 计算机在计算速度方面具有远远超过人类的特征,而且该特征不断扩大,其“学习”的速度也惊人,这使得人工智能在很多行业进入应用阶段,达到了本章开头所述的alphago。
例如,在图像和语音识别行业,Google、微软、ibm、百度等企业近年来加强了深入学习的研究和商业应用。 使用谷歌深度学习技术,在计算机视觉挑战比赛中更新了分类和检测记录,比以前的记录提高了一倍多。 谷歌在其视图软件中加入了人工智能模块,几乎正确地识别了文字、脸、地标等。
微软宣布图像识别系统的错误率为4.94%,不仅打破了迄今为止百度创造的5.98%和谷歌创造的6.66%的记录,而且人在分类识别时还低于5.1%的错误率。 百度也推出了基于深度学习的语音识别系统“deep speech”。 该系统可以模仿人类大脑新皮质中的神经活动,错误率比谷歌、微软和苹果系统低10%以上。
深度学习的有趣应用是预测分解。 与以前传达的逻辑推导不同,深度学习的预测分解结果令人吃惊,但异常正确。 在2008年巴西世界杯期间,各方人士都在预测比赛结果。 在小组赛后的15场淘汰赛中,微软利用深入学习的做法的预测结果都是正确的。 谷歌的预测也推测了其中14场比赛的结果。 这样的预测精度似乎比2008年法国世界杯的章鱼保罗和一贯的乌口贝利可靠得多。
深度学习是机器学习的本潮,也是人工智能迅速发展的里程碑,深度学习已经在语音识别、图像识别、预测分解、机器翻译等行业进行了小尝试,但客观上还处于襁褓阶段,无论是理论研究还是工程化商业化都是一大课题 没有人能保障深度学习将来是否是人工智能的最基础,也许有新的更好的技术代替深度学习,但人工智能的梦想已经不远了,机器在不久的将来可以像人类一样思考。
标题:【深度学习:人工智能进入应用阶段】
地址:http://www.china-huali.com/cjxw/17119.html