.

你一定要读的人工智能入门书

年秋天,上海,昔日繁华的街道上空无一人,马路上也没有汽车,高楼大厦在阳光下闪闪发光,城市干净整洁,空气清新,就是没有人味。

人都上哪儿去了?原来人工智能发展迅速,已经取代了所有人类的工作。人类不需要再工作,机器人掌管了整个城市的运营。为了减少人类行走带来的污染和麻烦,每个人都被戴上VR眼镜,躺在卧室里玩游戏。机器人提供一日三餐,照顾人类的生活。

这样的场景像不像《黑客帝国》中的?这算是比较美好的,在另一种幻想中,人类最终被机器人取代,成为了恐龙的追随者。

人工智能,在今天既是人类追求的新技术,又是人类对未来的恐惧。恐惧来自于年,

谷歌的阿尔法狗战胜了世界顶尖围棋棋士李世石,这表明人工智能已经超过了世界上最聪明的人类之一。那么未来会是怎样?霍金发出的警告是否会成真?

马云说未来已来,人工智能的发展是不可阻挡的,从IBM的深蓝战胜了国际象棋世界冠军卡斯巴罗夫开始,我们就已经感受到了这种压力。

科学家们普遍认为人工智能全面超过人类的时间在年,不要以为不可能,人工智能的发展是以指数级增长的。

无论人类是否会被人工智能所取代,毫无疑问,至少未来人工智能将伴随人类一起生存,所以,你想不想提前了解下人工智能的相关知识?作为人工智能的入门书,山本一成的《你一定爱读的人工智能简史》非常通俗易懂。

我不是理工男,对计算机编程之类的一窍不通,但山本一成的《你一定爱读的人工智能简史》很好读,没有什么艰深的专业词汇,配上简单的手绘,一看就懂。当然,这只是一本入门书,写给完全不了解人工智能的小白的。

山本一成是日本人工智能领域的代表人物,毕业于东京大学,现任爱知学院大学副教授、东京大学尖端科学技术研究中心客座研究员、株式会社HEROZ首席工程师。

他还是人工智能的历史上三大标志性事件“PONANZA”的开发者之一,这三大标志是——

年,IBM“深蓝”击败了俄罗斯顶尖棋手、国际象棋世界冠军卡斯巴罗夫,这是人类历史上电脑战胜人类的首例。

年,日本PONANZA战胜现役将棋代表佐藤慎一,且之后四年无一败绩。

年,谷歌“阿尔法狗”击败了世界顶尖围棋棋士李世石。

在《你一定爱读的人工智能简史》书中,三本一成主要以日本将棋电脑程序PONANZA的开发研究过程,来讲解人工智能的三大核心技术:机器学习、深度学习、强化学习。

一开始人们想的很简单,把人类的智慧输入电脑,加上电脑强大的计算和存储功能,不就实现人工智能了吗?

想法很简单,但实施起来确很困难,因为在输入的过程中,科学家才发现,人类的智慧是种说不清楚的东西。比如围棋,你是怎么思考的,为什么要下在那里,围棋高手都说不清。

就算把所有的棋谱都输入到电脑中,当有人走出不符合棋谱的走法时,电脑就会傻眼了,这根本还不如人类的初学者嘛。

所以电脑的学习方法和人类一样,也是要一步步往深了学的,山本一成在研发PONANZA时,发现了机器学习的奥秘:

一、什么是机器学习

机器学习的第一步,是向人类学习,模仿人类的智能。

人类的智能包含两大支柱,搜索和评估。

搜索就是从大量记忆中找出当前想搜索的内容,比如想要找“举头望明月”的下一句,电脑就会到数据库中寻找所有和“举头望明月”相关的句子。

如果它存了李白的《静夜思》,就会找到“低头思故乡”这句。这里用到的搜索功能,是建立在大量存储的数据库的基础上的。难怪有人说,大数据、统计就是人工智能的基础。

我们现在应用最广泛的人工智能就是仿真:从庞大的数据库中,搜索正确的答案。数据库越庞大,准确性越高。

比如你在头条上读了有关教育的文章,就会被智能推荐很多教育相关的资讯。

然而对于将棋、围棋来说,要搜索出每一个局面,是不可能的,如果1秒钟能搜索2亿个局面,亿年也搜索不完。

那么就要换一种方法了。人类在做判断前,不会把所有的结果都想明白,有时候只要考虑可能性比较大的方案就可以。这就叫评估。

比方,我们要从上海到北京,找时间最少的路线,不用考虑两地间所有的路线,只需要在高速公路之间做比较就好。

模拟技术就是搜索+评估。但模拟技术,有可能遗漏,因为没有对所有的可能性进行判断。

我们不懂将棋,拿象棋来比喻。

简单说就是从第一步落子开始,搜索电脑中存储的所有职业选手的棋谱,比如走“当头炮”的和没走“当头炮”的,哪一个胜率高,确认走“当头炮”胜率高,那么就落子“当头炮”。就这样每走一步都进行大量的搜索,按照胜率高低确定落子位置。

这种搜索+评估的模式,只有电脑存储大量的棋谱,再进行海量计算后,才能得出。在进行了大规模的试错后,电脑的出棋和职业棋手的相似度达到了45%。看起来百分比不高,但已经是飞跃式的进步。

所谓人工智能和一般电脑的区别在于:人工智能会自己思考,一般电脑只听从于人的具体命令。

在这里人工智能的思考方式就是:试错。

思考模式和人类相似:把问题在记忆库(数据库)中搜索,找到答案,再判断是否匹配;不匹配继续找,匹配就输出答案。

我们需要给到电脑的指令不再是具体的目标,而是最终目标。在棋类比赛中就是“战胜对手”,如何应战的具体步骤就由电脑自己操作。

原来机器学习和人类学习一样,也是在学会了学习方法后,靠自己去完成学习本身,并在学习过程中,不断调整学习方法,以便取得最好成绩。

和人类学习相比,婴儿阶段也是不断积累存储的过程,父母就是子女的程序员。

在机器学习阶段,将棋程序PONANZA,在年打败了现役将棋代表佐藤慎一。这时候的将棋程序PONANZA已经学会了自己编程完成搜索并评估的工作。

这就好比人类已经小学毕业,不需要父母把着手教了,只需要告诉孩子未来的目标,他就会自己学习。

这就是授人以鱼不如授人以渔,掌握了学习方法,人类就可以从学校毕业,人工智能也能从程序员毕业了。

我们目前使用的互联网检索功能和拍照的人脸识别功能,都是机器学习的结果。

二、深度学习中的黑魔法

但机器学习的缺点是,缺少教师,以将棋为例,就是职业选手的棋谱太少,不够学。

人类无法处理大量数据,因此学会了总结归纳,从极少的线索中寻找正确答案。但电脑不会,电脑需要大量数据,数据越多,判断才越准确。

没有棋谱怎么办?

山本一成的方法是,把PONANZA的程序略作修改,然后让它和修改前的自己对战局,判断胜率,赢面大,就采用修改后的版本。赢面小,就还用原来的版本。

不断地重复上面的动作,PONANZA的棋力就越来越强。

但这样的改进,通常有效率在2%,也就是说次改动中,只有2次赢面大。这样大量的试错方法,耗时耗电。

不过,这个时候出现了有趣的现象,它们称之为“黑魔法”:PONANZA的棋力为什么会增强,也没有人能说清了,三本一成也不知道原因。就跟人类的行为一样,变得无法解释了。

一部电脑的好坏主要看CPU,CPU就是电脑的大脑,运算能力越快,实力就越强。但CPU的发展已经碰到了技术天花板(集成电路的精细化),于是就出现了多核处理器,一个CPU下放2个、4个内核,就相当于本来是一个人工作,改为2个人、4个人共同工作。

但人多了就涉及到协调性,一个厨房两个人做一道菜,没问题,但如果是4个人、8个人、16个人做同一道菜,效率就会变低,厨房也会变拥挤。

于是新的方法出现了,让所有人同时做同一道菜,最快做好的那份菜提供给顾客。在做菜的过程中,要是某人发现了更有利的方法,就共享给大家,这被称为“懒散的并列化”。

这种方法为什么好用,只能说试了发现好用。没法解释的黑魔法也存在于深度学习中——一种机器学习的方法。它是模拟人的大脑神经网络构建的。

举个例子,学习英语要背单词,有人把整本英语词典都背了下来,遇到词典上有的词,就会很快认出来,但遇到词典上没有的,就傻眼了。电脑也是如此,它能记下所有的英文单词,但在做翻译时,就会显得语无伦次,因为它是按照词序挨个翻译单词的意思,而不是整句句子的意思。

这就是深度学习中的过度学习:即便你背下了所有的内容,你还是会遇到新的内容,生搬硬套是不行的,必须要学会举一反三、融会贯通。

为了防止电脑“过度学习”,解决办法就是“脱离”,简单说就是把全盘记忆改为特征记忆,做起来更简单:随机剪短几个神经元的连接。

当电脑没办法做到全部记住,就改为拼命记住特征了。这又是一个无法解释的黑魔法。

就好比一个拼命学习的孩子,考试成绩还是不好,就放他几天假,让他出去玩,放松一下,回来就考好了,很神奇吧?

故意设置障碍,反而能激发更大的潜力,对于人工智能非常有效。在引入深度学习技术后,阿尔法狗战胜了李世石,谷歌的翻译功能也能准确分析出省略的代词,图像、文字、声音可以自由转换的未来也快到来。

我有种人工智能正在生物化的感受,我们解释不了的、凭直觉判断的,现在人工智能也开始拥有了直觉、且无法用数学和逻辑解释。

三、强化学习中最有效的笨办法:大象解法

人工智能会不会超过人类?答案是肯定的,不管你愿不愿相信。

人类是人工智能的老师,按照人工智能的学习方法和学习态度,老师终将被超越。虽然指导人工智能学习的是人类,但人工智能的成长中的各种因素,人类已经无法解释清楚。

所谓的黑魔法,意味着在某种方面,人工智能已经超越了人类。

人工智能开始脱离人类,自主学习了。就像孩子长大,要独立生活了,依靠以往学得的知识,面对未知,做出选择。

强化学习,指的就是电脑对未知的环境进行随机搜索并反馈其结果,在不断地反馈结果的过程中,评估被不断强化了。

PONANZA在开始强化学习后,不再用职业棋手的棋谱做为模板,开始选取看起来对棋局有利的6-8步棋进行试验,并把结果是否好于预期,或是坏于预期,反馈给电脑,评估后进行微调。

按照这个方法,电脑需要搜80亿张棋谱,才能有所提高。山本一成用了数台机器共计个内核,连续数月不停地运转。每个月要数十万(日元)的电费。

人工智能的开发需要大量的数据作为支持,因此前期的积累是漫长的。从这个角度来说,人类比不上人工智能也没什么稀奇的,毕竟彼此之间的积累差距太大。

再回到阿尔法狗和李世石的世纪对战上,人工智能在围棋上的突破是相当惊人的。因为围棋的搜索结果是无法评估的,怎样才能判断围棋的某一个落子是有效的呢?

谷歌的程序员们运用到了一个比较笨的办法:蒙特卡洛法,一种大象解法。简单来说,就是掷骰子,通过随机选择一个点,然后往后推算0步,计算胜率;然后再随机选择另一个点,往后推算0步,计算胜率;比较两个点的胜率,选择胜率高的。

接着再重复上一步,运行的次数越多,获得的值就越接近正确答案。

就好比我们在做数学题时,计算从1一直加到的结果,优雅的做法就是找到简便的解题方法,然后迅速得出结果。而大象算法,就是硬加,虽然耗时,但也会得出正确答案。

阿尔法狗放弃了人类的学习模式,运用电脑自身的优点,选择了更适合自己的学习方法,也找到了破解围棋的通道,此后,它的胜算率达到了99%。

因此,联想到人类的学习,很多科学家都是在持久地积累,用看起来笨笨的大象算法,推动人类发展进步。陈景润满屋子的草稿纸,爱迪生0多次的发明失败,还有全世界各个实验室做的各种微小的实验,它们都在夯实科学的基础。

最笨的办法,也是最实用的、日常使用率最高的办法。这也是生活中,那些看起来很聪明的人,总是很难取得重大成果的原因吧。

年,东京,PONANZA静静地坐镇在没有对手的将棋棋盘前,成为了地球上唯一一个智慧体,因为它的目标是“绝不能输给人类”,为了达到这个目标,它消灭了所有的人类。

山本一成在《你一定爱读的人工智能简史》中,为我们描绘了如此一幕恐怖的未来世界,幸好,还未发生。但也提醒我们,对于人工智能要给出符合人类社会的伦理观和价值观,而不能任由它发展。

深度学习技术,是让电脑以人类为模板来理解世界,强化学习技术则是让电脑按照相同的逻辑模式去预测未知世界。电脑是否“学好”,取决于人类给了它什么样的榜样。

谷歌公司曾经发生了重大失误,在谷歌相册为照片提供自动添加标签时,把皮肤很黑的人错误标记为“大猩猩”,为此谷歌的管理层慌忙向大众赔礼道歉。

错误是电脑犯的,电脑学的对象却是人类。在电脑的搜索库中,一定有人把皮肤黑的人调侃为大猩猩,电脑记住了这一点,并直白地标注了出来。

倘若孩子超过了父母,父母是高兴,还是害怕?

扼杀是扼杀不了的,那么做一个好人,让孩子成年后,对我们保留敬意,才是最好的选择。




转载请注明:http://www.abachildren.com/jbzs/4340.html