机器学习研究的进展,对人工智能和智能机器的发展的影响——近年来神经网络程序的快速发展主要得益于计算机核心软硬件技术的进步。要确保神经网络程序输出误差的自我修正,一是要确保输入节点到输出节点之间神经元层数足够深,而以往这个层数只有3层左右,但是随着算法和深度学习技术改进,神经网络模板已经可以达到10层以上。
AlphaGo通过引入用于视觉识别的深度卷积网络DCNN,训练出13层的神经网络模板,从而具备更加平滑的导数方式,使输出偏差更小、结果更快趋近于目标。
二是大数据和云计算技术的发展,破解神经网络的数据量限制和算力硬件难题,从而使AlphaGo围棋棋力得到明显提升,从棋力的r版AlphaGo跃升到棋力的集群完整版AlphaGo,棋力超过樊麾、李世石,接近世界排名第1的柯洁(截止年3月柯洁棋力)。
总的来说,AlphaGo对算法改进,主要归功于大数据、云计算、神经网络模板、基础数学等技术的突破,核心算法上与以往差异不大。通过策略网络和价值网络的注入,AlphaGo棋力达到职业二段,这与人类世界冠军仍有左右棋力差距。
为此,DeepMind公司开展新的尝试,一方面加大AlphaGo训练的数据量,从16万场围棋对决中选出万个盘面用于训练AlphaGo神经网络程序。另外,一方面让AlphaGo自我对弈,通过自我对弈产生新的万场对局,然后利用深度卷积网络DCNN训练围棋的棋感。
理论上,这种“数据产生更强大的程序,程序产生更优的数据”的迭代过程,会让AlplaGo越来越强,因此AlphaGo程序从棋力跃升只用了5个月时间,按此计算其击败人类排名第1的柯洁应该指日可待。大数据就是通过计算机技术汇总的大量数据的总称。
麦肯锡全球研究所将大数据定义为一种规模大到在获取、存储、管理、分析方面远远超出传统数据库软件工具能力范围的数据集合。这种大数据具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。
换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。IBM曾经提出大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)。
大量(Volume)数据的大小决定所考虑的数据的价值和潜在的信息;多样(Variety)是代表数据类型的多样性;高速(Velocity)指获得数据的速度;真实性(Veracity)是指数据的质量;价值(value)指合理运用大数据,以低成本创造高价值。
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式的数据挖掘,这就需要依靠云计算的分布式处理、分布式数据库、云存储、虚拟化等技术。
当前大数据面临的主要问题是数据有用性、数据隐私、道德问题。数据有用性依赖于数据挖掘后形成的算法和数学模型,这方面主要在于人类认知能力和抽象化水平。隐私问题就是数据安全和加密问题。道德问题主要是如何确保数据被合法利用,而不是落入歧途。
在智能机器方面,人类综合利用大数据和云计算的技术优势,通过大数据的收集来扩大输入源,通过神经网络模型、算法模型、云计算来进行数据挖掘和分析,从而寻找有用的规律,进而指导智能机器改造世界的实践活动。因此,大数据对于智能机器的认识世界和改造世界能力来说提供了坚实的数据基础。
机器学习是指在没有明确编程指令的情况下,使机器具备自我训练和自我学习的技术。机器学习技术在人工智能的研究中具有十分重要的地位。机器学习算法是一种从数据中分析获得规律,并利用规律对未知数据进行预测的算法,尤其是如何在经验学习中改善具体算法的性能。
试想一个不具有学习能力的智能系统难以称得上是一个真正的智能系统,但是以往的智能机器都普遍缺少学习的能力。例如,它们遇到错误时不能自我校正,不会通过经验改善自身的性能,不会自动获取和发现所需要的知识。
它们的推理仅限于演绎而缺少归纳,因此至多只能够证明已存在事实、定理,而不能发现新的定理、定律和规则等。智能机器应该是有生命:必须让机器具有自己思考下一步行为的能力,而不是在固定代码下执行!
换言之,智能机器要干什么不是人类决定,而是机器在各种听觉视觉等环境刺激下激发应对的策略,并且能对这些策略进行总结。要知道人是很复杂的,靠模拟根本无法和人类比,因此智能机器必须能自己开发、自己决策、自主学习,从而不断自我升级完善,这样才能是突破智能机器的发展瓶颈。
机器学习领域的研究工作主要有以下三个方面:面向任务,研究和分析改进一组预定任务的执行性能;面向认知模型,研究人类学习过程并进行计算机模拟;面向理论分析,从理论上探索各种可能的学习方法和独立于应用领域的算法。按照以上3种主要的研究工作,从学习策略分类,机器学习技术可以分为6个类型。
学习策略是指学习过程中系统所采用的推理策略,其主要由学习和环境两部分组成。环境提供信息,学习则实现信息转换,用能够理解的形式记忆下来,并从中获取有用的信息。学习策略的分类标准就是根据学生实现信息转换所需的推理和难易程度来分类,依从简单到复杂,从少到多的次序分为以下六种基本类型:
第一、机械学习。智能机器无需任何推理或其它的知识转换,直接吸取环境所提供的信息。如塞缪尔的跳棋程序、手工编写规则的围棋程序。这类学习系统考虑的是如何索引存储的知识并加以利用。系统的学习方法是直接通过事先编好、构造好的程序来学习,学习者不作任何工作,或者是通过直接接收既定的事实和数据进行学习,对输入信息不作任何的推理。
第二、教学学习,智能机器从环境(真实世界、现有理论和实验成果)获取信息,把知识转换成内部可使用的表示形式,并将新的知识和原有知识有机地结合为一体。这要求智能机器在环境的配合下,具有一定程度的推理能力。
这种学习方法和人类社会的学校教学方式相似,学习的任务就是建立一个系统,使它能接受教导和建议,并有效地存储和应用学到的知识。许多专家系统在建立知识库时使用这种方法去实现知识获取。
第三、演绎学习。智能机器所用的推理形式为演绎推理。推理从公理出发,经过逻辑变换推导出结论。这种推理是"保真"变换和特化的过程,使智能机器在推理过程中可以获取有用的知识。
第四、类比学习。利用二个不同领域(源域、目标域)中的知识相似性,通过类比,从源域的知识(包括相似的特征和其它性质)推导出目标域的相应知识,从而实现学习。
类比学习系统可以使一个已有的计算机应用系统转变为适应于新的领域,来完成原先没有设计的相类似的功能。类比学习需要比上述三种学习方式更多的推理。它一般要求先从知识源(源域)中检索出可用的知识,再将其转换成新的形式,用到新的状况(目标域)中去。类比学习在人类科学技术发展史上起着重要作用,许多科学发现就是通过类比得到的。
第五、基于解释的学习。智能机器根据原来理论、实验数据和数学模型提供的目标概念、例子、准则,首先构造一个解释来说明该例子满足目标概念,然后将解释推广为目标概念的一个满足可操作准则的充分条件。
第六、归纳学习,归纳学习是由环境提供某概念的一些实例或反例,让智能机器通过归纳推理得出该概念的一般描述。这种学习的推理工作量远多于示教学习和演绎学习,因为环境并不提供一般性概念描述(如公理)。
从某种程度上说,归纳学习的推理量也比类比学习大,因为没有一个类似的概念可以作为"源概念"加以取用。归纳学习是最基本的,发展也较为成熟的学习方法,在人工智能领域中已经得到广泛的研究和应用。机器学习是继专家系统之后人工智能应用的又一重要研究领域,也是人工智能和神经计算的核心研究课题之一。
现有的计算机系统和人工智能系统只有非常有限的学习能力,因而不能满足科技和生产提出的新要求。机器学习技术使智能机器从现有数据中归纳、演绎和推导出新的规律,而这种学习能力也让智能机器有望成为学习式、自我意识的智能机器。对机器学习的研究的进展,必将促使人工智能和智能机器的进一步发展。