新闻是有分量的

斯坦福报告:如何定义人工智能?_6

2019-07-04 10:30栏目:观点
TAG:

  定义人工智能

  奇怪的是,人工智能缺乏一个精确的、被普遍接受的定义,这或许有助于该领域的加速成长、繁荣以及前进。虽然人工智能的从业者、研究人员和开发人员由一种粗略的方向感和一个与它相处的命令所引导,人工智能的定义仍然很重要,而 Nils J. Nilsson 就提供了一个有用的定义:人工智能就是致力于让机器变得智能的活动,而智能就是使实体在其环境中有远见地、适当地实现功能性的能力。

  从这个角度来看,对人工智能的表征取决于个人愿意适当地并有远见地为功能性提供合成软件和硬件的信用。一个简单的电子计算器比人类大脑进行的计算要快得多,而且几乎从来不出错。

  电子计算器智能吗?像 Nilsson 一样,研究小组以一种宽泛的视角来看待此问题,认为智力取决于一个多维频谱。根据这一观点,算术计算器和人脑之间的区别不是某一类,而是规模、速度、自主性和通用性的区别。

  同样的因素可以用来评估智能的其他各例智能语音识别软件、动物大脑、汽车巡航控制系统、围棋程序、自动调温器并将它们放置在频谱中的适当位置。虽然我们的宽泛解释把计算器列在了智能频谱中,但是如此简单的设备与今天的人工智能相比几乎没有相似之处。

  从这个角度看,对人工智能的表征取决于个人愿意适当地并有远见地为功能提供合成软件和硬件的信用。一个简单的电子计算器比人脑计算快得多而且几乎从不出错。

  人工智能的边界已经远远走在前面,而计算器可以实现的功能只是当下的智能手机的百万分之一。目前人工智能开发人员正在改进、推广和扩大从当下的智能手机中所建立起来的智能。事实上人工智能领域是一个不断努力推动机器智能向前发展的过程。

  具有讽刺意味的是,人工智能正在遭受失去话语权的长期灾难,最终不可避免地会被拉到边界内,即一个被称为人工智能效应(AI effect)或奇怪悖论(odd paradox)的重复模式人工智能将一种新技术带到了普通大众中去,人们习惯了这种技术,它便不再被认为是人工智能,然后更新的技术出现了。

  同样的模式将在未来继续下去。人工智能并没有交付一个惊雷般改变生活的产品。相反人工智能技术以一个连续的、进步的方式正在继续更好的发展。

  人类尺度

  值得注意的是,作为频谱的智能表征并不授予人类大脑以特殊地位。但到目前为止,即使人类拥有着推理、实现目标、理解和生成语言、感知和响应感官输入、证明数学定理、玩具有挑战性的游戏、合成和总结信息、创造艺术和音乐甚至撰写历史的能力,人类智力在纯粹的多功能性上与生物的和人工的世界并不相匹配。

  这使得人类智能成为检测人工智能进步的一个自然选择。它甚至可能是作为一个经验法则被提出来,认为计算机能够执行的、以及人们曾经实现了的任何活动,都应该算作智力的一个实例。但是对于任何人类能力的匹配只是一个充分条件而非必要条件。至少在速度上,已经存在许多超越人类智力的系统,比如对机场成千上万的航班进行每日往返行程的调度。

  对人工智能在国际象棋游戏中打败人类玩家的长期探索以及最终的成功为人类和机器智能之间的比较提供了一个高知名度的实例。人们已经被国际象棋吸引了数百年。

  当建立计算机的可能性即将来临时,被许多人认为是计算机科学之父的 阿兰图灵提到了以国际象棋作为范例来展示智力的计算机概念。没有对强大的计算机的访问,图灵玩了一个模拟计算机的游戏,他每走一步棋大约花半个小时。

  但只是在六十和七十年代,由来自卡耐基-梅隆大学、斯坦福、麻省理工学院、莫斯科的理论和实验物理研究所以及西北大学的小组所贡献的一长串改进之后,国际象棋游戏程序开始取得成果。终极推动是来自 IBM 的一个长期项目,Deep Blue 程序于 1997 年以 3.5-2.5 的成绩打败了国际象棋冠军 Garry Kasparov。

  奇怪的是,在人工智能赶上了它的难以捉摸的目标之后没多久,Deep Blue 被描绘成一个蛮力方法(brute force methods)集合,而不是真正的智能(real intelligence)。事实上,IBM 关于 Deep Blue 的后续出版物提供了有关其搜索和评价程序的丰富内容,完全没有提及智能的(intelligent)一词!Deep Blue 是否智能?又一次,边界移动了。

  一个可操作的定义

  人工智能也可由其研究人员的工作来定义。本报告主要将人工智能视为通过合成智能以研究智能特性的计算机科学的一个分支。虽然人工智能的出现是依靠着硬件计算资源的快速发展,但是这里对于软件的关注反映出人工智能界的一个趋势。尽管,最近在为基于神经网络计算建立定制硬件上取得的进展已经促进了人工智能硬件和软件之间的严格耦合。

  智能(intelligence)仍然是一个复杂现象,其不同方面已经吸引了几个不同研究领域的注意,包括心理学、经济学、神经科学、生物学、工程学、统计学和语言学。人工智能领域自然是得益于所有这些相关领域的进步。比如人工神经网络,如今已成为若干基于人工智能的解决方案的中心,它最初是受生物神经元中有关信息流的思想所启发。

  人工智能研究趋势

  直到本世纪初,人工智能的吸引点主要在于它所传递的承诺,但在过去的十五年里,大多这样的承诺已经得到兑现。人工智能技术已经充斥了我们的生活。当它们成为了社会的一股中心力量时,该领域正在从仅仅建立智能系统,转向了建立有人类意识的、值得信赖的智能系统。

  几个因素加速了人工智能革命。其中最重要的是机器学习的成熟,部分由云计算资源和广泛普及的、基于 Web 的数据收集所支持。机器学习已经被深度学习(deep learning)急剧地向前推进了,后者是一种利用被称作反向传播的方法所训练的适应性人工神经网络的一种形式。

  信息处理算法的这种性能飞跃一直伴随着用于基本操作的硬件技术的显著进步,比如感觉、感知和目标识别。数据驱动型产品的新平台和新市场,以及发现新产品和新市场的经济激励机制,也都促进了人工智能驱动型技术的问世。

  所有这些趋势都推动着下文中所描述的热门研究领域。这种编辑只是想要通过某个或另一个度量标准来反映目前比其他领域得到更大关注的领域。它们不一定比其他领域更重要或更有价值。事实上目前的一些热门领域在过去几年中并不怎么流行,而其他领域可能在未来会以类似的方式重新出现。

  大规模机器学习

  许多机器学习的基本问题(如监督和非监督学习)是很好理解的。目前努力的一个重点是将现有算法扩展到更庞大的数据集上。例如鉴于传统方法能够负担得起若干遍数据集的处理,现代方法是为单次处理所设计;某些情况只认同非线性方法(那些只关注一部分数据的方法)。

  深度学习

  成功训练卷积神经网络的能力非常有益于计算机视觉领域,比如目标识别、视频标签、行为识别和几个相关变体的应用。深度学习也在大举进军感知方面的其他领域,如音频、语音和自然语言处理。

  强化学习

  鉴于传统机器学习主要关注于模式挖掘,强化学习将重点转移到决策中,这种技术将有助于促进人工智能在现实世界中更深入地进入相关研究和实践领域。作为一种经验驱动型的序贯决策框架,强化学习已经存在了几十年,但是这个方法在实践中没有取得很大成功,主要是由于表征和缩放的问题。然而深度学习的出现为强化学习提供了一贴强心剂。

  由谷歌 DeepMind 开发的计算机程序 AlphaGo 在五次对抗比赛中击败了人类围棋冠军,它最近所取得的成功在很大程度上要归功于强化学习。AlphaGo 是通过使用一个人类专家数据库来初始化一个自动代理的方法被训练的,但随后提炼的方法是通过大量地自我对抗游戏以及应用强化学习。

  机器人

  至少在静态环境中,机器人导航在很大程度上被解决了。目前的努力是在考虑如何训练机器人以泛型的、预测性的方式与周围世界进行交互。互动环境中产生的一个自然要求是操纵,这是当下所感兴趣的另一个话题。

  深度学习革命只是刚开始影响机器人,这在很大程度上是因为要获得大的标记数据集还很困难,这些数据集已推动了其他基于学习的人工智能领域。

  免去了标记数据需求的强化学习可能会有助于弥合这一差距,但是它要求系统在没有错误地伤害自己或其他系统的情况下能够安全地探索出一个政策空间。在可信赖的机器感知方面的进步,包括计算机视觉、力和触觉感知,其中大部分将由机器学习驱动,它们将继续成为推进机器人能力的关键。

  计算机视觉

  计算机视觉是目前最突出的机器感知形式。它是受深度学习的兴起影响最大的人工智能子领域。直到几年前,支持向量机还是大多视觉分类任务所选择的方法。但是特别是在 GPU 中的大规模计算的汇合,使得更大数据集的可获得性(尤其是通过互联网)以及神经网络算法的改进导致了基准任务中能的显著提高(比如 ImageNet 中的分类器)。计算机首次能够比人类更好地执行一些(狭义定义的)视觉分类任务。目前的研究多是关注于为图像和视频自动添加字幕。

  自然语言处理

  自然语言处理是另一个通常与自动语音识别一同被当做非常活跃的机器感知领域。它很快成为一种拥有大数据集的主流语言商品。谷歌宣布目前其 20% 的手机查询都是通过语音进行的,并且最近的演示已经证明了实时翻译的可能性。现在研究正在转向发展精致而能干的系统,这些系统能够通过对话而不只是响应程式化的要求来与人互动。

  协同系统

  协同系统方面进行的是对模型和算法的研究,用以帮助开发能够与其他系统和人类协同工作的自主系统。该研究依赖于开发正式的协作模型,并学习让系统成为有效合作伙伴所需的能力。能够利用人类和机器的互补优势的应用正吸引到越来越多的兴趣对人类来说可以帮助人工智能系统克服其局限性,对代理来说可以扩大人类的能力和活动。

  众包和人类计算

  在完成许多任务方面由于人类的能力是优于自动化方法的,因而在众包和人类计算方面,通过利用人类智力来解决那些计算机无法单独解决好的问题,该领域研究调查了增强计算机系统的方法,这项研究的提出仅仅是在大约 15 年前,现在它已经在人工智能领域确立了自己的存在。最有名的众包例子是维基百科,它是一个由网络公民维护和更新的知识库,并且在规模上和深度上远远超越了传统编译的信息源,比如百科全书和词典。

  众包专注于设计出创新的方式来利用人类智力。Citizen 科学平台激发志愿者去解决科学问题,而诸如亚马逊的 Mechanical Turk 等有偿众包平台,则提供对所需要的人类智力的自动访问。通过短时间内收集大量标记训练数据和/或人机交互数据,该领域的工作促进了人工智能的其它分支学科的进步,包括计算机视觉和自然语言处理。基于人类和机器的不同能力和成本,目前的研究成果探索出了它们之间理想的任务分离。

  算法博弈理论与 (基于) 计算机 (统计技术的) 社会选择

  包括激励结构、人工智能的经济和社会计算维度吸引到了新的关注。自 20 世纪 80 年代初以来,分布式人工智能和多代理(multi-agent)系统就已经被研究了,于 20 世纪 90 年代末开始有显著起色,并由互联网所加速。一个自然的要求是系统能够处理潜在的不恰当激励,包括自己所感兴趣的人类参加者或公司,以及自动化的、基于人工智能的、代表它们的代理。

  备受关注的主题包括计算机制设计(computational mechanism design)(一种激励设计的经济理论,它寻求激励兼容的系统,其中输入会被如实报告)、(基于) 计算机 (统计技术的) 社会选择(computational social choice)(一种有关如何为替代品排列顺序的理论)、激励对齐信息获取(incentive aligned information elicitation)(预测市场、评分规则、同行预测)和算法博弈理论(algorithmic game theory)(市场、网络游戏和室内游戏的平衡,比如 poker它在近几年通过抽象技术和无遗憾学习(no-regret learning)已经取得了显著的进步)。

  物联网(IoT)

  越来越多的研究机构致力于这样一个想法:一系列设备可以相互连接以收集和分享它们的感官信息。这些设备可以包括家电、汽车、建筑、相机和其他东西。虽然这就是一个技术和无线网络连接设备的问题,人工智能可以为了智能的、有用的目的去处理和使用所产生的大量数据。目前这些设备使用的是令人眼花缭乱的各种不兼容的通信协议。人工智能可以帮助克服这个巴别塔。

  神经形态计算

  传统计算机执行计算的冯诺依曼模型,它分离了输入/输出、指令处理和存储器模块。随着深度神经网络在一系列任务中的成功,制造商正在积极追求计算的替代模型特别是那些受到生物神经网络所启发的为了提高硬件的效率和计算系统的稳定性的模型。

  目前这种神经形态的(neuromorphic)计算机尚未清楚地显示出巨大成功,而是刚开始有望实现商业化。但可能它们在不久的将来会变成寻常事物(即使仅作为冯诺依曼所增加的兄弟姐妹们)。深度神经网络在应用景观中已经激起了异常波动。当这些网络可以在专门的神经形态硬件上被训练和被执行,而不是像今天这样在标准的冯诺依曼结构中被模拟时,一个更大的波动可能会到来。

  总体趋势以及人工智能研究的未来

  数据驱动型范式的巨大成功取代了传统的人工智能范式。诸如定理证明、基于逻辑的知识表征与推理,这些程序获得的关注度在降低,部分原因是与现实世界基础相连接的持续挑战。规划(Planning)在七十和八十年代是人工智能研究的一根支柱,也受到了后期较少的关注,部分原因是它强烈依赖于建模假设,难以在实际的应用中得到满足。

  基于模型的方法比如视觉方面基于物理的方法和机器人技术中的传统控制与制图已经有很大一部分让位于通过检测手边任务的动作结果来实现闭环的数据驱动型方法。即使最近非常受欢迎的贝叶斯推理和图形模式似乎也正在失宠,被数据和深度学习显著成果的洪流所淹没。

  研究小组预计在接下来的十五年中,会有更多关注集中在针对人类意识系统的开发上,这意味着它们是明确按照要与之互动的人类特点来进行建模与设计的。很多人的兴趣点在于试图找到新的、创造性的方法来开发互动和可扩展的方式来教机器人。

  此外在考虑社会和经济维度的人工智能时,物联网型的系统设备和云正变得越来越受欢迎。在未来的几年中,对人类安全的、新的感知/目标识别能力和机器人平台将会增加,以及数据驱动型产品数量与其市场规模将会变大。

  研究小组还预计当从业者意识到纯粹的端到端深度学习方法的不可避免的局限性时,会重新出现一些人工智能的传统形式。我们不鼓励年轻的研究人员重新发明理论,而是在人工智能领域以及相关领域(比如控制理论、认知科学和心理学)的第一个五十年期间,保持对于该领域多方面显著进展的觉察。