服务器 频道

纵式解读:AI的指数级增长有什么内幕?

  【IT168 资讯】在科技领域,每十年似乎都有它的一个技术专业术语诞生:20世纪80年代我们有了个人电脑; 20世纪90年代有了互联网和全球网络智能手机和社交媒体;在2000年代有了人工智能(AI)和机器学习。

  人工智能系统与人类竞争的领域

  1950 - 82年代出现了人工智能(AI)诞生,在这个新领域,许多开创性研究正在完成,同时大规模的炒作也被创造出来,但最终以失败而告终。1983 - 2004年代,人工智能领域的研究和开发逐渐取得进展,并取得了一些重要成就(例如深蓝在国际象棋中击败卡斯帕罗夫)和商业化解决方案(如Cyberknife),此外,其速度在2005年和2010年期间确实增长了不少。

  自2011年以来,人工智能研究和开发一直见证着高速发展,并且研究人员提供了几种AI解决方案,几个领域的人工智能解决方案几乎与人类一样好,甚至是更好。其中包括玩游戏、医疗保健、计算机视觉和物体识别、语音到文本转换、说话人识别、改进的机器人和聊天机器人以解决特定问题。附录中的表格列出了各种领域中与人类相媲美的关键AI解决方案,其中六种解决方案如下所述。在讨论这六种人工智能解决方案之后,我们讨论了出现这种超级增长的主要原因,包括摩尔定律、并行和分布式计算、开源软件、大数据的可用性、学术界和工业界之间日益增长的合作以及正在进行的研究在AI及其子领域完成情况。

  IBM Watson击败了人类!

  2006年,IBM Watson研究中心开始创建IBM Watson,该系统使用机器学习、自然语言处理和信息检索技术在名为Jeopardy的游戏中击败了人类。IBM Watson有90台服务器,服务器使用八核处理器,每个核心有四个线程(即总共2,880个处理器线程)和16 TB的RAM。这种处理能力使得IBM Watson能够每秒处理500千兆字节或大约100万本书。而在今天,这样的系统将花费大约60万美元。

  IBM研究人员很早就意识到,在3,500个随机选择的危险问题中,维基百科标题至少包含95%的答案。因此,IBM Watson包含了维基百科全部内容,而这个“特色工程”是它赢得Jeopardy的关键之一!它还包含了2亿页的其他内容,包括维基文库、维基语录的多个版本,还有百科全书、词典、新闻文章和其他文学作品,并且它使用了各种其他数据库、分类法和本体论(例如DBPedia、 WordNet和Yago)连接各种文件。

  


▲图1:IBM Watson击败人类!

  AlphaGo击败人类

  在2016年,谷歌DeepMind的研究人员在围棋游戏中创造了AlphaGo,击败了卫冕世界冠军李世石。 AlphaGo使用深度神经网络评估位置和选定的移动,这些神经网络是使用人类专家动作通过监督式学习进行训练的,并且通过强化自我学习来加以学习。2017年,Deep Mind研究人员推出了AlphaGo Zero,该产品完全基于强化学习,没有人员数据指导或相关的领域知识,除了为其纳入游戏规则。通过与自己对抗490万场比赛,AlphaGo Zero得到了改善,最终以100-0击败前一届冠军AlphaGo。

  自动驾驶

  20世纪80年代,卡内基梅隆大学的研究人员构建了第一辆自动驾驶汽车原型,但其能力有限。 2005年,美国政府(通过DARPA)发布了“城市挑战”,让自动驾驶汽车遵守交通规则并在城市环境中运营。2009年,谷歌的研究人员开发了这种自动驾驶汽车。 2015年,内华达州、佛罗里达州、加利福尼亚州、弗吉尼亚州、密歇根州和华盛顿特区允许在公共道路上测试自动驾驶汽车,2017年,Waymo(一家Google的姊妹公司)宣布已经开始测试无人驾驶汽车驾驶员位置的人(但仍然在车内)。 大多数自动驾驶汽车驾驶软件都基于监督学习和强化学习技术以及计算机视觉和图像处理。


▲图2:驾驶汽车时的反应时间

  深度患者比精神科医生提供更好的结果

  2015年,纽约Mount Sinai医院的一个研究小组带领Joel Dudley创建了一个名为Deep Patient的三层无监督深度学习网络。研究人员为大约700,000名患者提供了深度患者的数据,其数值为数百个变量(例如,病史、检查结果、医生就诊、药物处方)。该系统是无人监督的,但它能够发现医院数据中的模式,指出谁很可能得肝癌的可能性大一些。更有趣的一个方面是,它可以在很大程度上预测精神疾病如精神分裂症的发作。由于精神分裂症甚至对精神科医生来说都难以预测,达德利悲叹道:“我们可以建立这些模型,但我们却不知道它们是如何工作的。”

  改进的机器人和聊天机器人

  商业聊天机器人从Siri开始,后者是由SRI的人工智能中心开发的。其语音识别引擎后来由Nuance Communications提供,并于2010年2月在Apple iPhone中作为应用发布。2011-17年开发的其他商业聊天机器人包括微软的Cortana、Xbox、Skype的翻译器,亚马逊的Alexa,谷歌的Now和Allo ,百度和科大讯飞的语音搜索,以及Nuance语音产品。以下三款人形机器人特别有趣,还有其他几款正在生产或销售的其他产品,例如Milo、Ekso GT、Deka和Moley 也值得一提:

  ·Asimo精通美国和日本的手语,能识别人脸、爬楼梯、跳跃,单脚保持平衡,同时在步行和跑步方面无缝对接。

  ·“Pepper”的目的是“让人们开心”,增进人们的生活,促进人际关系,与人玩乐并将他们与世界的其他地方联系起来

  ·Spotmini可以灵活的将碗碟放进洗碗机中。  


▲图3:三个人形机器人:本田的Asimo、软银的Pepper和谷歌的Spotmini

  这些机器人中的大多数使用复杂的控制工程,计算机视觉和深度学习网络(特别是长期短期记忆),但总的来说,聊天机器人对话还远远没有达到人类对话的水准,并且也没有一个大众可接受的基准来互相比较它们。

  基于人工智能的机器人过程自动化

  机器人过程自动化(RPA)软件被配置为在执行特定任务时执行由人类用户遵循的步骤,这种配置是使用演示步骤实现的,而不是用计算机语言编码。 RPA的目标是提供一个软件机器人,它是一个虚拟工作者,可以以直观的方式快速“训练”或由业务用户配置,就像由有经验的同事培训新用户一样。虽然这个软件的根源可追溯到20世纪80年代,但实践者仅在2010年左右才开始大规模使用它。RPA软件本身具有几个缺点,例如,

  ·安装这样的机器人比通常看起来更复杂和耗时;

  ·机器人工作的平台经常发生变化,这增加了复杂性;

  ·由于法规或商业环境的变化可能会迫使这种软件进行重新配置;

  ·由于RPA软件不是开源的,因此不同供应商软件之间的互操作性可能是一个挑战;

  ·经济成果往往不太好,因为通常在业务流程中存在许多问题,并且通过RPA处理所有这些问题可能是一项艰巨的任务。

  为了克服这些缺点,在过去的两年中,RPA已经与机器学习和自然语言处理系统相结合,以构建更全面的自动化系统。


▲图4:机器人过程自动化取代人类

  这种高速增长的主要原因包括摩尔定律、并行和分布式计算、开源软件、大数据的可用性,学术界和工业界之间日益增长的合作以及AI中正在进行的研究的数量的影响。

  AI系统爆炸式增长的原因

  摩尔的“法则”

  摩尔在1965年观察到,电子电路中的晶体管数量大约每年翻一番,他预测这种增长速度将持续十年。 1975年,他预测将每两年翻一番。

  计算能力的指数增长以及规模和成本的降低对AI领域产生了最大的影响

  值得注意的是,摩尔定律并非真正的定律,而是由英特尔公司创始人戈登摩尔博士提出的一系列观察结果。实际上,在2015年,摩尔自己说:“我看到摩尔定律在未来十年左右会死掉”,这并不奇怪,因为今天的晶体管尺寸可以减少至多4900倍在一个硅原子的理论极限之前,这也提供了对感知器的尺寸和速度的限制。尽管如此,计算能力的这种指数增长以及尺寸和成本的降低对AI领域产生了最大的影响。  


▲图5:图表显示晶体管数量每两年翻一番
  

  并行和分布式计算

  大多数人工智能算法需要巨大的计算能力,到2004年,并行和分布式计算变得切实可行。由于电子通信、存储和计算已经变得便宜和普及,许多公司(例如亚马逊,微软,IBM,谷歌)现在正在以小时甚至是每分钟的时间销售计算能力,这反过来又帮助研究人员和从业人员利用并行并分布式计算并在数千台计算机上同时执行其算法(通过使用Hadoop、Spark和相关框架)。

  大数据的可用性

  机器学习算法,尤其是深度学习算法需要大量的数据。例如,具有50个输入属性(或变量)和一个输出感知器以及三个包含50个感知器的隐藏层的监督神经网络具有10,050个连接,并且该网络可能需要数十万个或更多个标记的数据点用于训练,因为每个连接的权重都需要优化。幸运的是,到2017年,便宜且易于获得的硬件和网络连接允许人类产生超过8千兆字节(即8字节)的数据。许多研究人员和开发人员开始使用免费提供的数据为特定问题创建“开放”数据库,并开始“标注”这些数据。MNIST是1998年创建的第一个这样的数据库,ImageNet是2011年创建的最大的数据库。ImageNet包含超过1400万个图像的URL,其中超过1000万个已经手工标记以表示它们代表的内容。

  免费提供开源软件

  开放源代码软件允许用户自由地执行、修改和重新分配其副本,无论有无更改。卡耐基梅隆大学教授理查德斯托曼于1985年推出了自由软件基金会。2002年,Torch是第一个这样的机器学习软件,但自那时起,许多其他软件(例如Caffe、Theano、Keras、MXNet、DeepLearning4J、Tensorflow)已被引入。这使得研究人员和从业者能够大量使用开源软件进行实验,并构建新的算法,如果成功的话,这些算法通常也是开源的。

  研究与开发的超常增长

  据估计,自1950年以来,人工智能及其子领域已编写了超过20万篇研究文章。其中,仅在2008年至2017年期间就发布了超过125,000份。同样,自2008年以来,工业界与学术界的合作有了惊人的增长,这导致了人工智能解决方案的高速增长。

  结论

  “历史不会重演,但总会有惊人的相似”,这是马克吐温的一句名言,而将它应用在人工智能领域中似乎是比较贴切的,1950年代以及过去七年再次出现了巨大的变化。在这两种情况下,研究人员都非常热情,希望能够快速创建可以模拟人类的人工智能机器,并且这两种情况都导致人工智能研究与开发的高速增长。

  在20世纪50年代和60年代,人工智能及其许多子领域都进行了开创性研究,而在目前的阶段,强大而乏味的工程以及廉价和丰富的计算产生超过20种人工智能系统与人类相媲美或击败人类。就像20世纪50年代和60年代一样,这再次在研究人员、开发人员、从业人员、投资者和公众中产生了欢欣,而这又开始了一个新的炒作循环周期。

0
相关文章