HPC将在人工智能领域发挥巨大作用！-服务器专区

HPC将在人工智能领域发挥巨大作用！

作者：王晓东编辑：王晓东 2014-09-26 12:13 IT168网站原创

　　【IT168 资讯】9月26日，2014高性能计算用户大会在京举行，近千位国内外高性能计算研究与应用专家和用户代表到会。大会提出“HPC PLUS”理念，认为高性能计算正在联结世界、改变生活，并展示了高性能计算在全球最大射电望远镜阵列SKA项目、政府间气候变化委员会IPCC-AR5、天河二号超大规模应用等科学工程中的最新进展，分享了深度学习、个体医疗以及脑科学等全球热点技术领域的高性能计算应用趋势。

▲科大讯飞高级副总裁胡郁先生

　　以下是科大讯飞高级副总裁胡郁先生的演讲全文：

　　女士们先生们，大家上午好，今天非常荣幸代表科大讯飞给大家介绍一下基于高性能计算的深度学习智能语音技术最新进展。

　　第一个方面是智能语音技术间接，里面包括语音合成，语音识别和自然语言等。可以将任意的文字信息转化为自然流畅的语言，相当于给机器装上了人工嘴巴。另外更重要的，语音识别能够将我们我说话的内容，我的音色代表我的声音，相当于给机器装上了人工耳朵。它能够把我们文字中的内容语义理解出来，相当于机器装上了人工的大脑。大家之间人类之间交流信息最方便的就是语音，我们人类和机器之间将来一定会采用语音交流的方式来进行，正是因为这样语音技术受到了国际各国的政府和大的互联网厂商，大的IT厂极度的重视，像微软、谷歌他们都投入了巨大的力量。

　　这是摩根史丹利作的报告，他们研究显示表明，信息产业每十年发生一次革命性的变化，从大型机时代开始进入我们的生活，全世界只需要5台的电脑，现在实际上不是，每过10年机器在不断发生变化，计算往前前进，到小型机时代，个人电脑时代，桌面互联网时代，移动互联网时代以及到现在移动穿戴式设备时代，每一个时代的演进都会诞生一大批先进的技术和伟大的公司。

　　我们看一下在这些机器这些时代不断演变过程中，人机交互界面正发生重大变革，第一是键盘和字符显示构成第一代人机交互，第二是鼠标和图形显示构成第二代人机交互，第三是触摸、语音和视频等技术引领人机交互。交互的发展我们可以看到发展的过程，那个时候人要去读纸带上打孔的信息才能知道要给机器说什么，后面进化了，用刻键盘鼠标就可以，不知道大家学键盘鼠标用了多长时间，我最少了用了三个月，但是我的父母现在还没有学会，我们可以看到触摸过程是语音，我们把它叫做自然交互，因为你生下来就会一种交互技能，如果没有这个技能，跟人都没法狡交流。最近这几年语音技术为什么这么火，我们可以看到在移动互联网穿戴式计算，便鞋式计算，对于背景自然计算使用环境下，语音计算可学性和必要性问题都得到解决，为什么这么说?我们都知道是非常难以交互的，用语音可以尽量变少地方，必要性比较强，另外因为云计算、无线互联网，可以让我们通过后台进行计算能力，这几年语音技术也逐步成熟。

　　我们在这过程中，为什么语音交互具有强大生命力，曾经有一个国家大部委领导问过我一个问题，比如键盘鼠标并没有成为一个产业，为什么语音几乎在将来有很小的生命力?我总结了四个字，叫做大、智、移、云，首先看一下智慧，首先看到交互智能，让大家上手门槛非常的快，而且因为现在移动互联网设备巨大，自然交互有了广泛的场景，通过语音计算解决了我们计算量的问题，通过语音计算我们得到了大数据，而通过大数据我们让算法和系统自动进行进化，技术上解决成为可能。这个地方我来说一下对这个的理解，为什么在现代语音技术，语音交互和自然交互取得突破，把它归结成涟漪效应，大家知道一个水滴遇到水韵的时候会形成一个水波纹，我把涟漪高度离我们需求的误差，大家都知道一个新的技术投入到用户中间，一开始是比较大的，用户觉得不好用，他们的经验会会聚到云计算中心，这样如果系统有学习能力，快速的改进当水波扩散到更多人的时候，这些新的人他感受到的技术和需求差距在降低，当水波慢慢扩散的时候，感觉到技术为什么这么好，但是他不知道他以前这些人给他做了很多贡献，做了小白鼠，这个涟漪扩展到整个水面全部蔓延的时候，可能技术已经成熟了，我相信这是移动互联网思想在解决我们工程研究非常重要的一点。

　　我们看一个实际的例子，在2010年业界语音识别不能够真正识别的时候，我们把语音云上线了，伴随着用户的集聚增加，这就是移动互联网和互联网的力量，大数据的力量。我们可以设想一下，将来语音交互在哪些方面有用，主要分为两个产品，第一个左边的穿戴式和运城智能家居设备，在这种场景下可能语音交互是主要的能力，比如我们讲的蓝牙耳机，这种情况下没有交互方式，只有语音交互，在右边可以看到智能手机，智能眼镜，智能电视，在这个过程语音要触摸、视觉，要融合在一起。

　　正是因为在这样历史车轮的驱动下，现在语音已经能提供各种各样的能力，语种识别等，过去我们非常快速的发展，在现代的使用语音云使用数量超过了5个亿，活跃的人员超过七千万，这个过程中很多手机上的应用包括新浪微博、腾讯QQ也接入到我们语音云的使用中间，已经有4500个平台他们在不同的地方都使用了。另外可以看到，除了智能手机国外所有包括小米、华为、中兴，他们手机拥有了智能语音助理等等以外，所有电视机厂商和机顶盒厂商都在用智能语音交互技术，在将来几年内大家会看到越来越多车展进入到语言模式。

　　第二个大家感兴趣的话题跟大家介绍一下，语音识别为什么取得成功，我说除了刚才讲的涟漪效应和大数据，有一个技术非常重要，就是我们讲的DNN深度神经网络，传统神经网络中间只有一层，我们叫隐含层，左边输入层，右边输出层，只是把中间隐含起来，就这么一点简单变化，它能够吸收更多的信息，也给计算量提出了更高的要求。我们可以看到传统语音识别复杂的技术体系，大家可以看到环节特别多，每一个里边都是统计学，都是数学，都是很复杂的东西，但是有DNN以后，一般省了这么多的环节。最近不仅仅把DNN推广到语音识别，有语音评测，语音合成等等。可以看到，其实在这个过程中，超算对DNN和语音云起到什么样的贡献，这就是我们的语音数据，经过神经网络的训练才得到，因为我们有了语音计算，我们现在有数万个小时可以进行计算，现在通过超算的配置，我们现在已经可以很好达到95%的准确率。现在讯飞用来计算，计算方面需要用到CPU计算集群和GPU计算集群，在我们训练这部分有多少，我们可以看到训练这部分比较小，在CPU方面，如果按照今天超算的来说，其实比较小的，我想跟大家讲一个概念，人脑在学习和运算，一个输入训练的过程，一个是输出判断过程，它其实是用一个脑袋的，但是在我们过程中把它分开的，用一种服务器去训练模型，然后用更多的服务器去运算，这个提的是指训练的部分，这块还比较小，我们也是包括跟浪潮在内的厂商合作，在CPU的加速上面。这是我们整个用GPUO的组合，他们用探寻的方法做计算，正是因为有这样的组合，才得到现在语音识别的高效率。

　　最后跟大家分享一下，语音和图象之外，现在在人工智能方面，首先刚才提到了原来超算在人类测序方面已经得到了非常大的发挥，美国在信息学和生物学结合项目以后，人类投入了10年38个亿美金，带动80亿的美金投入，美国总统奥巴马政府推动大脑活动图谱计划，每一个神经元和工作方式，欧洲也是用计算机来模拟大脑工作方式，希望能够了解大脑并获得突破，在这个方面其实给人工智能将来深入发展带来了指引。另外几个方面，我刚才说过了，像国际IT巨头包括苹果、微软、谷歌、Facebook。

　　我的理解给大家分享一下，原来计算机比较擅长的是什么，计算能力强，内存存储大，其实计算机会是典型记得很多图谱，算的比较快，能够预测11部，这个能预测15部，更难我把它叫做感知智能，一个动物看到外面的东西，听到东西做出反应，这就是智能驾驶汽车。我们要看到人类跟动物很大的区别，就是人类有知识体系，能够把我们文明，我们知识，我们世界观描写出来，在这点上我们把它叫做属于认知的方面，这是非常重要的一点。

　　我们看到，刚才讲的深度神经网络在感知智能上的成功，如果往最高的方面，更多是什么，需要解决语言理解，知识表示，联想推理和自主学习，这个过程中已经执行一个计划，对超算的相关领域还是非常有关，我们希望围绕人的大脑构造研制超脑的项目，有三大方向，第一贴近人脑认知机理的人工神经网络设计，更好的支撑人治智能的实现。第二个我们希望能够把现在在不断语音识别处理神经感知再扩大到1000倍，第三实现基于连续语义空间分布式表示的知识推理及自学习智能引擎，在这个目标的指引下，已经开展这个项目，包括国家863计划已经设计重大的专题，我现在作为重大专题的首席专家，作为一个能够参加高考的机器人，并且能够取得很好的成绩考进一本。这是一个很大的挑战，相信我们是有能力实现的，如果超脑不能实现，大家知道工业集群替代了体力劳动者，如果超脑能够实现，能够代替一些脑力劳动者。比如可以让机器人更好辅导小孩作业，在健康医疗方面有很多病例，自动客服可以减轻现在自动回答的，最后是手机的全能助理。

　　在实现人工智能的大脑中，我们可以看到一方面深度学习核心观点，第二个大数据开放性的涟漪效应，最后是超算平台，现在超算平台它要能够训练我们的大脑，并且能够支配他，这给超算提出了一个新的挑战。这种跟其他的应用不一样，这种智能将来会遍布到我们个人生活的方方面面，也许每个人都需要，所以它的使用量和普及面是相当的大，也许在将来10年能够实现，所以需要更大规模更大存储的超算平台集群建设，需要更优的深度学习并行化集群算法，最后定制的人工神经网络专属芯片系统。我最近和超算领域进行紧密的对接，今天也是我们这个人工智能领域和超算领域将来10年内有可能在国际商再次取得领先爆发的结合点，今天我的报告就到这里，谢谢大家!

关注我们