服务器 频道

西安科大朱虎明:GPU编程需要统一的平台

   西安科大朱虎明:GPU编程需要统一的平台
进入高性能计算社区

  【IT168 专稿】“西安电子科技大学智能感知与图像理解教育部重点实验室成立已经近十年,包括计算智能研究室、机器学习研究室、智能生物信息研究中心、影像处理系统研究室、航天电子信息研究室等。学校从2005年开始,购买了第一套集群……”

  为进一步了解西安电子科技大学智能感知与图像理解教育部重点实验室在高性能计算方面的研究和应用情况,IT168记者采访了实验室的朱虎明老师。他介绍了实验室的基本情况,分享了在人才培养方面的心得和体会,并介绍了在高性能应用方面的经验和体会。

  “从2005年开始,在学校领导的支持下,我们购买了第一套集群,当时花了近三百万,当时用的刀片比较笨重,网络还用的是独立的交换机,2010年我们又买了一套新的集群,这套集群已经把网络做到背板上去了,这套集群花了近600万。”

  目前,随着GPU计算的发展,我们把研究往GPU上转,把原来的很耗时的方法往GPU上转。速度提高了很多,电费也节省了很多,这样算法也可以从实验室转到企业里面去使用。

  高性能计算的人才培养的经验?

  在谈到高性能计算的人才培养的时候,朱虎明表示要通过各种手段,让学生更加直接全面地了解高性能计算,产生对高性能计算的兴趣。

  “事实上,国家的各大高性能计算中心建成以后非常缺人才。我本身也开了一门高性能计算的课,里面从集群、并行技术,包括GPU技术都有涉及。学生们普遍还是感觉编程比较难,把高性能计算从开课、报告、会议,了解到高性能计算渗透到各个领域,学习起来就比较有劲。”

  高校的HPC集群的建设方式?

  高校的高性能计算集群的建设方式一般有两种,一种是集中是建设,各个学院通过远程登陆的方式去访问和使用;另一种是分布式建设,也就是各个应用学科分别建设自己的集群。朱虎明认为,分布式建设更能推动高性能计算的教育和应用。

  “高性能计算在高校中究竟应该集中式建设还是分布式建设?上海交大的林庆华博士曾经写过一篇文章——《高性能的分久必合合久必分》,集中式的优点就是省钱,大家买一套集群大家都来用,但是到底给谁用呢?集中式就没有人去推动它。向我们学校就单独在我们实验室放着,这样我就非常有动力让学生们近距离接触到集群,学生能亲眼看到它,这样也能促进学生的兴趣,相反如果通过远程登陆的方法,学生就会觉得集群是个虚无飘渺的东西。”

  电子工程学院的HPC集群上的两大应用——图像处理和数据挖掘

  电子工程学院的HPC集群上的应用主要有两块:一个就是数据挖掘,一个就是图像处理。

  图像处理方面,我们国家发了那么多卫星,一个卫星成象就几百兆,如果使用传统的串行算法可能要处理好几天,但是现在用集群或者是GPU来处理就需要几分钟甚至几秒钟就能算完,这样大大提高了处理速度,实时性更好,这对于地震、救灾的时候,就可以实时地把握情况。”

  数据挖掘方面,最热的就是互联网和云计算,互联网最大的特点就是海量的数据。大家知道Google、百度的数据量都是成百上千T,怎么在这些数据里面找到我们所需要的知识?Google、百度的搜索,有时候反馈的结果不是我们所需要的,有了这样的数据挖掘算法,就能提升检索的效果,让用户能尽快找到最想要的知识。

  这两类应用对于集群有没有一些比较特殊的需求?

  朱虎明表示,其实高性能计算有两个方向:计算复杂性和海量数据的处理。计算复杂性是希望把时间降下来。有些算法就是可能需要算很长时间但数据量不一定大,但是有些算法可能数据量很大,有些算法数据量又大算法复杂度又高,所以在采购集群的时候,就要考虑到底采用什么样的架构了,这就是对于高性能计算集群来说要权衡的一个方面了,到底是要强调数据量还是强调计算复杂性对我们来说可能是一个难题。

  研究过程中遇到的挑战和经验总结?

  朱虎明表示高性能计算机房的建设是一个很大的挑战,高性能计算在应用领域的推广将成为高性能计算接下来的主题。

  朱虎明介绍道,高性能计算这两年发展非常迅速,我们学校买了集群以后,又要考虑机房是否合格,散热怎么办?还要买空调,同时几十千瓦的用电量还要单独引线。所以机房的后期建设费了非常多的精力。

  另外一点,在高性能计算的推广方面。如何把高性能应用推广到其他的学科?这可能是高性能计算的下一个目标,可以通过一些课程、讨论版、企业的专家的演讲等等。

  最后,朱虎明表示,GPU技术有可以实现低功耗、高效率,但是引入GPU之后呢,编程确实成为一个问题,微软的有DirectCompute,NVIDA有CUDA,AMD等公司有OpenCL,用户现在到底用哪一个呢?如果能有一种工具能集成起来,让用户不要做选择就好了。所以编程的易用性方面还需要提供一个更好地GPU开发的平台。

  推荐阅读:《GPU解决方案:积木式构建的灵活性

                            高性能计算社区

0
相关文章