服务器 频道

曙光大数据发布会 公司总裁历军致辞

  【IT168 资讯】2013年5月30日,曙光公司在北京召开了以“数聚应用 价值新生”为主题的发布会,发布了新一代面向大数据应用的一体机产品。会上,曙光公司总裁历军进行致辞。

曙光大数据发布会 公司总裁历军致辞
曙光公司总裁历军

  历军:各位尊敬的领导,尊敬的来宾大家下午好,请允许我代表曙光公司,今天简单的向大家汇报一下,曙光在之前的几年,以及未来之后的几年里面,在大数据未来的应用方面的一些设想,以及我们的一些实际的操作的思路。

  我想这张PPT,实际上讲的大家都很清楚了,就是信息系统架构的演变。从我们过去的,以PC机、服务器和大型的后台数据库为核心的三层架构的传统的信息系统,在今天在应用信息系统,逐步的向右侧的图在转变。我们前一阶段看到一份报告,在之前发展的过程里面,我们这个PC机这个市场的销售量是持续的在提高。而可能在前年,这个PC机的销售量,和这个智能终端的销售量,变到这个智能终端持续的增长,PC机平稳回落的趋势。我们未来的信息系统应该是基于智能终端,基于大型的信息处理平台。这个信息处理平台带来挑战,就是数据越来越庞大,越来越杂乱无章,越来越没有价值。

  刚才在贵宾室里,我们杨司长就提到这样一个观点,说数据如果没有规则,就是一堆垃圾。而我们未来所谓的这个大数据的处理,大数据的应用,我想应该就是在这一堆垃圾当中,找到黄金。 而且我们相信,几乎所有的人都相信,在这一堆垃圾当中,有无数个黄金需要我们去挖掘。我想这个大数据的兴起,有了相当长的时间。随着智能终端以及各种状态信息飞速的产生。数据自然也是一个爆炸式的增长。

  我们只要看到一个右下角的小图表,中国一线的大型城市,仅仅健康档案的数据,一年就有5PB之多。那么一个智慧城市的数据,一个季度就是200PB之多,这在过去很难想象。我记得我们读书的时候,我们都用的是关系型数据库。在这样的情况下是不可能,很难想象能产生这么大规模,这么大量的数据。而今天现实就是这样的。这个数据已经产生了,而且还在不断的产生。

  移动互联网的用户,已经超过了4亿、5亿这样的量,所以每天产生了大量的数据,这些数据怎么办?如果是无序,就是垃圾,我觉得这个地球在信息方面再增加更多的垃圾。我想在业界所有人都有共识,要把这堆垃圾变得井井有条,从中去寻找金矿。

  在未来面对这么大一堆的垃圾,也是一个让人心烦的事,我们现在面临来自各方面的挑战。比如说数据的标准,在全球范围内,还没有一个完全统一的标准。这个数据的共享,有诸多的壁垒,简单的讲,有很多的城市云计算的中心,那么这些城市云计算中心面临一个非常重要的问题,就是各个行业,各个部门,各个门类的数据,他们之间存在着无形的墙。这些数据是分块、分区、分人,如果不打破这个数据共享的壁垒,我想这个所谓的大数据,还是一堆垃圾。

  同时从我们整个的IT体系来看,我们现在已经有了一些面向大量数据的存储,大量数据的一些分析的基本的系统和方案。但是由于这些数据的整合方面,存在着这些壁垒和障碍。在这些数据上,能够在这一堆看似垃圾、杂乱无章的数据当中,要找到金矿,还需要相当漫长的时间。

  同时这一堆垃圾里面到底有什么?在今天我们已经看到了一些。但是我认为,还有无穷多的这些有待开发的这个资源。我们在今天也许根本还没有看到。同时在这方面我们恐怕还需要更多的人才,更多的资源和资金投入到未来的对于大数据的处理、分析和挖掘的过程中来。

  那么我们面临这么多的挑战,这些挑战我相信我们这个IT技术就是这样,从无到有,有的时候可能就是一点点,然后需要一点点时间,逐步的积累。所以今天我想我们曙光所提出的有关的大数据的系统,对于这个大数据处理的一些想法,算是在业界我们提出了一些自己的想法。而且现在近期内都付诸实施。

  随着我们技术,随着我们的理解的不断增强,我们的技术不断的提高。可能过去我们看不到的一些金矿,逐步的会显示出来。

  我想曙光在这个大数据的产业链里面,有一个自身的定位。在最下面,由于这些智能终端产生了大量的数据,大量的应用。在这个应用和终端领域,这个并不是曙光作为一个信息系统的制造商,作为一个信息系统软件供应商的定位。我们相信这里有大量的应用软件和应用推广的企业、用户,在这个方面进行着不断的努力。我们将自身的定位,定位在基于这个云计算技术,而产生了这样大量数据处理的领域。

  大家可能都知道,曙光在之前的四年到五年,我们开始在国内投资建设云计算中心,同时开发了大量基于云计算技术的软件、硬件系统。那么在今天,拿我们位于江西无锡城市云计算中心为例。在这个云计算中心上面,已经跑着一百到两百,各个领域的应用。

  比如说科大、讯飞、这个语音识别的云,每一天就产生大量的语音的数据。而这些数据,这一百到两百的应用,每天产生非常巨大的数据量。而对我们来看,这些数据如何更好的保存。

  比如说我们在一个基于语音的时时交流的工具上,每一天产生大量的文字,大量的语音和大量的图片。这些图片是与日俱增的。这样与日俱增的形式,我觉得我们在今天看,今天我们说的话,十年以后我们的运营商还能不能给你提供这样的保障。你今天说的话,十年以后还能不能把这个历史记录找回来。

  我相信在今天这样的形势下,没有一家企业用昂贵的投资,用庞大的系统,保存大家聊天的信息。怎么办?一个是从信息系统的设计,软件的设计方面,让系统的成本进一步的降低。同时拿什么来支撑这个与日俱增的数据,以及需要与日俱增的资金来构建大规模的存储系统的费用和成本。我想可能这个大数据,对于数据的挖掘所产生的收入,用来弥补系统建设的成本。也许大家饭后的谈资,里面有很多有价值的信息。这些信息被分析出来之后,进行一些必要商业的应用,那么这些收入来支撑未来对于数据保存的资源投入。

  其实我们今天曙光所提出的所谓的大数据的支撑处理系统,首先的一个层面就是在这个大规模的数据的保存方面。我想在国家813计划的支持下,曙光经过了多年的努力,已经形成了一套非常完整,而且具有国际先进水平的这种大规模分布式的并行存储系统。这些系统已经在市场上有两三年的部署经验,证明是一套可靠的,高效的、低成本的这种大规模的存储系统。

  那么如果解决了这个存储的问题,当然存储还面临很多的问题,是不是带宽足够,存储的容量是否足够,每一个比特存储的成本是不是足够低。我想我们在前一个阶段,在存储的领域达到了国际的先进水平。

  我们现在每天都增加了大量的结构化的数据,非结构化的数据,或者是半结构化的数据,这样的数据需要我们进行一个统一分类整合、整理。把一些看似杂乱的数据,按照我们的一个标准,把它整理起来。这样的整理不一定把这些非结构化的数据,给它变成结构化或者半结构化,但是我想我们需要一个对数据的标准化的一个平台,不管什么样的数据,放到这个平台上,他有一个标准的方法。所有的人都可以快速的找到它、利用它,这也是曙光今天一体机的一个核心技术之一。

  另外数据整理过之后,是一个海量的,是一个无穷大的,可能一百亿条的数据库,如何快速的找到。我们曙光有多年的在处理信息抽取领域的技术,我们能够保证在现有的系统上,能够高速的加载这些数据,快速的找到在100亿条的数据里面,快速的找到我们需要的数据。

  最后形成一个分析决策,所谓的数据深度的挖掘,并不是曙光这样系统的厂商能提供,我们需要有更多的合作伙伴。比如说电信、银行建立更紧密的合作关系,基于我们这套系统,来开发未来更深度的数据,挖掘的服务。所以我想曙光的所谓大数据未来的一些发展方向,首先是数据的“落地”。先把它存起来,高效、低成本的存起来,然后基于我们当前的数据处理,数据标准化的软件系统,进行一个分析、简化、编布,让它更有序。

  第三基于这些数据快速的查找,同时快速的开发出面向实际的应用。在这个领域我们已经先前做了一些在这方面的探索。我们已经在地理信息、电子政务、智能交通等领域做的必要的尝试,实践证明是高效的、可靠的,能达到我们客户的期望。

  所以曙光的这个大数据战略,首先是基于未来大数据应用环境的一些硬件产品。比如说我们大规模存储系统,高速的数据查询系统,包括我们的DS900,这些高性能、低成本的存储系统。

  另外值得一提的就是爱用40的存储系统,这个系统也是在863计划的支持下。863计划的一个云存储系统,支持的高密度、低成本、高可靠性的大规模的基于硬盘的存储服务器。我想面向未来的这个低成本的数据存储,能够提供这样的整体产品。

  另外就是大数据的解决方案,就是刚才我提到的一些,我们不光把它存起来,还要快速的找到,还要整理,未来我们还要做一些必要的挖掘。所以面向未来的大数据的处理服务,我们也会在用户培训,应用迁移,开发支持、运维保障这方面有详细的计划。

  总之、希望做到平台一体,这个平台一体的概念,就是软件和硬件一体化。监控管理一体化,产品和服务一体化,多种类型数据处理的一体化。实际上对于未来的大数据应用,我们不应该看这是结构化,那是非结构化,而是有一个相同的平台,把各种类性的数据一次性的统一的处理。

  从应用的角度,我们也会非常重视行业细分的市场,根据我们的顾客的需求,为它量身定制非常适合这个行业应用的一体化的系统。能够使我们未来的大数据的开发、应用、挖掘,提供一个真正的让它落实的软、硬件一体化的平台。

  在这个产品开发方面我们强调产品的扩展性,因为数据与日俱增,我们现在的系统如果没有一个相当长期的对于这个可扩展性的诉求,按照我们今天的结构已经不能适应未来数据进一步的增长的需要。那么同时我们多年在超级计算机,大规模存储这方面,对于性能的优化能力,也是我们曙光拥有的特长。

  同时智能化、可靠性、应用型,其实和我们高性能计算机的那些指标是基本相同。所以我们今天推出这个基于大数据一体机的系统,等一下我们的邵宗有副总裁,会详细的介绍我们大数据一体化产品的内容。

  我们希望曙光能够提供一体化的,面向大数据处理的解决方案。从采集、存储、分析和平台一体化的提供,从设计、实施、验收、运维、端到端的交互。为我们的顾客,能够快速的形成一个基于他们的应用需求,和他们的应用需求紧密结合的大数据的存储和处理系统。

  我想我们在这个方面已经有了一套详细的计划,而且已经经过了一年半左右的验证,已经在国内的几个大型的应用领域,得到了实施和验证。

  从产品、解决方案,还有一个就是我们面向大数据处理的服务。包括应用、迁移、对于顾客的应用开发的支持,对它后期运维的保障,同时我们定义了我们自己的标准。提供了成熟的接口,以便于未来对于这个数据进一步的挖掘。

  曙光所谓的大数据未来的方向,它源于曙光云计算的战略。因为我们在四年前发布的曙光云计算战略,那时候我们就说要在国内大规模的建设我们的云计算中心,基于城市的信息系统,信息化,提供整体的解决方案和服务。

  这几年下来,在我们云计算技术的发展过程里面,取得了很多的成绩,很多成功的应用案例。而它引出来的,就是大量的无用的数据,占用大量的资源。所以我们又花了两年的时间,开发出基于XDate的大数据应用服务一体机的产品。

  首先就是为我们曙光的云计算中心未来提供数据的挖掘,数据分析的服务。同时我们一体化的产品,也希望能和各个细分的应用市场,能够紧密的结合。所以我们会推出很多面向金融的,面向电信的,面向智能交通的一些专用的大数据一体机的产品。大数据我想是未来曙光,从一个硬件的制造商,朝着这个信息系统供应商在转变过程里面的一个非常好的契机。

  我们希望曙光借助我们的云计算的平台技术,借助我们未来的数据分析处理的相关技术,把曙光从一个单纯的硬件制造商,变成一个真正的信息系统的供应商。这也是曙光十年前制定的这个战略,我们要成为中国最有价值的信息系统的供应商。也许今天就是我们这个战略落实的一个关键一步。所以我们希望借助这个信息技术的发展,借助我们这些曙光技术人员的长期不懈的努力。能给我们的客户提供更加完美,更加高效、可靠、低廉成本的IT系统。谢谢大家。

0
相关文章