服务器 频道

英特尔Hadoop解决方案与应用案例分析

        【IT168 资讯】一年一度的英特尔高性能计算研讨会第六届会议于7月5日至7月8日在南京举行。自2007年首届至今,英特尔(中国)已经成功举办了五届英特尔高性能计算研讨会。该研讨会不仅已经成为英特尔的一项传统会议,而且在中国能源领域成为高性能计算需求和发展的风向标。会上,来自英特尔研究院的王晓栋先生讲解了英特尔Hadoop对于行业的应用解决方案和案例。

英特尔Hadoop解决方案与应用案例分析
英特尔研究院的王晓栋先生

  据介绍,英特尔在2007年开始进入Hadoop领域,帮助用户解决海量计算的问题。从构架来说,Hadoop提出了分区模式,解决了存储和计算的问题,对于英特尔构架的设备来说使用X86系统就可以完全解决计算方面的问题,同时机架服务器的所自带的硬盘也可以解决存储方面的问题。首先是解决了存储的问题,并行的多台服务器提供了近乎线性的增长模式,而且会有针对性的计算能力(移动计算会比移动存储更方便),解决了I/O的瓶颈问题。其次是冗余的方式,一般会将数据分配为3份,所以当某一服务器出现问题的时候,并不影响计算中的数据丢失。对于热点数据,可以进行并行计算,节省等待的时间。此外,冗余的不仅仅是数据,还有服务器——当某一台服务器遇到故障的时候,可以实时的在其他服务器上进行计算。

英特尔Hadoop解决方案与应用案例分析

  谈到HDFS,也就是分布式的文件系统时,王先生谈到了它的几点好处——高可靠性、高恢复性和自修复功能。所以来说,所有的数据都可以保存在整个集群当中,避免数据的丢失,适合数据密集型的计算。对于开发者和使用者来说,目前英特尔Hadoop发行版已经开始使用,同时提供了英特尔自家的管理和监控软件。英特尔还可以实现配置的完整化,根据计算任务的不同进行调整,可以在管理软件中配置不同的优化模式,及时进行调整。保证不同的计算任务可以切换任务模型,解决整个集群动态适合不同任务的需要,而数据则可以永久的保存,保证集群的可用性和效率。

英特尔Hadoop解决方案与应用案例分析

  从2010年开始英特尔开始推广Hadoop系统,但是由于客户需求的旺盛,王先生重点谈到了当今在电信行业(中国联通)的应用案例。通过英特尔Hadoop可以将原本3个月的存储数据时间提升到1年,包括用户的使用情况、网络负载等众多内容。同样在交通行业,英特尔Hadoop也有广泛的应用。这里,Hadoop主要用于计算和存储交通行业的探头、传感器结构化数据,比如车牌、车速等内容;非结构化数据则可以存储照片、影像等信息,可以实现图片和视频搜索。

  谈到英特尔Hadoop,王先生举了一个简单的比喻:Linux和RedHat。因为传统的Hadoop需要人工编译、升级等内容,英特尔Hadoop的推出给予了用户更好、更完整的应用平台,而且加上英特尔的优化和辅助软件,相比传统的Hadoop模型来说已经有了非常大的升级。

0
相关文章