【IT168 专稿】11月29日,曙光投资千万元建设的“曙光服务器应用体验中心”宣告启用,并正式对外开放。这个计算规模达3.1万亿次、存储规模达到20T的体验中心承担了曙光产品研发、方案优化、应用测试和用户体验等多重功能。IT168记者现场参观了体验中心,并对曙光技术支持中心总经理邵宗有进行了采访。
京城媒体记者现场直击体验中心
花费千万,建体验中心,为何?
据了解,曙光服务器应用体验中心由HPC性能评测和应用体验区、PC服务器性能评测和应用体验区、曙光VIP用户系统监控和管理服务区等三部分构成。主体软硬设备包括由128个双路双核节点、4个四路双核节点和2个8路双核节点组成的PC服务器机群,计算能力可达每秒3.1万亿次浮点运算,并配置了20TB存储、百千兆以太网和Infiniband高性能网络。操作系统则以Linux和Windows(WCCS)为主,铺以SUN的Solaris。另外,还部署了曙光DCOS+PBS+PVFS等机群软件。
邵宗有介绍说,该中心总投资达一千万元,计算规模是部署在上海超算中心的曙光4000A的三分之一,在最新的国内高性能计算机TOP100排行榜中列第23位,也是目前国内部署微软WCCS的一套最大规模机群。
那么,曙光为什么花这么多钱和心力来建设如此大规模的体验中心呢?
对此,邵宗有解释说,“曙光服务超越战略的需要,用户采购HPC的方式和目的日渐成熟,高专委、高标委以及众多合作伙伴的需要等多重原因促成了体验中心的建立。”
1)落实服务器超越战略
早在今年8月份,曙光发布了“服务超越新战略”,当时推出了5年原厂商免费售后服务标准,而“打造专家咨询型的售前队伍”和“建立曙光服务器应用体验中心”则是进一步落实该战略的另外两大步骤。
邵宗有表示,“在高端核心应用领域,硬件采购成本一般只占到总拥有成本的20-30%,而售前、售中和售后过程中的服务费用却占了一大半,同时服务也是用户使用好IT系统的关键因素。为了做到售前方案的合理性、售中实施的快速专业和售后服务的及时完备,厂商就需要有一支非常专业的队伍,整天跟这些应用摸爬滚打在一起。”据了解,曙光10月份正式组建了领域首席工程师团队,目前已经有包括石油、气象、物理、化学、基因、图形图像处理、数据库等领域的20名首席工程师到位,未来三年这支队伍会扩大到50人。
“除了有一支整天跟各种应用摸爬滚打在一起的人员队伍,还需要为这支队伍提供一个可以研究各种应用的测试环境,这是体验中心成立的首要目的。”邵宗有对记者说。
曙光技术工程师赵崇山在演示HPC应用测试过程
“曙光HPC未来都会以解决方案的形式提供给用户,而不仅仅是销售硬件,但要出台优秀的方案,就必须进行很详细的测试。比如我们采用32个节点、Windows操作系统、MC软件,来模拟飞机在空中飞行过程中的有限元状态,这个过程需要多长时间,这些都需要给出一个很好的答案,用户才能购买Total Solution。这些方案会在领域首席工程师的带领下进行制订并在全国推广。”
邵宗有表示,“目前围绕应用来做的HPC服务是曙光高性能计算机业务最最重要的核心竞争力。而不是以往我们提得比较多的技术领先和价格低廉。因为现在用户的需求集中在买什么样的高性能计算机并且能用好它。”
2)应用和好用性成HPC市场焦点
“跟过去不同,采购HPC的用户不再是仅仅关注峰值、效率和价格,应用和好用性是未来HPC市场必须关注的两大问题,并且会决定着用户的采购行为。”邵宗有认为这种趋势变化值得曙光花大力气研究。
从全球TOP500的分布来看,部门级和中小企业级的机群系统增长非常迅速,HPC平民化时代已经到来,这些中低端用户大多趋向于购买32个节点或64位节点的中小规模机群,主要目的就是为了实际应用。 “这说明应用是用户采购HPC的决定性因素。”
“虽然在TOP500中Linux HPC占据了主流地位,但微软今年发布了首个针对HPC的Windows操作系统WCCS,这说明应用和好用性是HPC的一个趋势。我们相信未来WCCS的份额会越来越多,就象三年前对待AMD的皓龙一样,曙光要牢牢把握住WCCS的机会,因此我们的体验中心也兼容WCCS的操作系统。”
X86服务器的迅速增长和Cluster占据国外TOP500和国内TOP100的主流地位,也说明HPC在朝标准化和好用性方向发展。“曙光作为国内HPC和服务器的领导厂商,必须承担起为用户提供演试环境和评测环境的责任,而且我们也有能力做这个事情。”据最新HPC TOP100显示,曙光占据了25%的份额,仅次于HP。
2)用户采购HPC的方式发生变化
用户对HPC应用和好用性的关注也导致了用户采购方式的变化。在过去相当长的一段时间内,用户采购HPC几乎只认品牌,认为品牌是一切的保障。但近两年,这种情况已经发生了变化。“方案+考察+测试”已经成为用户购买HPC的3部曲。
邵宗有解释说,“一方面是优先采购国产品牌的不可逆转的大潮,另一方面,很多用户对国产品牌还存有顾虑,担心产品和服务的品质。因此,很多用户在实际采购过程中,都强调整体解决方案,强调应用测试和体验,强调对厂商技术和服务实力的现场考察。”
为了打消用户对国产品牌的疑虑,曙光其实去年4月就建立了一个64个节点的HPC测试实验室,计算规模为5000亿次,迄今已累计提供了近两百次应用方案测试。“但原来的系统已经明显不够用,需要大规模扩容。”
3)AMD、Microsoft等合作伙伴的需要
据悉,中国2005年销售高性能服务器共计近50万台,销售金额接近170亿元,其年复合增长率高达10%以上。从中国HPC TOP100来看,去年位于榜尾的机器只有三四千亿次的规模,而今年已经增长到了7千亿次,翻了一倍之多。国内HPC市场的快速发展也为芯片、操作系统、应用软件等厂商也带来了巨大的商机。
“AMD、Microsoft、ORACLE、HPC软件等厂商都希望国内有一套可以演试的大规模HPC环境,但又不可能每家都去建一个,而曙光正好有需要、也有实力去搭建这样的环境。”邵宗有还透露说,在建设体验中心的过程中,合作伙伴提供了不少赞助。
体验中心门口挂了五块牌子
记者在体验中心门口看到了五块牌子——曙光服务器应用体验中心、曙光-AMD服务器技术实验室、曙光微软软件技术评测实验室、中国计算机学会高性能计算专业委员会(CCF HPCTC)性能评测实验室(筹)和信息产业部高性能计算标准委员会(HPCSC)标准评测实验室(筹)。
多重角色,承载太多重任
“从功能上,体验中心主要可以划分成三大块,既可以针对数据库、石油、气象等20多种应用进行HPC性能评测和应用体验,也可以针对信息服务各领域、TPCC、TPCH、SPEC等进行PC服务器的性能评测和应用体验,另外还有曙光VIP用户系统监控服务体验区。”邵宗有介绍说。
1)HPC性能评测和应用体验区
HPC性能评测和应用体验区是整个体验中心的核心部分
HPC性能评测和应用体验区是整个体验中心的核心部分,可以进行HPC的BENCHMARK性能评估,石油、气象等20多种应用方案测试体验,以及针对PVFS、lustre、LSF、PBSPro、其他机群操作系统、oracle RAC等机群软件进行测试与评价。“我们对选定领域的90%以上的软件都会进行研究和优化。”邵宗有对此充满信心。
目前的HPC应用领域和相关软件列表 | ||
1 |
性能评估 |
LINPACK、HPCC、NPB等等 |
2 |
石油领域 |
Geoeast、paradigm、cgg、omega、VSS |
3 |
气象领域 |
MM5、Grapes、WRF |
4 |
有限元领域 |
Ansys、LS_Dyna、MSC |
5 |
流体力学 |
fluent、CFX、Star_CD |
6 |
结构力学 |
ABAQUS、NASTRAN |
7 |
物理化学 |
VASP、Gaussian |
8 |
材料化学 |
Materials Studio |
9 |
分子动力学 |
NAMD、GROWMACS、AMBER |
10 |
生物计算 |
BLAST、FASTA、MEME |
11 |
并行文件系统和数据库 |
DCFS2、PVFS2、Lustre、Oracle RAC |
12 |
机群管理和监控系统 |
DCOS、DCMMII、Rocks、OSCAR |
“有了这个中心,我们以后就可以根据不同应用对英特尔和AMD两个平台进行对比测试,并且用户可以亲眼看到。”
PC服务器性能评测和应用体验区主要用于PC服务器的应用性能评估研究和用户应用体验,可采用SPEC、TPC-C/TPC-H、IOZone、IOMeter、Netperf等通用标准测试工具对服务器进行性能评测,也可以对CPU、内存、硬盘、网络、RAID等主要部件进行评测和性能分析。
3)曙光VIP用户系统监控服务体验
体验中心还设立了独立的监控中心,“可以协助VIP用户监控和管理其部署在外地的系统,这对于采购大规模系统的用户来说很有吸引力。”
曙光VIP用户系统监控服务体验区
由于有些用户的系统在某些时间段内需要厂商技术人员进行实时监控,如神舟飞船发射过程中要保障系统的稳定运行;另外有些大规模系统的用户需要厂商协助管理和维护,如中石油东方地球物理公司分布在全球的20多台曙光机群。
而在体验中心,在用户的要求和许可下,曙光的技术工程师可以通过远程一体化网格监控系统DCMM2对异地的机群系统进行实时监控,或通过SKVM over IP图形化管理、使用和维修外地的机群系统。
4)对合作伙伴的产品进行测试
从通常意义来说,HPC是一种集成性的产品,包括了服务器节点机、存储、网络、交换机等多种硬件,以及操作系统和应用软件。因此,该体验中心在对合作伙伴产品的yes-ready评测方面还会发挥作用,可以进行应用软件、操作系统、HPC配套硬件、曙光机群软件的兼容性和性能评测。
“虽然我们还控制不了友商的产品品质,但我们可以根据测试结果来决定是否采用友商的产品,从而规范曙光的部件采购,以整体提高曙光HPC的品质。”
除了上述几方面的作用外,邵宗有还表示,体验中心也是曙光5000百万亿次超级计算机软件研发、硬件兼容性测试和性能预评估的平台,同时也是高性能计算专家委员会(HPCTC)的计算服务平台和信息产业部高性能计算标准化委员会针对一系列高性能计算标准的验证平台。