服务器 频道

分析:买HPC 要先算投入产出比

科学计算案例:MIT现身说法

    MIT林肯实验室是美国国防部下的一个研发中心,由联邦政府提供资金支持。该实验室拥有一套600个处理器规模的企业级网格集群方案,其用户有200人。我们这里采用针对科学计算的BCR公式,其分子和分母数值为均值,该实验室每人一年的薪酬支出是20万美元,即平均每个工作小时可折算成100美元。

· 该系统每年可为200个用户节省的总时间是近36000个小时。节省时间= (系统使用时间)*(平均用户数)*(1-1/(平均每个任务所用的CPU数))。
· 为200个用户运算和模拟代码进行并行化的时间是近6200个小时。
· 每名用户学会使用系统的培训时间是4个小时,因此总的培训时间就是800小时。
· 平均每个任务的启动时间是10秒,每年有10000个并行任务需要启动,因此一年内总的启动时间是27.8个小时。
· 需要一名系统管理员,折算成2000个工作小时。
· 每年要购买200颗CPU(即100个双路服务器节点),每个节点的采购成本是5000美元,因此每年总采购成本是50万美元,相当于5000个工作小时。

    因此,BCR/生产力的计算结果如下:


     可见,一年相应的内部投资回报率(IRR)为160%,说明完全需要这样的HPC系统。

    实际上,HPC对MIT林肯实验室的作用也是相当明显的。比如,某位技术人员要对全美气象雷达进行改进性研究,如果在他自己的性能超强的台式机上进行运算和模拟,大约需要运行10个小时,他每天可以两次对计算过程进行调整或运行不同的数据:一次在白天工作时间,一次在晚上。而如果改用HPC系统,那么他需要培训一个上午来学会使用系统,然后下午对模拟代码进行并行化准备。接着在HPC系统上进行模拟,使用8-16颗CPU,通常运行时间少于一个小时。这样,每天他可以进行10-12次模拟,显然,这无疑会提高运算精度和运算效率,从而会给他自己的项目、赞助人乃至国家带来好处。

0
相关文章