服务器 频道

进击FPGA 第二代分布式计算发端中国?

  【IT168 专稿】2015年在FPGA市场,发生了两件大事。其一,英特尔斥巨资167亿美金收购了Altera,这一举动无疑牵动了FPGA市场的神经,同时也让ARM阵营和由IBM牵头的OpenPOWER基金会感受到了压力。此举若站在英特尔的角度,最主要的因素可能是借助FPGA迎击来自移动芯片市场的ARM架构,亦同时扭转“摩尔定律”的节拍,让其重新回到自身熟悉的轨道。当然,任何战略性的调整,都不会不只有一个源动力,对英特尔如此,对于IBM亦然。

  第二件大事的主角是由OpenPOWER基金会主导,由China Hadoop大数据专家委员会、IBM、赛灵思、无锡中太和恒扬科技等发起成立的第二代分布式计算联盟(以下简称联盟),该联盟在2015年9月16日在北京正式宣布成立。距离英特尔收购Altera仅仅过去了三个月。需要特别指出的是,该联盟的发源地是在中国。

  众所周知,目前在服务器市场,POWER架构虽然还未对X86带来明显阻力,但随着OpenPOWER基金会的成立,使得众多的服务器厂商有了新的选择,随着OpenPOWER的不断壮大,基于OpenPOWER平台所推出的服务器产品已经在性能和成本方面释放出优势,这得益于OpenPOWER基金会的ISV硬件加速支持计划。OpenPOWER基金会的中国成员无锡中太是受益者之一,其RedPOWER服务器成为了可首批承载IBM的CAPI技术和FPGA卡的OpenPOWER服务器产品。

  起源背景

  虽然由FPGA所引发的竞争已经箭在弦上,但正如前文所述“任何战略的调整,都不会只有一个原因”。第二代分布式计算是在2014年5月,由IBM和OpenPOWER基金会共同提出,所谓“第二代”是基于第一代无上限扩容与软件定义的计算的理念,提出将在服务器内部应用做细致切分,然后再将“异构芯片”与“加速器”的技术加入其中。而联盟的成立,却与中国市场在云计算、大数据、物联网等领域庞大的应用场景和跃进式发展息息相关,首先从一个故事谈起。

  故事的亲历者有IBM大中华区科技合作部业务发展总监张思民、有赛灵思亚太区通信业务拓展高级经理梁晓明,当然也有来自中国ISV。根据张思民的描述,这次跨界沟通要早于英特尔收购Altera,所以即便是收购没有发生,联盟的成立也在计划之中;或许后来的收购,更加速了联盟成立的进度,抑或更加深了联盟在中国发起的决心。

  在2015年的4月份开始,IBM和赛灵思有了首次沟通,IBM告诉赛灵思什么是CAPI;而赛灵思告诉IBM什么是FPGA,而在张思民看来这次沟通显然缺少了什么?究其原因,对于IBM和其所倡导的OpenPOWER基金会而言,更熟悉生态的建设,FPGA技术或许会让张思民和他的团队听着有点“云里雾里”,但对于IBM的CAPI架构师和梁晓明在技术方面的碰撞却没有阻碍,但当赛灵思提到FPGA如何解决应用中的性能问题时,这开始让张思民和他的团队感到兴奋了,因为这个方案与IBM许多的合作伙伴在做Hadoop大数据方面所遇到的问题契合。

  于是,IBM研究院的CAPI工程师、赛灵思的架构师,以及IBM的合作伙伴一家从事大数据应用研发的中国厂商走在了一起。虽然这次IBM和赛灵思方面有了默契,但面对ISV,FPGA属于硬件编程范畴,根本与ISV所擅长的软件开发搭不上脉,怎么办?具体问题具体分析,从Hadoop大数据着手,ISV提出具体问题,赛灵思和IBM提出应对手段。

  而这个案例也成为了联盟的第一个解决方案。Hadoop大数据应用为了确保数据冗余,Hadoop架构要求每一份数据备份三份,那么将面临需要3倍的存储空间,而且无法在线实时备份,从存储角度的解决方法是通过擦出码技术将硬盘所需要的使用率从3倍降1.4倍,虽然存储的问题解决了,但CPU的使用率会超过99.9%来进行逻辑运算,如此高的使用比,显然CPU的处理能力已然分身乏术。

  怎么办?显然ISV所面临的大数据问题,如果只有IBM自己,或赛灵思自己,ISV自己都不可能独自解决。因为实现在一台服务器中将应用负载分流,首先要解决生态和技术障碍;生态方面,ISV没有FPGA的编程经验,赛灵思缺乏行业应用知识,IBM有CAPI技术也独木难支;技术上障碍来自FPGA和CAPI接口的应用编程问题。

  为了解决掉这个实际应用场景问题,生态的力量开始发挥,IBM和无锡中太推进服务器和CAPI的研发,赛灵思与恒扬科技研发FPGA卡,来共同为ISV提供解决方案。据悉,目前赛灵思与恒扬科技研发FPGA卡已经面世。

  因何发端中国

  可能有朋友会问,目前ICT主要的标准和体系主要还源于美国,为什么联盟却从中国市场发端?IBM中国研究院副院长、IBM杰出工程师邵凌从市场和技术角度是这样解读的,“首先市场因素是诱因,我们看到在中国市场,大数据、认知计算、物联网等等很多新兴应用在中国发展和传播速度很快,而且新业务需求明显,对应的应用驱动下就要匹配解决方案”。

  技术因素方面,邵凌认为技术创新的方向发生了改变,同时开源使得技术差距缩短,还有FPGA一直以来在通信领域被广泛认可,众所周知在通信领域最活跃的市场在中国。他指出,“目前半导体的创新已经到了瓶颈阶段,虽然中美之间还存在较大差距,但技术的创新正在从半导体创新向架构创新改变;其次,很多新兴的平台逐渐走向开源,如大数据领域的Spark、Hadoop等,系统级的KVM、Docker、OpenStack等,使得中美之间的软件技术能力在逐渐缩小;还有中国在通信市场的领跑,使得以华为、中兴等为代表的优秀企业自身储备了大量的人才,而FPGA是通信产业的关键点。”

  第一张满足大数据应用的CAPI FPGA卡诞生,也让IBM内部开始反思?IBM希望张思民去总部分享,并考虑如何将这种模式复制到美国、欧洲。中国作为第一个“吃螃蟹的人”,得益于中国海量的应用场景和互联网高速发展,这会激发无数的想象力。但张思民也冷静的提到,“CAPI的核心技术研发和基础技术研发的土壤依然在美国,人才储备和经验积累短时间还无法超越,底子问题需要理性面对。”

  无疑,中国市场拥有蓬勃的潜力,也同样面临基础技术底子薄、人才匮乏的尴尬处境;但这样的处境正在发生改变,当IBM将POWER芯片的整个代码贡献出来的时候,中国的合作伙伴成为基金会最重要生力军,累计数量已经超过20家。这可能也是联盟要发端中国的一个因素吧。

  吸引了谁?

  在联盟成立的现场,吸引了超过200+用户的目光。这里包括ISV、IDH、FPGA技术人员,行业用户,最具代表性的当属来自阿里巴巴、京东、新浪、美团等互联网的用户。新浪研发中心总经理童剑(童剑也是IT168的老朋友,他曾作为演讲嘉宾多次出席中国系统架构师大会,分享新浪的技术发展)认为,“FPGA的硬件加速技术改变了存粹用软件的方式去提升性能的革命性方法;联盟的成立更是消除了软硬件之间的间隙和距离,使得用户能够在整个系统中软硬兼施并互相融合,对改善整体性能有很大的促进。”

  童剑分享到新浪之所以对FPGA如此感兴趣的原因在于,“新浪微博对能提供应对互联网海量数据的解决方案十分渴望;首先新浪是拥有数亿计会员的互联网公司,每天生成的数据量庞大,以图片服务为例。每天在微博,用户上传的图片存储数据过亿,兼容不同客户端的图片格式有40多种,如缩略图,高清图,更高像素比的图片,也就是40多种格式的图片要存储,要进行实时压缩,目前大量的图片压缩处理通过x86服务承载,如果有新的技术一定会第一时间尝试;如谷歌提供的压缩格式WebP格式,如GPU压缩加速。而一直以来使用FPGA方案,我们试图尝试,但要求复杂的改造,之前我们还无法实现,但现在联盟的成立给我们提供了新的桥梁,给技术的创新带来可能。”

  诸多的用户和ISV都在现场认为联盟的成立是具有划时代意义的,这也是笔者为什么在开篇要引出2015年的FPGA市场,联盟成立是大事件之一。虽然这样的结论还为时尚早,但联盟发端中国,联盟开放的连接纽带,以及OpenPOWER基金会的前车之鉴等等因素,都不得不让人做出这样的判断。但真正的实质在于,因为CAPI的独有性和纽带作用,使得OpenPOWER处理器的内核、FPGA的加速能力,服务器一起,共同打通了第二代分布式计算平台。

  据悉,在联盟成立的当天组织了第一次工作会议,就联盟的注册、章程制定、运营细节和目标等进行了磋商。

  CAPI是联盟的实质?

  形式虽然重要但实质才是决定成功的关键。那么要实现第二代分布式计算,CAPI技术无疑是关键所在。这就不得不从技术和行业两个维度细细阐述。CAPI全称Coherent Accelerator Processor Interface(一致性加速器接口),CAPI只是个协议名称,物理连接依托于PCIe 3.0总线,关键组件通过它具备直接访问CPU的内存空间(一致性)的能力,从而大大提高了外设的运行效率,从而降低加速卡的开销,而起到加速的作用。

  为什么要引入CAPI?简而言之,随着数据量的激增,系统需要更强的硬件计算能力来满足处理需求。IBM全球杰出工程师Bruce Wile在联盟成立的主旨演讲中指出,“当计算机系统从单CPU系统进化到多CPU系统的时候,它的性能功耗比其实是在不断下降的。为了提升硬件处理能力,一个解决方案就是在CPU核上开辟多个硬件的线程,用这些线程来提高它的处理能力;另一个方案是引入GPU或FPGA,使用这些硬件来帮助系统处理数据,传统上GPU和FPGA都是以I/O设备的形式挂载在系统上,要使用这些I/O设备,就需要更多的技能,比如编程人员需要学习一些硬件的知识,需要懂得I/O设备的驱动,同时由于它们是I/O设备,没有和CPU共享内存,因此需要内核代码帮助它们做数据传输。”

  很显然前者,受到“摩尔定律”瓶颈的约束,已经面临新的拐点。而后者是从固件、操作系统、设备应用等多个角度来寻求解决问题的办法。所以处于IT链顶端的IBM和英特尔都选择了两个方向并行的策略,而IBM先一步拥有了CAPI。

  CAPI的工作原理和模式是怎样的呢?FPGA工作在协处理器模式,它就像第二个CPU核,FPGA上面的CAPI加速器就像一个固化在硬件上面的线程,它与软件是工作在多线程的模式下。CAPI可以使FPGA连接到计算系统上,通过给FPGA内嵌处理逻辑,让FPGA硬件和CPU上的软件共享虚拟的地址空间。CPU上的线程会产生数据,同时也会产生一个任务队列,在这个队列中可以定义指导FPGA上的硬件对这些数据进行操作。通过调用CPU上的软件,可以触发FPGA硬件去任务队列中获取任务描述,然后FPGA通过共享的存储空间来读取内存上的数据,并产生结果,而这些结果和数据都是可以被CPU上的软件直接访问。

进击FPGA 第二代分布式计算发端中国?
▲图:使用CAPI后会解决点传统FPGA加速的局限性,同时在处理器端和FPGA端所得到的工具和生态圈支持。

  “因为CAPI,硬件加速和应用软件的距离被拉近了”,IBM中国研究院资深研究员陈飞如是说。这样阐述的理由在于,如前文中童剑所述,也曾通过FPGA来实现加速,但当评估结果要对软件架构做出大幅改动时,新浪选择了放弃。而现在CAPI给了他们尝试的理由。

  陈飞指出,“CAPI最大的优势有三个方面,减少软硬件数据传输的开销,减少系统开发的工作量,同时对已有应用程序的改动小。”

  如果你认为以上的描述过于偏重技术逻辑,那么CAPI在癌症治疗、银行欺诈检测和零售业销售水平分析方面的案例,更能带给我们真切感受,癌症治疗光子模拟计算令人印象深刻。

  在癌症治疗中,有一个难题,当医生将药物注入到癌症细胞中来杀死癌细胞的同时,也会杀死正常细胞。为了让治疗更加安全高效,医疗行业需要模拟药物在人体生效的过程,传统模拟中,模拟大概两周时间来产生非常好的治疗方案。为了缩短治疗方案模拟的周期,IBM使用一种名为“蒙特卡罗”的模拟方法,模拟“光子吸收前在体内的散射情况,需要对这种行为进行建模并且模拟,每个光子大概需要1000多次循环,来模拟它在人体中的飞行,同时会有更多的光子需要在并行的被模拟。”

  于是CAPI和FPGA硬件有了用武之地。如使用传统的计算结构再加上FPGA的加速,可以获得4倍速度的提升,如使用CAPI与POWER8的组合,可以获得64倍性能的提升。模拟从两周缩小到两小时。

  进击FPGA

  面对英特尔在x86市场的绝对主导地位,争锋不如抓住机遇来的实在,OpenPOWER基金会和IBM应该深谙此理。一方面是万物互联的新机遇,一方面是对手在FPGA市场的破绽,抓住了才能为联盟赢得时间和空间,所以进击会更加主动。

  令深圳市恒扬科技股份有限公司总经理李浩一直苦恼的是,“做FPGA加速卡一直以来都是阳春白雪的领域,别人不知道也看不清楚,而联盟将能让FPGA行业获得更大的发展。”

进击FPGA 第二代分布式计算发端中国?
▲图:无锡中太和恒扬科技工作人员演示将FPGA板卡插入卡槽

  在联盟成立现场,恒扬科技展示其基于PCIe标准规格的NSA系列硬件FPGA加速卡,在不改变POWER服务器硬件配置、无需额外机架空间、无需额外结构支持、无需额外电源提供、无需额外被动散热的情况下即可简单安装使用,达到硬件松耦合。而且只需要十几瓦到六十瓦的功耗即可达到现有X86服务器三倍到上百倍应用性能的提升。

  在无锡中太服务器有限公司董事长王雪松眼中,“加入OpenPOWER基金会在带来挑战的同时,也让无锡中太发现了更多的创新点,尤其是跟软硬件结合的创新,而联盟使得这种结合更加紧密。”

  从李浩和王雪松的表达中,不难看出联盟正给他们带来更大的机遇。那IBM呢?面对英特尔的服务器芯片市场的主导地位,通常有两种选择,其一努力与X86缩小差距,其二是另辟蹊径。IBM显然是第二种选择的代表。

  张思民甚至用“革自己的命”来解释IBM进击FPGA的决绝。“IBM已经在做7纳米技术,而从7纳米到4纳米乃至更小,从商业的性价比角度来看已经不太大,推进下去比较困难。而市场的浪潮让我们无法再纠结于卖不卖服务器,用户选择服务器扩容,那么服务器承载的数据中心空间已经不足,计算跟不上,客观条件不允许,IBM只能选择革自己的命。”

  同时,联盟为加强FPGA独立开发商以及相关行业ISV之间的更好协作,推出了CAPI FPGA应用加速商城。该商城建立于IBM中国研究院打造的SuperVessel云平台上。SuperVessel云平台将为CAPI FPGA应用加速方案提供高隔离性、高稳定安全的云端开发和测试环境,帮助ISV更充分利用OpenPOWER先进的硬件架构,更方便快捷地进行FPGA应用加速方案的设计、编程和构建。

  结语:

  通过介绍,也许你会发觉信息量如此之大;而我想说的是,还有很多信息因篇幅原因,还未表尽。如Altera虽然被英特尔收购,但它却依然是OpenPOWER基金会的会员,CAPI也对Altera开放,现在是这样,未来呢?目前在国内,基于CAPI的FPGA加速卡远远还与市场的应用需求脱节,相信很多用户仍在举目翘盼。还有,虽然CAPI已经将软硬件的联合创新提供了桥梁,但兼容性的人才,可能依然是用户和联盟所面临的挑战之一。CAPI的“中国模式”会给全球FPGA市场带来怎样的深远影响。。。

0
相关文章