服务器 频道

Power7芯动力 IBM Watson挑战人类智慧

  【IT168 专稿】2011年2月 14日,已鏖战三回合的人机大战终于硝烟散尽,采用IBM Power750服务器的“沃森”(“Watson”)计算系统在美国最受欢迎的智力竞赛节目《危险边缘》(Jeopardy!)中,与该节目史上最强的两位答题高手连续三天同场竞技,争夺一百万美元奖金,最终沃森以多达3倍的悬殊比分完胜,赢得人类历史上第一次人机智力问答比赛的冠军!

Watson挑战人类智慧
▲IBM Watson参加《危险边缘》(Jeopardy!)节目现场

  这一竞赛结果再次让世人震惊,并联想到14年前的另一场经典的人机对战。1997年,国际象棋大师卡斯帕罗夫以2.5:3.5的比分输给了一台名叫“深蓝”(Deep Blue)的IBM RS/6000SP(基于POWER2架构)计算机,成为人工智能首次战胜人类智慧的经典案例。

  Watson挑战人类智慧

  IBM系统与科技部大中华区Power Systems服务器产品部总经理韩忠恒先生在媒体发布会现场揭示了Watson的智慧之道:Waston的核心优势可被概括为强大的处理能力和优化合理的搜索算法,基于IBM Power 750服务器组成的计算机群,以及非结构化文本分析及优化检索的DeepQA软件算法,Watson最终成为世界首台能够与人类回答问题的能力相匹敌的计算系统。

Watson挑战人类智慧
▲IBM系统与科技部大中华区Power Systems服务器产品部总经理韩忠恒先生

  《危险边缘》(Jeopardy!)是美国一档极受欢迎的智力竞赛节目,在美国主流电视台的黄金时间播出已经有几十年历史,与国内很多家喻户晓的智力问答节目相比,《危险边缘》是纯知识性智力竞赛的电视节目,不包括娱乐以及现场求助环节。在实际比赛中,机器需要处理人类语言所暗含的复杂微妙的具体涵义,精确的识别“反讽”“暗喻”“叙述”“疑问”等不同语气,准确识别问题的具体涵义,并在无法连入互联网的条件下检索相关答案回答问题,而这一切都需要在短短不到3秒钟时间内全部完成。

Watson挑战人类智慧
▲IBM中国研究院资深经理潘越先生

  IBM中国研究院资深经理潘越先生亲身参与了Watson系统的开发工作,潘越先生透露, 衡量Watson的取胜因素具体可包括4个指标:首先是覆盖率,意即Watson所储备的知识容量;其次是准确率,包括分析问题和检索答案的精确程度;此外,Watson还会根据所运算出的答案再次检索知识库中相匹配的答案,并运算出一定的信心指数,在信心指数不高的情况下,Watson会选择不抢答该题目;最后,由于《危险边缘》采用了抢答制度的挑战规则,Watson进行所有运算和决策的时间不能超过3秒。

  Power 7给力人工智能

  根据潘越先生介绍,Watson运算的步骤则包括了五个步骤:在一个问题提出之后,Watson会根据问题进行深度的句法分析,确定问题和答案的类型等等;第二步则会根据问句分析得到的关键词去搜索引擎搜索,并在内部知识库中检索到相关的文本和段落。第三步Watson会根据答案的要求类型,大段的文本与段落中精确的确定答案。

Power 7给力人工智能
▲沃森在比赛的时候并不需要接入互联网,而是利用多个算法应对竞赛中的挑战

  在完成以上一系列运算后,Watson还需要为答案寻找证据,把答案和关键词一起去搜索,寻找相匹配的证据;最后,Watson将对找到的证据做句法分析,找到模型并为答案打出信心指数,在信心指数较高的情况下,Watson将向外提供答案。实际上要求计算机在3秒内处理海量并发任务和数据的同时实时分析信息――检索大约2亿页的内容(约一百万册书籍的价值),分析数以百万计的信息碎片。

Power 7给力人工智能
Watson与搜索的不同之处在于,搜索的智能分析部分已经由人类完成,而Watson则需要根据问题的具体涵义智能分析判断搜索的关键词,并判断检索的结果是否正确,这一模拟人工分析的过程基于IBM"DeepQA"技术实现(深度开放域问答系统工程)

  仅仅是进行一次问答,Watson所涉及到的运算过程就已经极其庞大,所需要的硬件平台也必须“给力”。

Power 7给力人工智能
Watson硬件外观为10个机柜大小,共90台集群架构Power 750服务器组成,包括2880个Power 处理器内核,运行速度高达80万亿浮点

  Watson的硬件由10个机柜总共90台Power 750服务器组成,并组成集群架构,每台Power 750服务器配备四路八核32线程3.55GHz处理器,内存16TB,RAM为15兆字节。也就是说,该系统每个节点都装有四架POWER 7芯片,每芯片均为8核4线程。因此沃森的每个节点都包含128线程,相当于128台电脑。这就意味着沃森包含了2880个Power 处理器内核,运行速度高达80万亿浮点。

  Watson采用了Linux开放式操作系统。

  不仅仅是一场游戏

  Watson的研发历时4年,由25位IBM 科学家共同建造,八所大学参与系统开发。最早进行测试的时候,正确率只有30%左右,经过不断的优化和测试,最终达到了堪与人类智能相媲美的高级人工智能。

  不过韩忠恒先生在发布会现场强调,与上一代挑战人类智慧的计算系统“深蓝”不同,Watson的意义并不仅仅局限在电视问答这一类趣味游戏上,Watson构建在一个完全可商业化的架构下,并已经准备好将首先应用在医疗行业,用以代替人类实现医疗诊断。

  在《危险边缘》中,每个问题都需要沃森从海量信息中进行全面筛选,在这一点上,与其他任何商业性的智能信息搜索指令都是相通的,基于Watson强大的运算能力、所涉及的广泛领域和分析技术,未来在商业及社会应用领域具有很大的潜在价值。

  谈到Watson未来的商业化应用范围,韩忠恒先生告诉记者,Watson的应用范围极其广阔,包括医疗、旅游、保险、银行、商业应用等行业,企业内部包含有大量的数据和知识,在遇到具体问题并需要依据这些数据和知识提供解决方案时,Watson庞大的知识库已经强大的知识分析与索引能力,能够很好的帮助企业管理和利用数据。

  此外,Watson系统还提供了学习、语言处理记忆检索技术,经过信息和数据的重新组合,并结合其他分析工具,可以为企业提供更复杂的服务,例如一些商业智能,通过对大量数据进行分析,提供决策支持供人参考,使决策更加科学、准确。最后,沃森技术本身的高性能计算平台可以应用于其它各种各样领域。

  Power 750服务器已经在全球广泛地应用于处理复杂的分析和交易两种不同的工作负载,交易处理可以被想象成针对固定数据而采取的行动,这类工作负载主要靠缓存子系统,重点在于定位正确的信息。在缓存、内存和存储中,潜伏时间是最重要的;而分析工作负载更多地侧重数据之间的变换,在分析过程中,数据会迅速地在系统中移动。因此在分析系统中,带宽是最重要的。POWER7无论在潜伏时间上还是在带宽上都是行业领头羊,因此对于两种不同的工作负载来说都是较好的运行平台。

0
相关文章