服务器 频道

Watson来临 你该知道的四大关键

  【IT168 专稿】提到Watson,很多人的记忆会回到智力答题节目“Jeopardy!(危险边缘)”的现场,IBM公司的Watson(沃森)超级智能计算机在节目中击败人类一战成名。在2011 IBM Unix World大会上,Watson与国内的观众来了一次近距离接触,但对于大多数观众而言,看到的是Watson接受人类语言提问,然后用人类语言给出答案,同时保证一定的正确率,对Watson背后的技术和架构了解甚少,Watson“思考”的奥秘是什么?今天笔者带你揭开Watson背后的四大关键。

  关键之一:智慧分析策略IBM DeepQA

  《危险边缘》在美国广受欢迎,该档节目创立于1964年,节目问题涉及地理、政治、历史和体育等领域。熟悉该节目游戏规则的朋友都知道,选手答题规则并非简单的“一问一答”,而是抢对答对一题可以获得相对应的金钱,答错就要倒扣,且选手必须要以问句的方式给出答案。

  基于以上的答题规则,Watson不仅要根据提问搜索出问题的答案,而且要根据答案的正确度来决定是否作答,因此除了基本的搜索能力,Watson还具备分析能力,也正是两者共同成就了Watson在不接入互联网的情况下,完成3秒内作答。

  Watson“思考”并“答题”来源于一套决策架构——DeepQA,作为在Watson体内运行的软件,DeepQA问答系统也是Watson实现创举的核心,可以把它理解为Watson思考和回答问题的思路和方法。基于DeepQA 运算系统,Watson“思考”和“答题”的步骤可归纳为以下几步:在一个问题提出之后,Watson会根据问题进行深度的句法分析,确定问题和答案的类型等;然后根据问句分析得到的关键词去搜索引擎搜索,并在内部知识库中检索到相关的文本和段落;接着根据答案的要求类型,根据大段的文本与段落中精确的确定答案;在完成以上一系列运算后,Watson还需要为答案寻找证据,把答案和关键词一起去搜索,寻找相匹配的证据;最后,Watson将对找到的证据做句法分析,找到模型并为答案打出信心指数,在信心指数较高的情况下,Watson将向外提供答案。

 

关键之一:智慧分析策略IBM DeepQA

  据了解,在最初的DeepQA架构的基础上,IBM将其与不同的商业应用相结合,并增加了应对医疗行业、企业搜索的特性,DeepQA的特性归纳如下:

  1.覆盖率:Watson所储备的知识容量庞大。

  2.准确率:利用海量并行计算来分析问题和检索答案的精确程度。

  3.信心指数:Watson还会根据所运算出的答案再次检索知识库中相匹配的答案,并运算出一定的信心指数,在信心指数不高的情况下,Watson会选择不抢答该题目。

  4.理解度:既能理解人类正式的深度语言,又能识别“反讽”、“疑问”等模糊的语气。

  关键之二:强劲的智能动力Power7

  既然将DeepQA比作Watson的思考方式,那什么是Watson思考的大脑呢?在硬件方面,Watson是由90台Power 750服务器组成,每台Power 750服务器配备四路八核Power7处理器,使得Watson总共有2880个Power7内核。这也使得Power7当之无愧地成为Watson思考的大脑。

  在系统架构设计上,Power7采用一个有效的平衡技术,可以保证每个芯片的内核分摊计算任务。Power7一个内核主频3.55 GHZ,可以保证每秒钟500Gb的带宽吞吐。所以Watson 90台Power750服务器共有360个CPU,可以每秒钟可以完成180,000 Gb的计算量。

 

关键之二:强劲的智能动力Power7
▲基于Power7的Power750服务器

  Power7无论在潜伏时间上还是在带宽上都极具优越性,八核的设计很好地满足了Watson大规模并行计算分析的要求,因此也成为运行大型计算负载的较好平台。基于支持关键大型业务运行的稳定性,Power 750服务器也已经在全球广泛地应用于复杂分析和交易的工作负载。

  关键之三:Watson能带来什么?

  毫无疑问,IBM研发Watson的目的不仅仅是用来答题,而且从一开始,IBM就为Watson设定了明确的商业路线,Watson在很多应用领域极具潜力,包括医疗、旅游、保险、银行、商业应用等行业。具备大量数据的企业,在遇到具体问题并需要依据这些数据提供决策时,Watson庞大的知识库以及强大的知识分析与索引能力,能够很好的帮助企业管理和利用数据。Watson为企业带来的价值体现在以下方面:

  更好地理解用户

  基于DeepQA技术的工具将向人们提供信息收集和决策支持。以客户关系管理(CRM)为例,当需要迅速回应客户的问题并对问题进行提交和分类的时候,基于DeepQA的工具可以帮助更好地理解并接受自然语言。DeepQA将帮助更好的理解用户,比如在教育领域。

  更高效地制定决策

  与人类相比,Watson的DeepQA可快速地对数据进行收集和评估。比如在对患者的诊断过程中,Watson可以向医生提示遗漏的药品,或者Watson可根据诊断情况提供几个相应的诊断分析,并由医生确定出最优的诊断分析。

  除了在医疗领域,随着全球经济的高度互通,金融数据正快速膨胀,Watson的深度分析能力将有助于金融企业从堆积如山的数据量中索取关键性数据,及时掌握信息,并作出正确的财务决策。

  改变客户服务

  虽然以上提到了Watson在教育行业和医疗行业的应用,但是不少人觉得Watson会最早应用于客服中心,取代人工应答,它甚至可能将彻底改变客户中心的商业模型。

  预测风险

  对金融等大型企业而言,任何一项系统风险都有可能带来致命的灾难,而Watson强大的分析能力能快速锁定风险的源头,及时规避风险。

  以上提到的在教育、医疗、金融行业的应用相信还只是Watson走向应用的一部分,而随着大数据和在线应用越来越多,Watson的DeepQA技术和处理能力也会带来更多获取数据的新方法。

  关键之四:Watson Box

  Power Watson Box是为OLAP(联机分析处理)数据仓库应用专门优化的解决方案,由优化的Power服务器配置DB2 InfoSphere Warehouse 9.7及Cognos 10 BI Server构成。Watson Box能够在强大稳定的系统性能支持下提供海量运算和处理能力,IBM系统软件、数据库、中间件、应用软件和硬件系统的优化确保系统准确实时的响应。

  Watson Box关键构件包括:

  POWER7

  POWER7具备多核多线程、无瓶颈IO内存带宽,均衡系统体系架构;其虚拟化功能灵活,无虚拟机大小限制,无虚拟化性能代价;均衡系统设计,自动优化系统或虚拟机的工作负载性能及容量;在能耗降低20%的同时,性能提升3倍,利用率更高、能耗更低;有计划的系统中断,并保持程序运行,从而提供连续可用性;服务器和虚拟化管理与网络和存储管理相集成,完全掌控资源;同步支持1024线程,以IBM中间件透明地利用高度并行线程,无需更改应用程序。

  DB2

  新版DB2软件是首款能够同时为关系型数据和XML数据提供业务分析功能的数据库软件。它可使企业更充分地利用硬件、提高管理效率、轻松运行用其它数据库软件编写的应用,并从有价值的XML数据中生成“新锐洞察”。

  此外,只需要很少的技能和培训就可以使用户的系统高速运行,易于配置。它包含用于简化数据分析和数据挖掘的工具,并集成数据管理方案,帮助迅速地开发和部署应用。值得一提的是,DB2 9.7还具有工作负载管理和自动计算特性,可提升高优先级应用(如完成季度财务报告,帮助IT员工更高效地管理不断增长的数据)的性能,节约35% 的行政工作时间。

  Cognos

  Cognos将全部功能集中到统一的产品和统一的架构,具有完备的BI能力,面向所有用户,覆盖全部数据,不仅可以为业务人员提供业务报表展现,也可以为高层管理人员提供立体直观的综合信息,为战略决策者提供战略层次的信息视图。

0
相关文章