服务器 频道

人机大战冠军Watson应战“大数据”时代

  “大数据”来袭!人机大战冠军Watson如何应战?

  作为IBM“智慧的运算”理念的重要支柱,Watson以其海量数据实时分析、负载优化系统方面的能力征服了全世界,下面将进一步分析Waston将有哪些法宝来助力企业应对“大数据”的挑战,抓住大数据的机遇。

  法宝之一:超强的自然语言理解能力。对于那些广泛使用分析应用的企业用户来说很重要这这一点很重要,过去,那些企业用户往往会被这类应用的复杂的接口所吓倒。Watson证明了通过自然语言与计算机的互交不再是科幻小说和好莱坞电影里的情节,其超强的自然语言理解技术完全可以根据自然语言上下文的内容和语境来准确理解词义。

  法宝之二:非结构化数据的处理。Watson是根据一些文本形式知识库来回答问题,这样的文本库是非结构化的信息,而不是基于结构化的知识库,这样的知识库可以使用知识表示语言(如CYC)来表示。在这一方面,Watson与Wolfram|Alpha等其他的问答系统有很大的不同。

  法宝之三:快速、高效地处理非结构化数据。尽管Waston在《危险边缘》节目中所分析的数据集相对于“大数据”的标准来说微不足道,但是,能够快速、高效地对非结构化数据进行分析是许多大数据分析情况中非常具有代表性的需求。很多时候,你不能确定需要对何种数据进行分析,不知道数据从哪里来,每一个数据集将会有多大,它是否干净,甚至不知道必须要在多久之内提供一个答案。

  法宝之四:基于文本的预测和分析算法。Waston目前使用了大量的预测模型来分析大数据,并且实时地得出结论。这是十分重要的一点,因为这为大数据的分析提供了另外一种很重要的方法。它与传统的Hadoop/MapReduce实现方式不同,不是一个单一的分析算法然后用MapReduce来适应一个大的数据集,而是使用了一些不同的预测和评估的算法。这些算法其中可能有一些是并行的,可以最大程度地发挥MapReduce的优势。这些基于文本的算法的应用对于IBM来说十分重要,因为它大部分的客户都面临着这样的数据(文本数据)。

  当然,在比赛中,沃森分析的数据都是比较干净的,现实生产中的“大数据”很少有这样干净的数据,IBM还需要用更加嘈杂的数据以及视频和音频数据来测试系统的性能。Watson未来将针对不同的行业应用推出负载优化的解决方案,如医疗、金融、呼叫中心等,届时IBM Watson将会真正成为“大数据”时代的英雄。

  了解智慧的运算更多详情可下载白皮书智慧的运算:下一个IT时代

 

0
相关文章