【IT168 专稿】提到Watson,很多人的记忆会回到智力答题节目“Jeopardy!(危险边缘)”的现场,IBM公司的Watson(沃森)超级智能计算机在节目中击败人类一战成名。在2011 IBM Unix World大会上,Watson与国内的观众来了一次近距离接触,但对于大多数观众而言,看到的是Watson接受人类语言提问,然后用人类语言给出答案,同时保证一定的正确率,对Watson背后的技术和架构了解甚少,Watson“思考”的奥秘是什么?今天笔者带你揭开Watson背后的四大关键。
关键之一:智慧分析策略IBM DeepQA
《危险边缘》在美国广受欢迎,该档节目创立于1964年,节目问题涉及地理、政治、历史和体育等领域。熟悉该节目游戏规则的朋友都知道,选手答题规则并非简单的“一问一答”,而是抢对答对一题可以获得相对应的金钱,答错就要倒扣,且选手必须要以问句的方式给出答案。
基于以上的答题规则,Watson不仅要根据提问搜索出问题的答案,而且要根据答案的正确度来决定是否作答,因此除了基本的搜索能力,Watson还具备分析能力,也正是两者共同成就了Watson在不接入互联网的情况下,完成3秒内作答。
Watson“思考”并“答题”来源于一套决策架构——DeepQA,作为在Watson体内运行的软件,DeepQA问答系统也是Watson实现创举的核心,可以把它理解为Watson思考和回答问题的思路和方法。基于DeepQA 运算系统,Watson“思考”和“答题”的步骤可归纳为以下几步:在一个问题提出之后,Watson会根据问题进行深度的句法分析,确定问题和答案的类型等;然后根据问句分析得到的关键词去搜索引擎搜索,并在内部知识库中检索到相关的文本和段落;接着根据答案的要求类型,根据大段的文本与段落中精确的确定答案;在完成以上一系列运算后,Watson还需要为答案寻找证据,把答案和关键词一起去搜索,寻找相匹配的证据;最后,Watson将对找到的证据做句法分析,找到模型并为答案打出信心指数,在信心指数较高的情况下,Watson将向外提供答案。
▲
据了解,在最初的DeepQA架构的基础上,IBM将其与不同的商业应用相结合,并增加了应对医疗行业、企业搜索的特性,DeepQA的特性归纳如下:
1.覆盖率:Watson所储备的知识容量庞大。
2.准确率:利用海量并行计算来分析问题和检索答案的精确程度。
3.信心指数:Watson还会根据所运算出的答案再次检索知识库中相匹配的答案,并运算出一定的信心指数,在信心指数不高的情况下,Watson会选择不抢答该题目。
4.理解度:既能理解人类正式的深度语言,又能识别“反讽”、“疑问”等模糊的语气。