服务器 频道

“大数据”来袭!冠军Watson如何应战?

  【IT168 专稿】当我们在地铁上习惯性地拿起手机发几条微博的时候,当我们被一张又一张的美图迷乱了眼球的时候,当各式各样的网络拍客忙得热火朝天的时候……一个叫做“大数据(Big Data)”的名词不经意间在IT界走红,“大数据”的时代正在朝我们走来。

“大数据”时代企业面临着三大残酷现实
▲"大数据"时代走来

  所谓的“大数据”有两个方面的内涵——海量和非结构化。这并非一个很突然的变化,更不是一个很新鲜的趋势,那它究竟意味着什么?答案是——机遇。一方面,对于企业是一种机遇。企业可以基于现有的大量的数据、海量数据进行分析,并利用这些数据产生效益。另一方面,对一些特定领域的发展来说也是机遇。如医疗等领域,有着大量的文献、化验结果、病例等等,这些信息大部分以人类语言方式记录下来,通过对这些信息的挖掘,可以辅助医生作出正确的决策。

  当然,机遇与挑战并存,“大数据”对于企业来说也是如此。在谈Watson如何帮助企业应战“大数据”时代之前,首先需要了解“大数据”对于企业来说究竟意味着怎样严峻的挑战。

  “大数据”时代企业面临着三大严峻现实

  现实之一:海量

  IDC最新数字宇宙研究报告表明,到2020年,全球数据使用量预计暴增44倍,达到35.2ZB。35ZB是什么概念?(1ZB=1024EB=1048576PB=1073741824TB,1073741824TB*35=37580963840TB),也就是说全球大概需要376亿个1TB硬盘来存储数据。

  现实之二:非结构化

  相对于结构化数据(即行数据,存储在数据库里,可以用二维表结构来实现的数据)而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。

  据统计,企业中20%的数据是结构化的,80%是非结构化或半结构化的。当今世界结构化数据增长率大概是32%,而非结构化数据增长则是63%,至2012年,非结构化数据占有比例将达到互联网整个数据量的75%以上。

  现实之三:实时处理

  一项对全球CIO调查得出的结论表明:“通过对企业界搜集的大量数据进行实时分析,并从中获得启示,进而将这些启示转化为自身的竞争优势,对当今企业来说至关重要。”

  某证券公司的CIO在介绍公司对于数据实时处理的需求时曾经表示,上亿条数据的分析要在5秒钟内完成。

0
相关文章