大数据不等于大智慧

 

大数据是不错的概念,但“对的数据”才是关键所在。

 

casino games float: left; padding-top: 0px; border: 0px;” title=”Minority-Report” src=”https://www.ctocio.com/wp-content/uploads/2012/03/Minority-Report_thumb.jpg” alt=”Minority-Report” width=”129″ height=”167″ align=”left” border=”0″ />关于大数据的报道可谓铺天盖地。今天,计算机、传感器、社交网络、科学实验都在产生Petabytes级别的海量数据。但大数据的问题在于规模太大,种类太多,远远超出Oracle、SQL Server和DB2等传统关系型数据库的处理能力。通过Hadoop分布式数据文件系统和MapReduce处理能力,大数据已经可以被聚合管理,下一步是找到分析大数据的工具。

Andy Palmer是数据库连环创业家,先后创立过Vertica Systems(现被惠普收购)和VoltDB,同时还是Bluefin Lab,CloudSwitch(现被Verizon收购)和Recorded Future三家企业的创始董事。他认为大数据的关键问题在于“分析”。

”大数据的真正价值在于大分析。大数据领域真正吸引人的公司都是那些攻克分析难题的公司“,Palmer认为:”我相信大数据本身就是一种工具,更多的其实是指大分析,一旦你完成了大数据的聚合,接下来的工作就是用大分析解答难题。“

大数据分析和可视化工具的兴起证实了palmer的判断。Splunk上个月已经进入IPO申请程序,Tableau也在路上。另外一个分析提供商QlikView去年夏天已经上市,开盘来股价已经翻了一番。这些公司的业务都是提供大数据分析相关服务。

市场目前非常迫切需要能够处理多为数据阵列——例如那些来自航天和科学实验的数据集的数据库技术,Palmer认为:“当你在传统数据库中展现这些数据,就会损失这些数据的一些天然属性。如果你将很多数据集成在一起,最终这些数据看上去像一个超大的阵列,在传统数据库中表示数据阵列是非常不自然的做法。”

另外一家不可忽视的公司是Paradigm4,该公司也在攻克大数据的分析难题。过去一些数据库厂商有办法把新的工作负载裁剪后装入关系型数据库,例如十几年前出现了一些创新的对象数据库厂商如Object Design、Ontos等。今天这些公司虽然都消失了,但是新出现的大数据厂商都或多或少在数据库中增加了“对象能力”。

Palmer认为类似的事情将不会在大数据领域再次发生——大数据需要全新的工具,试图用传统数据库处理大数据的成本和资源需求太高。这也是为什么Oracle这样的厂商会推出专门的大数据产品。

大数据本身毫无意义,除非能够通过正确的分析工具进行处理,并且有合适的人才了解大数据能提供什么样的分析结果。

 

Via GigaOM

第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom

   

除非注明,本站文章均为原创或编译,未经许可严禁转载。

相关文章:
标签:


关于作者

主要关注社会化商务时代的客户关系管理、业务流程管理、数据挖掘、商业智能和企业协作等领域的新技术、新应用和新趋势。曾长期从事信息化咨询服务和软件开发工作,服务过首都机场、国家电网公司、中国蓝星等企业。邮箱:guanzhigang@ctocio.com