DARPA出手, Python有望成为大数据分析语言

Big-Data-on-cloud

当前, 在大数据领域, Java成为了当仁不让的必修语言。原因就是大数据平台必备的Hadoop分布式管理平台需要使用Java,但是这种局面有可能被DARPA改变。

IT经理网在“大数据成为美国军队的’新型武器’”一文中,报道过美国国防部下属的“国防高级研究项目署”(DARPA)通过XDATA项目进行大数据投资的情况。 最近, DARPA通过XDATA项目的基金投资Continuum Analytics,帮助其开发Python在大数据领域的数据处理和可视化能力。 XDATA这个计划的目的, 就是研究在对非完美及非完整数据集,进行海量数据处理和数据可视化的算法。 XDATA项目基金总共有1亿美元, 这次DARPA对Continuum Analytics的投资共计3百万美元。

Python是一个非常流行的编程语言, 无论在网络程序员中(比如Google的相当多的产品就是用Python编写的,Python也是豆瓣的主要开发语言), 还是在科学计算领域, Python都有很广泛的应用。而Continuum Analytics的目的, 就是要进行下一代数据分析工具的开发, 使得Python在数据分析领域的应用, 如同在科学, 工程和规模化计算方面那样强大。

Continuum Analytics的旗舰产品Anaconda是一个基于Disco平台的数据管理,分析和可视化的工具。而 Disco是一个最初由诺基亚开发的, 基于Python的分布式数据管理平台,可以作为以Java为基础的Hadoop平台的替代。

参考阅读:Hadoop过时,大数据泡沫将破裂

Anaconda支持流行的Python科学计算库如NumPy, SciPy和Pandas等。 此外, Continuum Analytics还推出了一个名为Wakari的产品, 这是一个基于浏览器的数据分析环境。 Continuum Analytics把它描述成为“科学, 工程和商业数据分析中的WordPress, Github和Youtube。”

而DARPA好像对Continuum Analytics参与的几个开源项目表现出了特别的兴趣。 这些项目包括 Blaze (使用Python代码在分布式系统上进行数据分析的技术), Bokeh(一个为大数据和多维度数据设计的基于HTML5的数据可视化库),以及Numba(Python编译器, 可以将Python代码编译成机器码从而加快计算速度)。

从DARPA的角度, XDATA项目的目的是研究基于海量数据的高性能计算和可视化。 因此, 像Continuum Analytics这样具备这样核心技术的公司, 就理所应当的成为投资目标。 而鉴于Python在开源社区,科学和工程领域的广泛应用。 通过投资Continuum Analytics, 也可以极大地扩大大数据分析的使用人群。同时也可以加强DARPA和开发者社区的进一步紧密合作来推动大数据分析的发展。

第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom

   

除非注明,本站文章均为原创或编译,未经许可严禁转载。

相关文章:


关于作者

        在TMT领域具有十余年的咨询和创业经验。 目前主要关注信息安全,同时密切关注云计算、社会化媒体、移动、企业2.0等领域的技术创新和商业价值。拥有美国麻省理工学院MBA学位和清华大学经济管理学院学士学位,曾任BDA中国公司高级顾问,服务过美国高通、英特尔、中国网通、SK电讯、及沃达丰等公司。联系邮件:wangmeng@ctocio.com