Hive开发者创业大数据，提供Hadoop按需服务

作者：关志刚
2012年06月07日
动态, 大数据

Qubole创始人：Ashish Thusoo

Facebook团队中开发Hadoop查询语言Hive的两位关键人物——Ashish Thusoo和Joydeep Sen Sarma，今日启动了他们自己的大数据创业公司Qubole。据悉，Qubole将提供可管理的Hive服务，托管在亚马逊的AWS云计算平台上。

Qubole的创业团队阵容豪华，都有很强的数据分析背景，除了开发Hive的两位创始人外，还包括Oracle Exalytics平台和并行数据库技术的架构者Shrikanth Shankar。

两位创始人Thusoo和Sarma与2007年同时进入Facebook，离开前已是数据架构团队的高级主管，在他们的努力下Facebook的Hadoop集群规模超过了25PB（目前已经超过30PB）。期间Thusoo还在Apache软件基金会兼任Hive项目的主管。Hive是基于Hadoop之上的框架和附属查询语言，通过Hive人们可以像使用传统SQL数据仓库那样使用Hadoop系统。

Qubole的创业灵感来自Facebook数据架构团队的挑战——让所有Facebook用户能无需中转直接访问他们想要的数据。为了达成这个目标，Qubole在用户和数据基础架构之间搭起一个抽象层。

用户在分析存储在亚马逊S3云中的数据集时，无需了解Hadoop系统管理，Qubole提供的Hadoop服务能够根据用户的工作负载动态调整服务器资源配置，实现随需计算，对于用户来说，这大大简化了大数据应用的复杂性，而且成本更低。

过去，人们通常认为基于云计算的大数据应用在性能无法与物理系统媲美。Thusoo表示Qubole的产品整合了很多专门的缓存设计，查询速度是普通云计算Hadoop的五倍，而且用户还能根据需要随时变更任务实例类型。例如，默认的实例类型是亚马逊EC2 High-Memory Extra Large，而内存密集型的任务可以选择在High-Memory Quadruple Extra Large实例上运行以获得更高性能。

Qubole完成的一个查询任务截图

Qubole的另外一个特点是能够预先在一小块数据中运行查询，然后再发送到Hadoop集群，这有助于避免由于查询本身的bug而浪费时间和金钱。

虽然Qubole目前专注于Hive界面的定位很独特，但是Hadoop云计算的选择还有很多，创业公司如Infochimps和Mortar Data，甚至微软也在试图解决Hadoop集群管理的复杂性和高成本问题。那些希望获得系统级别控制的用户可以选择亚马逊的弹性云MapReduce服务，或者在云服务器上部署一个Hadoop发行版本。


第一时间获取面向IT决策者的独家深度资讯，敬请关注IT经理网微信号：ctociocom


   除非注明，本站文章均为原创或编译，未经许可严禁转载。


相关文章：


                    Cloudera将被私有化，Hadoop时代或将落幕
                                      大数据的泰坦尼克号，Hadoop即将沉没了吗？
                                      五个不容忽视的“非主流”大数据技术工具
                                      一位数据科学家的私房工具清单
                                      Hadoop何以快速成为最佳网络安全工具？
                                      最受欢迎的十个开源大数据技术
                                      Airbnb开源数据探查与可视化平台Caravel
                                      LinkedIn开源元数据管理工具WhereHows
                  



标签： Hadoop, Hive, 大数据工具