首页  »   Spark

最受欢迎的十个开源大数据技术

最受欢迎的十个开源大数据技术
开源让越来越多的项目可以直接采用大数据技术,下面就来盘点最受欢迎的十大开源的大数据技术。 阅读全文

大数据赛道上的单挑:MapReduce与Spark到底谁快?

大数据赛道上的单挑:MapReduce与Spark到底谁快?
通常人们认为Spark的性能和速度全面优于MapReduce,但最新的对决显示MapReduce也有胜场。 阅读全文

磁盘性能同样彪悍,Spark打破大数据基准测试记录

磁盘性能同样彪悍,Spark打破大数据基准测试记录
不少人认为Spark仅仅是在内存计算环境比Mapreduce表现出色,近日为了给Spark正名,Spark商业化公司Databrick在磁盘环境给Spark做了GraySort跑分测试。 阅读全文

Hortonworks改进内存分析平台Spark与Hadoop全面整合

Hortonworks改进内存分析平台Spark与Hadoop全面整合
本周三Hortonworks宣布改进Spark软件与Hive的集成度,并增加对Spark的ORC数据格式的支持,Hortonworks还计划提升Spark通过YARN资源管理工具与Hadoop协作的安全性和性能表现。 阅读全文

Hadoop快速查询工具Drill将随MapR发行版问世

Hadoop快速查询工具Drill将随MapR发行版问世
包括Drill在内的SQL-on-Hadoop技术取得长足进步,负责推动Drill技术的Hadoop厂商MapR近日宣布在Drill的开发者预览版整合到MapR大数据平台中,向外界展示Drill这种新型SQL查询引擎到底能做什么。 阅读全文
标签|Tags: , , ,

下一代BI创业公司ClearStory再融资2100万美元

下一代BI创业公司ClearStory再融资2100万美元
ClearStory以功能独特的云端分析服务杀入进入BI市场,号称“下一代仪表盘”。用户可以同时分析多种数据源。 阅读全文
标签|Tags: , ,

Cloudera为Hadoop带来机器学习开源工具Oryx

Cloudera为Hadoop带来机器学习开源工具Oryx
将Oryx打造成开发推荐系统的标准化工具的做法将使这个项目赢得极大关注,因为用户推荐系统几乎已经成了主流网站的标配,但是推荐引擎目前面临的最大问题就是缺乏标准和开源工具。 阅读全文

Spark取代MapReduce成为Apache顶级项目

Spark取代MapReduce成为Apache顶级项目
由于性能和速度优于MapReduce,且更加容易使用,Spark目前已经拥有一个庞大的用户和贡献者社区。这意味着Spark更加符合下一代低延迟、实时处理、迭代计算的大数据应用的要求。 阅读全文
标签|Tags:

Airbnb如何打造大数据引擎

Airbnb如何打造大数据引擎
在推动旅游业的大数据应用方面,没有企业比Airbnb做得更多,走得更远… 阅读全文

Twitter将采用Spark分析大数据

Twitter将采用Spark分析大数据
Twitter数据科学家Edwin Chen最近在接受媒体采访的时候透露,Twitter内部希望尝试一种全新的大数据系统——Spark。 阅读全文
标签|Tags: , , ,