LinkedIn开源元数据管理工具WhereHows

Linkedin

职业社交平台LinkedIn今天开源了元数据管理工具WhereHows(GitHub),该工具可以帮企业员工发现和分享企业内部的元数据。

LinkedIn部署了很多数据存储和处理系统,包括Teradata的数据仓库、开源的Hadoop分布式文件系统,开源的Hive数据仓库以及自己开发的开源试试分析软件Pinot。而WhereHows则能帮LinkedIn的员工检索和分享LinkedIn的HDFS系统中超过25000个共享数据集。在数据爆炸的今天,随时掌握企业内部有价值信息的情况(元数据)非常重要,这能大大提高企业员工的信息搜索和分享深度,盘活整个企业的数据资产。

LinkedIn此前也开源过很多大数据工具,例如上文提到的Pinot,以及Azkaban、Kafka、Samza和Voldemort等,但在数据发现和数据目录方面的工具,WhereHows还是头一个。对于那些数据架构复杂的企业来说,WhereHows具有很高的实用价值。而对于LinkedIn来说,开源高价值高人气的工具能够帮助公司吸引优秀人才,这一点比什么都重要。

WhereHows的详细文档在这里

第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom

   

除非注明,本站文章均为原创或编译,未经许可严禁转载。

相关文章:


关于作者

隐私已经死去,软件正在吃掉世界,数据即将爆炸