点球成金:NBA发布数据分析网站
NBA上周五与SAP联合发布 了联盟数据子站:NBA.com/Stats,全球世界的篮球迷将可以通过该站对NBA比赛进行数据分析,也可以查询1946年联盟成立以来的所有历史数据。这意味着所有的篮球迷都与NBA的教练球探一样掌握相同的数据信息,当他们观看一场比赛时,通过组合数据分析,他们能随时了解教练战术、阵容排布方面的数据依据。
据悉,NBA数据网站采用的分析引擎基于SAP提供的Hana内存数据库技术,能够对大规模的并发查询分析请求做出快速响应。
过去,NBA网站上只能提供一些基本数据,大量的历史数据都存在传统数据库中,仅供内部使用。数年前,酷爱数据统计的NBA总裁大卫斯特恩开始推动NBA数据面向球迷开放。去年夏天NBA开始着手整合并转移历史数据,开发新的分析引擎。
并非大数据,但面临两大技术挑战
也许很多人会兴奋地联想到一个词——大数据。但实际上,NBA的历史数据全部加起来还不到1TB,从容量上看显然还不是很“大”,而且大多是结构化数据。但NBA数据分析网站面临一个类似12306的巨大的技术挑战——并发查询。NBA官网目前的流量为每月600万独立访客,不过分流到数据分析子站的访客流量会小很多,NBA预计初期会有2万并发查询用户。
NBA数据分析网站面临的另外一个技术挑战是分析技术。传统的OLAP 只能为预先定义的查询条件提供分析结果,但NBA数据分析需要满足球迷的任意组合的查询分析——例如谁是比赛最后两分钟最好的绝杀者,球迷也可以自己“绝杀时刻”的时间跨度。NBA的副总裁兼CIO Michael Gliedman表示:传统的数据仓库方法需要预设查询条件,无法处理球迷各种各样的分析请求,而Hana能够满足我们的需求。
延迟方面,NBA在新闻发布会上透露比赛数据将在比赛结束15分钟后才可以访问,并非实时数据。这个延迟是出于官方确认的需要,而不是技术问题。即使是这样,15分钟的延迟也比大多数企业动辄一整晚的ETL批量处理速度要快得多。
数据可视化是未来重点
此外,NBA数据分析网站还提供多种数据可视化服务,包括投篮点热力图以及趋势图等。Gliedman透露NBA还计划增加拖放的数据可视化服务,采用的是SAP的BusinessObjects Explorer和Visual Inteligence软件。下个赛季,NBA还打算在数据分析中整合相关的比赛视频片段。
在体育界,NBA是数据分析应用的推动者之一(参考阅读:NFL),在去年的MIT斯隆商学院体育分析大会上,NBA官员还就预测型分析在NBA球员罢工、工资帽、球员合同谈判、球队营收预测等方面中发挥的作用发表过主题演讲。参考阅读:职业体育进入数据分析时代
而SAP近年来在体育界颇有斩获,美国职棒大联盟(MBL)、NFL官网NFL.com以及旧金山49人队等联盟和球队都采用了SAP的商业智能和分析产品。参考阅读:数据科学家:NFL冠军球队的“四分卫”
第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom
除非注明,本站文章均为原创或编译,未经许可严禁转载。
相关文章: