Kaggle启动大数据创意众包模式
对于那些希望利用大数据分析改进业务的企业来说,市场上最缺的不是工具和技术,而是人才和想法,Kaggle的大数据创意众包模式,正好解决了这两大难题。
当今炙手可热的数据科学创业公司Kaggle显然不安于仅仅举行数据分析竞赛解决统计难题。日前Kaggle又推出了新的数据创意众包模式——Prospect,Kaggle的数据科学家会员们可以通过这个模式为企业提供包括机器学习(Machine Learning)等方面的数据分析建议和创意,帮助他们改进业务。
Kaggle总裁和首席科学家Jeremy Howard表示,很少有人能比Kagge的4万专业会员更了解机器学习,此外大数据潮流推动企业开始重视相对复杂但是回报丰厚的机器学习应用,希望能够借此改进业务。
对于初涉机器学习应用的企业来说,如果没有掌握正确的知识,很容易走极端,要么深度不够无法全部发挥机器学习的价值,要么就是过度依赖,产生新的业务风险。针对这种情况,Kaggle的Prospect原理很简单:客户提交希望深入分析的样本数据,竞赛者提出自己的数据利用创意和想法。当竞赛截止日期到来,Kaggle将根据社区投票和客户选择的综合得分选出优胜者并颁发客户的悬赏奖金。而客户则获得数据分析建议和创意的使用权。
对于企业来说,可以在Kaggle的大数据创意众包平台上循序渐进,先花点小钱获得靠谱的想法和创意,再进一步提高悬赏金额以获得可行的数据模型。例如电子病历提供商Practice Fusion显示悬赏500美元征集数据的最佳应用创意,然后进一步悬赏一万美元在创意的基础上开发出数据模型。
Kaggle的创意众包模式横跨企业的“大数据分析生命周期”,Howard称之为“分析价值链”。企业从获得数据分析的创意想法到开发(预测)模型、培训和部署、扩展、优化和维护,整个流程都可以借助Kaggle的众包平台完成。
在Howard的眼里,新的创意众包模式将挑战传统的数据分析咨询公司:”这些所谓咨询公司都是卖印度神油的,除了漂亮的图表和文字外,没什么真货。“Howard认为Kaggle的悬赏模式在预测模型的开发和培训方面远远优于传统模式。
第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom
除非注明,本站文章均为原创或编译,未经许可严禁转载。
相关文章: