《数据竞赛白皮书》:揭秘数据竞赛的20年历史


数据竞赛在近年来掀起全球热潮,引发产学研政资多方关注。深受阿里、华为、百度等行业巨头追捧,那数据竞赛从

数据竞赛在近年来掀起全球热潮,引发产学研政资多方关注。深受阿里、华为、百度等行业巨头追捧,那数据竞赛从何而来,其发展经历了怎样的变迁?最近,和鲸科技作为国内最早的数据竞赛平台,在大数据系统软件国家工程实验室的指导下,携旗下第三方数据竞赛平台和鲸社区(Kesci),联合AWS共同发布了《数据竞赛白皮书》,为我们揭示数据竞赛的20年演变历史。

《数据竞赛白皮书》:揭秘数据竞赛的20年历史



以工业应用为目标的数据竞赛模式诞生

1997年首届KDD Cup标志数据竞赛诞生,赛题要求参赛者通过数据分析,判断出哪些人有可能成为美国瘫痪退伍军人协会的捐赠者,从而帮助协会更精准地发送求助邮件。此后,KDD Cup保持了一年一度的举办惯例。

《数据竞赛白皮书》:揭秘数据竞赛的20年历史


通过KDD Cup的历年赛题,我们可以看到其始终带有强烈的工业应用色彩,高度契合各类组织机构的实际需求,也不断涌现出全新的应用场景。

KDD:Conference on Knowledge Discovery and Data Mining,知识发现和数据挖掘会议,属于ACM(Association for Computing Machinery,国际计算机学会)

国际顶会先锋探路,引领全球前沿探索

自KDD Cup后很长一段时间,全球数据竞赛市场都以国际顶尖学术会议主导举办,如ICCV、NeurlPS、ISBI、Euro CSS、ECML-PKDD、VoxCeleb、MICCAI、C-MIMI、IEEE-CIS、CVPR(ActivityNet)、IWCS、ECCV等。

国际顶会数据竞赛兼顾市场应用的需求,联手全球各地的企业、科研机构,聚集当下技术与数据应用中的难点寻求解决思路,不断缩短科研成果与落地应用之间的距离,赛题内容广泛覆盖医疗、军事、互联网、交通出行、快消零售、生态及文化保护等众多场景。

Kaggle开启全球数据竞赛平台化模式

《数据竞赛白皮书》:揭秘数据竞赛的20年历史


2010年,Kaggle初出现,并形成了以竞赛、数据集、开发工具为主,配套汇集数据科学人才的分享社区的第三方平台模式,在加速资源汇聚的同时,带来了全新的数据竞赛系统和格局,赛事体验、效率和价值也大幅提升。

到2019年10月,Kaggle面向全球累计举办竞赛近400场,社区活跃用户逾百万,成为全球知名企业、顶级会议等竞相合作的重要伙伴。

在Kaggle的影响下,国外市场开始出现一批深耕不同细分领域的竞赛平台,如InnoCentive、DrivenData、支持自助办赛的CodaLab等。

中国数据竞赛迎来全面蓬勃发展

自2014年科赛网(现和鲸科技)运营的SODA(上海开放数据应用大赛)开始,我国正式开启数据竞赛时代,并在一两年的时间内崛起了一批数据竞赛平台并开始探索区别于Kaggle的差异化发展道路。

《数据竞赛白皮书》:揭秘数据竞赛的20年历史


在全行业的努力下,短短五年时间内,我国完成400+场数据竞赛,成为全球数据竞赛最活跃的市场之一。

《数据竞赛白皮书》:揭秘数据竞赛的20年历史

(本内容属于网络转载,文中涉及图片等内容如有侵权,请联系编辑删除。市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。)

本文来自网络,不代表中国法治经济立场,转载请注明出处