TinyMind 多标签图像分类竞赛(中级难度) 进行中

开始 2018.08.06
结束 2018.09.29
举办方:TinyMind
团队113 人数136

大赛介绍

随着互联网技术迅猛发展,存储设备性能大幅提升,各种图像数据数量飞速增加,如何对海量的图像数据进行有效管理以及检索,成为了一个亟需解决的问题。

TinyMind联合视觉中国,推出本次多标签图像分类练习赛。本次竞赛以视觉中国提供的经过人力手工标记的图片数据作为竞赛数据。要求参赛者利用竞赛数据,训练一个多标签分类模型,使得该模型能自动根据输入的任意图片提供对应图片内容的多个标签。

竞赛分为预赛、决赛两个阶段

预赛:8月6日-9月26日

任务:利用训练数据(train.tgz),训练一个多标签分类模型,使得该模型能自动根据输入的任意图片提供对应图片内容的多个标签。

验证:使用验证数据(valid.tgz),将训练好的模型得出的图片标签结果,上传到TinyMind训练阶段测评系统,得到评分与排名。

决赛:9月27日-9月29日

参赛者全员进入决赛(未参与训练排名的参赛者无效),统一使用总决赛测试图片(test.tgz),提交模型运行结果到总决赛测评系统,参与最终评分与排名。

竞赛交流群

扫码添加助手备注“标签竞赛”进群~~任何与竞赛相关的通知、资料都会第一时间在群里告知。

评分程序

本竞赛使用f_measure为最终评价指标,f_measure定义表述如下:

令\(D\)表示多标签数据集,有\(|D|\)个多样本标签\((x_i,Y_i), i=1..|D|, Y_i\subseteq L\)。

令\(H\)为一个多标签分类器,令\(h=H(x_i)\)为有H基于\(x_i\)的预测结果,\(h\)为m维向量\((h_1,h_2,\cdots ,h_m)\)。

标签\(Y\)为m维向量\((y_1,y_2,\cdots ,y_m)\)。

则: $$ f_measure=\frac{1}{|D|} \sum_1^{|D|} \frac{2\sum^m_{i=1}y_i h_i}{\sum^m_{i=1}y_i+\sum^m_{i=1}h_i} \in[0, 1] $$ 作为参考,precision与recall定义如下: $$ precision=\frac{1}{|D|} \sum_1^{|D|} \frac{\sum^m_{i=1}y_i h_i}{\sum^m_{i=1}h_i} \in[0, 1] $$

$$ recall=\frac{1}{|D|} \sum_1^{|D|} \frac{\sum^m_{i=1}y_i h_i}{\sum^m_{i=1}y_i} \in[0, 1] $$

最终结果,f_measure *100 作为竞赛得分,最高者获胜。

1、最佳阵容奖:

奖励TinyMind平台提供的GPU服务时长。决赛排行榜第1名获得100小时,第2-5名分别获得与该团队得分相等的时长。四舍五入.

2、杰出练习师:

决赛排行榜前10团队成员均获得TinyMind限量版T恤(团队按人奖励)以及中国软件行业协会智能应用服务分会颁发的获奖证书

3、优秀の写手:

比赛期间,鼓励大家分享经验心得,发布到TinyMind文章频道,经审核后,可获得一件纪念T恤。

第一阶段数据

预赛数据集下载链接:https://pan.baidu.com/s/1F_KEbMpadayUPnTmzSCoRw 密码:le7d

(若下载巨慢,请进交流群了解加速。。)

本次竞赛共有3.5W张图片作为训练集,8K张图片作为第一阶段评分测试集,最后6612张图片作为总决赛测试集。

visual_china_train.csv 图片与标签对应的列表。文件名已做hash处理。

valid_tags.txt:6941个标签的有序列表文件。标签的标号从0开始,到6940为止。

tags_train.npz: 3.5W张图片对应的标签。该文件为npz格式数组,可以用np.load直接载入。数组shape为(35000,6941),数组列顺序与visual_china_train.csv文件列顺序对应。数组中每一行代表一张图片的标签,对应valid_tags.txt内容顺序代表的标签位置为1代表该图片有该标签,为0则代表该图片没有该标签。

train.tgz: 3.5W张训练图片。

valid.tgz: 8K张验证图片。

决赛阶段竞赛数据将在决赛当天公布。

本次竞赛数据由视觉中国提供并保留相应权利,参数人员不能把数据用于除参加本次比赛的其他目的,不能把数据共享给第三方或者发布到公共领域供第三方下载,不能利用本数据形成最终的产品或者服务。

竞赛分为预赛、决赛两个阶段

预赛:8月6日-9月26日

任务:利用训练数据(train.tgz),训练一个多标签分类模型,使得该模型能自动根据输入的任意图片提供对应图片内容的多个标签。

验证:使用验证数据(valid.tgz),将训练好的模型得出的图片标签结果,上传到TinyMind训练阶段测评系统,得到评分与排名。每天可提交3次。

决赛:9月27日-9月29日

参赛者全员进入决赛(未参与训练排名的参赛者无效),统一使用总决赛测试图片(test.tgz),提交模型运行结果到总决赛测评系统,参与最终评分与排名。

提交结果格式要求

提交结果格式参考visual_china_train.csv文件格式,每一行为一个数据,标签之间用逗号分割,最好直接使用pandas的输出数据。文件内容以UTF-8编码。以图片文件名作为唯一标志,文件名请勿包含路径等内容。给出的标签中,不在valid_tags.txt文件中6941个标签内的不予考虑。

(参考图)

比赛小贴士

  1. 本次比赛可以个人形式或团队形式参与,每团队不超过5人,第一个创建团队的人是队长。
  2. 如果个人参赛有难度,又无团队,可加入竞赛交流群,欢迎线上组队。
  3. 直接参与决赛的参赛者成绩无效。

竞赛交流群

扫码添加助手备注“标签竞赛”进群~~任何与竞赛相关的通知、资料都会第一时间在群里告知。

名次 获奖团队
搜索团队
评论
支持Markdown和数学公式,公式格式:\\(...\\)或\\[...\\]

还没有评论