进行中 【练习赛】TinyMind人民币面值及编码识别

举办方:TinyMind
开始 2019.05.09
组队结束 2019.06.30
结束 2019.12.31
奖金: ¥10,000

参赛团队

202

参赛人数

253

人民币作为我国法定货币,与生俱来,人见人爱。它在我们日常生活中的重要性不言而喻,每张人民币纸币都有一串唯一的字符号码,是人民币的重要标识。由于这串序列号的唯一性,若能在纸币识别装置上添加编码识别,让每张人民币的行走轨迹都可以被记录并存储,这样人民币都能进入银行监管之内,不仅有助于识别假币,还可以很大程度上协助攻破抢劫,盗窃人民币等非法事件。人民币编码识别技术在日常生活中具有很好的实用价值。

针对人民币纸币面额及编码识别技术的深入研究,TinyMind发起本期挑战赛,诚邀广大AI界大佬,疯狂炫技,踊跃报名。

规则及评估方法

本次挑战赛分为热身赛、正式赛两个阶段,共瓜分10000元奖金池

第一阶段:热身赛—— ⼈⺠币⾯值识别

要求参赛者根据训练集(train_data.zip)图片训练模型,识别人民币面值,并按要求提交验证集(public_test_data)训练结果进行验证。

时间:5月16日至5月30日

本阶段评分标准:

评分采⽤top1准确率。

提交文件要求:

参赛者需要提交如下格式的文件,逗号分割的csv文件,共20001行,utf-8编码,:

name, label
XXXXX.jpg,  0.1
XXXXX.jpg,  0.2
XXXXX.jpg,  50
XXXXX.jpg,  0.1
XXXXX.jpg,  0.1
XXXXX.jpg,  10
XXXXX.jpg,  1
XXXXX.jpg,  0.2
XXXXX.jpg,  0.2
XXXXX.jpg,  100
XXXXX.jpg,  0.1
XXXXX.jpg,  5
XXXXX.jpg,  0.1
......
XXXXX.jpg,  0.2
XXXXX.jpg,  100
XXXXX.jpg,  10
XXXXX.jpg,  10
XXXXX.jpg,  1
XXXXX.jpg,  100
XXXXX.jpg,  1

name应与相应的榜单测试数据文件名一一对应。

本阶段成绩以5月30日23:59前提交的结果为依据。

得分超过99.9的参赛者需提交模型和相应的调用代码及配置文档(跑不起来视为失效哦),通过审查的参赛者们共同瓜分2000元奖金。

模型若大于100M,发送邮件至 lisw@csdn.net 备注团队名,成绩。

第二阶段:正式赛——人民币冠字号编码识别

预赛:5月31日-6月30日

任务:使用热身赛训练集(train_data.zip)图片,训练人民币冠字号编码识别模型,使得该模型能自动根据输入的任意人民币图片识别对应人民币的编码。

验证:使用验证数据(public_test_data.zip),将训练好的模型得出的编码识别结果,上传到TinyMind相应阶段测评系统,得到评分与排名。

决赛:7月1日-7月3日

参赛者全员进入决赛(未参与预赛排名的参赛者无效),统一使用总决赛测试图片(private_test_data.zip),提交模型运行结果到总决赛测评系统,参与最终评分与排名。

决赛结束后,进入自由练习赛阶段,采用预赛数据,规则与预赛保持一致,独立榜单,仅供学习。

评分标准

本阶段将同时开放2个榜单,A榜根据人民币编码中每位编码识别准确率评测,B榜根据每张人民币整体编码识别准确率评测。

A榜评分公式:

评分采用平均logloss, \(pred=xxxxxxxxx\)为模型给出的一张图片中人民币的冠字号预测,共十位,也就是十个字符,\(x_i\)为其中第\(i\)位。\(label=yyyyyyyyy\)为对应图片中人民币的冠字号标签,,共十位,也就是十个字符, \(y_i\)为其中第\(i\)位。\(n\)为图片数量。则需要计算每张人民币冠字号预测结果中十个字符中正确的个数: $$ logloss = - \frac{1}{n}\sum log(1e^{-6}+\frac{1}{10}{\sum_0^9(x_i == y_i)}) $$

注: log是以e为底的对数, \(1e^{-6}\) 含义是\(1 \times 10^{-6}\)

最终结果越小准确率越高,排名越靠前。

B榜评分公式:模型准确率,十个字符必须全部正确才算本张人民币预测正确:

$$ accuracy = \frac{1}{n}\sum (pred == label) $$

结果越接近1准确率越高,排行榜百分制越接近100分,排名越靠前。

提交文件要求

参赛者需要提交如下格式的文件,逗号分割的csv文件,utf-8编码:

name, label
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx
...
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx
XXXXX.jpg,  xxxxxxxxxx

name应与相应的榜单测试数据文件名一一对应。

参赛者前十名需提交模型和相应的调用代码及配置文档,模型若大于100M,发送邮件至 lisw@csdn.net 备注团队名,成绩。

数据说明

登录TinyMind账号后,可获取以下数据下载权限。

第一阶段热身赛数据集说明:

  • train_data.zip:此数据集用于训练模型(热身赛与正式赛共用),图片为第四套人民币中的某一张。共包含39620张图片。该文件采用分卷压缩方式,下载至一个文件夹下解压缩即可

  • train_face_value_label.csv:train_data.zip对应的面额标签。数据共有两列,name和label,name为train_data中对应的文件名,label为对应的面值,共有9种面值,分别编号为 0.1,0.2,0.5,1,2,5,10,50,100,单位为元。

  • public_test_data.zip:共有20000张图片。将训练好的模型得出的面额识别结果,上传到TinyMind对应测评系统,得到评分与排名。该文件采用分卷压缩方式,下载至一个文件夹下解压缩即可。

第二阶段正式赛数据集说明:

  • train_data.zip:此数据集用于训练模型(热身赛与正式赛共用,参与热身赛同学无需重复下载),图片为第四套人民币中的某一张。共包含39620张图片。

  • train_id_label.csv:train_data.zip对应的冠字号标签。数据共有两列,name和label,name为train_data中对应的⽂件名,label为对应的⼈⺠币的冠字编号。

  • public_test_data.zip:共有20000张图片。将训练好的模型得出的面额识别结果,上传到TinyMind对应测评系统,得到评分与排名。

  • private_test_data.zip:此数据用于决赛期间提交验证。共10000张人民币图片。在决赛开始时开放下载。

您尚未登录TinyMind,请 后下载数据

奖励

当各位大佬累的快坚持不下去的时候,请看看人民币上那坚定的眼神,是他告诉我们为了TOP1,永不放弃,坚持到底,继续向前。

面值识别阶段

奖金池2000元,由面值识别排行榜 99.9分以上通过审查的参赛者均分。本阶段如果没有获奖用户,将按比例追加到下阶段前五名

编码识别阶段

A榜:

第一名:4000元

第二名:2000元

第三名:1000元

第四名:600元

第五名:400元

B榜模型准确率,榜单成绩供大家参考,不参与奖金分配。

比赛结束后,TinyMind将邀请前五名团队代表参与赛后经验总结分享会,以在线直播方式与全体参赛者共同探讨总结本次比赛的经验,具体时间待定。

报名规则

- 本次比赛报名阶段要求开发者先实名认证,请未实名同学尽快实名:https://www.tinymind.cn/users/authentication
- 本次比赛可以个人形式和团队形式参与,每团队不超过5人。每账户每天最多提交5次。
- 本次比赛严禁小号刷榜,发现相同模型参赛者成绩均判无效。
- 组队截止时间分别5月28日截止,6月1日开放,6月30日截止。
- 本次比赛模型所有权均归参赛者个人所有。
- 本竞赛由TinyMind与人工智能千人群ApacheCN共同策划,感谢热爱人工智能的群友们~~

比赛交流群:

扫码添加助手,发送“编码识别”进群~~任何与竞赛相关的通知、资料都会第一时间在群里告知。

description

经验分享直播视频

视频内PPT下载:链接:https://pan.baidu.com/s/11ZAt-rLu3yLCpAzXrzO2og

提取码:z2u2

文档、模型、代码下载地址:https://github.com/mind/RMB

名次 获奖团队
第一名 wei
第二名 TitanikData
第三名 TechDing
搜索团队
{{panelTitle}}(15)
支持Markdown和数学公式,公式格式:\\(...\\)或\\[...\\]
阿花菌 2019-07-08 16:50
l4kangaxx 2019-06-05 18:22

晕了,用百度下载工具,下载很正常,也不报错,但下载下来的文件全部解压失败,有人知道这是怎么回事么

阿花菌 2019-06-10 16:37

进群发下截图,是什么系统下的?

挠挠-王奇勋 2019-06-03 23:51

百度云下的速达只有100k,还有别的方式下载么??

阿花菌 2019-06-10 16:37

群公告里有个下载加速器看看

涂鸦 2019-05-31 00:14

可以用这些个数据写论文吗> ** **

阿花菌 2019-06-10 16:37

可以的

好朋友 2019-05-30 10:13

验证又不能用了吗?

K5niper 2019-05-29 17:56

test数据有 噪声,100分是怎么做到的

Helium :@K5niper 2019-06-02 16:14

test没噪声,训练有

K5niper :@TinyMind 2019-05-29 22:01

我是说有些样本就不是货币的图像 097BAEPV.jpg GV92MWO8.jpg 100分是不是人工调的

TinyMind 2019-05-29 17:58

可以进群咨询大佬

好朋友 2019-05-29 10:24

模型不到100M 在那儿提交?

好朋友 2019-05-29 10:21

是不是自动验证机制坏了? 最近提交的都没出成绩是那般?

TinyMind 2019-05-29 17:58

出来啦

howiema 2019-05-29 09:25

请问提交.csv文件后10分钟内就会给出成绩吗?还是说必须 .csv 和代码都提交以后才会给出评分成绩呢? 昨天提交的.csv至今没有给出分数诶。。。。

ZihanLi 2019-05-24 14:57

请问是一共只有一次提交机会吗?还是每天有几次?

阿花菌 2019-05-25 17:46

每天5次

关注微信公众号