Update readme.md

This commit is contained in:
David Young
2021-01-01 09:45:39 +08:00
committed by GitHub
parent 6588ec5a4a
commit 9a092801e4

View File

@@ -62,11 +62,29 @@
- 初赛赛制:
选手报名成功后,选手下载数据,在初赛阶段可以本地完成数据统计分析,通过赛题页左侧提交入口提交结果;
初赛阶段提交后将进行实时评测每天每支队伍可提交2次排行榜每小时更新按照评测指标得分从高到低排序排行榜将选择历史最优成绩进行展示
在初赛阶段,需要参赛选手统计如下统计任务:
- 任务1论文数量统计数据统计任务统计2019年全年计算机各个方向论文数量
- 任务2论文作者统计数据统计任务统计所有论文作者出现评率Top10的姓名
- 任务3论文代码统计数据统计任务统计所有论文类别下包含源代码论文的比例
- 任务4论文分类数据建模任务利用已有数据建模对新论文进行类别分类
- 任务5作者关联数据建模任务对论文作者关系进行建模统计最常出现的作者关系
初赛阶段评分规则:利用准确率进行打分,选手可以在天池平台提交结果参与排行。
- 复赛赛制:
在复赛阶段,选手沿用初赛的赛题数据。根据自身需要完成数据分析,并进行可视化等相应操作。
复赛阶段需要所有选手在规定时间完成并将可视化结果和代码公布在比赛论坛内部并根据大众评审帖子star数量和举办方评审后得到最终排名
在复赛阶段,需要参赛选手完成自己的可视化任务(可自定义任务和具体分析目标),以下任务仅供参考:
- 任务1统计分析每个类别论文在不同时期的热门关键词分析arXiv论文常见关键词的发展趋势并进行统计可视化
- 任务2统计分析每个类别论文综述句子的长度、情感和定冠词并进行可视化
- 任务3统计分析论文作者的关联度通过关联挖掘进行分析
复赛阶段评分规则根据需要参赛选手在天池论坛公开代码并以统计时期帖子star数量为标准star相同则以fork为标准fork相同则以浏览量为标准
### 长期赛
在正式赛后,本场比赛将长期开放,报名和参赛无时间限制。
@@ -96,26 +114,6 @@ arXiv公开的数据集格式如下
数据集来源:
[https://www.kaggle.com/Cornell-University/arxiv](https://www.kaggle.com/Cornell-University/arxiv)
### 评测标准
在初赛阶段,需要参赛选手统计如下统计任务:
- 任务1论文数量统计数据统计任务统计2019年全年计算机各个方向论文数量
- 任务2论文作者统计数据统计任务统计所有论文作者出现评率Top10的姓名
- 任务3论文代码统计数据统计任务统计所有论文类别下包含源代码论文的比例
- 任务4论文分类数据建模任务利用已有数据建模对新论文进行类别分类
- 任务5作者关联数据建模任务对论文作者关系进行建模统计最常出现的作者关系
初赛阶段评分规则:利用准确率进行打分,选手可以在天池平台提交结果参与排行。
在复赛阶段,需要参赛选手完成自己的可视化任务(可自定义任务和具体分析目标),以下任务仅供参考:
- 任务1统计分析每个类别论文在不同时期的热门关键词分析arXiv论文常见关键词的发展趋势并进行统计可视化
- 任务2统计分析每个类别论文综述句子的长度、情感和定冠词并进行可视化
- 任务3统计分析论文作者的关联度通过关联挖掘进行分析
复赛阶段评分规则根据需要参赛选手在天池论坛公开代码并以统计时期帖子star数量为标准star相同则以fork为标准fork相同则以浏览量为标准
## 致谢
特别感谢 [@LSGOMYP](https://github.com/LSGOMYP) 对本项目的帮助与支持。