AI大赛-通义千问AI挑战赛-Code Qwen能力算法赛道-AITOP100,AI资讯

一、活动简介

代码是人类创造的高质量语言之一，通过高度的抽象来代替形式多样的自然语言，最终转换为具体程序来代替人类完成任务，其具有精确性、逻辑性和可执行性等优点。所以代码能力也成为大语言模型（LLMs）的核心能力，我们期待 LLMs 可以帮助人类进行辅助编程、漏洞修复、甚至是全自动代码生成等工作。

如何通过高质量的数据微调提升基础语言模型的代码能力仍然是一个开放且具有挑战的问题，Qwen AI 挑战赛由阿里云和NVIDIA主办，天池平台和魔搭联合承办，是聚焦于通义千问大模型微调训练的竞赛，其主要目标是通过高质量的数据探索和拓展开源模型 Qwen 1.8B 及 Qwen 72B 的代码能力上限。

二、活动规则

【报名与组队】即日起—2023年12月17日18:00，UTC+8

参赛者通过天池平台进行报名，确保报名信息准确有效，否则会被取消参赛资格及激励；
参赛组织可以单人或者多人自由组队,每队限最多3人，每人只能参加1支队伍；如果是多人团队，则需指定1名队长，负责沟通事宜。
本赛道所有选手需在2023年12月17日18:00前完成实名认证（实名认证入口：天池网站-个人中心-认证-支付宝实名认证），未按要求完成实名认证队伍，将被取消参赛资格。

特别提醒：

每个队伍中，队长与队员都需要进行实名验证才符合“队伍完成实名认证”的需求。
组队成功后，点击左侧「我的团队」即可查看本队伍实名情况。

【初赛阶段 - 小试牛刀 1.8B】2023年12月5日10:00-2023年12月18日18:00，UTC+8

高质量的数据是大模型提升效果的关键，初赛阶段主要聚焦在如何通过 SFT 提升基础模型的代码能力。需要选手基于最新开源的 Qwen 1.8 模型作为基础模型，在我们提供的训练框架上自行进行数据收集与微调，训练完成后将进行自动评估，返回最终结果进行排名；

时间：2023年12月5日10:00-2023年12月18日18:00
评测方式：系统每天提供3次实时评测，供选手进行提交测试，排行榜将展示排名情况，比赛期间每小时更新排行榜，按照评测指标从高到低排序。排行榜将选择参赛队伍在本阶段的历史最优成绩进行排名展示。一阶段评测数据集主要为公开的代码基准（见赛题说明）；另外我们会做训练数据的泄露检测，防止训练集中混入测试集；组委会将取消存在相互抄袭、测试集泄露等行为队伍的比赛资格。
评测时间：即日起至12月18日18:00，选手未在该时间前提交成功，系统将不予评测。排行榜最后一次刷新时间是12月18日18:00。
代码审核：初赛最终排行榜前10名的参赛团队，需于2023年12月19日18:00前提交包含模型的完整代码及数据供组委会审核，通过审核且实名认证后即可晋级复赛，复赛晋级名额为10支，如有不合格队伍，晋级资格将依据排行榜顺延。

另外初赛我们还设置一些额外彩蛋 🎁：

友谊第一奖凡是初赛提交并成功出分且高于 baseline 的选手队伍，每人均可获得大赛官方纪念帽衫一件。
持之以恒奖每日坚持提交评测选手，将获得组委会提供的通义周边奖品一份。
名列前茅奖初赛最终榜单排名前20%选手团队，将获得组委会提供天猫精灵-方糖两台。

【复赛阶段 - 八仙过海 72B】2023年12月20日18:00-2023年12月28日12:00，UTC+8

复赛阶段我们将提供 GPU 算力（在线 API 的方式），参赛队伍将基于 Qwen-72B 模型进行 PEFT （lora）进行训练；

复赛评测采用混合评测方式，评测时间为2023年12月20日18:00-2023年12月28日12:00，复赛的评测集为初赛公开数据集分数 * 0.5 + 隐藏的代码 QA 数据集 * 0.5；评测对选手完成训练的模型进行在线盲测，选手将看不到隐藏代码 QA 数据集的具体题目（包括 prompt）公平公正地验证模型效果。
本赛段需要选手在截止日期前上传训练模型的所有参数、数据、部署训练好的 Qwen-72B 模型。最终获胜方案需要按组委会要求进行线上答辩，具体情况留意组委会通知。