
大赛概览
自2019年首届成功举办以来,全国人工智能大赛(NAIC)便以国际视野为引领,紧密围绕重点科研方向和产业前沿难题,通过竞赛形式推动研究、吸引人才。四届大赛累计吸引了来自全球20多个国家的2万多支高水平团队参与,成功构建了五个百万级数据集,对重点领域的研究起到了显著推动作用。同时,大赛还链接了多家头部科创单位,促进了产学研的深度融合,并为粤港澳大湾区引入了20余位高端人才,助力多项科研成果成功落地。
如今,第五届全国人工智能大赛再次启航,由深圳市科技创新局和鹏城实验室联合主办,新一代人工智能产业技术创新战略联盟(AITISA)承办。本次大赛设置了“AI+图像编码”、“AI+增强视频质量评价”、“AI+数智空间”以及“AI+数智人能力及客服应用”四大核心赛道,旨在进一步汇聚全球人工智能领域的优秀人才、团队和项目,提升关键领域的科研和算法技术水平,助力解决科研与产业中的实际难题。

组织机构
- 主办单位:深圳市科技创新局、鹏城实验室
- 承办单位:新一代人工智能产业技术创新战略联盟(AITISA)
- 协办单位:中国移动通信集团有限公司、咪咕文化科技有限公司、咪咕新空文化科技(厦门)有限公司
- 支持单位:广东省人工智能与机器人学会
赛题背景
数智人,作为生成式技术生成的类人形态框架体系,正以其独特的创造性和可塑性,助力各行各业实现延展升级。通过结合AIGC技术,利用3D数智人的AI形象生成、AI语音生成以及驱动等关键技术,可以快速构建从制作到运营的一体化能力,为更多业务场景赋能。
大赛官网
活动规则详情请查看:【活动入口】
赛题任务详解
本次“AI+数智人能力及客服应用”赛道将围绕3D数智人,全面考察人工智能技术在数智人形象生成、声音复刻及播报中的应用效果。参赛者需通过AI技术完成以下任务:
- 形象生成:基于用户提供的一张或多张照片,生成对应的3D数智人形象。
- 驱动能力:实现对面部表情和唇形的精准驱动。
- 声音复刻:对用户声音进行复刻,生成高拟真的个性化语音包,支持中英文两种语种。
- 数智人播报:基于文本数据和复刻的语音包,生成具有特定音色的语音播报数据,并通过3D数智人进行播报,生成播报视频。
参赛者需提交包括形象生成程序、声音复刻程序、数智人播报程序以及自动化运行脚本等在内的可运行程序,用于后续评分和效果演示。同时,还需开发一个3D数智人语音播报的可视化Unity演示程序,以全面展示数智人的生成、驱动、声音复刻及视频合成能力。
竞赛流程安排
初赛阶段:
- 2024年11月28日:启动仪式及初赛赛题发布,选手开始预报名。
- 2024年12月至2025年3月:初赛评测阶段,每日每队最多可提交3次作品。
- 2025年3月28日:报名、组队及作品提交截止。
- 2025年3月至4月:晋级资格审核,每赛道排名前13名的团队晋级决赛。
- 2025年4月:公布初赛晋级名单。
决赛阶段:
- 2025年4月下旬:线下路演答辩及颁奖典礼。
奖项设置
- 优胜奖:1名,奖金30万元。
- 激励奖:2名,奖金各10万元。
- 入围奖:10名,颁发荣誉证书。

此外,所有获奖团队还将获得与中国移动咪咕公司合作的优先权,以及优胜数智空间免费入驻鼓浪屿元宇宙/MCC平台一年的机会。校园组队伍还有机会获得咪咕绿色通道或实习生offer。
报名与组队规则
- 参赛人群:全球征集,不限年龄、国籍,高校、科研院所、企业从业人员等均可报名。
- 报名要求:每队上限5人,同一赛题中只能参加一支团队。
- 组队要求:自行组队,提交各阶段作品材料。
- 队长责任制:队长负责团队分工、协调及与组委会沟通。
- 提交要求:初赛阶段每日每队最多提交3次作品。
- 回避原则:大赛主办、承办、支持、协办单位相关人员禁止参赛。
- 实名认证:参赛选手需完成实名认证。
作品要求与评审规则
- 作品原创性:保证原创,不侵犯第三方知识产权。
- 作品合规性:不得包含违规内容或虚假信息。
- 竞赛数据使用:仅用于指定比赛模型训练,不得用于商业用途。
- 知识产权归属:参赛作品知识产权归参赛团队所有,部分赛道获奖作品知识产权共享。
- 评审标准:包括成熟度、先进性、创新性、实用性等多个维度。
- 作品复现与验证:参赛者需配合组委会进行作品验证。
- 评审结果:专家委员会评审结果为最终结果。
通知与获奖
- 选手通知:通过预留联系方式邀请参赛团队参与活动。
- 奖金纳税:奖金个人所得税由获奖者承担,组委会代缴。
- 奖金分配:奖金统一发放给团队队长,由队长负责分配。
组织方权利
大赛组委会保留对参赛资格、作品、规则等进行调整、修改和解释的权利,包括但不限于拒绝参赛、收回奖项、更新数据、调整时间等。同时,组委会也拥有对比赛违规、作弊行为的判定和处置权利。
提交指南
数据说明
(1)输入文件夹介绍(input文件夹)

(2)输出产物及其数据规范
参赛者运行main.py后,将基于主路径自动生成各阶段程序的日志和产物,存储于指定子目录中。子目录及文件生成需遵循以下规范:(具体规范内容略,与原文保持一致)、

提交要求
1.源码要求:
- 包含训练数据预处理(如适用)、训练代码(或开源模型训练代码)、推理代码及所有相关依赖。
- 提供可视化脚本或工程,确保资产可脱离工程单独使用。
2.数据要求:
- 包含训练、验证数据及标注工具(如涉及)。
- 提供3D数智人素材,如3DMM模型的基础模型、形变基底向量、拓扑信息、标准贴图等。
- 如使用BlendShape方案,需提供生成的BlendShape数据信息。
3.文档要求:
- 提供技术文档、操作文档、实现程序逻辑PPT和性能文档。
- 技术文档需详细说明算法框架、数据预处理、训练过程等。
- 操作文档需明确推理流程、控制选项及参数。
4.可视化相关资产:
- 提供基膜文件、控制信息(如说话风格、情绪类别)等。
5.提交规范:
- 初赛评测阶段,每日每队最多提交3次,仅保留最新提交作品。
- 截止时间后不再接收作品,排行榜记录最高成绩。
- 参赛者需自行保存最高成绩作品的源代码以备审核。
提交示例
参赛者提交程序时,需遵循以下文件夹结构规范:
- 所有代码及自有资源应置于同一文件夹下(如project)。
- main.py应置于主文件夹路径下,不可置于子文件夹内。
- 其他内部子文件夹结构无特定限制。
评测标准
参赛者作品的评测将综合客观评价与主观评价进行打分。初赛阶段主要采用客观评测,而决赛的最终评测则结合客观与主观评测结果。
客观评价
3D数智人生成效率:
- 评测方法:使用提供的评测数据(位于
project/input),运行参赛者的main.py程序。 - 评分标准:支持从一张或多张照片生成3D数智人,若生成算法在15秒内完成形象生成,则得满分。生成时间越短,得分越高。此项占形象生成总分的30%。
3D数智人生成相似度:
- 评测方法:对比输入图片与生成的3D数智人正面图片。
- 评分标准:相似度取值范围为0-100,相似度越高,得分越高。此项占形象生成总分的70%。
声音复刻能力:
- 评测方法:输入一段低于10秒的真人播报音频文件(wav格式),运行声音复刻算法。
- 评分标准:若声音复刻算法在10秒内完成声音复刻,则得满分。生成时间越短,得分越高。
最终客观得分计算:
计算公式:最终客观得分 = (形象生成评分平均分 + 复刻能力评分平均分) / 2
主观评价
数智人生成效果:
- 评价标准:在输入数据质量不佳(如照片存在遮挡)时,AI算法仍能稳定输出高质量的纹理贴图。
声音复刻效果:
- 评价标准:复刻的音色与真人语音还原度高,且在文本播报时语音情感丰富、自然。
数智人播报效果:
- 评价标准:结合语音包,数智人在文本播报时形象动作自然,声音与画面匹配良好;唇形匹配时延低,贴近真实唇形和口型;面部表情与播报内容情感相匹配,展现出数智人的高度智能化。
评测数据
- 提供10组真人照片,用于生成3D数智人形象。
- 提供3组播报音频数据,用于声音复刻效果评测。
- 提供3段文本数据,用于数智人播报效果评测。
所有评测数据均位于project/input目录下,参赛者需按照要求提交运行后的产物,并通过官方评测脚本进行统计分析,以计算客观指标值作为评分依据。
更多AI比赛请关注
AI人工智能网站--AITOP100平台AI创作大赛专区: 点击此处进入AI大赛专区
AI人工智能网站--AITOP100平台活动专区:点击此处进入活动专区
AITOP100平台大赛社群二维码:









