第五届全国人工智能大赛：AI+数智人能力及客服应用专项赛-AITOP100,AI资讯

第五届全国人工智能大赛：AI+数智人能力及客服应用专项赛

大赛概览

自2019年首届成功举办以来，全国人工智能大赛（NAIC）便以国际视野为引领，紧密围绕重点科研方向和产业前沿难题，通过竞赛形式推动研究、吸引人才。四届大赛累计吸引了来自全球20多个国家的2万多支高水平团队参与，成功构建了五个百万级数据集，对重点领域的研究起到了显著推动作用。同时，大赛还链接了多家头部科创单位，促进了产学研的深度融合，并为粤港澳大湾区引入了20余位高端人才，助力多项科研成果成功落地。

如今，第五届全国人工智能大赛再次启航，由深圳市科技创新局和鹏城实验室联合主办，新一代人工智能产业技术创新战略联盟(AITISA)承办。本次大赛设置了“AI+图像编码”、“AI+增强视频质量评价”、“AI+数智空间”以及“AI+数智人能力及客服应用”四大核心赛道，旨在进一步汇聚全球人工智能领域的优秀人才、团队和项目，提升关键领域的科研和算法技术水平，助力解决科研与产业中的实际难题。

AI+数智人能力及客服应用专项赛

组织机构

主办单位：深圳市科技创新局、鹏城实验室
承办单位：新一代人工智能产业技术创新战略联盟(AITISA)
协办单位：中国移动通信集团有限公司、咪咕文化科技有限公司、咪咕新空文化科技(厦门)有限公司
支持单位：广东省人工智能与机器人学会

赛题背景

数智人，作为生成式技术生成的类人形态框架体系，正以其独特的创造性和可塑性，助力各行各业实现延展升级。通过结合AIGC技术，利用3D数智人的AI形象生成、AI语音生成以及驱动等关键技术，可以快速构建从制作到运营的一体化能力，为更多业务场景赋能。

大赛官网

活动规则详情请查看：【活动入口】

赛题任务详解

本次“AI+数智人能力及客服应用”赛道将围绕3D数智人，全面考察人工智能技术在数智人形象生成、声音复刻及播报中的应用效果。参赛者需通过AI技术完成以下任务：

形象生成：基于用户提供的一张或多张照片，生成对应的3D数智人形象。
驱动能力：实现对面部表情和唇形的精准驱动。
声音复刻：对用户声音进行复刻，生成高拟真的个性化语音包，支持中英文两种语种。
数智人播报：基于文本数据和复刻的语音包，生成具有特定音色的语音播报数据，并通过3D数智人进行播报，生成播报视频。

参赛者需提交包括形象生成程序、声音复刻程序、数智人播报程序以及自动化运行脚本等在内的可运行程序，用于后续评分和效果演示。同时，还需开发一个3D数智人语音播报的可视化Unity演示程序，以全面展示数智人的生成、驱动、声音复刻及视频合成能力。

竞赛流程安排

初赛阶段：

2024年11月28日：启动仪式及初赛赛题发布，选手开始预报名。
2024年12月至2025年3月：初赛评测阶段，每日每队最多可提交3次作品。
2025年3月28日：报名、组队及作品提交截止。
2025年3月至4月：晋级资格审核，每赛道排名前13名的团队晋级决赛。
2025年4月：公布初赛晋级名单。

决赛阶段：

2025年4月下旬：线下路演答辩及颁奖典礼。

奖项设置

优胜奖：1名，奖金30万元。
激励奖：2名，奖金各10万元。
入围奖：10名，颁发荣誉证书。

第五届全国人工智能大赛：AI+数智人能力及客服应用专项赛奖项设置

此外，所有获奖团队还将获得与中国移动咪咕公司合作的优先权，以及优胜数智空间免费入驻鼓浪屿元宇宙/MCC平台一年的机会。校园组队伍还有机会获得咪咕绿色通道或实习生offer。

报名与组队规则

参赛人群：全球征集，不限年龄、国籍，高校、科研院所、企业从业人员等均可报名。
报名要求：每队上限5人，同一赛题中只能参加一支团队。
组队要求：自行组队，提交各阶段作品材料。
队长责任制：队长负责团队分工、协调及与组委会沟通。
提交要求：初赛阶段每日每队最多提交3次作品。
回避原则：大赛主办、承办、支持、协办单位相关人员禁止参赛。
实名认证：参赛选手需完成实名认证。

作品要求与评审规则

作品原创性：保证原创，不侵犯第三方知识产权。
作品合规性：不得包含违规内容或虚假信息。
竞赛数据使用：仅用于指定比赛模型训练，不得用于商业用途。
知识产权归属：参赛作品知识产权归参赛团队所有，部分赛道获奖作品知识产权共享。
评审标准：包括成熟度、先进性、创新性、实用性等多个维度。
作品复现与验证：参赛者需配合组委会进行作品验证。
评审结果：专家委员会评审结果为最终结果。

通知与获奖

选手通知：通过预留联系方式邀请参赛团队参与活动。
奖金纳税：奖金个人所得税由获奖者承担，组委会代缴。
奖金分配：奖金统一发放给团队队长，由队长负责分配。

组织方权利

大赛组委会保留对参赛资格、作品、规则等进行调整、修改和解释的权利，包括但不限于拒绝参赛、收回奖项、更新数据、调整时间等。同时，组委会也拥有对比赛违规、作弊行为的判定和处置权利。

提交指南

数据说明

（1）输入文件夹介绍（input文件夹）

第五届全国人工智能大赛：AI+数智人能力及客服应用专项赛输入文件夹介绍

（2）输出产物及其数据规范

参赛者运行main.py后，将基于主路径自动生成各阶段程序的日志和产物，存储于指定子目录中。子目录及文件生成需遵循以下规范：（具体规范内容略，与原文保持一致）、

第五届全国人工智能大赛：AI+数智人能力及客服应用专项赛输出产物以其数据规范

提交要求

1.源码要求：

包含训练数据预处理（如适用）、训练代码（或开源模型训练代码）、推理代码及所有相关依赖。
提供可视化脚本或工程，确保资产可脱离工程单独使用。

2.数据要求：

包含训练、验证数据及标注工具（如涉及）。
提供3D数智人素材，如3DMM模型的基础模型、形变基底向量、拓扑信息、标准贴图等。
如使用BlendShape方案，需提供生成的BlendShape数据信息。

3.文档要求：

提供技术文档、操作文档、实现程序逻辑PPT和性能文档。
技术文档需详细说明算法框架、数据预处理、训练过程等。
操作文档需明确推理流程、控制选项及参数。

4.可视化相关资产：

提供基膜文件、控制信息（如说话风格、情绪类别）等。

5.提交规范：

初赛评测阶段，每日每队最多提交3次，仅保留最新提交作品。
截止时间后不再接收作品，排行榜记录最高成绩。
参赛者需自行保存最高成绩作品的源代码以备审核。

提交示例

参赛者提交程序时，需遵循以下文件夹结构规范：

所有代码及自有资源应置于同一文件夹下（如project）。
main.py应置于主文件夹路径下，不可置于子文件夹内。
其他内部子文件夹结构无特定限制。

评测标准

参赛者作品的评测将综合客观评价与主观评价进行打分。初赛阶段主要采用客观评测，而决赛的最终评测则结合客观与主观评测结果。

客观评价

3D数智人生成效率：

评测方法：使用提供的评测数据（位于project/input），运行参赛者的main.py程序。
评分标准：支持从一张或多张照片生成3D数智人，若生成算法在15秒内完成形象生成，则得满分。生成时间越短，得分越高。此项占形象生成总分的30%。

3D数智人生成相似度：

评测方法：对比输入图片与生成的3D数智人正面图片。
评分标准：相似度取值范围为0-100，相似度越高，得分越高。此项占形象生成总分的70%。

声音复刻能力：

评测方法：输入一段低于10秒的真人播报音频文件（wav格式），运行声音复刻算法。
评分标准：若声音复刻算法在10秒内完成声音复刻，则得满分。生成时间越短，得分越高。

最终客观得分计算：

计算公式：最终客观得分 = (形象生成评分平均分 + 复刻能力评分平均分) / 2

主观评价

数智人生成效果：

评价标准：在输入数据质量不佳（如照片存在遮挡）时，AI算法仍能稳定输出高质量的纹理贴图。

声音复刻效果：

评价标准：复刻的音色与真人语音还原度高，且在文本播报时语音情感丰富、自然。

数智人播报效果：

评价标准：结合语音包，数智人在文本播报时形象动作自然，声音与画面匹配良好；唇形匹配时延低，贴近真实唇形和口型；面部表情与播报内容情感相匹配，展现出数智人的高度智能化。

评测数据

提供10组真人照片，用于生成3D数智人形象。
提供3组播报音频数据，用于声音复刻效果评测。
提供3段文本数据，用于数智人播报效果评测。

所有评测数据均位于project/input目录下，参赛者需按照要求提交运行后的产物，并通过官方评测脚本进行统计分析，以计算客观指标值作为评分依据。