昆仑万维上线AI内容“双重标识”体系,响应《人工智能生成合成内容标识办法》
随着AI技术发展,内容创作方式剧变,虚假信息传播风险也随之而来。为规范行业,2025年3月14 日,多部门联合发布《人工智能生成合成内容标识办法》,9月1日正式实施。
昆仑万维作为行业领军者,积极响应。9月1日起全面落实要求,启动“双重标识”制度。在所有AI生成的文本、图片、音频和视频内容里,自动嵌入显式水印和隐式元数据标识,严禁用户删除、涂改或伪造。创作者发布或二次传播时,要在标题或首屏显著位置添加“#AI生成 #”话题标签,并在简介说明所用模型及版本号。平台还建立巡查机制,对违规行为,如擅自移除标识、冒充人工创作、传播虚假信息等,依情节采取下架、限流、封禁等措施,并向主管部门报告。
昆仑万维深知技术发展需与责任并行,此次启动“双重标识”体系,不仅履行了企业责任,更为构建可信赖AI生态助力。同时,呼吁广大创作者共同遵守规定,维护真实、透明的内容生态。若发现规避、篡改或隐匿AI标识的内容,可通过官方邮箱举报,昆仑万维会及时处理。
相关文章地址:昆仑万维率先落地《AI生成内容标识办法》:构建“显隐双标”体系,守护内容生态真实底线
开源工具xiaohongshu-mcp发布,实现小红书平台内容自动化发布,解放你的双手
一款名为xiaohongshu-mcp的小红书自动化工具引发关注。它基于模型上下文协议(MCP),借助 AI 技术,实现小红书平台自动化登录、内容发布和数据获取,给用户带来便捷运营体验。
该工具操作简单,支持用户通过配置和命令行,完成账户登录、图文发布及数据获取。得益于 MCP 协议,能与多种 AI 客户端无缝集成,用户和 AI 对话就能完成复杂操作。像内容创作者,能通过脚本快速发布图文帖子,无需手动编辑,尤其适合批量发布和市场调研的用户,大幅提升运营效率。
首次使用时,用户手动扫码登录,工具会自动保存登录状态,后续无需重复操作,简化流程。它通过HTTP JSON-RPC协议提供服务,运行于本地端口,开发者可轻松集成到现有工作流。
目前,其核心功能聚焦图文自动化发布,用户能快速上传含文字和图片的帖子。未来还计划扩展搜索、视频发布和数据分析等功能。作为开源项目,它基于Go语言开发,代码清晰,易于二次开发,还提供详细操作指南。
不过,用户使用时要注意遵守平台规范,合理控制操作频率,确保内容符合审核标准,避免账号风险。
体验地址:xiaohongshu-mcp官网入口 (海外网站需要科学上网)
微软在Copilot Labs平台推出“音频表达”工具,支持文本转语音与风格调整
近日,微软推出全新实验性AI中心——Copilot Labs,邀请用户参与AI创新。该平台为用户提供实验性AI工具,鼓励与全球社区共同塑造Copilot未来。
其首个工具“Copilot音频表达”利用微软最新语音生成模型,能把书面文本转化为自然流畅的语音旁白。用户可自由调整音频情感、个性和风格,比如为睡前故事选柔和语气,为励志演讲选激昂语调。
此工具支持英语,有情感模式和故事模式两种核心功能。情感模式下,用户提供脚本大纲,Copilot按不同风格演绎;故事模式结合多种声音风格,让故事更具表现力。生成的音频样本可免费用于个人项目。
“Copilot音频表达”全球免费开放,适用于所有现代浏览器,但建议用桌面计算机体验更佳。部分功能需用户登录Microsoft账户并拥有有效Copilot Pro订阅。
Copilot Labs的推出,让用户从技术使用者变为创造者和贡献者。微软希望通过这种开放创新模式,吸引更多人加入 AI 实验,共同探索人工智能的无限可能,为AI发展注入新活力。
体验地址:微软Copilot Labs平台官网 (海外网站需要科学上网)
阶跃星辰Step-Audio 2 mini模型发布,支持语音理解、生成与工具调用一体化
9月1日,阶跃星辰发布最强开源端到端语音大模型Step-Audio2mini。它在多个国际基准测试集上取得SOTA成绩,将语音理解、音频推理与生成统一建模,在诸多任务中表现卓越,还率先支持语音原生Tool Calling能力,可实现联网搜索等操作。
Step-Audio2mini在多个关键基准测试成绩领先。在通用多模态音频理解测试集MMAU上,以73.2分位列开源榜首;在衡量口语对话能力的URO Bench上,基础与专业赛道均获开源最高分;中英互译任务在多个评测集分数大幅领先;语音识别任务多语言和多方言排名第一。
它采用创新架构设计,采用真端到端多模态架构,突破传统结构,实现原始音频输入到语音响应输出的直接转换,架构简洁、时延低,能有效理解副语言信息与非人声信号。还首次引入链式思维推理与强化学习联合优化,能精细理解、推理并回应副语言和非语音信号,支持外部工具,解决幻觉问题并扩展多场景能力。
在实际案例中,它能精准识别大自然声音、精湛配音,还能实时搜索行业资讯、控制语速应对不同场景。当面对哲学难题,能将抽象问题转化为极简方法论,展现强大逻辑推理能力,为语音领域带来新突破。
详情查看:阶跃星辰Step-Audio 2 mini模型发布 (海外网站需要科学上网)
上海AI实验室发布书生·万象InternVL3.5模型,刷新开源多模态大模型性能记录
8月31日,上海人工智能实验室开源发布多模态大模型书生·万象InternVL3.5。该模型通过创新技术,实现推理能力、部署效率与通用能力的全面升级,开源从 1B 到 241B 各尺寸参数版本,刷新开源模型性能标杆。
InternVL3.5的旗舰模型在多学科推理基准MMMU中获开源模型最高分77.7分,在多模态通用感知基准MMStar和OCRBench分别取得77.9分和90.7分,超越GPT-5。文本推理基准也全面领先现有开源多模态大模型。依托级联式强化学习框架,全系列模型推理性能平均提升 16.0 分。
借助创新架构,38B模型在896分辨率下响应速度大幅提升,单次推理延迟大幅缩短。轻量化的InternVL3.5-Flash在减少视觉序列长度时,仍能保持接近100%性能。
它还加强了GUI智能体等核心能力,在多个任务中超越主流开源模型。提供九种尺寸模型,覆盖不同资源需求场景,包含稠密模型和专家混合模型,是首个支持GPT-OSS语言模型基座的开源多模态大模型。官方提供示例代码,方便不同规模模型部署。
ms-swift已支持对其训练,用户可准备数据微调,训练后推理并推送模型到 ModelScope。InternVL3.5的发布推动了多模态人工智能发展。
详情查看:上海AI实验室发布书生·万象InternVL3.5模型
腾讯AudioStory模型通过统一框架,解决长音频生成中的时间与情感一致性问题
近日,腾讯ARC团队发布AudioStory模型,利用大语言模型(LLMs)生成长篇叙事音频,解决了现有技术处理长篇音频的难题。
AudioStory的核心是统一的理解与生成框架,能处理视频配音、音频延续和长篇叙事音频合成等多种任务。它将大语言模型与音频生成系统结合,生成结构化且时间一致的音频叙事。具备强大的指令跟随推理生成能力,可把复杂叙事查询分解为按时间排列的子任务,保持场景转换连贯和情感基调一致。
该模型有两个显著特点。一是去耦合的桥接机制,将大语言模型与音频生成器协作分成两个专业化部分;二是端到端训练方式,统一指令理解与音频生成,提升组件协同效应。
研究团队还建立AudioStory-10K 基准数据集,涵盖动画音景等领域。通过大量实验,AudioStory 在单音频和叙事音频生成方面表现优于以往模型,指令跟随能力和音频质量卓越。
目前,团队已发布模型推理代码,并展示一系列演示视频,如经典动画《猫和老鼠》配音示例和基于文本生成长音频案例,展示了其广泛适用性和强大功能,为音频创作领域带来新的可能。
体验地址: 腾讯AudioStory模型官网入口 (海外网站需要科学上网)
AI应用市场新动态:谷歌Gemini逐步逼近ChatGPT,移动端AI应用中国占主导
根据Andreessen Horowitz 发布的《前100名生成式AI消费应用报告》,AI应用市场有新变化。谷歌的Gemini虽仍落后于 ChatGPT,但在网络和移动应用领域正逐步缩小差距,中国公司在移动领域占据主导。
与2025年3月版本相比,本次报告新增网络应用减少,显示市场趋于稳定。移动应用新增14款,因应用商店加强对“ChatGPT克隆”监管。报告按月独立访问量和月活跃用户数对网络和移动应用排名。
网络应用中,ChatGPT仍居榜首,谷歌的Gemini和Deepseek紧随其后。移动应用方面,ChatGPT同样第一,Gemini、AI Gallery 和Doubao名列前五。
谷歌的Gemini家族首次在网络榜单占四个席位,月访问量约为ChatGPT的12%。在移动领域,月活跃用户几乎达ChatGPT的一半,在Android系统用户基础强大,约90%用户来自Android,而ChatGPT为 60%。
Grok竞争力上升,用户达 2000 万,发布Grok4和推出AI伴侣头像后用户数增长显著。Meta AI增长缓慢,网络排名第46位,未进移动榜单。
在中国市场,阿里巴巴的Quark、字节跳动的Doubao和Moonshot AI的 Kimi在网络前20名中占据席位,中国公司凭借庞大用户基础和严格监管政策获得优势。 (本文由AI辅助生成,部分内容人工编辑)
详情查看:谷歌Gemini加速追赶ChatGPT:AI应用市场格局生变,中国力量主导移动赛道
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码: