• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

每日AI资讯-2025年09月01日

每日AI资讯-2025年09月01日
AI TOP100
11小时前

昆仑万维上线AI内容“双重标识”体系,响应《人工智能生成合成内容标识办法》

随着AI技术发展,内容创作方式剧变,虚假信息传播风险也随之而来。为规范行业,2025年3月14 日,多部门联合发布《人工智能生成合成内容标识办法》,9月1日正式实施。

昆仑万维作为行业领军者,积极响应。9月1日起全面落实要求,启动“双重标识”制度。在所有AI生成的文本、图片、音频和视频内容里,自动嵌入显式水印和隐式元数据标识,严禁用户删除、涂改或伪造。创作者发布或二次传播时,要在标题或首屏显著位置添加“#AI生成 #”话题标签,并在简介说明所用模型及版本号。平台还建立巡查机制,对违规行为,如擅自移除标识、冒充人工创作、传播虚假信息等,依情节采取下架、限流、封禁等措施,并向主管部门报告。

昆仑万维深知技术发展需与责任并行,此次启动“双重标识”体系,不仅履行了企业责任,更为构建可信赖AI生态助力。同时,呼吁广大创作者共同遵守规定,维护真实、透明的内容生态。若发现规避、篡改或隐匿AI标识的内容,可通过官方邮箱举报,昆仑万维会及时处理。

相关文章地址:昆仑万维率先落地《AI生成内容标识办法》:构建“显隐双标”体系,守护内容生态真实底线

人工智能生成合成内容标识办法

开源工具xiaohongshu-mcp发布,实现小红书平台内容自动化发布,解放你的双手

一款名为xiaohongshu-mcp的小红书自动化工具引发关注。它基于模型上下文协议(MCP),借助 AI 技术,实现小红书平台自动化登录、内容发布和数据获取,给用户带来便捷运营体验。

该工具操作简单,支持用户通过配置和命令行,完成账户登录、图文发布及数据获取。得益于 MCP 协议,能与多种 AI 客户端无缝集成,用户和 AI 对话就能完成复杂操作。像内容创作者,能通过脚本快速发布图文帖子,无需手动编辑,尤其适合批量发布和市场调研的用户,大幅提升运营效率。

首次使用时,用户手动扫码登录,工具会自动保存登录状态,后续无需重复操作,简化流程。它通过HTTP JSON-RPC协议提供服务,运行于本地端口,开发者可轻松集成到现有工作流。

目前,其核心功能聚焦图文自动化发布,用户能快速上传含文字和图片的帖子。未来还计划扩展搜索、视频发布和数据分析等功能。作为开源项目,它基于Go语言开发,代码清晰,易于二次开发,还提供详细操作指南。

不过,用户使用时要注意遵守平台规范,合理控制操作频率,确保内容符合审核标准,避免账号风险。

体验地址:xiaohongshu-mcp官网入口 (海外网站需要科学上网)

xiaohongshu-mcp

微软在Copilot Labs平台推出“音频表达”工具,支持文本转语音与风格调整

近日,微软推出全新实验性AI中心——Copilot Labs,邀请用户参与AI创新。该平台为用户提供实验性AI工具,鼓励与全球社区共同塑造Copilot未来。

其首个工具“Copilot音频表达”利用微软最新语音生成模型,能把书面文本转化为自然流畅的语音旁白。用户可自由调整音频情感、个性和风格,比如为睡前故事选柔和语气,为励志演讲选激昂语调。

此工具支持英语,有情感模式和故事模式两种核心功能。情感模式下,用户提供脚本大纲,Copilot按不同风格演绎;故事模式结合多种声音风格,让故事更具表现力。生成的音频样本可免费用于个人项目。

“Copilot音频表达”全球免费开放,适用于所有现代浏览器,但建议用桌面计算机体验更佳。部分功能需用户登录Microsoft账户并拥有有效Copilot Pro订阅。

Copilot Labs的推出,让用户从技术使用者变为创造者和贡献者。微软希望通过这种开放创新模式,吸引更多人加入 AI 实验,共同探索人工智能的无限可能,为AI发展注入新活力。

体验地址:微软Copilot Labs平台官网 (海外网站需要科学上网)

Copilot Labs平台

阶跃星辰Step-Audio 2 mini模型发布,支持语音理解、生成与工具调用一体化

9月1日,阶跃星辰发布最强开源端到端语音大模型Step-Audio2mini。它在多个国际基准测试集上取得SOTA成绩,将语音理解、音频推理与生成统一建模,在诸多任务中表现卓越,还率先支持语音原生Tool Calling能力,可实现联网搜索等操作。

Step-Audio2mini在多个关键基准测试成绩领先。在通用多模态音频理解测试集MMAU上,以73.2分位列开源榜首;在衡量口语对话能力的URO Bench上,基础与专业赛道均获开源最高分;中英互译任务在多个评测集分数大幅领先;语音识别任务多语言和多方言排名第一。

它采用创新架构设计,采用真端到端多模态架构,突破传统结构,实现原始音频输入到语音响应输出的直接转换,架构简洁、时延低,能有效理解副语言信息与非人声信号。还首次引入链式思维推理与强化学习联合优化,能精细理解、推理并回应副语言和非语音信号,支持外部工具,解决幻觉问题并扩展多场景能力。

在实际案例中,它能精准识别大自然声音、精湛配音,还能实时搜索行业资讯、控制语速应对不同场景。当面对哲学难题,能将抽象问题转化为极简方法论,展现强大逻辑推理能力,为语音领域带来新突破。

详情查看:阶跃星辰Step-Audio 2 mini模型发布 (海外网站需要科学上网)

Step-Audio 2 mini模型

上海AI实验室发布书生·万象InternVL3.5模型,刷新开源多模态大模型性能记录

8月31日,上海人工智能实验室开源发布多模态大模型书生·万象InternVL3.5。该模型通过创新技术,实现推理能力、部署效率与通用能力的全面升级,开源从 1B 到 241B 各尺寸参数版本,刷新开源模型性能标杆。

InternVL3.5的旗舰模型在多学科推理基准MMMU中获开源模型最高分77.7分,在多模态通用感知基准MMStar和OCRBench分别取得77.9分和90.7分,超越GPT-5。文本推理基准也全面领先现有开源多模态大模型。依托级联式强化学习框架,全系列模型推理性能平均提升 16.0 分。

借助创新架构,38B模型在896分辨率下响应速度大幅提升,单次推理延迟大幅缩短。轻量化的InternVL3.5-Flash在减少视觉序列长度时,仍能保持接近100%性能。

它还加强了GUI智能体等核心能力,在多个任务中超越主流开源模型。提供九种尺寸模型,覆盖不同资源需求场景,包含稠密模型和专家混合模型,是首个支持GPT-OSS语言模型基座的开源多模态大模型。官方提供示例代码,方便不同规模模型部署。

ms-swift已支持对其训练,用户可准备数据微调,训练后推理并推送模型到 ModelScope。InternVL3.5的发布推动了多模态人工智能发展。

详情查看:上海AI实验室发布书生·万象InternVL3.5模型

腾讯AudioStory模型通过统一框架,解决长音频生成中的时间与情感一致性问题

近日,腾讯ARC团队发布AudioStory模型,利用大语言模型(LLMs)生成长篇叙事音频,解决了现有技术处理长篇音频的难题。

AudioStory的核心是统一的理解与生成框架,能处理视频配音、音频延续和长篇叙事音频合成等多种任务。它将大语言模型与音频生成系统结合,生成结构化且时间一致的音频叙事。具备强大的指令跟随推理生成能力,可把复杂叙事查询分解为按时间排列的子任务,保持场景转换连贯和情感基调一致。

该模型有两个显著特点。一是去耦合的桥接机制,将大语言模型与音频生成器协作分成两个专业化部分;二是端到端训练方式,统一指令理解与音频生成,提升组件协同效应。

研究团队还建立AudioStory-10K 基准数据集,涵盖动画音景等领域。通过大量实验,AudioStory 在单音频和叙事音频生成方面表现优于以往模型,指令跟随能力和音频质量卓越。

目前,团队已发布模型推理代码,并展示一系列演示视频,如经典动画《猫和老鼠》配音示例和基于文本生成长音频案例,展示了其广泛适用性和强大功能,为音频创作领域带来新的可能。

体验地址: 腾讯AudioStory模型官网入口 (海外网站需要科学上网)

 腾讯AudioStory模型

AI应用市场新动态:谷歌Gemini逐步逼近ChatGPT,移动端AI应用中国占主导

根据Andreessen Horowitz 发布的《前100名生成式AI消费应用报告》,AI应用市场有新变化。谷歌的Gemini虽仍落后于 ChatGPT,但在网络和移动应用领域正逐步缩小差距,中国公司在移动领域占据主导。

与2025年3月版本相比,本次报告新增网络应用减少,显示市场趋于稳定。移动应用新增14款,因应用商店加强对“ChatGPT克隆”监管。报告按月独立访问量和月活跃用户数对网络和移动应用排名。

网络应用中,ChatGPT仍居榜首,谷歌的Gemini和Deepseek紧随其后。移动应用方面,ChatGPT同样第一,Gemini、AI Gallery 和Doubao名列前五。

谷歌的Gemini家族首次在网络榜单占四个席位,月访问量约为ChatGPT的12%。在移动领域,月活跃用户几乎达ChatGPT的一半,在Android系统用户基础强大,约90%用户来自Android,而ChatGPT为 60%。

Grok竞争力上升,用户达 2000 万,发布Grok4和推出AI伴侣头像后用户数增长显著。Meta AI增长缓慢,网络排名第46位,未进移动榜单。

在中国市场,阿里巴巴的Quark、字节跳动的Doubao和Moonshot AI的 Kimi在网络前20名中占据席位,中国公司凭借庞大用户基础和严格监管政策获得优势。 (本文由AI辅助生成,部分内容人工编辑)

详情查看:谷歌Gemini加速追赶ChatGPT:AI应用市场格局生变,中国力量主导移动赛道

AI应用市场新动态


想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区

AITOP100平台官方交流社群二维码:

AITOP100平台官方交流社群二维码

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • xiaohongshu-mcp
  • Copilot Labs
  • AudioStory
  • Grok AI
  • 书生大模型
  • 谷歌Gemini
  • ChatGPT
相关资讯
  • 每日AI资讯-2025年09月01日

  • 每日AI资讯-2025年08月29日

  • 每日AI资讯-2025年08月28日

  • 每日AI资讯-2025年08月27日

  • 每日AI资讯-2025年08月26日

热点资讯

谷歌放大招!AI视频工具Google Vids免费开放,普通用户也能玩转专业剪辑

4天前
谷歌放大招!AI视频工具Google Vids免费开放,普通用户也能玩转专业剪辑

2025年自主AI智能体全景图:12款顶级产品深度评测与企业应用指南

8天前
2025年自主AI智能体全景图:12款顶级产品深度评测与企业应用指南

Nano Banana AI深度实测教程:Google神秘武器如何重新定义图像编辑标准

6天前
Nano Banana AI深度实测教程:Google神秘武器如何重新定义图像编辑标准

重磅更新!AITOP100平台接入Google Gemini 2.5 Flash Image模型,可免费体验Nano Banana!

3天前
重磅更新!AITOP100平台接入Google Gemini 2.5 Flash Image模型,可免费体验Nano Banana!

Anthropic推出Claude Code网页版,降低使用门槛并与OpenAI Codex形成竞争

4天前
Anthropic推出Claude Code网页版,降低使用门槛并与OpenAI Codex形成竞争
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有