• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

每日AI资讯-2025年09月28日

每日AI资讯-2025年09月28日
AI TOP100
3小时前

快手KAT系列Agentic Coding大模型:KAT-Dev-32B和KAT-Coder

2025年9月25日,快手Kwaipilot团队发布KAT系列两款大模型——KAT-Dev-32B和KAT-Coder,在代码智能领域表现亮眼。KAT-Dev-32B是开源的32亿参数模型,在SWE-Bench Verified测试中解决率达62.4%,开源模型里排第5,适合轻量级开发环境。KAT-Coder作为闭源旗舰模型,解决率73.4%,功能强大且实用高效。

对于开发者而言,这两款模型意义重大。KAT-Dev-32B开源,方便开发者自由调用和实验,已在Hugging Face平台上线。KAT-Coder可通过StreamLake平台获取API调用,后续还会发布技术报告。它们为程序员提供了更多选择,助力在代码开发和智能应用领域高效工作。

在人工智能和机器学习快速发展的当下,这两款模型将推动代码智能技术普及。开发者借助它们,能在复杂编程环境中更得心应手,提升开发效率,降低开发成本。未来,随着技术不断进步,KAT系列模型有望在代码智能领域发挥更大作用,为行业发展注入新动力。

详情查看:快手推出双模编程模型:开源KAT-Dev-32B与闭源KAT-Coder性能领先

快手KAT系列Agentic Coding大模型

Moondream3.0预览版发布:2亿激活参数,高效视觉推理模型开源

最近,Moondream3.0预览版发布,这款基于高效混合专家架构的模型,在视觉推理能力上令人惊叹。它仅激活2亿参数,却拥有9亿参数总量,轻量化设计使其在复杂场景表现出色。与前代及GPT-5等顶尖模型相比,多项基准测试成绩优异,实现技术飞跃。

Moondream3.0支持32K上下文长度,适合实时交互和代理工作流。搭载创新SigLIP视觉编码器,能高分辨率处理图像,支持多裁剪通道拼接。虽训练数据量仅约450亿个令牌,但性能卓越。

该模型“全能”视觉技能突出,涵盖开放词汇物体检测、点选、计数等多种功能,还能直接生成结构化输出。在用户界面理解、文档转录和物体定位方面表现出色。实际应用中,能轻松识别复杂场景,应用范围广泛。

Moondream3.0开源,秉持“无训练、无地面真相数据、无重型基础设施”理念,开发者简单提示即可解锁强大视觉理解能力。已在机器人语义行为、移动设备和Raspberry Pi上成功部署,适合边缘计算场景。

详情查看:Moondream 3.0正式发布

Moondream3.0

腾讯混元图像3.0正式发布:业界首个开源商用级原生多模态生图模型

2025年9月28日,腾讯混元微信公众号官方正式发布混元图像3.0,这是业界首个开源商用级原生多模态生图模型。拥有80亿参数,效果可与顶尖闭源模型媲美,模型权重和加速版本已在GitHub和Hugging Face等开源社区发布,供开发者免费下载使用。

其亮点在于“原生多模态”技术架构,能同时处理文字、图片等多种输入输出形式,具备图像生成和语义理解双重能力,如同“智能画家”。语义理解能力显著提升,用户输入简单提示词,如生成科普漫画,模型就能自动生成完整内容。

混元图像3.0能精确生成用户指令,包括图片小字和长文本。还能处理复杂文字要求,生成商品图、海报等,满足各类创作需求。对于插画师、设计师和缺乏美术基础的内容创作者,它能大幅提升创作效率,原本数小时的创作可能几分钟完成。

该模型基于50亿图文对和6TB语料数据多模态混合训练,未来还将推出图生图、图像编辑等新功能,增强用户体验。用户可通过腾讯混元官网体验这一全新图像生成技术。

体验地址:腾讯混元官网入口 -首页-图像模型

腾讯混元图像3.0

Cherry Studio v1.6.0:开源AI桌面应用升级

2025年9月25日,开源AI桌面应用Cherry Studio发布v1.6.0版本,支持Windows、macOS和Linux系统,带来更强性能和更多实用功能,提升用户操作体验。

新版本接入全新AI SDK,重构底层框架,响应速度更快,操作更流畅。新增Perplexity SDK和Aionly提供商支持,为Anthropic提供便捷OAuth登录设置。集成PaddleOCR作为本地识别引擎,增强本地识别能力。新增内置API服务器,方便高级用户和开发者集成与自动化开发。

编辑和文件处理方面,富文本编辑器支持生成和导航目录,可自由调整字体大小,长文处理能力提升。知识库功能重构,支持文件和文件夹批量上传,聊天文本附件可直接预览。

稳定性与修复上,解决上百个已知问题,优化多平台兼容性。引入Biome和Oxlint等新一代前端工具链,提升开发效率和代码质量。这一系列改进,让Cherry Studio成为开发者和普通用户的理想选择。

项目地址: https://github.com/CherryHQ/cherry-studio/releases  (海外网站需要科学上网)

Cherry Studio v1.6.0

YouTube Music试水AI主播功能,对标Spotify DJ,开放美国用户测试

YouTube Music周五宣布测试AI音乐主播功能,为用户收听的音乐提供相关故事、粉丝趣闻和评论解说,这是对Spotify两年前推出AI DJ功能的回应。

YouTube Music的新功能基于对话式AI实验,今年7月推出AI对话电台功能,允许用户创建自定义电台。此次AI主播功能通过YouTube Labs测试,这是YouTube新推出的AI实验中心,类似Google Labs。

YouTube Labs向所有用户开放,无需Premium会员资格,但目前仅有限数量美国用户能访问。该平台近期实施多项AI功能,为创作者发布生成式AI工具,推出AI驱动搜索结果轮播等。同时,YouTube也在打击AI垃圾内容,限制创作者从“非真实”内容获利。

音乐流媒体平台将AI个性化体验视为竞争关键,通过提供智能音乐解说和背景故事,创造沉浸式听觉体验。YouTube Labs的开放性策略,有望获得广泛用户反馈完善功能,但限制美国用户测试也体现其对稳定性和监管合规的谨慎。

体验地址:登录YouTube Music官网

YouTube Music

商汤Seko:上线1个月,用户数突破10万

2025年9月28日,商汤微信公众号“商汤科技SenseTime”发文宣布:商汤Seko上线仅1个月,用户数突破10万,成为AI视频创作领域黑马,被创作者称为“AI短剧大师”。它凭借不用跨平台、不用调参数、不用学软件,对着创意“唠嗑”就能出片的优势,受到视频团队、自媒体大V和短剧导演青睐。

传统AI视频创作流程繁琐,需在多个软件间切换,学习成本高,输出一致性差。Seko则采用“创编一体”模式,一键对话生成完整视频,角色、风格、光线高度统一,0基础5分钟上手,适用短剧、广告、自媒体等多种场景。

技术上,Seko的AI能自动解析剧本生成详细分镜表,专业级成片编辑器所见即所得,可拖拽分镜调整顺序,修改细节。它还集成12个主流模型,自动匹配最佳模型。升级后的“一致性生图引擎”解决角色、光线、风格不一致问题。

使用Seko成本大幅下降,传统动画制作每分钟成本约2万元,用Seko后降至100元。未来,Seko还将上线“多语言配音”和“3D角色库”功能,降低出海视频制作门槛。

体验地址:商汤Seko官网平台

商汤Seko

通义万相国际版Wan2.5发布2大核心功能:音频驱动视频生成与指令式图像编辑

2025年9月28日和9月26日,通义万相国际版Wan2.5预览版接连发布两大“黑科技”功能,在视频生成和图像编辑领域引发关注。

音频驱动视频生成功能是创新之举,打破常规创作方式。以前做视频靠文字脚本和图片素材,现在可直接用音频输入做文本转视频和图像转视频生成。结合音频和文本提示或参考图像,就能打造完整视频故事,省时省力,还能激发更多创意。Wan2.5支持生成长达10秒的视频,质量大大增强,让创作者能解锁更丰富视觉空间,讲好故事。

图像编辑功能方面,Wan2.5有基于指令的编辑功能,支持各种图像编辑任务,专业设计师和“小白”都能轻松使用,提高效率。同时,它支持从单个或多个图像参考生成,保证面部、产品和样式等视觉元素一致,有助于广告设计等创意完美呈现。

通义万相国际版Wan2.5预览版为创作者提供更厉害的工具,随着技术进步,将在视频生成和图像编辑领域发挥更大作用,开启创意科技新增程。

体验地址:通义万相网页版官网



想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区

AITOP100平台官方交流社群二维码:

aitop100官方交流30群

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • Seko
  • 腾讯混元大模型
  • Wan
  • 通义万相
相关资讯
  • 每日AI资讯-2025年09月28日

  • 每日AI资讯-2025年09月26日

  • 每日AI资讯-2025年09月25日

  • 每日AI资讯-2025年09月24日

  • 每日AI资讯-2025年09月23日

热点资讯

字节跳动豆包翻译大模型上线:28种语言秒译,性能碾压GPT-4o,价格直接打“骨折”?

6天前
字节跳动豆包翻译大模型上线:28种语言秒译,性能碾压GPT-4o,价格直接打“骨折”?

阿里夸克重磅推出AI创作平台“造点”:AI生图+视频生成全免费,Midjourney V7+通义万相Wan2.5双引擎加持

4天前
阿里夸克重磅推出AI创作平台“造点”:AI生图+视频生成全免费,Midjourney V7+通义万相Wan2.5双引擎加持

Wan2.5 Preview正式上线:AI生成电影级视频+“听懂”人话的多模态神器来了

4天前
Wan2.5 Preview正式上线:AI生成电影级视频+“听懂”人话的多模态神器来了

2025年9月25日重磅:Meta上线320亿参数代码模型CWM,AI写代码竟能"先试后做"?

3天前
2025年9月25日重磅:Meta上线320亿参数代码模型CWM,AI写代码竟能"先试后做"?

重磅升级!阿里Qwen-Image-Edit-2509多图像编辑神器,一键生成广告大片不是梦

5天前
重磅升级!阿里Qwen-Image-Edit-2509多图像编辑神器,一键生成广告大片不是梦
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有