• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

每日AI资讯-05月21日

每日AI资讯-05月21日
AI TOP100
2025-05-21 18:21:02

谷歌放大招!文生电影神器Veo3登场,4K画质+声画同生颠覆创作

在5月20日的谷歌开发者大会上,一款堪称“电影制作革命”的AI工具Veo3正式亮相。这个新一代视频生成模型有多牛?简单来说,现在你只需敲几段文字,就能直接“变”出带音效的4K电影片段——从潺潺溪流的背景音到角色对话的口型同步,它都能一键搞定。 Veo3最绝的是“声画一体化”功能。

以前做视频,找音效、对口型堪称折磨人的“后期地狱”,但现在只需输入一句“夕阳下的咖啡馆,男女主轻声交谈”,Veo3不仅能生成人物表情细腻、光线逼真的4K画面,还能同步生成杯碟轻碰的环境音和贴合台词的对话声,连衣服褶皱的动态都符合物理规律。对短视频创作者和独立导演来说,这简直是把“编剧+摄影师+音效师”塞进了一台电脑里。

画质方面,Veo3支持4K分辨率,不管是雪山延绵的空镜,还是科幻片里的未来城市广角镜头,细节都能经得起放大细看。风格更是百搭,既能模仿王家卫的复古滤镜,也能复刻好莱坞大片的跟拍运镜,甚至能生成教育动画里的卡通场景,难怪刚发布就被影视圈人士称为“数字时代的摄像机”。

不过目前Veo3还比较“高冷”,只对美国地区订阅了Gemini Ultra的用户和企业客户开放,并且内置了数字水印防止滥用。但业内已经炸开了锅,有人预测它可能让小成本电影制作门槛暴跌,也有人担心“AI造假”风险。不管怎样,这个能“听懂文字造电影”的工具,已经让人们看到了内容创作的新次元。


腾讯混元大模型放大招!Turbo S升级成“最强大脑”,游戏美术效率暴增数十倍

5月21日,腾讯的AI大模型家族迎来“集体进化”,最让人眼前一亮的是混元Turbo S和T1模型的升级——前者现在能解竞赛数学题、写复杂代码,后者则学会了“边看图边思考”的新技能。 先看Turbo S,这个被称为“快思考”的模型现在可不得了:在全球权威的大模型测试中,它的排名已经冲进全球前八,国内仅次于DeepSeek。秘诀在于腾讯给它“喂”了更多数据,还教会它“长短思维链融合”的本事,现在解物理题、写Python代码都不在话下,甚至能挑战奥数题。

作为国内首个混合Mamba-MoE架构的模型,它就像个聪明又快手的“理科生”,处理逻辑题又快又准。 再说“深度思考”的T1模型,这次升级后更擅长“复杂任务”了。比如给它几张图片,它能像人类一样边看边分析:“这张图里的建筑风格属于巴洛克,旁边的人物穿着18世纪服饰,推测场景可能设定在维也纳”。新推出的T1-Vision视觉模型更是厉害,支持多图输入和“长思维链”推理,看电影分镜图能直接生成剧情分析,对游戏策划和设计师来说简直是“灵感加速器”。

在多模态领域,腾讯更是火力全开:图像生成2.0能“毫秒级”出图,3D模型升级到2.5版后,做出来的虚拟角色连头发丝都清晰,几何精度提升了10倍,纹理达到4K画质。最让人激动的是游戏视觉生成平台上线,能一键生成技能特效、角色动态立绘,让游戏美术师的工作效率暴涨几十倍,未来还能做可漫游的3D场景,简直是游戏行业的“生产力革命”。 腾讯这次更新就像给AI界扔了颗“全能型炸弹”,从写代码到做游戏,从看图片到生成3D模型,几乎覆盖了数字内容创作的全链条。难怪有开发者说:“以后可能真的是‘AI打下手,人类搞创意’的时代了。”

腾讯混元

字节跳动甩出王炸!开源多模态模型BAGEL,修图生成样样能打

最近字节跳动在AI圈扔下一枚“开源核弹”——推出了名为BAGEL的多模态模型,参数高达140亿,却能在图文生成和编辑领域“拳打脚踢”,甚至能和专业级工具掰手腕。

先看实力:在标准多模态理解测试中,BAGEL轻松超过了Qwen2.5-VL和InternVL-2.5等热门开源模型,生成图片的质量能和Stable Diffusion 3媲美,修图效果更是碾压多数开源工具。比如你想把照片里的阴天改成晴天,它不仅能精准替换天空,还能让地面光影跟着变,连云层的质感都做得像真的一样。

BAGEL的“秘密武器”是它的混合架构:用两个独立编码器分别捕捉图像的“像素级细节”和“语义级含义”,就像同时有两个大脑在工作——一个盯着像素点修图,一个琢磨“这张图想表达什么”。训练时它“吃”下了数万亿的文字、图片、视频数据,所以不仅能“看懂”图文,还能玩出很多花样:比如根据“未来城市”的描述生成图片,或者在现有图片上“脑补”出未来几帧的画面,甚至能模拟三维空间的物体移动。 对普通用户来说,最实用的是它的“智能编辑”能力。比如你拍了张自拍照,觉得背景太乱,只需画个框标出来,BAGEL就能自动“擦除”杂物并补全背景,效果自然得像原图。对设计师来说,它能根据文字描述直接生成设计稿,还能按需求调整风格——前一秒是赛博朋克风,下一秒就能变成水墨画风,省了大量改稿时间。

虽然BAGEL现在还是“技术流”选手,需要一定的编程基础才能用,但开源社区已经炸了锅。有开发者说:“这相当于把专业修图师和插画师的大脑开源了。”随着更多人参与优化,未来它可能会走进普通人的手机相册,成为“一键变美”“一键生成”的神器。

BAGEL

豆包出大招!语音播客模型上线,秒变双人聊天神器

想做播客却苦于没有搭档?不会剪辑音频?现在豆包推出的语音播客模型能帮你“一键解决”——只需输入文字,就能生成逼真的双人对话播客,连“嗯”“哦”这样的语气词都自然得像真人聊天。

这个模型基于流式架构,最大的亮点是“三秒成播”:输入一个话题,比如“聊聊最近的AI新工具”,它会自动生成两个人的对话脚本,一个当“主持人”抛问题,一个当“嘉宾”深度分析,中间还会穿插“对,没错”“确实是这样”的互动,听着就像真的在电台里聊天。而且声音高度拟人,能模仿不同性别、年龄的音色,甚至能根据内容调整情绪——聊科技时沉稳专业,聊娱乐时轻松活泼。

对内容创作者来说,这简直是“效率救星”:以前写好稿子后,要找配音员、剪辑音频、加音效,一套流程下来至少半天,现在只需把文本复制进去,选好音色,5秒钟就能生成带背景音乐的完整播客。更绝的是它能“深度搜索”——输入“五一旅游攻略”,它会自动抓取最新的景点开放时间、网红打卡地,甚至实时交通数据,让你的播客永远“保鲜”。

如果你是“懒人”,还能直接上传文档或网页链接,模型会自动提炼重点,转换成口语化的对话。比如丢进去一篇新闻报道,它能把枯燥的文字变成“主播+专家”的解读节目,连过渡句都帮你想好了。

目前这个模型即将在豆包APP、PC端和扣子等平台上线,无论是想做知识科普、热点评论,还是情感树洞类播客,它都能成为你的“虚拟搭档”。有用户调侃:“以后可能连播客主播都要失业了,不过对我们这些想试试的普通人来说,简直是零门槛入行了。”

豆包AI播客

谷歌发手机AI神器Gemma3n!2G内存就能跑,拍照识物秒回应

现在手机也能玩转“全能AI”了!谷歌在I/O大会上推出的Gemma3n模型,只需2GB内存就能在手机、平板上流畅运行,拍照识物、语音翻译、视频分析样样精通,而且不用联网,彻底告别“云端等待”。

这个小家伙别看“身材小”,本事可不小:你拍张花的照片,问“这是什么植物”,它能秒答“这是蓝花楹,原产于南美洲”;录一段街头的声音,它能识别出“有汽车喇叭声、咖啡馆的杯碟声、远处的钢琴声”;甚至能分析短视频内容,比如看一段猫咪视频,它会告诉你“猫的品种是布偶猫,正在玩毛线球,表情看起来很开心”。

技术上,Gemma3n用了“逐层嵌入”技术,把模型压缩得很小却很精,处理1080p视频帧和10秒音频的准确率高达90%。最贴心的是它支持140多种语言,在国外旅游时拍个菜单,就能实时翻译出声,连方言都能听懂几分。对听障人士来说,它还能实时解析手语视频,把动作翻译成文字,被称为“史上最强手语模型”。 开发者也能玩出花样:在Google Colab上花几小时就能给模型“定制培训”,比如让它专门识别某种工业零件,或分析特定领域的文献图片。

现在Hugging Face上已经有预览版,发布首日下载量就破了10万,很多开发者用它做了手机端的“AI小助手”——比如拍照记账、语音备忘录、实时环境监测等。 当然,也有人担心它的开源协议限制商业使用,谷歌表示未来会优化。但不管怎样,这个“揣在兜里的AI大脑”已经让人们看到了手机的新可能:不用下载一堆APP,一个模型就能搞定N种需求,说不定以后手机里的“万能工具箱”里,就藏着这么个小而强的AI助手。


谷歌Jules coding助手公测!自动修Bug+写代码,程序员摸鱼有望?

程序员们注意了!谷歌的AI编码助手Jules正式开放测试,现在只要有谷歌和GitHub账号,就能让AI帮你写代码、修Bug,甚至自动提交代码——简直是“加班救星”。

Jules有多智能?举个例子:你发现代码里有个Bug,只需在GitHub上提交任务,Jules会自动克隆你的代码库,在云端虚拟机里分析问题,然后生成修复方案。

比如你的JavaScript函数老是返回错误,它会先找出逻辑漏洞,再写出修正代码,最后自动提交Pull Request,整个过程不用你盯着,喝杯咖啡的功夫就搞定了。 最让人放心的是它的“透明化”设计:执行任务前,会先给你看详细的“工作计划”,比如“第一步检查变量定义,第二步测试循环逻辑”,你觉得没问题了再让它开工;完成后还会生成“代码差异对比”和“语音变更日志”,让你快速理解改了哪里。而且它能根据你团队的代码风格自动调整,比如你们习惯用驼峰命名法,它就绝不会写出下划线风格的变量名。

目前Jules支持Python和JavaScript,每天有5次免费任务额度,适合中小团队试用。虽然复杂项目处理起来还有待优化,但在处理重复性任务上已经很靠谱——比如写单元测试、更新依赖包,效率比人工快3倍以上。有开发者测试后说:“以前写API文档要半天,现在Jules几分钟就生成了初稿,简直是‘代码加速器’。”

和OpenAI的Codex相比,Jules更擅长“多步骤任务”,比如帮你把一个旧项目升级到新技术框架,它会分阶段制定计划,先处理兼容性问题,再重构代码结构,稳定性更高。不过也有人担心:“如果AI都能写代码了,程序员会不会失业?”但更多人觉得,这其实是把程序员从“搬砖”中解放出来,让大家有时间去做更有创造性的设计。

jules

谷歌虚拟试衣间开挂!上传照片秒变模特,还能自动比价下单

网购衣服最头疼的就是“卖家秀vs买家秀”,但谷歌新推出的虚拟试衣工具让这个难题成了过去式——只需上传一张全身照,就能看到自己穿上任意衣服的效果,连褶皱和光影都逼真到能“以假乱真”。

怎么玩?很简单:在谷歌搜索或购物页面找到带“试穿”图标的商品,上传你的正面全身照(不用担心隐私,谷歌承诺数据仅用于生成试穿图),3秒钟后就能看到自己穿着这件衣服的效果图——可以是正面站着的,也能是侧面抬手的,甚至能模拟走路时的动态。比如你试一条牛仔裤,模型会根据你的身材数据(不用手动输入,AI自动分析照片)显示裤长是否合适、腰部是否贴身,连布料的垂坠感都和真的一样。

更厉害的是它的“智能购物”功能:你可以告诉AI“我想要一条适合夏天的、价格在200美元以内的碎花连衣裙”,它会从50亿商品数据中筛选出符合条件的,生成你的专属试穿图;还能帮你监控价格——比如你看好一件上衣,设定“降价10%提醒”,它会实时追踪价格变动,一降价就通知你。最爽的是“自动下单”功能,确认尺码颜色后,AI会帮你自动加购物车、付款,全程不用手动操作。 对商家来说,这个工具可能会颠覆行业:以前因为尺码不合导致的退货率高达30%,现在有了试穿图,预计能降低40%退货率。对消费者来说,再也不用买一堆衣服回家试穿了,环保又省钱。不过目前只在美国上线,且支持的品牌主要是欧美快时尚,但已经有用户呼吁:“快把这个功能引进中国!”

当然,也有人担心AI生成的图片太逼真,会不会被用来造假?谷歌表示已经内置了数字水印,而且试穿图会标注“AI生成”,避免误导。总的来说,这个工具就像把“私人试衣间”装进了手机,让网购衣服变得像在实体店试穿一样直观——说不定未来逛街,真的可以“躺着逛遍全球品牌”了。



更多AI行业最新资讯新闻信息(ai界最新新闻)请关注AI人工智能网站--AITOP100平台--AI资讯

0
0
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • Jules
  • Veo
  • 豆包AI官网
  • 腾讯混元大模型
  • Gemma 3
相关资讯
  • 每日AI资讯-2025年08月29日

  • 每日AI资讯-2025年08月28日

  • 每日AI资讯-2025年08月27日

  • 每日AI资讯-2025年08月26日

  • 每日AI资讯-2025年08月25日

热点资讯

谷歌放大招!AI视频工具Google Vids免费开放,普通用户也能玩转专业剪辑

3天前
谷歌放大招!AI视频工具Google Vids免费开放,普通用户也能玩转专业剪辑

2025年自主AI智能体全景图:12款顶级产品深度评测与企业应用指南

7天前
2025年自主AI智能体全景图:12款顶级产品深度评测与企业应用指南

Nano Banana AI深度实测教程:Google神秘武器如何重新定义图像编辑标准

5天前
Nano Banana AI深度实测教程:Google神秘武器如何重新定义图像编辑标准

重磅更新!AITOP100平台接入Google Gemini 2.5 Flash Image模型,可免费体验Nano Banana!

2天前
重磅更新!AITOP100平台接入Google Gemini 2.5 Flash Image模型,可免费体验Nano Banana!

Anthropic推出Claude Code网页版,降低使用门槛并与OpenAI Codex形成竞争

3天前
Anthropic推出Claude Code网页版,降低使用门槛并与OpenAI Codex形成竞争
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有