海螺 AI 解锁全新 “导演” 模式:I2V-01-Director 模型向所有人开放
中国的人工智能公司海螺 AI(Hailuo AI)说啦,他们新研发的 “I2V-01-Director” 模型,现在全球用户都能用啦!这个超厉害的 AI 视频生成工具,被大家叫做 “新 AI 电影制作人”,能让你用超厉害的文本和图像模型,把自己的创意变成像电影一样好看的作品。
在 X 平台(以前叫推特)上,有个叫 @azed_ai 的用户可兴奋了,说:“能精准控制相机,把想法变成电影般的艺术作品,你准备好当导演了没?” 海螺 AI 官方账号也在 2 月 22 号发消息,说模型已经全面上线,还发了体验链接。这个模型最牛的地方,就是能用自然语言指令控制相机,你简单说几句话或者下个具体命令,就能控制镜头怎么动,做出又流畅又专业的视频画面。
还有用户在 X 平台评论呢。@LudovicCreator 说:“I2V-01-Director 模型让创作有了更多可能,它的精确控制太让人惊喜了。”@KusanagiMo67070 说:“这直接把电影叙事的水平提高了一个档次!” 现在,这个模型已经加到海螺 AI 的视频创作平台里了,大家上官网就能马上体验。
以前海螺 AI 就因为能做出特别逼真的视频受到关注,这次 I2V-01-Director 模型发布,更证明了它在 AI 影视这块的领先地位。业内的人觉得,这个工具一开放,专业视频制作的门槛就变低了,给搞创意的人更大的创作自由。
海螺 AI(HaiLuo AI)工具地址》》》详情查看
Pixverse 推出 V4.0 更新:同步音效与转绘功能震撼登场
做人工智能视频生成工具的 Pixverse,正式发布 V4.0 版本啦!用户都说这更新 “强得有点吓人”。看 X 平台上的消息,Pixverse V4.0 不仅把底层模型大大升级了,还新添了同步生成音效和稳定的转绘功能,给内容创作者带来好多新玩法。
这次更新里,最吸引人的就是 “Restyle” 转绘功能。X 用户 @toto2AI 晒了个视频,说用 V4 的转绘功能,一键就能把实拍的猫咪视频变成水彩风动漫风格,效果超惊艳。@op7418 说,新版本 10 秒就能生成视频,真实感更强,对提示词的还原度也更高,还能同步输出音效,创作体验一下子就丰富起来了。
官方账号 @PixVerse_发帖子,详细介绍了 V4.0 的厉害之处:更真实、动作更自然、生成速度更快,还能一键做出又有画面又有声音的内容。@AIYIRAN1231 测试后也说,新功能让视频创作 “更流畅自然”,还推荐大家赶紧去体验这个免费版本。
从 X 平台上大家的反馈来看,V4.0 的转绘功能特别受欢迎,都觉得它开启了 “未来内容玩法” 的新篇章。比如,@BrentLynch 说他用 Restyle 功能做出了自定义风格,120 个字符就能灵活实现视频到视频(V2V)的转换,这功能成了他 “最喜欢的特性”。@AIMIRAI46487 分享了一段 V4 生成的吉他演奏视频,说音效和画面完美同步,太让人印象深刻了。
Pixverse V4.0 一发布,在 AI 视频生成领域的竞争力更强了。业内人士觉得,这次更新不仅提高了技术水平,也给创意产业带来更多机会。
Pixverse AI软件官网地址》》》详情查看
腾讯云智能数智人、企点客服全面接入 DeepSeek
2 月 24 号,腾讯云智能数智人和腾讯企点客服宣布,全面接入 DeepSeek 大模型。有了这个模型超强的语义理解和意图识别能力,用户体验能变得更好,服务质量和客户满意度也能跟着提升。
腾讯云智能数智人接入 DeepSeek 大模型后,用户不用自己开发,在数智人平台里用内置的 V3、R1 等模型,就能让 DeepSeek 有真人的样子,还能自然流畅地交流。在交互的时候,数智人能很快整合各种信息,给出准确答案,还能进行多轮对话,理解上下文,像政策问答、景区导览、展厅接待这些场景都能用。在播报的时候,数智人结合 DeepSeek 生成的口语化表达,再配上新出的 “2D 小样本 - 免定制” 数智人,几分钟就能从文案做出成品视频,内容生产效率大大提高。
想体验也很方便,用户登录腾讯云智能数智人平台,创建数字人会话项目,按自己需求选 DeepSeek V3 或 R1 模型,就能和 “真人版” DeepSeek 智能交互了。
同时,腾讯企点客服也通过实时联网搜索,和 DeepSeek 大模型一起,做出了智能客服解决方案。企点客服机器人既能实时联网找信息,又有 DeepSeek 强大的语义理解能力,在回答知识密集型问题的时候,准确率大大提高,模型幻觉的情况也少了很多,客户服务满意度自然就上去了。这个方案在政务、零售、文旅、金融等好多行业都能用,像满减优惠计算、多种相似产品型号识别、复杂产品信息简化这些业务场景,它都能处理得很好。
考虑到政府、金融这些行业对数据安全要求高,腾讯企点客服还弄了三层防护机制,包括数据加密传输、内容安全过滤、访问权限控制,保证企业知识资产和对话服务全程安全合规。
用户上腾讯企点客服官网,点右下角 “申请体验”,就有专门的服务人员安排体验产品,感受智能客服带来的高效和便捷。这次腾讯云智能数智人和企点客服接入 DeepSeek 大模型,不光让服务更智能了,也给行业数字化转型提供了新动力和新方案。
月之暗面推出新优化器 Muon,计算效率大幅提升
最近,人工智能领域又有大动静。月之暗面(Moonshot)宣布开源新版优化器 Muon,计算效率直接提升到传统 AdamW 的两倍。这新优化器出来的时候,正好赶上 DeepSeek 要连续开源好几个代码库,一下子就在业内引起了很多关注和讨论。
Muon 优化器最开始是 OpenAI 的研究者 Keller Jordan 等人在 2024 年提出来的,在训练小规模模型的时候表现特别好。不过,模型规模一大,原来的 Muon 在性能提升上就遇到麻烦了。所以,月之暗面团队就深入研究,做了技术改进,主要是加了权重衰减和一致的均方根(RMS)更新,这样就能在大规模训练里用 Muon 了,还不用再调超参数。
新的 Muon 优化器已经用在最新推出的 Moonlight 模型上了。Moonlight 是一种有 3B/16B 参数的混合专家(MoE)模型,训练了 5.7 万亿 tokens 之后,性能提升特别明显,现在是 “帕累托前沿”。这就意味着,在同样的训练预算下,Moonlight 模型在各项性能指标上都比别的模型强。
月之暗面还把 Muon 的实现代码开源了,发布了预训练和中间检查点,给研究人员后续研究提供了很有用的资源。研究发现,Muon 优化器训练的时候需要的 FLOPs 只有 AdamW 的 52%,这更证明了它在大规模语言模型训练里的高效。
月之暗面的 Muon 优化器,性能比传统优化器强,还开源了,给整个 AI 领域发展注入了新活力。以后肯定会有越来越多研究者和开发者参与进来,说不定能推动人工智能技术再进一步呢。
AI 洗稿泛滥!今日头条:2025 年加大 AI 识别与线下打击
在今天的 “今日头条平台治理开放日” 上,今日头条安全运营负责人闫梦茹,详细说了平台在打击同质化内容、网络诈骗和网络水军方面的成果,还有以后的计划。
说到同质化内容太多这个问题,闫梦茹说,AI 技术让低质量内容洗稿变得容易了,像 “蚂蚁 AI” 这种专业洗稿工具,更是让这种现象越来越严重。过去一年,今日头条处理了 781 万多篇同质化内容,整治了 6.3 万多个违规账号,还配合警方,针对地方团伙发布同质化谣言立了 2 个案子,发了 6 篇治理公告。
在治理网络诈骗和网络水军方面,平台拦截了 150 多亿次虚假流量,处理了 13960 条水军招募内容,封禁了 72 万多个违规账号,禁言 6000 多个违规账号。
展望 2025 年,闫梦茹表示,团队会升级模型识别能力,加大线下打击力度,加强对作者的教育,进一步提升平台治理水平。
百度 APP 全面焕新:上线 AI 入口 DeepseekR1 深度搜索不卡顿
今天,百度 App 宣布有重大更新,全新的 AI 入口全量上线了,还把文心大模型和 DeepSeek 的模型能力深度融合,用户体验全面升级。
这次升级的重点,是集成了好多超厉害的智能功能,像 “AI 搜索”“全网信息提炼”“捏一下 AI 总结”“数字人智能体” 等等。有了这些功能,百度 App 能更准确地明白用户需求,给出更符合个人喜好的搜索结果和智能总结。
百度 App 靠着海量的用户画像和行为数据,再结合大模型的推理思考能力,能深刻理解用户的意图。这就意味着,每个用户都能得到符合自己兴趣和需求的搜索结果,真正做到了 “千人千面” 的个性化体验。
同时,百度 App 还利用搜索溯源库、智能体开发者生态和 AIGC 创作功能,给用户提供各种各样的内容。通过动态组织和智能总结,百度 App 能推荐出多模态的丰富内容,用户不用在一堆网页里跳来跳去筛选,直接就能看到精炼后的有用信息。
值得一提的是,2 月 16 号,百度搜索就说要全面接入 DeepSeek 和文心大模型的最新深度搜索功能。2 月 20 号,百度 AI 搜索正式接入 DeepSeek-R1 满血版,还和百度联网搜索功能深度融合。这一升级,上线第一天使用次数就突破了千万次,可见用户对百度 App 新功能有多喜欢。
阶跃星辰举办首届生态开放日,智能终端 Agent 成为焦点
前几天,阶跃星辰在上海成功办了首届 Step UP 生态开放日。活动来了好多各行各业的重要合作伙伴,一起展示了基于大模型技术的各种应用场景和创新体验。阶跃星辰 CEO 姜大昕在开幕的时候说,智能终端 Agent 是大模型技术落地的关键突破点,以后会重点在汽车、手机、具身智能和 IoT 这些核心场景布局。
在智能汽车这块,阶跃星辰宣布和吉利汽车集团、千里科技加深技术合作。姜大昕说,汽车是智能终端 Agent 最重要的落地场景,三方合作能给汽车智能化变革加点新动力。在手机终端方面,阶跃星辰和 OPPO 深度合作,把 Agent 技术集成到手机里,提升用户交互体验。OPPO 智能助理部部长万玉龙说,基于阶跃 Step 系列模型,OPPO 推出了好多创新 AI 功能,能帮用户更好地用手机。
除了智能终端,阶跃星辰还和金融、内容创作、新零售、数字人等行业的伙伴深入合作,想在各个垂直领域做出创新应用。特别是在金融财经领域,阶跃星辰和上海报业旗下的界面财联社一起创办了大模型科技公司财跃星辰,探索大模型在金融领域的应用,还推出了几款面向 C 端的智能助手。
为了帮开发者,阶跃星辰发布了升级版的 “繁星计划”,从模型、算力、资本、数据到企业孵化,全方位支持,助力大家创新突破。这个计划就是想降低开发门槛,提高效率,推动大模型产业快速发展。
这次生态开放日,既展示了阶跃星辰在智能终端 Agent 领域的探索成果,也说明大模型技术在好多行业都开始广泛应用了,以后肯定还能推动各行各业智能化发展。
Grok 3 语音功能正式上线:支持 10 种模式,甚至包括 18 禁选项
埃隆・马斯克旗下的 xAI 公司说,他们的人工智能聊天机器人 Grok3 语音功能正式上线啦!这个大家盼了好久的功能,现在通过 Grok 应用程序就能用,目前只支持英语交流。看 X 平台上的消息,用户更新 Grok 应用后,在界面右上角 “新对话” 按钮旁边,就能看到新添的语音标志,点一下就能体验新功能。
xAI 说,Grok3 语音功能有 10 种不同模式,其中有两种标着 “18 禁” 选项,这可引起用户的热烈讨论了。虽然具体模式细节还没全公开,但这设计说明 Grok3 在交互多样性上有突破,也体现了马斯克对 “最大化真实性” AI 的坚持。X 用户 @canlee886 在帖子里夸:“动动嘴就能和 Grok 对话,复杂问题一句话解决,效率一下子就提高了!”@baravannrway 也说,这功能现在是早期测试版,可能还有点小毛病,不过 xAI 团队说会尽快修复。
目前,Grok3 语音功能好像只支持英文,还不知道啥时候能支持其他语言。使用方法很简单,更新应用后,点语音标志就进入语音模式,用户按自己需求选不同模式就能交流。从 X 平台的反馈来看,这功能让 Grok3 和用户交互更人性化了,直接和 OpenAI 的 ChatGPT 语音模式、谷歌 Gemini Live 形成竞争。
这次更新,Grok3 其他性能也提升了,理解力更强,智能应答能力也更好。xAI 之前就说,Grok3 在数学、科学和编码基准测试里,超过了好几个主流模型,现在加上语音功能,实用性和吸引力更强了。感兴趣的用户赶紧更新 Grok 应用,去体验这个 “聪明得让人害怕” 的 AI 新特性吧。
更多AI行业最新资讯新闻信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html