每日AI资讯-06月05日-AITOP100,AI资讯

Gemini 2.5来了！音频功能大升级，对话更带感

谷歌最近放了个大招，Gemini 2.5版本闪亮登场，这可是AI音频对话和生成技术的一大步啊！Gemini 2.5是个多面手，文本、图像、音频、视频、代码，啥都能搞定，让咱们和AI的互动更顺畅。

这次升级，Gemini 2.5的音频对话功能可是亮点中的亮点。你瞧，它现在能实时跟你音频聊天，语调、口音、笑声，这些细节都给你模仿得惟妙惟肖，交流起来就像跟真人一样。而且，延迟超低，你随便说句话，它立马就能接上，还能根据你的要求，换口音、调语气，甚至耳语都没问题。

更厉害的是，Gemini 2.5还能在对话中调用各种工具，实时获取信息，让对话更实用。背景噪音？不存在的，它都能自动忽略，只关注你的声音。音视频理解也不在话下，跟你讨论视频内容、屏幕共享的信息，统统搞定。

还有啊，它的文本转语音技术也牛了，不仅能生成自然的语音，还能让你随心所欲地控制风格、语调、情感，想怎么调就怎么调。动态表现、速度控制、多说话人对话生成，这些功能一应俱全，让你的音频内容更加丰富多彩。

谷歌这次可是下了血本，对潜在风险进行了全面评估，还加了SynthID水印技术，确保AI生成的音频透明可识别。开发者们也有福了，可以通过Google AI Studio或Vertex AI的Gemini API，构建更具互动性的应用，让公告、故事、播客、视频游戏等音频创新层出不穷。

Gemini 2.5

微软开源AI助手Athena，Teams工作效率飙升

微软又搞事情了！这次他们在Teams应用里整合了一个叫Athena的AI助手，而且源代码还开源了，就在GitHub上，谁都能用，谁都能改。

Athena这AI助手可不简单，它能智能识别团队的下一步工作，直接在Teams里帮你完成任务，再也不用频繁切换应用了。代码审查、工作项管理、安全检查，这些繁琐的任务，Athena都能帮你搞定，让你有更多时间去创新、去开发新功能。

产品经理和工程领导们也有福了，Athena能提供实时的项目状态更新，帮你判断产品是不是准备好了发布，确保团队目标一致。而且啊，Athena已经在微软内部超过2000名工程师中投入使用了，效果杠杠的，开发速度和质量都显著提升。

Athena还能加速代码审查，提前发现可能影响发布的关键漏洞，确保在发布前完成必要的安全和隐私流程，给你一个软件交付的健康评估。这样一来，开发者们就能更专注于核心功能的开发，双手解放了，时间也多了，产品的交付时间也缩短了，用户遇到的问题也少了。

微软这次可是下了大功夫，希望通过Athena帮团队提升工作效率，实现更好的产品交付。咱们就拭目以待吧！

微软Athena

《逆水寒》手游联手 可灵AI解锁新玩法，图生动图超有趣

《逆水寒》手游又出新花样了！这次他们跟可灵AI合作，推出了个“图生动图”的新玩法，让玩家们能更轻松地创作个性化的动图。

你想啊，以前在游戏里想做个动图，那得多麻烦啊！现在好了，直接在游戏内打开【剧组模式】里的【动图创作】功能，就能开始你的创作之旅了。你可以选择在游戏里截图，或者上传已有的图片，然后输入你想要的效果描述，系统就能快速给你生成动图。

动图品质还能选呢，标准和高品质两种，时长也有5秒和10秒的选项。拍摄截图的时候，还能用些特效，比如“冰绡75”，让动图视觉效果更棒。生成动图的时候，还能输入些提示词，比如“身体微动”、“头发飘动”，让静态图片“活”起来。

更有趣的是，这个功能还支持双人互动呢！你可以跟游戏里的情缘来个亲密互动，创造出温馨又有趣的场景。不过啊，这个动图创作功能在可灵AI APP里是付费的，在《逆水寒》手游里用也得支付一定的纹玉费用。不过网易说了，他们不会从中获利，就是给玩家们提供个创作便利。

这个新玩法一出来，玩家们可都乐坏了，纷纷表示要把自己的创意和游戏元素结合起来，展现个人风格，让《逆水寒》的游戏体验更加丰富多彩。

《逆水寒》手游

秘塔AI搜索新功能，PPT导出超方便

秘塔AI搜索旗下的“今天学点啥”平台最近搞了个大动作，上线了PPT导出功能，这可真是满足了众多用户对学习资料整理和分享的需求啊！

以前啊，用户们在平台上看完视频讲解，想要整理成PPT分享给别人，那可真是个麻烦事。现在好了，直接在视频讲解页面点击右上角的“导出PPT”按钮，就能下载完整的讲解PPT了。导出的内容可丰富了，每一页幻灯片的图文都能编辑，还有语音讲解和逐字稿呢！

不过啊，这个功能对算力的消耗可是挺大的，平台的计算资源有限，难以支撑长期免费使用。所以啊，平台决定在上线的前三天（6月5日-6月7日）提供限时免费服务。三天之后呢，每次下载就得消耗1400点计算额度了。不过别担心，注册用户会获得5000点初始赠送额度呢！

这个新功能一出来，用户们可都高兴坏了，纷纷表示这个功能太实用了，以后整理学习资料、分享给别人就方便多了。秘塔AI搜索这次可是真的听到了用户们的声音，积极响应用户诉求，给大家带来了实实在在的便利啊！

秘塔AI搜索

Midjourney V8视频功能即将上线，V8模型蓄势待发

嘿，小伙伴们，告诉你们个好消息！Midjourney的视频功能马上就要上线了，而且V7.1和V8模型的开发也在加速推进呢！

Midjourney这次可是下了血本，视频生成功能已经进入最后冲刺阶段了，预计本月就能正式发布。新一批服务器也将在未来一至两周内上线，为视频功能的上线保驾护航。为了确保模型质量，Midjourney还计划在下周举办视频评级派对，邀请用户们一起来评估，优化最终模型。

这个新视频功能啊，可是以图像到视频（image-to-video）为核心的，初期会提供两种基础分辨率，虽然暂时没有上行放大功能，但动态效果和视觉美感可是杠杠的。而且啊，价格也很亲民，即使是每月10美元的订阅用户也能负担得起。不过呢，初期这个功能只对年度订阅用户开放，用来评估服务器性能。

除了视频功能外，Midjourney的风格引用（sref）功能也要迎来全新升级了。新版sref预计下周发布，能显著提升风格引用的准确性，更贴合参考图像的表现效果。还有啊，V7.1和V8模型也在紧锣密鼓地开发中，V7.1将重点优化手部和身体的连贯性，V8则预计会带来“巨大差异”，整合更多创新特性。

Midjourney这次可是真的要引领AI创意新纪元了！咱们就拭目以待吧！

Midjourney V8

日本AI逆袭全球！Shisa V2 405B开源发布，日语AI新神器

嘿，小伙伴们，告诉你们个事儿！日本有个叫Shisa.AI的公司，最近发布了个超厉害的日英双语模型——Shisa V2 405B，这模型可是被誉为“日本有史以来训练的最强大型语言模型”呢！

这个Shisa V2 405B啊，在日语任务上可是表现得相当出色，连GPT-4和GPT-4Turbo都被它给碾压了。测试数据显示，它在多项日语基准测试中都是佼佼者，跟最新的GPT-4o和DeepSeek-V3在日语任务上也是不相上下。这一下子，日本本土AI实验室在全球AI竞争中的地位可就上去了，日语AI应用也迎来了新的可能性。

Shisa.AI这家公司啊，是专门为日本市场开发和部署先进的开源AI语言和语音模型的。他们这次发布的Shisa V2系列啊，放弃了昂贵的持续预训练和分词器扩展，聚焦于优化后训练流程，通过合成数据驱动的方法显著提升了模型性能。他们的核心数据集ultra-orca-boros-en-ja-v1啊，还被认为是最强大的日英双语数据集之一呢！

这个Shisa V2系列啊，涵盖了从7B到405B参数的不同规模模型，能满足从轻量级设备到高性能计算的多样化需求。在日语语法、角色扮演、翻译等任务上啊，它都表现得相当出色。而且啊，Shisa V2 405B在训练中还融入了少量韩语和繁体中文数据，进一步增强了它的多语言能力。

Shisa.AI这次可是真的为日本AI争了口气啊！他们的开源模型和数据集啊，不仅提升了日语AI的性能，还推动了全球AI社区的发展。咱们就拭目以待吧，看看日本AI在全球AI领域能掀起多大的风浪！

Shisa

ChatGPT新功能上线，MCP支持与会议记录超实用

嘿，小伙伴们，告诉你们个好消息！ChatGPT最近又升级了，推出了两项超实用的新功能——MCP支持和会议记录模式。这两项功能啊，可是能让企业和团队的工作效率飙升呢！

先说说这个MCP支持吧。它能让ChatGPT无缝连接企业内部的数据源，比如GitHub、Dropbox、SharePoint这些。这样一来啊，企业内部的知识就能被智能检索和分析，私域知识也能快速查询、分析与应用了。比如啊，企业可以把内部文档、代码库或邮件系统跟ChatGPT整合起来，快速生成报告、提取关键信息或者回答复杂问题。这个功能啊，对企业用户来说可是太实用了！

再来说说这个会议记录模式吧。它支持自动转录会议内容、提取关键要点，还能生成后续行动计划、任务分配甚至代码片段呢！这样一来啊，会议结束后就不用再手动记录了，ChatGPT会自动帮你整理出关键讨论点、待办事项和相关代码建议。这个功能啊，目前已经向ChatGPT Team计划的macOS用户开放了，未来还会扩展到Plus、Pro、Enterprise和Edu计划用户呢！

OpenAI这次可是真的在企业级AI市场下了大功夫啊！MCP支持和会议记录模式的推出啊，不仅提升了ChatGPT的实用性，还为企业提供了更智能、更高效的数字化工具。而且啊，OpenAI还计划在未来推出更多针对企业用户的定制化功能呢！咱们就拭目以待吧！

ChatGPT

更多AI行业最新资讯新闻信息（ai界最新新闻）请关注AI 人工智能网站--AITOP100平台--AI资讯