Gemini 2.5来了!音频功能大升级,对话更带感
谷歌最近放了个大招,Gemini 2.5版本闪亮登场,这可是AI音频对话和生成技术的一大步啊!Gemini 2.5是个多面手,文本、图像、音频、视频、代码,啥都能搞定,让咱们和AI的互动更顺畅。
这次升级,Gemini 2.5的音频对话功能可是亮点中的亮点。你瞧,它现在能实时跟你音频聊天,语调、口音、笑声,这些细节都给你模仿得惟妙惟肖,交流起来就像跟真人一样。而且,延迟超低,你随便说句话,它立马就能接上,还能根据你的要求,换口音、调语气,甚至耳语都没问题。
更厉害的是,Gemini 2.5还能在对话中调用各种工具,实时获取信息,让对话更实用。背景噪音?不存在的,它都能自动忽略,只关注你的声音。音视频理解也不在话下,跟你讨论视频内容、屏幕共享的信息,统统搞定。
还有啊,它的文本转语音技术也牛了,不仅能生成自然的语音,还能让你随心所欲地控制风格、语调、情感,想怎么调就怎么调。动态表现、速度控制、多说话人对话生成,这些功能一应俱全,让你的音频内容更加丰富多彩。
谷歌这次可是下了血本,对潜在风险进行了全面评估,还加了SynthID水印技术,确保AI生成的音频透明可识别。开发者们也有福了,可以通过Google AI Studio或Vertex AI的Gemini API,构建更具互动性的应用,让公告、故事、播客、视频游戏等音频创新层出不穷。

微软开源AI助手Athena,Teams工作效率飙升
微软又搞事情了!这次他们在Teams应用里整合了一个叫Athena的AI助手,而且源代码还开源了,就在GitHub上,谁都能用,谁都能改。
Athena这AI助手可不简单,它能智能识别团队的下一步工作,直接在Teams里帮你完成任务,再也不用频繁切换应用了。代码审查、工作项管理、安全检查,这些繁琐的任务,Athena都能帮你搞定,让你有更多时间去创新、去开发新功能。
产品经理和工程领导们也有福了,Athena能提供实时的项目状态更新,帮你判断产品是不是准备好了发布,确保团队目标一致。而且啊,Athena已经在微软内部超过2000名工程师中投入使用了,效果杠杠的,开发速度和质量都显著提升。
Athena还能加速代码审查,提前发现可能影响发布的关键漏洞,确保在发布前完成必要的安全和隐私流程,给你一个软件交付的健康评估。这样一来,开发者们就能更专注于核心功能的开发,双手解放了,时间也多了,产品的交付时间也缩短了,用户遇到的问题也少了。
微软这次可是下了大功夫,希望通过Athena帮团队提升工作效率,实现更好的产品交付。咱们就拭目以待吧!

《逆水寒》手游联手可灵AI解锁新玩法,图生动图超有趣
《逆水寒》手游又出新花样了!这次他们跟可灵AI合作,推出了个“图生动图”的新玩法,让玩家们能更轻松地创作个性化的动图。
你想啊,以前在游戏里想做个动图,那得多麻烦啊!现在好了,直接在游戏内打开【剧组模式】里的【动图创作】功能,就能开始你的创作之旅了。你可以选择在游戏里截图,或者上传已有的图片,然后输入你想要的效果描述,系统就能快速给你生成动图。
动图品质还能选呢,标准和高品质两种,时长也有5秒和10秒的选项。拍摄截图的时候,还能用些特效,比如“冰绡75”,让动图视觉效果更棒。生成动图的时候,还能输入些提示词,比如“身体微动”、“头发飘动”,让静态图片“活”起来。
更有趣的是,这个功能还支持双人互动呢!你可以跟游戏里的情缘来个亲密互动,创造出温馨又有趣的场景。不过啊,这个动图创作功能在可灵AI APP里是付费的,在《逆水寒》手游里用也得支付一定的纹玉费用。不过网易说了,他们不会从中获利,就是给玩家们提供个创作便利。
这个新玩法一出来,玩家们可都乐坏了,纷纷表示要把自己的创意和游戏元素结合起来,展现个人风格,让《逆水寒》的游戏体验更加丰富多彩。

秘塔AI搜索新功能,PPT导出超方便
秘塔AI搜索旗下的“今天学点啥”平台最近搞了个大动作,上线了PPT导出功能,这可真是满足了众多用户对学习资料整理和分享的需求啊!
以前啊,用户们在平台上看完视频讲解,想要整理成PPT分享给别人,那可真是个麻烦事。现在好了,直接在视频讲解页面点击右上角的“导出PPT”按钮,就能下载完整的讲解PPT了。导出的内容可丰富了,每一页幻灯片的图文都能编辑,还有语音讲解和逐字稿呢!
不过啊,这个功能对算力的消耗可是挺大的,平台的计算资源有限,难以支撑长期免费使用。所以啊,平台决定在上线的前三天(6月5日-6月7日)提供限时免费服务。三天之后呢,每次下载就得消耗1400点计算额度了。不过别担心,注册用户会获得5000点初始赠送额度呢!
这个新功能一出来,用户们可都高兴坏了,纷纷表示这个功能太实用了,以后整理学习资料、分享给别人就方便多了。秘塔AI搜索这次可是真的听到了用户们的声音,积极响应用户诉求,给大家带来了实实在在的便利啊!

Midjourney V8视频功能即将上线,V8模型蓄势待发
嘿,小伙伴们,告诉你们个好消息!Midjourney的视频功能马上就要上线了,而且V7.1和V8模型的开发也在加速推进呢!
Midjourney这次可是下了血本,视频生成功能已经进入最后冲刺阶段了,预计本月就能正式发布。新一批服务器也将在未来一至两周内上线,为视频功能的上线保驾护航。为了确保模型质量,Midjourney还计划在下周举办视频评级派对,邀请用户们一起来评估,优化最终模型。
这个新视频功能啊,可是以图像到视频(image-to-video)为核心的,初期会提供两种基础分辨率,虽然暂时没有上行放大功能,但动态效果和视觉美感可是杠杠的。而且啊,价格也很亲民,即使是每月10美元的订阅用户也能负担得起。不过呢,初期这个功能只对年度订阅用户开放,用来评估服务器性能。
除了视频功能外,Midjourney的风格引用(sref)功能也要迎来全新升级了。新版sref预计下周发布,能显著提升风格引用的准确性,更贴合参考图像的表现效果。还有啊,V7.1和V8模型也在紧锣密鼓地开发中,V7.1将重点优化手部和身体的连贯性,V8则预计会带来“巨大差异”,整合更多创新特性。
Midjourney这次可是真的要引领AI创意新纪元了!咱们就拭目以待吧!

日本AI逆袭全球!Shisa V2 405B开源发布,日语AI新神器
嘿,小伙伴们,告诉你们个事儿!日本有个叫Shisa.AI的公司,最近发布了个超厉害的日英双语模型——Shisa V2 405B,这模型可是被誉为“日本有史以来训练的最强大型语言模型”呢!
这个Shisa V2 405B啊,在日语任务上可是表现得相当出色,连GPT-4和GPT-4Turbo都被它给碾压了。测试数据显示,它在多项日语基准测试中都是佼佼者,跟最新的GPT-4o和DeepSeek-V3在日语任务上也是不相上下。这一下子,日本本土AI实验室在全球AI竞争中的地位可就上去了,日语AI应用也迎来了新的可能性。
Shisa.AI这家公司啊,是专门为日本市场开发和部署先进的开源AI语言和语音模型的。他们这次发布的Shisa V2系列啊,放弃了昂贵的持续预训练和分词器扩展,聚焦于优化后训练流程,通过合成数据驱动的方法显著提升了模型性能。他们的核心数据集ultra-orca-boros-en-ja-v1啊,还被认为是最强大的日英双语数据集之一呢!
这个Shisa V2系列啊,涵盖了从7B到405B参数的不同规模模型,能满足从轻量级设备到高性能计算的多样化需求。在日语语法、角色扮演、翻译等任务上啊,它都表现得相当出色。而且啊,Shisa V2 405B在训练中还融入了少量韩语和繁体中文数据,进一步增强了它的多语言能力。
Shisa.AI这次可是真的为日本AI争了口气啊!他们的开源模型和数据集啊,不仅提升了日语AI的性能,还推动了全球AI社区的发展。咱们就拭目以待吧,看看日本AI在全球AI领域能掀起多大的风浪!

ChatGPT新功能上线,MCP支持与会议记录超实用
嘿,小伙伴们,告诉你们个好消息!ChatGPT最近又升级了,推出了两项超实用的新功能——MCP支持和会议记录模式。这两项功能啊,可是能让企业和团队的工作效率飙升呢!
先说说这个MCP支持吧。它能让ChatGPT无缝连接企业内部的数据源,比如GitHub、Dropbox、SharePoint这些。这样一来啊,企业内部的知识就能被智能检索和分析,私域知识也能快速查询、分析与应用了。比如啊,企业可以把内部文档、代码库或邮件系统跟ChatGPT整合起来,快速生成报告、提取关键信息或者回答复杂问题。这个功能啊,对企业用户来说可是太实用了!
再来说说这个会议记录模式吧。它支持自动转录会议内容、提取关键要点,还能生成后续行动计划、任务分配甚至代码片段呢!这样一来啊,会议结束后就不用再手动记录了,ChatGPT会自动帮你整理出关键讨论点、待办事项和相关代码建议。这个功能啊,目前已经向ChatGPT Team计划的macOS用户开放了,未来还会扩展到Plus、Pro、Enterprise和Edu计划用户呢!
OpenAI这次可是真的在企业级AI市场下了大功夫啊!MCP支持和会议记录模式的推出啊,不仅提升了ChatGPT的实用性,还为企业提供了更智能、更高效的数字化工具。而且啊,OpenAI还计划在未来推出更多针对企业用户的定制化功能呢!咱们就拭目以待吧!









