每日AI资讯-2025年06月19日-AITOP100,AI资讯

通义APP翻译功能大升级，全场景翻译超厉害！

家人们，6月19号有个超棒的消息！通义APP的翻译能力全面升级啦，一下子就变成了“最强翻译综合体”，不管是个人还是专业用户，都能用得上。

这次升级可不得了，文字翻译、同传翻译、文档翻译、图片翻译这四大核心场景全覆盖。它支持119种语言和方言，像印欧语系、亚非语系啥的都有，语言覆盖密度在行业里那可是数一数二的。而且，它的准确率、专业性和交互体验都提升了一大截。不管你是跨境办公、看学术资料，还是出去旅游，通义APP都能给你提供“全场景、全模态”的翻译方案。

它的同传翻译功能也上线了，支持英语、日语、韩语等10大语种。分屏对照、逐句对照、纯译文展示这些交互模式，在会议、旅游、视频通话的时候用起来特别方便。关键是，同传翻译不限时、不限次，还完全免费，再也不用担心时间限制和付费问题了。

文档翻译方面，通义APP也很厉害。翻译后的文档排版不变，表格内容也能处理。还会自动生成全文总结和脑图，让你快速掌握文档核心内容。

图片翻译也全面升级了，它不像传统OCR工具就翻译单词，它能保留图片排版结构，在菜单、图文海报这些场景里表现特别好。有了通义APP，以后翻译再也不是难题啦！

通义APP

AI秒变PPT大师，Office-PowerPoint-MCP-Server让你效率翻倍！

最近，Office-PowerPoint-MCP-Server成了社区里的热门话题。这是一款基于Model Context Protocol（MCP）的开源工具，用AI帮你快速创建和编辑PowerPoint演示文稿，给企业报告生成和数据可视化提供了新办法。

它用python-pptx库开发，能从零开始生成PPT，也能修改现有文件，功能可全了。新建和编辑PPT、管理幻灯片、插入各种内容元素、代码批量生成PPT，还能和AI助手无缝对接，通过自然语言指令完成复杂操作，不管你是专业开发者还是普通用户，用起来都很方便。

在企业场景里，它的优势可明显了。企业能快速生成月度或季度报告PPT，数据分析师能批量生成可视化PPT，营销团队能创建有品牌风格的演示文稿，教育机构能生成标准化培训课件。有企业用了这个工具，月度报告生成时间从几个小时缩短到了几分钟，效率大大提高。

它依托python-pptx库，能精细操作PPT文件，还支持多种图表类型。因为是开源的，开发者还能根据需求定制，未来还有可能集成图像生成模型、连接外部数据源、优化跨平台兼容性。有了它，做PPT再也不愁啦！

Office-PowerPoint-MCP-Server

Claude Code支持远程MCP服务器，开发者效率飙升！

AI行业发展得越来越快，Anthropic公司最近宣布，把Claude Code功能扩展到任何远程的模型上下文协议（MCP）服务器。自从去年MCP标准发布后，微软、OpenAI和谷歌这些大公司都采用了，成了连接AI助手和数据系统的重要标准。

Claude Code是个强大的编码助手，能在工作空间里直接编写或管理代码，支持在终端、IDE内或后台运行。这次更新后，开发者能用它访问第三方服务，像开发工具和项目管理系统，安全高效地从数据源提取信息，创建个性化工作流程。

Anthropic还展示了一些合作伙伴的使用案例，比如Claude Code和Sentry MCP服务器集成，开发者在终端调试时能直接查询错误和获取堆栈跟踪信息；和Linear集成，能实时获取项目状态和问题详细信息。这些功能让开发者工作效率大大提高，能更好地管理项目和代码。

Claude4发布后，用户关注度更高了，Claude Code的用户需求在三周内增长了160%。Anthropic年收入达到了30亿美元，五个月内增长了200%。随着MCP服务器越来越多，Claude Code也会不断推动行业发展，开发者们有福啦！

claude

GPT-4.5 API服务要停用，开发者赶紧找新出路！

最近OpenAI宣布了一个重磅消息，2025年7月14号要终止GPT-4.5预览版API服务。这对用该服务的第三方开发者影响可大了，不过个人版ChatGPT用户不受影响。开发者们得在三个月内把应用迁移到其他模型，不然业务就没法正常运行了。

很多业内人士和开发者对这个消息都很困惑和失落，觉得这可能和运算成本、定价策略有关。随着AI技术进步，OpenAI得调整业务模式，保持竞争力，满足市场需求。GPT-4.5之前性能好，吸引了很多开发者和企业，但平衡运算成本和盈利能力成了问题。

虽然转型对开发者是个挑战，但也是个机会。市场上有很多新的AI模型和服务，开发者可以根据自己需求选。OpenAI也在开发更先进的AI技术，以后在竞争中还能保持领先。OpenAI这个决定会让AI应用开发格局重新洗牌，开发者们得做好准备，应对变化，寻找新机会创新发展。

OpenAI

Midjourney推出V1视频模型，静态图像秒变动画！

人工智能图像生成领域的老大Midjourney最近宣布推出首款视频生成模型——V1视频模型，能把静态图像变成短动画片段，这可是向实时3D世界模拟系统发展的重要一步。

这个视频模型还在早期阶段，但已经能把用户上传的静态图像变成2 - 4秒的动画片段。它基于公司现有的图像生成AI架构，通过扩展时间维度实现了突破。它支持多种艺术风格的动画转换，能生成连贯的物体运动效果，保留原始图像的构图和细节特征，处理时间还控制在30秒以内。

现在AI视频生成技术发展得很快，过去一年里，Runway、Stability AI这些公司都推出了类似产品。Midjourney进入这个领域，会让竞争更激烈。技术分析师说，从静态图像到动态视频是生成式AI发展的必然趋势，Midjourney凭借在图像生成领域的积累，有望追上先行者。

Midjourney说，当前视频模型只是“长期路线图中的第一步”，目标是开发能实时模拟完整3D世界的AI系统，和元宇宙、虚拟现实这些前沿技术发展方向一致。不过，要实现这个目标还有很多技术挑战，预计未来2 - 3年，AI视频生成技术会发展得更快。

Google升级Search Live模式，语音+摄像头交互更智能！

Google打算进一步升级Search Live模式，这是AI Mode搜索功能的一部分，未来几个月会引入更多创新功能，把Search Live打造成更直观、交互性更强的AI搜索工具。

Google在2025年Google I/O大会上展示了Search Live模式，6月18号在美国正式推出，面向参与AI Mode实验（Google Labs）的Android和iOS用户。Search Live能让用户通过语音和Google搜索实时、双向对话，就像Gemini Live的交互体验一样。用户点击“Live”图标就能开始语音提问，AI会用生成式音频回应，还会在屏幕上显示相关网页链接。

它当前的功能亮点可多了，支持自然对话，用户能随时打断AI语音响应，提出后续问题；支持多任务，用户切换到其他应用时还能继续对话；能查看会话历史；还有四种语音风格可选。

未来，Google还打算给Search Live引入实时摄像头交互和个性化搜索结果。实时摄像头交互能让用户通过手机摄像头展示实时场景，AI基于视觉输入回答问题；个性化搜索结果能让AI根据用户授权的Gmail数据和搜索历史生成更个性化的结果。这些升级会让Search Live从传统搜索工具变成全能AI助手，和OpenAI的ChatGPT、Anthropic的Claude等竞品竞争。

Search Live的推出和升级标志着Google搜索向对话式、情境化体验转型。不过，它也面临区域限制、隐私争议和内容生态影响等挑战，Google得采取措施解决这些问题。

Google升级Search Live模式

MiniMax Agent来袭，革新工作流超厉害！

最近，一款叫MiniMax Agent的全新通用智能代理正式推出，在行业内引起了广泛关注。

MiniMax Agent是专门为解决长期复杂任务设计的智能代理，有专家级的多步骤规划能力、灵活的任务分解机制和端到端的执行效率。它就像一个“可靠的队友”，给用户提供无缝支持。据说在内部测试使用60天，就成了超过50%团队成员的日常工作工具，实用性和稳定性都很强。

它的功能可多了，在编程与工具使用方面，不管是写代码还是调用工具，都能高效完成，降低了技术门槛；支持多模态理解与生成，能适应多样化场景需求；还能和主流协作平台深度整合，实现任务管理的流畅衔接。它不仅适合个人开发者，还能为企业级团队提供高效协作支持。

传统开发里，很多人都说“光说不练，直接给我代码”，但MiniMax Agent改变了这个现状。它通过深度理解用户需求，自动完成任务规划与执行，让用户从繁琐的代码编写中解放出来，专注于创意和决策。

MiniMax Agent的发布标志着通用智能代理领域迈出了重要一步。随着智能代理技术普及，类似的产品有望重塑生产力工具格局，推动各行业智能化、自动化发展。有了MiniMax Agent，工作起来更轻松啦！

更多AI行业最新资讯新闻信息（ai界最新新闻）请关注AI 人工智能网站--AITOP100平台--AI资讯