每日AI资讯 - 03月17日-AITOP100,AI资讯

搜狗输入法PC版大升级！腾讯元宝大模型强势入驻

搜狗输入法PC版最近可太牛啦！它的「AI助手」接入了超厉害的满血版「腾讯元宝」大模型。这意味着咱用户不用再额外下载AI软件，直接在键盘上就能享受腾讯混元和DeepSeek大模型的强大功能。不管是办公时需要深度思考解决复杂问题，还是学习中想快速获取资料，它都能助力效率大幅提升。

只要把PC版搜狗输入法更新到最新，点击状态栏的「汪仔」按钮，或者用「Alt+空格」快捷键，就能召唤出AI助手。升级后，用「AI助手」时可以自由挑选腾讯混元或DeepSeek大模型，不管简单问题还是复杂逻辑推理，都能轻松应对。

另外，搜狗输入法还推出了超便捷的「=号」搜索功能。在微信、QQ、Word等常用软件打字时，打完字轻轻敲下「=」号，AI助手立马出现解答问题，查专业知识、旅游攻略、热梗解读啥的，结果直接呈现，都不用跳转页面，边聊天边搜索，简直不要太方便。

还有「AI划词」功能，浏览网页、写文档、聊天时，鼠标一划选词句，就能实现搜索、翻译、总结等操作，快速查找概念、翻译外文、总结长文核心，彻底告别来回切换应用的麻烦事儿。

这次搜狗输入法的升级，真的是把输入法和AI深度融合，给咱用户带来了超智能、超便捷的新体验。

DeepSeek AI工具地址》》》详情查看

搜狗输入法PC

百川智能俩联合创始人离职，投身AI创业新热潮

最近，AI圈有个大新闻。据界面报道，AI独角兽百川智能的联合创始人焦可已经正式离职，另一位联合创始人陈炜鹏也准备走人，现在正在办理内部离职手续呢。这消息一传出，在业内引起了不少关注。

听说焦可已经开始搞AI语音领域的创业项目了，而且还在积极找融资。陈炜鹏虽然离职手续还没办完，但也已经着手筹备AI Coding方向的创业计划，并且已经和一些投资人接触上了。到目前为止，他俩都还没对这事公开回应。

百川智能是前搜狗CEO王小川在2023年创办的，焦可和陈炜鹏作为早期核心成员，为公司发展出了不少力。这次他俩离职，说不定反映出现在AI行业创业有多火爆。AI语音和AI Coding这两个领域，现在可是热门赛道，吸引了好多人才和资本的目光。

有业内人士分析，焦可和陈炜鹏选择这两个方向创业，可能和他们在百川智能积累的技术经验有关。这几年，AI语音在智能交互、语音合成等方面取得了不少突破，AI Coding因为能提升代码生成效率，也备受关注。不过他俩这新征程能不能像百川智能那样成功，还得时间来检验。

百川大模型地址》》》详情查看

Anthropic要出新模型Claude3.7Sonnet Max？Cursor更新引猜测

最近，AI代码编辑器Cursor在它的0.47.5最新版本更新日志里透露，正在为Anthropic即将推出的“Claude3.7Sonnet Max”模型做准备。这消息一出来，AI圈立马就热闹起来了。但尴尬的是，Anthropic那边到现在都还没发布官方公告，“Claude3.7Sonnet Max”到底是个啥样，大家都还一头雾水。

从Cursor的更新日志能看到，明确提到在为“3.7-sonnet-max”做准备。而且Anthropic最近对API做了不少更新，像提升Claude3.7Sonnet的处理效率，减少token使用量，还增强了开发者的请求处理能力。这一系列操作，好像在暗示他们确实在为新模型打技术基础。

现在外界都在猜测“Claude3.7Sonnet Max”是不是性能会有大升级，或者会有啥新功能，但这些都没得到官方证实。Cursor提前适配，是不是意味着新模型马上就要来了呢？大家都在等着Anthropic给个说法。业内人都盼着，要是真出这款新模型，能在现有的Claude3.7Sonnet基础上有更多突破。

Claude大模型地址》》》详情查看

Claude3.7Sonnet Max

联想问天WA7785a G3服务器牛炸！单机运行671B DeepSeek大模型超厉害

联想今天宣布了一个超牛的消息！他们家首款AMD AI大模型训练服务器——联想问天WA7785a G3，在单机部署671B（满血版）DeepSeek大模型时，吞吐量竟然高达6708token/s，直接刷新了单台服务器运行超大规模模型性能的纪录。

这次性能大突破，多亏了联想万全异构智算平台的大力支持。联想用了一堆创新技术，像访存优化、显存优化，还有创新的PCIe5.0全互联架构，在SGLang框架里精选最优算子，对大模型从预训练、后训练到推理的整个流程进行持续优化。

实际测试结果显示，在单台部署DeepSeek671B大模型的联想问天WA7785a G3服务器上，最高吞吐量能达到惊人的6708token/s。在模拟问题对话场景（上下文序列长度128/1K）时，这服务器最高能支持158的并发数，TPOT（输出每个token的时间）是93毫秒，TTFT（首个token输出时间）是2.01秒；模拟代码生成场景(上下文序列长度512/4K)时，并发数能到140，TPOT是100毫秒，TTFT是5.53秒。

联想说，这性能表现意味着单台联想问天WA7785a G3服务器，就能满足1500人规模企业的正常使用。这可是继联想问天WA7780G3服务器单机部署满血版DeepSeek大模型总吞吐量突破2500token/s之后，在单机部署该大模型推理性能上的又一次重大飞跃。

联想还强调，这次技术突破是联想中国基础设施业务群、联想研究院ICI实验室和AMD一起设计、调优实现的。而且这还不是最终结果，他们还在继续探索新方法，想让性能再往上提提。

联想问天WA7785a G3服务器牛炸

钉钉放大招！AI客服助理上线，多平台轻松接入

2025年3月17日，钉钉宣布推出一个超实用的AI功能——AI客服助理。这个功能可厉害啦，能自动接入企业官网、公众号等平台，直接给消费者和企业客户提供服务。一推出就受到企业客户的热烈欢迎，现在已经有云深处科技、Rokid（乐奇）、瑞德林、艾为电子、精准学等700多家企业接入使用了。

钉钉AI客服助理特别聪明，通过多轮对话能精准理解用户的真实需求，像“产品参数对比”这种复杂问题都能有效回复。用户提问时，客服助理会先在知识库找答案，再结合大模型的理解能力，给出专业又准确的回答。它能7×24小时在线服务，秒级响应，可不是那种简单机械的话术，而是把产品手册、技术参数和服务流程都吃透了的“最强大脑”。

另外，钉钉还开放了把AI助理部署到微信服务号、订阅号、小程序和企业官网等外部平台的能力，也就是说，不管用户在微信公众号、企业官网还是其他渠道，和他们对话的客服可能就是钉钉AI助理。

从2024年1月推出AI助理以来，钉钉AI已经构建了从通用能力到垂直场景的完整产品体系。这次推出的AI客服助理操作特别简单，三步配置就能快速上线，还有三大核心优势：

第一，企业以前在钉钉里沉淀的产品手册、技术文档或者官网产品链接，能马上变成AI助理的训练素材，不用再从头构建知识体系，甚至还能二次开发适配更多外部知识库训练需求；

第二，企业不用基于大模型从头搭建，在钉钉里就能完成AI客服助理的创建、训练和部署整个流程，用户不仅能自己选多款底模型，还能结合工作流能力实现多人协同和持续服务，AI助理还能把用户反馈信息同步到多维表、宜搭等钉钉应用，实现客户建议与技术问题自动同步；

第三，钉钉免费开放AI助理多平台部署能力，一键就能发布到网页、公众号、小程序等，让企业能快速拥有一个懂业务、懂产品的客服AI智能体。

钉钉AU

小米大模型团队牛！音频推理领域取得大进展，登顶MMAU榜

小米技术官方微博发布了一个超振奋的消息！小米大模型团队在音频推理领域有了大突破。他们受DeepSeek-R1启发，率先把强化学习算法用在了多模态音频理解任务上。结果团队只用了一周时间，就以64.5%的SOTA（最先进水平）准确率，成功登顶国际权威的MMAU音频理解评测榜，而且还把相关技术开源了。

MMAU（大规模多任务音频理解与推理）评测集可是测试音频推理能力的重要标准，里面有一万条语音、环境音和音乐样本，主要考察模型在多种技能上的表现。人类专家在这个评测集上的准确率是82.23%，目前在这个榜单上表现最好的商业模型是OpenAI的GPT-4o，准确率是57.3%，接着是Google DeepMind的Gemini2.0Flash，准确率是55.6%。

小米团队一开始用清华大学发布的AVQA数据集进行微调，准确率达到了51.8%。但真正的大突破是在把DeepSeek-R1的Group Relative Policy Optimization（GRPO）算法应用到Qwen2-Audio-7B模型后，仅仅用AVQA的3.8万条训练样本，就把准确率提升到了64.5%，超过了现有的商业模型。

研究团队还发现，训练过程中要是强制模型输出推理过程，准确率反而会下降到61.1%。这说明，显式的思维链输出可能对模型训练没啥好处，强化学习的实时反馈机制更能帮模型找到高质量答案的分布区域。

虽然小米团队已经取得了不错的准确率，但和人类专家的水平比起来，还是有差距的。小米大模型团队的这个实验结果，不仅展现了强化学习在音频推理领域的独特优势，也给未来的研究提供了新想法。他们还把训练代码、模型参数以及技术报告都开源了，方便学术界和产业界进一步研究交流。

小米大模型

腾讯混元要搞大事！3D开源日活动马上来袭

腾讯官方宣布，腾讯混元在3月18日到19日要举办混元3D开源日活动，而且在活动期间的3月18日和19日上午11点会开启直播。虽然官方还没透露直播具体有啥内容，但今年1月腾讯混元的一系列操作已经很吸引人了。

它正式开源了3D生成大模型2.0版本（Hunyuan3D -2.0），这个版本生成能力更强，精度也更高，给3D内容生成提供了更好的解决方案。同时，还上线了业界首个一站式3D内容AI创作引擎，一下子就把3D创作门槛降低了，让大家更有创作热情。

这次活动对开发者来说，是个难得的学习交流好机会，能了解前沿技术和趋势，还能和同行交流合作。对喜欢3D的小伙伴来说，也是个感受3D技术魅力的好时机。大家都很期待这次活动，看看腾讯混元又会带来哪些惊喜。

腾讯混元3D工具地址》》》详情查看

腾讯混元3D

谷歌Gemini 2.0 Flash新功能惹争议，图片水印去除引版权担忧

最近，社交媒体上的用户发现了谷歌新推出的Gemini AI模型一个有点麻烦的用途——去除图片水印，而且像Getty Images和其他知名图片库发布的图片水印都能去掉。

上周，谷歌扩大了Gemini2.0Flash模型图像生成功能的使用权限，这个功能能让模型直接生成和编辑图像内容。不得不说，这功能确实强大，但好像没啥限制。Gemini2.0Flash不仅能生成名人及有版权角色的图像，还能去除现有照片上的水印。

一些X和Reddit用户发现，Gemini2.0Flash不光能去掉水印，还会试着填补水印去掉后留下的空白。其他一些人工智能驱动的工具也有这功能，但Gemini2.0Flash在这方面好像特别厉害，关键还免费使用。

不过得说明一下，目前Gemini2.0Flash的图像生成功能被标记为“实验性”和“非用于生产”，而且只在谷歌面向开发者的工具，比如AI Studio中能用。这模型也不是完美的水印去除工具，处理某些半透明水印和覆盖大部分图像的水印时，它也有点费劲。

按照美国版权法，除了少数特殊情况，未经原所有者同意去除水印是违法的。谷歌在非工作时间还没回应关于这事的评论请求。这事儿后续会怎么发展，大家都在关注。

谷歌Gemini 2大模型地址》》》详情查看

Gemini2.0Flash

更多AI行业最新资讯新闻信息请关注AI 人工智能网站--AITOP100平台--AI资讯专区