搜狗输入法PC版大升级!腾讯元宝大模型强势入驻
搜狗输入法PC版最近可太牛啦!它的「AI助手」接入了超厉害的满血版「腾讯元宝」大模型。这意味着咱用户不用再额外下载AI软件,直接在键盘上就能享受腾讯混元和DeepSeek大模型的强大功能。不管是办公时需要深度思考解决复杂问题,还是学习中想快速获取资料,它都能助力效率大幅提升。
只要把PC版搜狗输入法更新到最新,点击状态栏的「汪仔」按钮,或者用「Alt+空格」快捷键,就能召唤出AI助手。升级后,用「AI助手」时可以自由挑选腾讯混元或DeepSeek大模型,不管简单问题还是复杂逻辑推理,都能轻松应对。
另外,搜狗输入法还推出了超便捷的「=号」搜索功能。在微信、QQ、Word等常用软件打字时,打完字轻轻敲下「=」号,AI助手立马出现解答问题,查专业知识、旅游攻略、热梗解读啥的,结果直接呈现,都不用跳转页面,边聊天边搜索,简直不要太方便。
还有「AI划词」功能,浏览网页、写文档、聊天时,鼠标一划选词句,就能实现搜索、翻译、总结等操作,快速查找概念、翻译外文、总结长文核心,彻底告别来回切换应用的麻烦事儿。
这次搜狗输入法的升级,真的是把输入法和AI深度融合,给咱用户带来了超智能、超便捷的新体验。
DeepSeek AI工具地址》》》详情查看
百川智能俩联合创始人离职,投身AI创业新热潮
最近,AI圈有个大新闻。据界面报道,AI独角兽百川智能的联合创始人焦可已经正式离职,另一位联合创始人陈炜鹏也准备走人,现在正在办理内部离职手续呢。这消息一传出,在业内引起了不少关注。
听说焦可已经开始搞AI语音领域的创业项目了,而且还在积极找融资。陈炜鹏虽然离职手续还没办完,但也已经着手筹备AI Coding方向的创业计划,并且已经和一些投资人接触上了。到目前为止,他俩都还没对这事公开回应。
百川智能是前搜狗CEO王小川在2023年创办的,焦可和陈炜鹏作为早期核心成员,为公司发展出了不少力。这次他俩离职,说不定反映出现在AI行业创业有多火爆。AI语音和AI Coding这两个领域,现在可是热门赛道,吸引了好多人才和资本的目光。
有业内人士分析,焦可和陈炜鹏选择这两个方向创业,可能和他们在百川智能积累的技术经验有关。这几年,AI语音在智能交互、语音合成等方面取得了不少突破,AI Coding因为能提升代码生成效率,也备受关注。不过他俩这新征程能不能像百川智能那样成功,还得时间来检验。
百川大模型地址》》》详情查看
Anthropic要出新模型Claude3.7Sonnet Max?Cursor更新引猜测
最近,AI代码编辑器Cursor在它的0.47.5最新版本更新日志里透露,正在为Anthropic即将推出的“Claude3.7Sonnet Max”模型做准备。这消息一出来,AI圈立马就热闹起来了。但尴尬的是,Anthropic那边到现在都还没发布官方公告,“Claude3.7Sonnet Max”到底是个啥样,大家都还一头雾水。
从Cursor的更新日志能看到,明确提到在为“3.7-sonnet-max”做准备。而且Anthropic最近对API做了不少更新,像提升Claude3.7Sonnet的处理效率,减少token使用量,还增强了开发者的请求处理能力。这一系列操作,好像在暗示他们确实在为新模型打技术基础。
现在外界都在猜测“Claude3.7Sonnet Max”是不是性能会有大升级,或者会有啥新功能,但这些都没得到官方证实。Cursor提前适配,是不是意味着新模型马上就要来了呢?大家都在等着Anthropic给个说法。业内人都盼着,要是真出这款新模型,能在现有的Claude3.7Sonnet基础上有更多突破。
Claude大模型地址》》》详情查看
联想问天WA7785a G3服务器牛炸!单机运行671B DeepSeek大模型超厉害
联想今天宣布了一个超牛的消息!他们家首款AMD AI大模型训练服务器——联想问天WA7785a G3,在单机部署671B(满血版)DeepSeek大模型时,吞吐量竟然高达6708token/s,直接刷新了单台服务器运行超大规模模型性能的纪录。
这次性能大突破,多亏了联想万全异构智算平台的大力支持。联想用了一堆创新技术,像访存优化、显存优化,还有创新的PCIe5.0全互联架构,在SGLang框架里精选最优算子,对大模型从预训练、后训练到推理的整个流程进行持续优化。
实际测试结果显示,在单台部署DeepSeek671B大模型的联想问天WA7785a G3服务器上,最高吞吐量能达到惊人的6708token/s。在模拟问题对话场景(上下文序列长度128/1K)时,这服务器最高能支持158的并发数,TPOT(输出每个token的时间)是93毫秒,TTFT(首个token输出时间)是2.01秒;模拟代码生成场景(上下文序列长度512/4K)时,并发数能到140,TPOT是100毫秒,TTFT是5.53秒。
联想说,这性能表现意味着单台联想问天WA7785a G3服务器,就能满足1500人规模企业的正常使用。这可是继联想问天WA7780G3服务器单机部署满血版DeepSeek大模型总吞吐量突破2500token/s之后,在单机部署该大模型推理性能上的又一次重大飞跃。
联想还强调,这次技术突破是联想中国基础设施业务群、联想研究院ICI实验室和AMD一起设计、调优实现的。而且这还不是最终结果,他们还在继续探索新方法,想让性能再往上提提。
钉钉放大招!AI客服助理上线,多平台轻松接入
2025年3月17日,钉钉宣布推出一个超实用的AI功能——AI客服助理。这个功能可厉害啦,能自动接入企业官网、公众号等平台,直接给消费者和企业客户提供服务。一推出就受到企业客户的热烈欢迎,现在已经有云深处科技、Rokid(乐奇)、瑞德林、艾为电子、精准学等700多家企业接入使用了。
钉钉AI客服助理特别聪明,通过多轮对话能精准理解用户的真实需求,像“产品参数对比”这种复杂问题都能有效回复。用户提问时,客服助理会先在知识库找答案,再结合大模型的理解能力,给出专业又准确的回答。它能7×24小时在线服务,秒级响应,可不是那种简单机械的话术,而是把产品手册、技术参数和服务流程都吃透了的“最强大脑”。
另外,钉钉还开放了把AI助理部署到微信服务号、订阅号、小程序和企业官网等外部平台的能力,也就是说,不管用户在微信公众号、企业官网还是其他渠道,和他们对话的客服可能就是钉钉AI助理。
从2024年1月推出AI助理以来,钉钉AI已经构建了从通用能力到垂直场景的完整产品体系。这次推出的AI客服助理操作特别简单,三步配置就能快速上线,还有三大核心优势:
第一,企业以前在钉钉里沉淀的产品手册、技术文档或者官网产品链接,能马上变成AI助理的训练素材,不用再从头构建知识体系,甚至还能二次开发适配更多外部知识库训练需求;
第二,企业不用基于大模型从头搭建,在钉钉里就能完成AI客服助理的创建、训练和部署整个流程,用户不仅能自己选多款底模型,还能结合工作流能力实现多人协同和持续服务,AI助理还能把用户反馈信息同步到多维表、宜搭等钉钉应用,实现客户建议与技术问题自动同步;
第三,钉钉免费开放AI助理多平台部署能力,一键就能发布到网页、公众号、小程序等,让企业能快速拥有一个懂业务、懂产品的客服AI智能体。
小米大模型团队牛!音频推理领域取得大进展,登顶MMAU榜
小米技术官方微博发布了一个超振奋的消息!小米大模型团队在音频推理领域有了大突破。他们受DeepSeek-R1启发,率先把强化学习算法用在了多模态音频理解任务上。结果团队只用了一周时间,就以64.5%的SOTA(最先进水平)准确率,成功登顶国际权威的MMAU音频理解评测榜,而且还把相关技术开源了。
MMAU(大规模多任务音频理解与推理)评测集可是测试音频推理能力的重要标准,里面有一万条语音、环境音和音乐样本,主要考察模型在多种技能上的表现。人类专家在这个评测集上的准确率是82.23%,目前在这个榜单上表现最好的商业模型是OpenAI的GPT-4o,准确率是57.3%,接着是Google DeepMind的Gemini2.0Flash,准确率是55.6%。
小米团队一开始用清华大学发布的AVQA数据集进行微调,准确率达到了51.8%。但真正的大突破是在把DeepSeek-R1的Group Relative Policy Optimization(GRPO)算法应用到Qwen2-Audio-7B模型后,仅仅用AVQA的3.8万条训练样本,就把准确率提升到了64.5%,超过了现有的商业模型。
研究团队还发现,训练过程中要是强制模型输出推理过程,准确率反而会下降到61.1%。这说明,显式的思维链输出可能对模型训练没啥好处,强化学习的实时反馈机制更能帮模型找到高质量答案的分布区域。
虽然小米团队已经取得了不错的准确率,但和人类专家的水平比起来,还是有差距的。小米大模型团队的这个实验结果,不仅展现了强化学习在音频推理领域的独特优势,也给未来的研究提供了新想法。他们还把训练代码、模型参数以及技术报告都开源了,方便学术界和产业界进一步研究交流。
腾讯混元要搞大事!3D开源日活动马上来袭
腾讯官方宣布,腾讯混元在3月18日到19日要举办混元3D开源日活动,而且在活动期间的3月18日和19日上午11点会开启直播。虽然官方还没透露直播具体有啥内容,但今年1月腾讯混元的一系列操作已经很吸引人了。
它正式开源了3D生成大模型2.0版本(Hunyuan3D -2.0),这个版本生成能力更强,精度也更高,给3D内容生成提供了更好的解决方案。同时,还上线了业界首个一站式3D内容AI创作引擎,一下子就把3D创作门槛降低了,让大家更有创作热情。
这次活动对开发者来说,是个难得的学习交流好机会,能了解前沿技术和趋势,还能和同行交流合作。对喜欢3D的小伙伴来说,也是个感受3D技术魅力的好时机。大家都很期待这次活动,看看腾讯混元又会带来哪些惊喜。
腾讯混元3D工具地址》》》详情查看
谷歌Gemini 2.0 Flash新功能惹争议,图片水印去除引版权担忧
最近,社交媒体上的用户发现了谷歌新推出的Gemini AI模型一个有点麻烦的用途——去除图片水印,而且像Getty Images和其他知名图片库发布的图片水印都能去掉。
上周,谷歌扩大了Gemini2.0Flash模型图像生成功能的使用权限,这个功能能让模型直接生成和编辑图像内容。不得不说,这功能确实强大,但好像没啥限制。Gemini2.0Flash不仅能生成名人及有版权角色的图像,还能去除现有照片上的水印。
一些X和Reddit用户发现,Gemini2.0Flash不光能去掉水印,还会试着填补水印去掉后留下的空白。其他一些人工智能驱动的工具也有这功能,但Gemini2.0Flash在这方面好像特别厉害,关键还免费使用。
不过得说明一下,目前Gemini2.0Flash的图像生成功能被标记为“实验性”和“非用于生产”,而且只在谷歌面向开发者的工具,比如AI Studio中能用。这模型也不是完美的水印去除工具,处理某些半透明水印和覆盖大部分图像的水印时,它也有点费劲。
尽管如此,还是有不少版权所有者对Gemini2.0Flash缺乏使用限制提出质疑。像Anthropic的Claude3.7Sonnet和OpenAI的GPT -4o等模型,就明确拒绝去除水印,Claude还说未经图像原所有者同意去除水印是“不道德且可能违法的”。
按照美国版权法,除了少数特殊情况,未经原所有者同意去除水印是违法的。谷歌在非工作时间还没回应关于这事的评论请求。这事儿后续会怎么发展,大家都在关注。
谷歌Gemini 2大模型地址》》》详情查看