每日AI资讯-2025年09月30日-AITOP100,AI资讯

火山引擎豆包大模型1.6-vision发布，视觉理解能力适配多行业需求

9月30日，火山引擎推出了豆包大模型1.6-vision版本。这次更新重点强化了视觉理解相关功能，尤其是调用工具的能力，让图像识别、目标检测更精准，处理速度也比之前快了不少。

从技术层面看，该模型运用了最新的深度学习技术，具备处理海量数据和实时分析的能力。研发团队在发布会上展示了它在人脸识别、物体识别等场景的实际表现，例如自动驾驶里的路况识别、安防监控中的异常目标捕捉，以及医疗影像的细节分析等。

而且，它的可扩展性良好，企业能够根据自己的需求进行定制化开发，不受固定功能限制。值得一提的是，之前火山引擎还推出了“Viking长期记忆”功能，解决了AI“记不住”的问题。此次两个技术共同推进，也体现出他们在AI领域的持续投入，对于需要复杂视觉分析的行业而言，算是一个实用的技术更新。

详情查看：火山引擎发布豆包大模型1.6-vision

火山引擎豆包大模型1.6-vision发布

Opera Neon浏览器开放试用，每月19.99美元主打AI辅助功能

最近，Opera推出了一款名为Neon的AI浏览器，目前已开始向部分用户发放邀请，不过使用该浏览器需按月付费，每月19.99美元。其实早在今年5月，Opera就表示在研发这款产品，此前一直处于封闭预览状态。

这款浏览器的核心功能均围绕AI展开。比如内置了聊天机器人，可直接对话答疑。更为实用的是“Neon Do”功能，它能帮用户处理不少日常任务，像总结Substack博客内容并转发到Slack，还能提取上周看过的YouTube视频详情、昨天读的文章重点，毕竟它能访问用户的浏览历史。

另外，它还设有“卡片”功能，用户可将常用的提示保存成卡片反复使用，还能组合不同卡片生成新功能，例如把“提取详情”和“比较表”结合，用于对比多个标签页里的产品。它还添加了“任务”标签组织功能，像是将标签组和工作区结合，并带有AI上下文。不过目前这些功能还在试用阶段，实际使用效果能否如演示的那般顺畅，还得等待用户反馈。

体验地址： https://www.operaneon.com/ （海外网站需要科学上网）

Opera Neon浏览器

通义千问Qwen3-LiveTranslate-Flash发布，3秒同传覆盖18种语言

9月30日，通义千问推出了多语言实时音视频翻译系统Qwen3-LiveTranslate-Flash。该系统不仅支持18种语言的离线和实时翻译，还能处理普通话、粤语、北京话、吴语等方言，无论是国际会议还是日常跨语言交流，都能派上用场。

这个系统最突出的亮点是视觉上下文增强技术，它不仅能“听”懂语言，还能通过识别口型、动作、文字等多模态信息，理清上下文。比如在嘈杂的环境里，或者遇到一词多译的情况，翻译准确率能明显提高。

在延迟方面，它采用了轻量混合专家架构和动态采样策略，最低能做到3秒同传延迟，比不少同类产品快很多，实时交流时不会有明显卡顿。而且通过语义单元预测技术，还能减少跨语言翻译里的语序问题，翻译质量接近离线水平。测试数据显示，它在中英及多语言翻译准确率上，超过了Gemini-2.5-Flash、GPT-4o-Audio-Preview等主流模型，后续还会继续优化音色自然度和语种覆盖范围。

详情查看：通义千问Qwen3-LiveTranslate-Flash刷新纪录：3秒同传+方言覆盖，跨语言交流要变天了？

Qwen3-LiveTranslate-Flash

智谱GLM-4.6开源，编程能力对齐Claude Sonnet4适配国产芯片

最近，智谱AI发布了开源大模型GLM-4.6。官方称这款模型在Agentic Coding能力上提升显著，无论是公开的编程基准测试，还是实际编程任务，表现都能与国际顶尖模型Claude Sonnet4对齐，还超过了DeepSeek-V3.2-Exp，算是目前国内编程能力较强的代码生成模型。

除了技术提升，它在国产化适配方面也有突破，已经能在寒武纪国产芯片上实现FP8+Int4混合量化部署，这也是首套能投产的该模式芯片一体化方案。另外，基于vLLM框架，它还能在摩尔线程新一代GPU上，以原生FP8精度稳定运行。

这对国内AI开发者来说颇为实用，不仅多了一个好用的编程工具，还推动了大模型和国产硬件的适配融合。现在不少企业都在关注自主可控的AI生态，GLM-4.6的开源，也为这方面发展打下了基础，后续在实际开发中的应用效果，值得期待。

详情查看：智谱GLM-4.6正式上线

智谱GLM-4.6

OpenAI 2025上半年财报：销售额43亿美元，全年现金消耗预计85亿

近日，OpenAI公布了2025年上半年的财务数据，销售额达到43亿美元，比去年同期增长16%，而且目前月收入已经超过10亿，照此趋势，全年收入有望突破130亿美元。

不过亮眼的收入背后，成本压力也不小。上半年现金消耗就有25亿美元，官方预计全年会达到85亿美元，主要花在AI研发和ChatGPT的运营上。而且上半年经营亏损78亿美元，净亏损更是高达135亿美元，其中一部分是因为可转股权益重估的会计处理。

从支出明细看，研发费用上半年花了67亿，销售和市场费用20亿，都比去年多了不少。股权激励开支也在涨，上半年25亿，全年预计60亿，几乎是去年的两倍。另外，服务器相关投入也是大开销，预计到2030年计算基础设施总投入会达4500亿美元，今年光服务器租赁费用就有160亿，为了缓解现金压力，还向服务器供应商支付了6.7亿美元的股权。如何平衡扩张和成本，成了OpenAI接下来的重要问题。

详情查看：OpenAI上半年销售额破43亿美元

OpenAI 2025上半年财报

蚂蚁集团开源Ring-1T-preview，万亿参数模型代码生成超GPT-5

最近，蚂蚁集团宣布开源自研的万亿参数推理大模型Ring-1T-preview，这也是全球首个开源的万亿参数推理大模型。虽然目前只是预览版，但在多个测试中表现都很突出。

在AIME25测试里，它拿了92.6分，超过了包括Gemini2.5Pro在内的所有开源模型，接近GPT-5的94.6分。更让人关注的是其代码生成能力，在CodeForces测试中，它以94.69分领先GPT-5，在LiveCodeBench、ARC-AGI-v1等权威榜单里，也稳居开源模型第一。

而且它在复杂推理任务上也有不错表现，蚂蚁百灵团队用国际奥林匹克数学竞赛（IMO25）测试，它能一次性答对第三题，还能在一、二、四、五题里推理出部分正确答案。目前团队正在对Ling2.0家族1T语言基座做后训练，还在推进Ring-1T正式版的训练，后续开源后，可能会给AI研发领域带来更多新可能。

详情查看：蚂蚁集团开源全球首个万亿参数大模型Ring-1T-preview

蚂蚁集团开源Ring-1T-preview

Brave浏览器新增Ask Brave功能，AI搜索兼顾深度与隐私

近日，浏览器开发商Brave推出了新功能Ask Brave，加入到其AI驱动的搜索套件中。这个功能和去年推出的AI Answers不同，AI Answers主要给用户提供简明的摘要，而Ask Brave能给出更详细的主题回答，还支持后续提问和深度研究的聊天模式。

从使用方式来看，不用切换特殊模式，搜索引擎会自动识别查询类型。用户要么点Brave搜索框旁边的提问按钮，要么在搜索结果页点Ask标签，把普通搜索转成AI搜索。如果把Brave设为默认搜索引擎，在查询后面加双问号（“??”），也能直接启动Ask Brave。

Brave方面表示，会用自有API保证搜索结果准确，而且重点强调了隐私保护——用户的聊天记录会加密，24小时不活动后就会删除。现在谷歌、微软Bing等都在推AI搜索功能，Brave的这个新功能，通过深度报告式回答加隐私保护的组合，想在竞争中找到差异化。目前用户每天已经能获得超过1500万次AI答案，后续可能会吸引更多关注隐私的用户。

详情查看：Brave浏览器即将推出Ask Brave功能，AI搜索+隐私保护双剑合璧

brave