火山引擎豆包大模型1.6-vision发布,视觉理解能力适配多行业需求
9月30日,火山引擎推出了豆包大模型1.6-vision版本。这次更新重点强化了视觉理解相关功能,尤其是调用工具的能力,让图像识别、目标检测更精准,处理速度也比之前快了不少。
从技术层面看,该模型运用了最新的深度学习技术,具备处理海量数据和实时分析的能力。研发团队在发布会上展示了它在人脸识别、物体识别等场景的实际表现,例如自动驾驶里的路况识别、安防监控中的异常目标捕捉,以及医疗影像的细节分析等。
而且,它的可扩展性良好,企业能够根据自己的需求进行定制化开发,不受固定功能限制。值得一提的是,之前火山引擎还推出了“Viking长期记忆”功能,解决了AI“记不住”的问题。此次两个技术共同推进,也体现出他们在AI领域的持续投入,对于需要复杂视觉分析的行业而言,算是一个实用的技术更新。
Opera Neon浏览器开放试用,每月19.99美元主打AI辅助功能
最近,Opera推出了一款名为Neon的AI浏览器,目前已开始向部分用户发放邀请,不过使用该浏览器需按月付费,每月19.99美元。其实早在今年5月,Opera就表示在研发这款产品,此前一直处于封闭预览状态。
这款浏览器的核心功能均围绕AI展开。比如内置了聊天机器人,可直接对话答疑。更为实用的是“Neon Do”功能,它能帮用户处理不少日常任务,像总结Substack博客内容并转发到Slack,还能提取上周看过的YouTube视频详情、昨天读的文章重点,毕竟它能访问用户的浏览历史。
另外,它还设有“卡片”功能,用户可将常用的提示保存成卡片反复使用,还能组合不同卡片生成新功能,例如把“提取详情”和“比较表”结合,用于对比多个标签页里的产品。它还添加了“任务”标签组织功能,像是将标签组和工作区结合,并带有AI上下文。不过目前这些功能还在试用阶段,实际使用效果能否如演示的那般顺畅,还得等待用户反馈。
体验地址: https://www.operaneon.com/ (海外网站需要科学上网)
通义千问Qwen3-LiveTranslate-Flash发布,3秒同传覆盖18种语言
9月30日,通义千问推出了多语言实时音视频翻译系统Qwen3-LiveTranslate-Flash。该系统不仅支持18种语言的离线和实时翻译,还能处理普通话、粤语、北京话、吴语等方言,无论是国际会议还是日常跨语言交流,都能派上用场。
这个系统最突出的亮点是视觉上下文增强技术,它不仅能“听”懂语言,还能通过识别口型、动作、文字等多模态信息,理清上下文。比如在嘈杂的环境里,或者遇到一词多译的情况,翻译准确率能明显提高。
在延迟方面,它采用了轻量混合专家架构和动态采样策略,最低能做到3秒同传延迟,比不少同类产品快很多,实时交流时不会有明显卡顿。而且通过语义单元预测技术,还能减少跨语言翻译里的语序问题,翻译质量接近离线水平。测试数据显示,它在中英及多语言翻译准确率上,超过了Gemini-2.5-Flash、GPT-4o-Audio-Preview等主流模型,后续还会继续优化音色自然度和语种覆盖范围。
详情查看:通义千问Qwen3-LiveTranslate-Flash刷新纪录:3秒同传+方言覆盖,跨语言交流要变天了?
智谱GLM-4.6开源,编程能力对齐Claude Sonnet4适配国产芯片
最近,智谱AI发布了开源大模型GLM-4.6。官方称这款模型在Agentic Coding能力上提升显著,无论是公开的编程基准测试,还是实际编程任务,表现都能与国际顶尖模型Claude Sonnet4对齐,还超过了DeepSeek-V3.2-Exp,算是目前国内编程能力较强的代码生成模型。
除了技术提升,它在国产化适配方面也有突破,已经能在寒武纪国产芯片上实现FP8+Int4混合量化部署,这也是首套能投产的该模式芯片一体化方案。另外,基于vLLM框架,它还能在摩尔线程新一代GPU上,以原生FP8精度稳定运行。
这对国内AI开发者来说颇为实用,不仅多了一个好用的编程工具,还推动了大模型和国产硬件的适配融合。现在不少企业都在关注自主可控的AI生态,GLM-4.6的开源,也为这方面发展打下了基础,后续在实际开发中的应用效果,值得期待。
详情查看:智谱GLM-4.6正式上线
OpenAI 2025上半年财报:销售额43亿美元,全年现金消耗预计85亿
近日,OpenAI公布了2025年上半年的财务数据,销售额达到43亿美元,比去年同期增长16%,而且目前月收入已经超过10亿,照此趋势,全年收入有望突破130亿美元。
不过亮眼的收入背后,成本压力也不小。上半年现金消耗就有25亿美元,官方预计全年会达到85亿美元,主要花在AI研发和ChatGPT的运营上。而且上半年经营亏损78亿美元,净亏损更是高达135亿美元,其中一部分是因为可转股权益重估的会计处理。
从支出明细看,研发费用上半年花了67亿,销售和市场费用20亿,都比去年多了不少。股权激励开支也在涨,上半年25亿,全年预计60亿,几乎是去年的两倍。另外,服务器相关投入也是大开销,预计到2030年计算基础设施总投入会达4500亿美元,今年光服务器租赁费用就有160亿,为了缓解现金压力,还向服务器供应商支付了6.7亿美元的股权。如何平衡扩张和成本,成了OpenAI接下来的重要问题。
详情查看:OpenAI上半年销售额破43亿美元
蚂蚁集团开源Ring-1T-preview,万亿参数模型代码生成超GPT-5
最近,蚂蚁集团宣布开源自研的万亿参数推理大模型Ring-1T-preview,这也是全球首个开源的万亿参数推理大模型。虽然目前只是预览版,但在多个测试中表现都很突出。
在AIME25测试里,它拿了92.6分,超过了包括Gemini2.5Pro在内的所有开源模型,接近GPT-5的94.6分。更让人关注的是其代码生成能力,在CodeForces测试中,它以94.69分领先GPT-5,在LiveCodeBench、ARC-AGI-v1等权威榜单里,也稳居开源模型第一。
而且它在复杂推理任务上也有不错表现,蚂蚁百灵团队用国际奥林匹克数学竞赛(IMO25)测试,它能一次性答对第三题,还能在一、二、四、五题里推理出部分正确答案。目前团队正在对Ling2.0家族1T语言基座做后训练,还在推进Ring-1T正式版的训练,后续开源后,可能会给AI研发领域带来更多新可能。
详情查看:蚂蚁集团开源全球首个万亿参数大模型Ring-1T-preview
Brave浏览器新增Ask Brave功能,AI搜索兼顾深度与隐私
近日,浏览器开发商Brave推出了新功能Ask Brave,加入到其AI驱动的搜索套件中。这个功能和去年推出的AI Answers不同,AI Answers主要给用户提供简明的摘要,而Ask Brave能给出更详细的主题回答,还支持后续提问和深度研究的聊天模式。
从使用方式来看,不用切换特殊模式,搜索引擎会自动识别查询类型。用户要么点Brave搜索框旁边的提问按钮,要么在搜索结果页点Ask标签,把普通搜索转成AI搜索。如果把Brave设为默认搜索引擎,在查询后面加双问号(“??”),也能直接启动Ask Brave。
Brave方面表示,会用自有API保证搜索结果准确,而且重点强调了隐私保护——用户的聊天记录会加密,24小时不活动后就会删除。现在谷歌、微软Bing等都在推AI搜索功能,Brave的这个新功能,通过深度报告式回答加隐私保护的组合,想在竞争中找到差异化。目前用户每天已经能获得超过1500万次AI答案,后续可能会吸引更多关注隐私的用户。
详情查看:Brave浏览器即将推出Ask Brave功能,AI搜索+隐私保护双剑合璧
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码: