火山引擎豆包编程模型:性价比与性能的双重惊喜
11月11日,火山引擎推出的豆包编程模型(Doubao-Seed-Code)成了开发者圈里的热门话题。首月订阅仅9.9元,这价格太亲民,一下就吸引了众多目光。
豆包编程模型专为Agentic编程任务优化,在SWE-Bench-Verified官方榜单上刷新了SOTA记录,还兼容主流开发环境。综合使用成本比行业平均低62.7%,是国内价格最低的AI编程工具,性价比超高。
它有256K长上下文处理能力,复杂代码文件和多模块依赖都能轻松应对,全栈开发效率大大提升。作为国内首个支持视觉理解的编程模型,能根据UI设计稿、截图或手绘草图生成代码,还能自动修复样式问题和Bug,前端开发者用起来超方便。
火山引擎的“Coding Plan”订阅套餐,首次订阅9.9元,支持多种主流工具,给开发者稳定的算力保障。TRAE中国版接入后,企业级开发者也能享受全面服务,高并发处理大规模代码库,还有灵活的模型管理和安全控制功能。
豆包编程模型的出现,给开发者带来了更多选择。它以高性价比和强大功能,在AI编程领域站稳脚跟。相信未来,会有更多开发者借助它,开发出更优秀的项目。
详情查看:火山引擎发布豆包编程模型,首月9.9元,支持长上下文与视觉理解

OpenAI Polaris Alpha:疑似GPT - 5.1的神秘模型
最近,OpenAI在第三方分发平台OpenRouter悄悄上线了代号“Polaris Alpha”的匿名大模型,虽未官方确认,但和传闻中的GPT - 5.1高度吻合,引发了开发者们的热烈讨论。
Polaris Alpha支持256K上下文窗口,单次输出128K,知识库更新到2024年10月,比GPT - 4Turbo强不少。处理长文档和多轮复杂推理任务时表现稳健,信息提取和逻辑归纳能力出色。还能引用冷门信源,创意写作语言自然。
在代码生成方面,它也表现出色。用户简单提示就能生成贪吃蛇、打地鼠等完整小游戏代码,包含交互逻辑、界面渲染和边界处理,可直接运行,为开发者提供了高可用初稿。
有迹象显示,它可能为年底推出的NSFW模式做技术准备,不过这也面临隐私、安全和伦理挑战。虽然OpenAI没承认它是GPT - 5.1,但从命名、性能和上线时机看,很可能是预发布技术验证。
大模型竞赛正从“有没有”转向“好不好”,Polaris Alpha的出现表明,更长上下文、更深知识、更强逻辑和更广场景是未来竞争的关键。这场竞赛的最终结果,值得我们期待。
详情查看:OpenAI“暗藏大招”?Polaris Alpha上线引AI圈震动

百度发布ERNIE-4.5-VL模型,新增“图像思考”能力支持工具调用
2025年11月11日,百度发布了新一代多模态AI模型ERNIE-4.5-VL-28B-A3B-Thinking,在多模态AI领域又迈进了一步。
这个模型激活参数只有3B,计算效率高、灵活性好,处理多种任务时能迅速响应。它最大的亮点是加入了“图像思考”功能,不仅能放大图片,还能进行图片搜索等工具调用。
有了“图像思考”功能,用户和图像、文本的交互体验更丰富了。在智能搜索中,能更精准地找到所需信息;在线教育里,能帮助学生更好地理解知识;电子商务中,能让消费者更直观地了解商品。
百度在多模态AI领域一直处于领先地位,这次开源ERNIE-4.5-VL,让开发者和研究者能更便捷地探索多模态AI的潜力。大家可以基于这个模型进行二次开发,推动相关技术的发展和应用。
ERNIE-4.5-VL的发布是多模态人工智能的新篇章。相信在未来,它会在各个行业发挥更大价值,帮助人们更智能地处理信息和解决问题,让我们的生活变得更加便捷和美好。
模型地址: https://huggingface.co/baidu/ERNIE-4.5-VL-28B-A3B-Thinking

Replit推出AI Integrations:无需API密钥,直接调用300+模型构建应用
在科技飞速发展的今天,构建AI应用常常面临步骤复杂、设置繁琐的问题。不过,Replit的新AI集成功能改变了这一现状,让构建AI应用变得轻松简单。
Replit AI集成让用户在平台内就能直接访问300多种顶尖AI模型,无需创建开发者账户、找API密钥或读文档。不管是文本生成还是图像处理,都能快速找到合适的模型投入创作。
使用起来也很方便,用户通过Replit智能助手提出需求,比如“建个聊天机器人”或“给项目加GPT - 5”,助手会请求批准连接模型,整个过程高效快捷。平台还会自动处理后台工作,包括配置凭证和链接计费。
智能助手会根据需求自动选模型,用户想换模型也能随时提出。使用情况和费用透明显示在仪表板上,让用户清楚了解。
有了Replit AI集成,用户能轻松创建各种AI应用,像AI聊天机器人、图像生成工具等都能在工作区内完成。它简化了构建过程,让初次尝试和扩展项目的用户都能快速上手。如果你有构建AI应用的想法,不妨试试Replit。
官方博客:https://blog.replit.com/ai-integrations

字节跳动推出InfinityStar框架,大幅提升视频生成速度
字节跳动推出的InfinityStar框架,给视频生成领域带来了新惊喜。这个框架把生成5秒720p视频的时间缩短到了58秒,大大提高了生成效率。
InfinityStar框架的设计很独特,它基于对视频数据本质的理解,采用时空金字塔模型,把空间尺度和时间维度分开。这样处理视频时,能更有效地解耦外观信息和动态运动信息,提升生成质量。
它还引入了知识继承策略,利用预训练的变分自编码器(VAE)作为基础,让新模型能快速学习高质量视频特征,缩短训练时间和计算资源消耗。
实验表明,InfinityStar生成的视频视觉质量优良,速度还快。它支持多种视觉生成任务,像图像生成、文本生成视频、视频续写等。
InfinityStar框架的推出是视觉生成技术的重要进步,为长视频生成和多样化任务处理奠定了基础。未来,它有望在更多领域得到应用,为视频创作带来更多可能,让我们期待它带来更多精彩
详情查看: https://github.com/FoundationVision/InfinityStar

Meta推出Omnilingual ASR系统,支持1600种语言语音识别
Meta的基础人工智能研究团队(FAIR)推出的Omnilingual ASR自动语音识别系统,为全球语言交流带来了新希望。
大多数语音识别工具只关注几百种资源丰富的语言,全球7000多种语言中,很多都没得到AI支持。Omnilingual ASR能转录超过1600种语言的口语,其中500种语言从未被AI系统覆盖,向“通用转录系统”迈进了一大步。
该系统准确性取决于训练数据,在测试的1600种语言中,78%的语言字符错误率低于10。有至少10小时训练音频的语言,95%达到这一标准。低资源语言也有36%字符错误率低于10。
Meta还发布了包含350种欠代表性语言转录语音的语料库,供开发者和研究人员使用。它的“自带语言”选项采用上下文学习方式,用户提供少量配对音频和文本样本,系统就能学习,无需重训练或大量计算资源。
Omnilingual ASR是开源项目,采用Apache2.0许可证,模型系列涵盖多种参数版本。它有望打破全球语言障碍,让不同语言的人能更顺畅地交流,促进文化的传播和交流。
体验地址: https://aidemos.atmeta.com/omnilingualasr/language-globe

ChatTutor上线:新增实时绘图功能,支持边讲边画式教学
AI教育领域有了新突破,全新一代可视化交互式AI教师系统ChatTutor正式发布,给教育带来了新活力。
传统AI问答多是纯文字输出,ChatTutor打破了这一局限,通过右侧实时同步画板,实现“边讲解、边绘制、边推演”的类人教学体验。比如问“二次函数如何平移”,它会动态绘制曲线、标注顶点、演示变换过程,让知识变得直观。
ChatTutor依托多模态生成技术,构建了覆盖多领域的智能教学矩阵。数学可视化能生成函数图像等;物理实验模拟可绘制力学受力图等;逻辑电路交互能拖拽门电路元件;编程逐行教学支持多种语言;思维导图生成可自动结构化复杂概念。
实测显示,面对复合问题,ChatTutor逻辑清晰、节奏得当,教学逻辑媲美一线教师。它把教学法融入AI内核,通过视觉引导等模拟人类启发式教学,提升理解效率,培养结构化思维能力。
ChatTutor的出现,标志着AI教育从“信息检索工具”升级为“认知协作伙伴”。
未来,它有望成为学生自学、教师备课、企业培训的标配,让教育智能化真正开始。
github地址: https://github.com/sheepbox8646/ChatTutor

想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码:









