每日AI资讯-2025年11月11日-AITOP100,AI资讯

火山引擎豆包编程模型：性价比与性能的双重惊喜

11月11日，火山引擎推出的豆包编程模型（Doubao-Seed-Code）成了开发者圈里的热门话题。首月订阅仅9.9元，这价格太亲民，一下就吸引了众多目光。

豆包编程模型专为Agentic编程任务优化，在SWE-Bench-Verified官方榜单上刷新了SOTA记录，还兼容主流开发环境。综合使用成本比行业平均低62.7%，是国内价格最低的AI编程工具，性价比超高。

它有256K长上下文处理能力，复杂代码文件和多模块依赖都能轻松应对，全栈开发效率大大提升。作为国内首个支持视觉理解的编程模型，能根据UI设计稿、截图或手绘草图生成代码，还能自动修复样式问题和Bug，前端开发者用起来超方便。

火山引擎的“Coding Plan”订阅套餐，首次订阅9.9元，支持多种主流工具，给开发者稳定的算力保障。TRAE中国版接入后，企业级开发者也能享受全面服务，高并发处理大规模代码库，还有灵活的模型管理和安全控制功能。

豆包编程模型的出现，给开发者带来了更多选择。它以高性价比和强大功能，在AI编程领域站稳脚跟。相信未来，会有更多开发者借助它，开发出更优秀的项目。

详情查看：火山引擎发布豆包编程模型，首月9.9元，支持长上下文与视觉理解

火山引擎豆包编程模型

OpenAI Polaris Alpha：疑似GPT - 5.1的神秘模型

最近，OpenAI在第三方分发平台OpenRouter悄悄上线了代号“Polaris Alpha”的匿名大模型，虽未官方确认，但和传闻中的GPT - 5.1高度吻合，引发了开发者们的热烈讨论。

Polaris Alpha支持256K上下文窗口，单次输出128K，知识库更新到2024年10月，比GPT - 4Turbo强不少。处理长文档和多轮复杂推理任务时表现稳健，信息提取和逻辑归纳能力出色。还能引用冷门信源，创意写作语言自然。

在代码生成方面，它也表现出色。用户简单提示就能生成贪吃蛇、打地鼠等完整小游戏代码，包含交互逻辑、界面渲染和边界处理，可直接运行，为开发者提供了高可用初稿。

有迹象显示，它可能为年底推出的NSFW模式做技术准备，不过这也面临隐私、安全和伦理挑战。虽然OpenAI没承认它是GPT - 5.1，但从命名、性能和上线时机看，很可能是预发布技术验证。

大模型竞赛正从“有没有”转向“好不好”，Polaris Alpha的出现表明，更长上下文、更深知识、更强逻辑和更广场景是未来竞争的关键。这场竞赛的最终结果，值得我们期待。

详情查看：OpenAI“暗藏大招”？Polaris Alpha上线引AI圈震动

OpenAI Polaris Alpha

百度发布ERNIE-4.5-VL模型，新增“图像思考”能力支持工具调用

2025年11月11日，百度发布了新一代多模态AI模型ERNIE-4.5-VL-28B-A3B-Thinking，在多模态AI领域又迈进了一步。

这个模型激活参数只有3B，计算效率高、灵活性好，处理多种任务时能迅速响应。它最大的亮点是加入了“图像思考”功能，不仅能放大图片，还能进行图片搜索等工具调用。

有了“图像思考”功能，用户和图像、文本的交互体验更丰富了。在智能搜索中，能更精准地找到所需信息；在线教育里，能帮助学生更好地理解知识；电子商务中，能让消费者更直观地了解商品。

百度在多模态AI领域一直处于领先地位，这次开源ERNIE-4.5-VL，让开发者和研究者能更便捷地探索多模态AI的潜力。大家可以基于这个模型进行二次开发，推动相关技术的发展和应用。

ERNIE-4.5-VL的发布是多模态人工智能的新篇章。相信在未来，它会在各个行业发挥更大价值，帮助人们更智能地处理信息和解决问题，让我们的生活变得更加便捷和美好。

模型地址： https://huggingface.co/baidu/ERNIE-4.5-VL-28B-A3B-Thinking

百度ERNIE-4.5-VL模型

Replit推出AI Integrations：无需API密钥，直接调用300+模型构建应用

在科技飞速发展的今天，构建AI应用常常面临步骤复杂、设置繁琐的问题。不过，Replit的新AI集成功能改变了这一现状，让构建AI应用变得轻松简单。

Replit AI集成让用户在平台内就能直接访问300多种顶尖AI模型，无需创建开发者账户、找API密钥或读文档。不管是文本生成还是图像处理，都能快速找到合适的模型投入创作。

使用起来也很方便，用户通过Replit智能助手提出需求，比如“建个聊天机器人”或“给项目加GPT - 5”，助手会请求批准连接模型，整个过程高效快捷。平台还会自动处理后台工作，包括配置凭证和链接计费。

智能助手会根据需求自动选模型，用户想换模型也能随时提出。使用情况和费用透明显示在仪表板上，让用户清楚了解。

有了Replit AI集成，用户能轻松创建各种AI应用，像AI聊天机器人、图像生成工具等都能在工作区内完成。它简化了构建过程，让初次尝试和扩展项目的用户都能快速上手。如果你有构建AI应用的想法，不妨试试Replit。

官方博客：https://blog.replit.com/ai-integrations

Replit推出AI Integrations

字节跳动推出InfinityStar框架，大幅提升视频生成速度

字节跳动推出的InfinityStar框架，给视频生成领域带来了新惊喜。这个框架把生成5秒720p视频的时间缩短到了58秒，大大提高了生成效率。

InfinityStar框架的设计很独特，它基于对视频数据本质的理解，采用时空金字塔模型，把空间尺度和时间维度分开。这样处理视频时，能更有效地解耦外观信息和动态运动信息，提升生成质量。

它还引入了知识继承策略，利用预训练的变分自编码器（VAE）作为基础，让新模型能快速学习高质量视频特征，缩短训练时间和计算资源消耗。

实验表明，InfinityStar生成的视频视觉质量优良，速度还快。它支持多种视觉生成任务，像图像生成、文本生成视频、视频续写等。

InfinityStar框架的推出是视觉生成技术的重要进步，为长视频生成和多样化任务处理奠定了基础。未来，它有望在更多领域得到应用，为视频创作带来更多可能，让我们期待它带来更多精彩

详情查看： https://github.com/FoundationVision/InfinityStar

字节跳动InfinityStar框架

Meta推出Omnilingual ASR系统，支持1600种语言语音识别

Meta的基础人工智能研究团队（FAIR）推出的Omnilingual ASR自动语音识别系统，为全球语言交流带来了新希望。

大多数语音识别工具只关注几百种资源丰富的语言，全球7000多种语言中，很多都没得到AI支持。Omnilingual ASR能转录超过1600种语言的口语，其中500种语言从未被AI系统覆盖，向“通用转录系统”迈进了一大步。

该系统准确性取决于训练数据，在测试的1600种语言中，78%的语言字符错误率低于10。有至少10小时训练音频的语言，95%达到这一标准。低资源语言也有36%字符错误率低于10。

Meta还发布了包含350种欠代表性语言转录语音的语料库，供开发者和研究人员使用。它的“自带语言”选项采用上下文学习方式，用户提供少量配对音频和文本样本，系统就能学习，无需重训练或大量计算资源。

Omnilingual ASR是开源项目，采用Apache2.0许可证，模型系列涵盖多种参数版本。它有望打破全球语言障碍，让不同语言的人能更顺畅地交流，促进文化的传播和交流。

体验地址： https://aidemos.atmeta.com/omnilingualasr/language-globe

Omnilingual ASR系统

ChatTutor上线：新增实时绘图功能，支持边讲边画式教学

AI教育领域有了新突破，全新一代可视化交互式AI教师系统ChatTutor正式发布，给教育带来了新活力。

传统AI问答多是纯文字输出，ChatTutor打破了这一局限，通过右侧实时同步画板，实现“边讲解、边绘制、边推演”的类人教学体验。比如问“二次函数如何平移”，它会动态绘制曲线、标注顶点、演示变换过程，让知识变得直观。

ChatTutor依托多模态生成技术，构建了覆盖多领域的智能教学矩阵。数学可视化能生成函数图像等；物理实验模拟可绘制力学受力图等；逻辑电路交互能拖拽门电路元件；编程逐行教学支持多种语言；思维导图生成可自动结构化复杂概念。

实测显示，面对复合问题，ChatTutor逻辑清晰、节奏得当，教学逻辑媲美一线教师。它把教学法融入AI内核，通过视觉引导等模拟人类启发式教学，提升理解效率，培养结构化思维能力。

ChatTutor的出现，标志着AI教育从“信息检索工具”升级为“认知协作伙伴”。

未来，它有望成为学生自学、教师备课、企业培训的标配，让教育智能化真正开始。

github地址： https://github.com/sheepbox8646/ChatTutor

ChatTutor

想了解AITOP100平台其它版块的内容，请点击下方超链接查看

AI 创作大赛 | AI活动 | AI工具集 | AI资讯专区

AITOP100平台官方交流社群二维码：

aitop100官方交流30群