有道“子曰3”大模型,让数学难题迎刃而解
6月23号,网易有道搞了个大动作,正式推出并开源了“子曰3”系列大模型,英文名叫Confucius3-Math。这模型专门针对数学教育,能在普通消费级GPU上高效运行,是国内首个低成本高性能的AI教育神器。
“子曰3”数学模型可不简单,它用大规模增强学习和创新算法,把数学问题解决能力提升了一大截。训练成本才2.6万美元,推理性能却是DeepSeek R1的15倍。在GAOKAO-Bench(Math)评测里,它拿了98.5的高分,数学推理能力杠杠的。
这模型不仅性能强,还降低了教育场景里AI应用的门槛。每百万token只要0.15美元,普通教育机构和开发者都能轻松部署专业级数学AI应用,大大提高了教育公平性。
网易有道首席科学家段亦涛说,推出“子曰3”就是为了证明低成本也能构建强大的特定领域推理模型。这给教育大模型研发和应用提供了参考,也给“AI + 教育”领域注入了新活力。
从2023年7月推出首个教育大模型“子曰”开始,网易有道就在教育领域不断拓展。这次“子曰3”开源,能让更多开发者和教育从业者共享技术成果,一起推动教育科技发展。段亦涛还强调,AI在教育里不是要替代老师,而是要成为推动教育公平的杠杆。希望“子曰3”能吸引更多开发者探索数学推理模型在教育中的应用。
字节跳动“探饭”来袭,美食AI新体验
最近有消息说,字节跳动的用户增长团队开发了一款叫“探饭”的AI产品,搭载了豆包大模型,由北京有竹居网络技术有限公司开发。
“探饭”主要给用户提供美食智能向导服务,能买团购套餐、点外卖,还能AI点菜。一位知情人士透露,这是抖音生活服务和AI推荐功能的小范围尝试,目前只在抖音小程序能用。看来字节跳动正积极探索把AI技术融入本地生活服务,想给用户带来更智能便捷的美食体验。
去年9月,北京字跳网络技术有限公司就申请了多枚“探饭”商标,国际分类涵盖科学仪器、餐饮住宿、网站服务等。这说明字节跳动对“探饭”有战略布局和未来规划。以后说不定“探饭”能成为我们找美食、享受美食服务的好帮手,让我们的生活更加丰富多彩。
开源设计新利器Jaaz,免费替代Lovart AI
最近开发者社区都在热议一款开源AI设计工具Jaaz,它被誉为Lovart AI的本地化免费替代品。Jaaz用先进的AI模型和图像生成技术,支持通过聊天对话完成图像设计、编辑和生成,涵盖海报、故事板等多种创意场景。
Jaaz定位很明确,就是为需要本地化运行的设计师和开发者打造。它和依赖云服务的Lovart AI不同,支持完全本地部署,兼容多种开源图像生成模型,还能通过Ollama免费使用。而且它还能通过API密钥连接多种模型,给用户提供灵活选择。
Jaaz的聊天式交互界面是亮点,用户用自然语言描述需求就能完成复杂设计任务,降低了设计门槛。它还集成了对象移除、风格转移、一致性角色生成、局部元素调整等功能,还有无限画布和批量生成图像的能力,能大幅提升创作效率。未来还计划推出视频生成功能,拓展应用场景。
Jaaz基于ComfyUI框架,支持本地运行多种模型,保障数据隐私,降低成本。它的开源特性也让它有很高的可定制性,开发者能通过GitHub获取代码进行二次开发。虽然目前在模型训练数据透明度和复杂场景提示词优化上有提升空间,但它的开源属性和快速迭代速度已经让它成为2025年最受关注的AI设计工具之一。
MiniMax Voice Design,音色设计随心所欲
MiniMax最近推出了Voice Design音色设计功能,这可是语音合成技术的一大突破。自5月发布以来,MiniMax Speech-02模型在Artificial Analysis榜单上稳居全球第一,还赢得了用户广泛认可。到现在,Speech-01和Speech-02两代模型已经帮客户生成了超过1.5亿小时的语音,和全球30多个国家的用户建立了合作。
Voice Design功能可厉害了,用户能用自然语言描述理想中的音色,实现对语音的多维度精准控制,甚至能生成世界上不存在的音色。它和Speech-02语音模型紧密结合,用户在进行文字转语音时,能“所需即所得”,自由选择“任意语言 × 任意口音 × 任意音色”,进行全自定义无限组合。
通过简单的文本描述,用户就能得到不同风格的AI助手语音。比如想要一个积极鼓励、语调活泼的AI助手,或者一个严厉、快速的女声AI助手,都能轻松实现。Voice Design功能解决了语音合成领域的两个难题,一是音色库难以满足细分需求,二是复刻音色需要高质量输入素材和面临版权风险。现在用户只需描述需求,模型就能自动生成新的音色编码,还能多次尝试获得理想专属音色并存储用于后续创作。MiniMax一直致力于降低AI技术使用门槛,让不同语言的用户都能体验到语音模型的价值。
万兴科技推出万兴天幕音视频多媒体大模型2.0,创作更轻松
在人工智能领域,万兴科技又有了新动作,正式发布了万兴天幕音视频多媒体大模型2.0。这个升级版大模型提升了音视频处理能力,给用户带来了更智能便捷的多媒体应用体验,被很多人认为是提升内容创作效率和质量的游戏规则改变者。
万兴天幕音视频多媒体大模型2.0集成了更强大的人工智能算法,能实现高质量的音频和视频生成。用户创作时能节省更多时间和精力,轻松制作出专业水平的多媒体作品。不管是短视频制作、在线课程,还是影视后期编辑,它都能提供强有力的支持。
除了万兴科技的突破,科技界还有其他动态。苹果公司近期就收购人工智能初创公司Perplexity AI进行了内部讨论,这是苹果在人工智能领域进一步扩展的重要一步。英国的AI初创公司PhysicsX也备受瞩目,估值已接近10亿美元,展现出在市场上的潜力和影响力。在这样一个充满机遇和挑战的时代,万兴科技的音视频多媒体大模型2.0无疑为行业注入了新活力。随着技术不断进步,我们期待看到更多企业在AI领域的探索和发展。
Firecrawl推出Fireplexity,开源AI搜索新势力
在AI搜索引擎领域,Firecrawl要搞大事情了。根据最新社交媒体动态,Firecrawl宣布将于下周正式推出Fireplexity,这是一款开源的Perplexity克隆版,要为开发者提供强大的AI驱动问答引擎,挑战现有AI搜索工具的格局。
Fireplexity被描述为一个完全开源的AI问答引擎,核心功能和Perplexity类似,能通过AI技术为用户提供精准、带来源引用的答案。它依托Firecrawl强大的/search和/scrape功能,支持高效的网页数据抓取与处理。不仅能回答复杂问题,还能为开发者提供灵活的定制能力,据说三天内就能构建专属的AI问答引擎。
Firecrawl作为企业级网页抓取工具,处理动态JavaScript页面、绕过反爬机制以及输出LLM友好的Markdown或JSON格式都很厉害,已经获得了Snapchat、Coinbase等企业的青睐,GitHub星标数超34,000。Fireplexity充分利用了这些优势,结合AI技术,提供从数据采集到答案生成的完整解决方案。
Perplexity是AI搜索领域的先锋,估值高达180亿美元,但闭源模式和内容抓取引发的版权争议,让开源替代品有了机会。Fireplexity的出现,为开发者提供了低成本替代方案,也可能推动AI搜索行业向更开放的方向发展。不过它也面临建立活跃开发者生态和数据抓取合规性等挑战。但Firecrawl在技术积累和社区支持上的优势,为Fireplexity的未来奠定了坚实基础。
月之暗面Kimi-Researcher,AI智能体新王者
月之暗面(Moonshot AI)今天推出了备受期待的Kimi研究功能,正式加入了日益激烈的AI智能体(Agent)竞争。据说这个功能在多项基准测试中表现出色,尤其在“人类终极考验”(HLE)测试中,性能超越了谷歌和OpenAI的同类产品,登顶了。
Kimi研究功能的核心是Kimi-Researcher,这是一款擅长多轮搜索与推理的自主智能体。官方数据显示,它执行每个任务时平均会进行23个推理步骤,并浏览超过200个网址,信息处理和分析能力超强。
在“人类终极考验”(HLE)测试中,Kimi-Researcher取得了26.9%的Pass@1得分率,达到了业界顶尖水平;Pass@4准确率更是高达40.17%。它基于Kimi k-系列模型的内部版本构建,完全通过端到端的智能体强化学习(RL)进行训练。从初始得分8.6%提升到26.9%,几乎全靠端到端的强化学习训练,这证明了端到端智能体强化学习能极大推动智能体智能水平提升。
Kimi-Researcher在多个复杂且具挑战性的真实世界基准测试中也表现出色,比如在xbench测试的xbench-DeepSearch项目上,取得了69%的Pass@1(4次运行平均值),表现优于配备了搜索工具的o3等模型。在多轮搜索推理和事实性信息问答的基准测试中,它也毫不逊色。月之暗面宣布,Kimi-Researcher将逐步向用户开放,现在用户可以访问kimi.com申请内测。
未来几个月内,还将开源背后的基础预训练模型以及经过强化学习训练后的模型,这会给AI社区发展带来重要贡献。