每日AI资讯-11月18日-AITOP100,AI资讯

Kimi发布k0-math模型，数学推理能力匹敌OpenAI o1系列

标题：Kimi

月之暗面科技有限公司旗下的AI项目Kimi近日宣布推出其新一代数学推理模型k0-math，这一模型在数学能力上与OpenAI的o1系列模型相媲美。k0-math模型在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中表现出色，成绩超越了OpenAI的o1-mini和o1-preview模型。在更高难度的竞赛级别数学题库OMNI-MATH和AIME基准测试中，k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%。k0-math模型的设计理念聚焦于复杂的逻辑推理与问题解决，结合最新的数学理论与深度学习算法，使其在处理抽象概念与复杂推理方面展现出卓越的能力。月之暗面创始人杨植麟博士表示，k0-math模型和更强大的Kimi探索版将在未来几周内陆续上线Kimi网页版和Kimi智能助手APP，帮助用户解决更具挑战性的数学和搜索调研类任务。

了解详情》》》

KIM工具地址》》》

天工大模型4.0 O1版（英文名：Skywork O1）将于11月27日启动邀测

标题：AITOP100

昆仑万维宣布，其旗下具有复杂思考推理能力的系列模型——天工大模型4.0 O1版（英文名：Skywork O1）将于11月27日正式启动邀请测试。这款新模型以其中文逻辑推理能力备受瞩目，是国内首款具备此能力的o1模型。天工大模型4.0 O1版在模型输出上支持思考、计划及反思等多个层面的能力。此次发布的4.0 O1版包含两款重要模型：一款是基于开源Llama 3.1 8B的开源模型，另一款则是进阶能力更为强大的天工大模型4.0 O1版（英文名：Skywork O1），后者将在天工平台上线，并面向公众开放测试与使用。昆仑万维在AI领域的全面布局，不仅推动了国内开源社区在o1领域的复现进程，也为AI技术的应用提供了更广阔的想象空间。

天工大模型地址》》》

夸克发布学术搜索AI，每次回答引用超10篇文献，提升学术效率

来源：夸克AI搜索

夸克近日宣布推出“学术搜索”AI产品，依托于AI技术和亿级学术文献，旨在提高学术工作中信息获取、创作和处理的效率。夸克与维普、知网等平台合作，构建了总量过亿的专业学术文献题录和全文资料库。夸克学术搜索凭借大模型能力，可以为每次AI回答引用超过10篇文献内容，实现多维度的信息归纳和知识整理，确保搜索内容的正确性。在创作写作场景方面，夸克能够根据用户搜索的学术问题，结合研究背景、市场现状以及发展趋势等要素，提供由AI生成的学术大纲，并能一键制作PPT，进一步提高学术工作效率。夸克的这一创新，不仅提升了学术工作的效率，也为学术领域带来了新的应用可能，成为年轻人首选的PC端AI产品。

抖音推进“V”项目，探索直播游戏互动与AI分身新体验

来源：抖音

抖音正在推进名为“V”的项目，该项目致力于拓展直播与互动的边界，通过虚拟互动和游戏化玩法，为用户提供更有趣的抖音互动体验。V项目的核心目标是让抖音变得更好玩，主要通过虚拟互动、游戏化玩法等方式，为用户提供更有趣的抖音互动体验。通过V项目，创作者可以培养出与自身性格特征、思维习惯类似的AI分身，让用户与创作者的AI分身对话，也可以进行不同类型的虚拟创作和IP经营，让虚拟互动变得有趣。用户则可以在直播、社交等渠道体验到玩法丰富、品类多样的抖音小游戏、社交游戏、直播互动玩法等，让抖音有好玩的、自闭环的游戏。此外，AI分身输出的内容由AI生成，非创作者本人回复，AI分身可在创作者设置的场景中与用户互动，极大地丰富了用户的互动体验。

最高法发布“法信法律基座大模型”，推动法治领域智能化

来源：36Ker

最高人民法院近日发布了“法信法律基座大模型”，这一模型是国内法治领域的“行业基座”大模型，并已于10月21日完成在网信部门的生成式人工智能服务备案。“法信法律基座大模型”是在清华大学科研成果转化的千亿参数通用大模型基座上，投入最高法“法信”等多个法律大数据平台经过高质量专业标注的3.2亿篇共计3.67万亿字的法律文献、裁判、案例、观点等数据语料，融入人民法院电子音像出版社历时十余年搭建的包含18万法律知识体系编码的“法信大纲”，在各级法院、科研机构和科技企业的共同努力下，经过为期数月的预训练、优化训练、监督微调和多轮测评，形成的研发成果。该模型将立足国家级法律人工智能基础设施这一关键定位，广泛赋能司法审判、行政执法和公共法律服务等领域。

xAI宣布Grok-3模型证明黎曼假设，AI领域迎来重大突破

来源：推特

马斯克的人工智能企业xAI技术员工Hieu Pham宣布，大模型Grok-3证明了黎曼猜想，这是数论中的一个基本问题，与素数的分布密切相关。尽管大模型拥有强大的计算能力，但解决黎曼猜想还需深厚的理论知识和新数学框架的发展。专家认为，AI证明黎曼猜想将是AI系统超越人类智能的一个标志性事件。尽管已有大量的数值验证支持这一猜想，但至今还没有找到完整的数学证明，因此它仍然是未解之谜。Grok-3在训练过程中曾遭遇灾难性事件，但问题已得到解决，现在看起来模型表现良好。如果Grok-3的证明是正确的，那么训练将不会恢复，因为这个AI被认为聪明到足以成为对人类的威胁