Kimi发布k0-math模型,数学推理能力匹敌OpenAI o1系列
标题:Kimi
月之暗面科技有限公司旗下的AI项目Kimi近日宣布推出其新一代数学推理模型k0-math,这一模型在数学能力上与OpenAI的o1系列模型相媲美。k0-math模型在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中表现出色,成绩超越了OpenAI的o1-mini和o1-preview模型。在更高难度的竞赛级别数学题库OMNI-MATH和AIME基准测试中,k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%。k0-math模型的设计理念聚焦于复杂的逻辑推理与问题解决,结合最新的数学理论与深度学习算法,使其在处理抽象概念与复杂推理方面展现出卓越的能力。月之暗面创始人杨植麟博士表示,k0-math模型和更强大的Kimi探索版将在未来几周内陆续上线Kimi网页版和Kimi智能助手APP,帮助用户解决更具挑战性的数学和搜索调研类任务。
天工大模型4.0 O1版(英文名:Skywork O1)将于11月27日启动邀测
标题:AITOP100
昆仑万维宣布,其旗下具有复杂思考推理能力的系列模型——天工大模型4.0 O1版(英文名:Skywork O1)将于11月27日正式启动邀请测试。这款新模型以其中文逻辑推理能力备受瞩目,是国内首款具备此能力的o1模型。天工大模型4.0 O1版在模型输出上支持思考、计划及反思等多个层面的能力。此次发布的4.0 O1版包含两款重要模型:一款是基于开源Llama 3.1 8B的开源模型,另一款则是进阶能力更为强大的天工大模型4.0 O1版(英文名:Skywork O1),后者将在天工平台上线,并面向公众开放测试与使用。昆仑万维在AI领域的全面布局,不仅推动了国内开源社区在o1领域的复现进程,也为AI技术的应用提供了更广阔的想象空间。
夸克发布学术搜索AI,每次回答引用超10篇文献,提升学术效率
来源:夸克AI搜索
夸克近日宣布推出“学术搜索”AI产品,依托于AI技术和亿级学术文献,旨在提高学术工作中信息获取、创作和处理的效率。夸克与维普、知网等平台合作,构建了总量过亿的专业学术文献题录和全文资料库。夸克学术搜索凭借大模型能力,可以为每次AI回答引用超过10篇文献内容,实现多维度的信息归纳和知识整理,确保搜索内容的正确性。在创作写作场景方面,夸克能够根据用户搜索的学术问题,结合研究背景、市场现状以及发展趋势等要素,提供由AI生成的学术大纲,并能一键制作PPT,进一步提高学术工作效率。夸克的这一创新,不仅提升了学术工作的效率,也为学术领域带来了新的应用可能,成为年轻人首选的PC端AI产品。
抖音推进“V”项目,探索直播游戏互动与AI分身新体验
来源:抖音
抖音正在推进名为“V”的项目,该项目致力于拓展直播与互动的边界,通过虚拟互动和游戏化玩法,为用户提供更有趣的抖音互动体验。V项目的核心目标是让抖音变得更好玩,主要通过虚拟互动、游戏化玩法等方式,为用户提供更有趣的抖音互动体验。通过V项目,创作者可以培养出与自身性格特征、思维习惯类似的AI分身,让用户与创作者的AI分身对话,也可以进行不同类型的虚拟创作和IP经营,让虚拟互动变得有趣。用户则可以在直播、社交等渠道体验到玩法丰富、品类多样的抖音小游戏、社交游戏、直播互动玩法等,让抖音有好玩的、自闭环的游戏。此外,AI分身输出的内容由AI生成,非创作者本人回复,AI分身可在创作者设置的场景中与用户互动,极大地丰富了用户的互动体验。
最高法发布“法信法律基座大模型”,推动法治领域智能化
来源:36Ker
最高人民法院近日发布了“法信法律基座大模型”,这一模型是国内法治领域的“行业基座”大模型,并已于10月21日完成在网信部门的生成式人工智能服务备案。“法信法律基座大模型”是在清华大学科研成果转化的千亿参数通用大模型基座上,投入最高法“法信”等多个法律大数据平台经过高质量专业标注的3.2亿篇共计3.67万亿字的法律文献、裁判、案例、观点等数据语料,融入人民法院电子音像出版社历时十余年搭建的包含18万法律知识体系编码的“法信大纲”,在各级法院、科研机构和科技企业的共同努力下,经过为期数月的预训练、优化训练、监督微调和多轮测评,形成的研发成果。该模型将立足国家级法律人工智能基础设施这一关键定位,广泛赋能司法审判、行政执法和公共法律服务等领域。
xAI宣布Grok-3模型证明黎曼假设,AI领域迎来重大突破
来源:推特
马斯克的人工智能企业xAI技术员工Hieu Pham宣布,大模型Grok-3证明了黎曼猜想,这是数论中的一个基本问题,与素数的分布密切相关。尽管大模型拥有强大的计算能力,但解决黎曼猜想还需深厚的理论知识和新数学框架的发展。专家认为,AI证明黎曼猜想将是AI系统超越人类智能的一个标志性事件。尽管已有大量的数值验证支持这一猜想,但至今还没有找到完整的数学证明,因此它仍然是未解之谜。Grok-3在训练过程中曾遭遇灾难性事件,但问题已得到解决,现在看起来模型表现良好。如果Grok-3的证明是正确的,那么训练将不会恢复,因为这个AI被认为聪明到足以成为对人类的威胁