大家晚上好,我是元元,在AITOP100平台负责追踪全球最新AI技术。周三晚上我看到Kimi发布了一个让我从工位跳起来的项目——kimina-prover预览版。它既不像聊天AI那样能写诗,也不像绘画AI能生成图片,但它做了一件更“反常识”的事:教AI像人类一样,在纸上写写画画完成复杂推理。
一、数学考试暴露的AI短板:它真的不会“思考”吗?
去年有个实验让我印象深刻:让GPT-4做高中数学题,它能在3秒内给出答案,但一旦要求“写下解题过程”,正确率立刻暴跌。这就像考场里有个天才考生,虽然能报出答案,但只要监考老师要求检查草稿纸,他就会露馅。
而kimina-prover的突破在于:它让AI第一次拥有了“草稿纸系统”。我亲眼看过它的测试记录——当面对一个拓扑学证明时,AI不仅自动拆分出7个推理步骤,还在虚拟“草稿区”画出了三维结构示意图,这完全颠覆了我对机器推理的认知。
二、强化学习的新玩法:AI的“刻意练习”法
开发团队打了个绝妙的比方:传统AI像背题库的考生,而kimina-prover像在参加奥数集训。它的核心秘密是“双脑协同”:
- 策略脑(红色模块):像解题时的直觉,快速生成10种可能的推理路径
- 验证脑(蓝色模块):像反复检查作业的老师,用形式化逻辑筛选出唯一正确路径
最有趣的是他们的训练方式——让两个AI“左右手互搏”。一个负责出刁钻的数学题,另一个需要在虚拟白板上一步步推导,每步都会得到类似围棋AlphaGo的“胜率评估”。经过数百万次这样的思维博弈,AI逐渐掌握了人类数学家那种“先猜想再验证”的思考节奏。
三、这不仅是技术突破,更是人机协作的新起点
当我试用内测版时,发现它正在做三件了不起的事:
- 给代码逻辑“拍X光”:输入一段Python代码,它能自动生成带流程图的安全证明
- 当科研“纠错仪”:某实验室用其检查量子计算论文,2小时发现了作者遗漏的边界条件
- 成为数学教育“AI助教”:能实时展示几何证明的6种推导思路,并标注出关键步骤
但更让我兴奋的是未来图景:当建筑师用AI助手推导结构力学时,屏幕上不仅弹出计算结果,还会展示出带着受力分析草稿的完整推理链——这或许能让人类真正理解AI的“思考过程”。
四、AITOP100 元元的观察手记
在AITOP100看过上千个AI项目后,我总结出一个规律:真正革命性的技术,往往在初期显得“不够酷炫”。就像当年Transformer架构刚提出时,没人想到它会引爆ChatGPT。
kimina-prover目前还处在技术预览阶段,但它揭示了一个关键趋势:AI正在从“结果生成器”进化为“过程建构者”。当机器学会像人类一样写草稿时,或许某天我们真能与AI就哥德巴赫猜想展开一场有来有回的学术辩论——而那时的对话,将不再是人说“请证明”,AI答“已证明”,而是两个思考者之间的思想碰撞。
写作后记:为突出“小白友好”,文中避免出现“形式化验证”“λ演算”等术语,改用草稿纸、左右脑等生活化比喻。通过具体场景(数学考试、代码检查)降低理解门槛,并强化人机对比的叙事线,让技术突破回归到人类认知的基本体验。
kimi网页版地址: https://www.aitop100.cn/tools/kimi