法国AI小钢炮:Mistral AI要搞事情!
话说最近AI圈里不太平,法国人工智能初创公司Mistral AI可谓是放了个大招,直接宣布全面进军人工智能基础设施领域。简单来说,就是他们要自己盖房子、铺路,打造一套完整的AI生态系统,目标直指亚马逊AWS、微软Azure、谷歌云这些美国云计算巨头。这架势,摆明了是要当欧洲对抗美国科技霸权的先锋啊!
这家总部位于浪漫之都巴黎的公司,这次发布了一个名为Mistral Compute的重量级平台。据说这个平台是他们跟英伟达(Nvidia)强强联手打造的,专门为欧洲的企业和政府提供服务,让他们不再受制于美国的云服务商。要知道,以前欧洲的企业想搞AI,基本都得用美国的云平台,现在Mistral AI站出来说:“别慌,咱自己也能搞!”这对于欧洲的科技自主,绝对是个大大的利好。
Mistral AI 的 CEO Arthur Mensch 也说了,进军AI基础设施是他们公司发展历程中的一个重要转折点。这意味着他们不仅仅是开发AI模型,而是要掌控整个技术栈,确保欧洲的技术自主权,并在可持续发展方面做出贡献。这话说得,那叫一个掷地有声!
能用你的母语思考的AI模型,这才是真智能!
除了搞基建,Mistral AI还发布了 Magistral 系列推理模型。这玩意儿厉害了,据说能像人一样进行逻辑思考,有点像OpenAI的o1模型和中国的DeepSeek R1。但是Mistral AI的首席科学家 Guillaume Lample 说,他们的模型跟别人不一样,关键在于更灵活,效率更高。
Guillaume Lample 在采访中透露,他们是从零开始打造这个模型的,并且在在线强化学习流程上做得非常高效。更牛的是,Mistral的模型会把整个思考过程展示给用户,而且是用用户的母语!这样用户就能看懂AI到底是怎么想的,是不是靠谱。这比起那些只会说英语的AI,简直不要太贴心!
这次Mistral AI一口气发布了两个版本:一个是拥有 240 亿个参数的开源模型Magistral Small,另一个是更强大的专有系统Magistral Medium,可以通过Mistral API使用。
训练过程中意外获得的“超能力”!
更让人惊喜的是,这些模型在训练过程中还展现出了一些意想不到的能力。比如,Magistral Medium虽然主要训练的是基于文本的数学和编码问题,但它竟然还保留了多模态推理能力,也就是能看懂图片!
Lample表示,他们在强化学习训练结束后,重新插入初始视觉编码器,结果发现模型竟然可以对图像进行推理。这简直是个意外之喜!
此外,这些模型还获得了复杂的函数调用能力,可以自动进行多步互联网搜索和代码执行,从而回答复杂的查询。Lample解释说,模型会像人一样上网搜索,然后处理结果,甚至在需要的时候再次搜索。这种能力是自然形成的,不需要特殊训练,这让Mistral AI的团队感到非常惊喜。
工程突破:训练速度快到飞起!
Mistral AI的技术团队还克服了巨大的工程挑战,创造了Lample所说的训练基础设施方面的突破。他们开发了一套“在线强化学习”系统,让AI模型能够在生成响应的同时不断改进,而无需依赖现有的训练数据。
关键的创新在于实时同步数百个图形处理单元(GPU)之间的模型更新。Lample解释说,他们找到了一种方法,只需通过GPU即可完成模型的迁移,这使得系统能够在几秒钟内(而不是通常需要的几小时)在不同的GPU集群之间更新模型权重。简直是黑科技!
Lample指出,目前还没有哪个开源基础设施能做到这一点。这种训练方式不仅速度更快,而且成本更低。Lample表示,用不了一周就能完成训练。
英伟达:为欧洲AI独立提供芯片支持!
Mistral Compute 平台将运行在18,000块英伟达最新的Grace Blackwell芯片上。这些芯片最初部署在法国埃松省的一个数据中心,并计划扩展到整个欧洲。英伟达CEO黄仁勋表示,这次合作对于欧洲的技术独立至关重要。
黄仁勋在巴黎表示,每个国家都应该在自己的国家建设人工智能,为本国服务。通过Mistral AI,他们正在开发模型和人工智能工厂,作为欧洲各地企业的自主平台,帮助企业在各个行业扩展智能。他还预测,未来两年欧洲的人工智能计算能力将增长十倍,欧洲大陆将规划超过 20 个“人工智能工厂”。
这次合作不仅限于基础设施,还包括英伟达与其他欧洲人工智能公司以及搜索公司Perplexity合作,开发各种欧洲语言的推理模型,而这些语言的训练数据通常有限。
解决AI的环境和主权问题
Mistral Compute还解决了人工智能发展中的两大问题:环境影响和数据主权。该平台确保欧洲客户能够将其信息保存在欧盟境内并受欧洲管辖。
Mistral AI还与法国国家生态转型机构和领先的气候咨询公司Carbone4合作,评估并尽量减少其人工智能模型在整个生命周期内的碳足迹。他们计划使用脱碳能源为其数据中心供电,并表示“通过选择欧洲作为我们的工厂所在地,我们能够从大量脱碳能源中受益。”
速度优势:Mistral 推理模型的杀手锏!
早期测试表明,Mistral的推理模型不仅性能出色,而且解决了现有系统普遍存在的一个问题——速度。要知道,OpenAI和其他公司的推理模型可能需要几分钟才能响应复杂的查询,这限制了它们的实际应用。
Lample指出,人们通常不喜欢这种推理模型的一点是,尽管它很智能,但有时也会耗费大量时间。而在这里,你实际上只需几秒钟就能看到输出,有时甚至不到五秒,有时甚至更短。这改变了体验。速度优势对于企业采用来说至关重要,因为等待人工智能响应几分钟会造成工作流程瓶颈。
Mistral 的野心:挑战美国人工智能霸主地位!
Mistral进军基础设施领域,使其与主导云计算市场的科技巨头展开直接竞争。他们要提供完整的垂直整合解决方案——从硬件基础设施到AI模型再到软件服务。这包括面向开发者的 Mistral AI Studio、提升企业生产力的Le Chat和提供编程辅助的Mistral Code。
行业分析师认为,Mistral的战略是区域人工智能发展大趋势的一部分。黄仁勋表示,欧洲若想保持全球竞争力,就迫切需要扩大其人工智能基础设施。这与欧洲政策制定者的担忧不谋而合。
欧盟已经承诺投入 200 亿欧元,在欧洲大陆建设人工智能“超级工厂”,而Mistral与英伟达的合作或将加速这些计划的实施。
Mistral宣布推出基础设施和模型功能,表明该公司致力于成为一个全面的 AI 平台,而不仅仅是一个模型提供商。在微软和其他投资者的支持下,该公司已筹集超过10亿美元,并将继续寻求额外资金来支持其业务范围的扩展。
Lample看到了推理模型未来更大的可能性,他表示,当我观察内部进展时,我认为在一些基准测试中,该模型的准确率每周都在提高 5%,大概持续了六周。所以它正在快速改进,有很多很多,我的意思是,你能想到的无数个小点子都能提升性能。欧洲挑战美国人工智能主导地位的举措能否成功,最终可能取决于客户是否足够重视主权和可持续性,从而愿意放弃现有供应商。至少目前,他们还有选择。
总之,Mistral AI这次可是要玩真的了!未来AI界,有好戏看了!