Mistral AI携手英伟达,打造“主权”AI基础设施与顶尖推理模型

目录
文章目录隐藏
  1. Mistral 如何构建能够用任何语言思考的推理模型
  2. AI 模型训练中获得的“超能力”
  3. 工程突破:训练速度远超竞争对手
  4. 英伟达承诺为欧洲 AI 独立提供 18,000 块芯片
  5. 解决 AI 的环境和主权问题
  6. 速度优势赋予 Mistral 推理模型实用优势
  7. Mistral 基础设施投资对全球人工智能竞争的深远影响

法国人工智能初创公司 Mistral AI 周三宣布全面进军人工智能基础设施领域,将其公司定位为欧洲对美国云计算巨头的有力回应。与此同时,该公司还推出了可与 OpenAI最先进系统相媲美的新型推理模型。

这家总部位于巴黎的公司发布了 Mistral Compute,这是一个与英伟达(Nvidia)合作构建的综合 AI 基础设施平台,旨在为欧洲企业和政府提供替代方案,摆脱对亚马逊网络服务(AWS)、微软 Azure 和谷歌云(Google Cloud)等美国云提供商的依赖。此举标志着 Mistral AI 的重大战略转变,从单纯开发 AI 模型转向掌控整个技术栈。

Mistral AI 首席执行官兼联合创始人 Arthur Mensch 表示:“进军人工智能基础设施领域标志着 Mistral AI 迈出了转型的一步,因为它使我们能够触及人工智能价值链中一个关键的垂直领域。这一转变意味着我们有责任确保我们的解决方案不仅能够推动创新和人工智能的普及,还能维护欧洲的技术自主权,并为其可持续发展领导力做出贡献。”

Mistral AI 携手英伟达,打造“主权”AI 基础设施与顶尖推理模型

Mistral 如何构建能够用任何语言思考的推理模型

除了基础设施的宣布,Mistral 还发布了其 Magistral 系列推理模型——这些人工智能系统能够进行逐步逻辑思考,类似于 OpenAI 的 o1 模型和中国的 DeepSeek R1。然而,Mistral 首席科学家 Guillaume Lample 表示,该公司的方法在关键方面与竞争对手有所不同。

Lample 在一次独家采访中透露:“我们一切都是从零开始,主要是因为我们想学习我们现有的专业知识,比如工作中的灵活性。实际上,我们在更强大的在线强化学习流程上做到了非常高效的水平。”与竞争对手经常隐藏推理过程不同,Mistral 的模型会向用户展示完整的思维链,并且至关重要的是,它使用用户的母语,而不是默认的英语。Lample 解释说:“我们用用户自己的语言,向用户展示了完整的思维链,这样他们就可以真正地阅读,看看它是否有意义。”

该公司发布了两个版本:拥有 240 亿个参数的开源模型 Magistral Small;以及可通过 Mistral API 使用的更强大的专有系统 Magistral Medium。

AI 模型训练中获得的“超能力”

这些模型在训练过程中展现出了令人惊喜的能力。最值得注意的是,尽管训练过程仅侧重于基于文本的数学和编码问题,Magistral Medium 仍保留了多模态推理能力——即分析图像的能力。

Lample 表示:“我们意识到,这并非完全是意外,而是我们绝对没有想到的,如果在强化学习训练结束时,你重新插入初始视觉编码器,那么你会突然发现,模型能够对图像进行推理。”

这些模型还获得了复杂的函数调用能力,可以自动执行多步互联网搜索和代码执行来回答复杂的查询。Lample 解释道,模型会像进行网络搜索一样,然后处理结果,甚至在需要时再次搜索。这种行为无需特殊训练即可自然形成,这让团队感到“非常惊喜”。

工程突破:训练速度远超竞争对手

Mistral 的技术团队克服了重大的工程挑战,创造了 Lample 所说的训练基础设施方面的突破。该公司开发了一套“在线强化学习”系统,使 AI 模型能够在生成响应的同时不断改进,而无需依赖现有的训练数据。

关键创新在于实时同步数百个图形处理单元(GPU)之间的模型更新。Lample 解释说:“我们所做的就是找到一种方法,只需通过 GPU 即可完成模型的迁移。”这使得系统能够在几秒钟内(而不是通常需要的几小时)在不同的 GPU 集群之间更新模型权重。

Lample 指出:“没有哪个开源基础设施能够像它一样妥善地做到这一点。通常情况下,有很多类似的开源尝试来做到这一点,但速度极其缓慢。而在这里,我们非常注重效率。”事实证明,训练过程比传统的预训练更快、更便宜,Lample 表示,用不了一周就能完成。

英伟达承诺为欧洲 AI 独立提供 18,000 块芯片

Mistral Compute 平台将运行在 18,000 块英伟达最新的 Grace Blackwell 芯片上,这些芯片最初部署在法国埃松省的一个数据中心,并计划扩展到整个欧洲。英伟达首席执行官黄仁勋表示,此次合作对于欧洲的技术独立至关重要。

黄仁勋在巴黎的联合声明中表示:“每个国家都应该在自己的国家建设人工智能,为本国服务。通过 Mistral AI,我们正在开发模型和人工智能工厂,作为欧洲各地企业的自主平台,帮助企业在各个行业扩展智能。”黄仁勋预测,未来两年欧洲的人工智能计算能力将增长十倍,欧洲大陆将规划超过 20 个“人工智能工厂”。

此次合作不仅限于基础设施,还包括英伟达与其他欧洲人工智能公司以及搜索公司 Perplexity 合作,开发各种欧洲语言的推理模型,而这些语言的训练数据通常有限。

解决 AI 的环境和主权问题

Mistral Compute 解决了人工智能发展中的两大问题:环境影响和数据主权。该平台确保欧洲客户能够将其信息保存在欧盟境内并受欧洲管辖。

该公司与法国国家生态转型机构和领先的气候咨询公司 Carbone4 合作,评估并尽量减少其人工智能模型在整个生命周期内的碳足迹。Mistral 计划使用脱碳能源为其数据中心供电,并表示“通过选择欧洲作为我们的工厂所在地,我们能够从大量脱碳能源中受益。”

速度优势赋予 Mistral 推理模型实用优势

早期测试表明,Mistral 的推理模型不仅性能出色,而且解决了现有系统普遍存在的一个问题——速度。OpenAI 和其他公司目前的推理模型可能需要几分钟才能响应复杂的查询,这限制了它们的实际应用。

Lample 指出:“人们通常不喜欢这种推理模型的一点是,尽管它很智能,但有时也会耗费大量时间。而在这里,你实际上只需几秒钟就能看到输出,有时甚至不到五秒,有时甚至更短。这改变了体验。”速度优势对于企业采用来说至关重要,因为等待人工智能响应几分钟会造成工作流程瓶颈。

Mistral 基础设施投资对全球人工智能竞争的深远影响

Mistral 进军基础设施领域,使其与主导云计算市场的科技巨头展开直接竞争。该公司提供完整的垂直整合解决方案——从硬件基础设施到 AI 模型再到软件服务。这包括面向开发者的 Mistral AI Studio、提升企业生产力的 Le Chat 和提供编程辅助的 Mistral Code。

行业分析师认为,Mistral 的战略是区域人工智能发展大趋势的一部分。黄仁勋表示:“欧洲若想保持全球竞争力,就迫切需要扩大其人工智能基础设施。”这与欧洲政策制定者的担忧不谋而合。

这一声明发布之际,欧洲各国政府越来越担心其在关键人工智能基础设施方面对美国科技公司的依赖。欧盟已承诺投入 200 亿欧元,在欧洲大陆建设人工智能“超级工厂”,而 Mistral 与英伟达的合作或将加速这些计划的实施。

Mistral 宣布推出基础设施和模型功能,表明该公司致力于成为一个全面的 AI 平台,而不仅仅是一个模型提供商。在微软和其他投资者的支持下,该公司已筹集超过 10 亿美元,并将继续寻求额外资金来支持其业务范围的扩展。

Lample 看到了推理模型未来更大的可能性,他表示:“当我观察内部进展时,我认为在一些基准测试中,该模型的准确率每周都在提高 5%,大概持续了六周。所以它正在快速改进,有很多很多,我的意思是,你能想到的无数个小点子都能提升性能。”欧洲挑战美国人工智能主导地位的举措能否成功,最终可能取决于客户是否足够重视主权和可持续性,从而愿意放弃现有供应商。至少目前,他们还有选择。

以上关于Mistral AI携手英伟达,打造“主权”AI基础设施与顶尖推理模型的文章就介绍到这了,更多相关内容请搜索码云笔记以前的文章或继续浏览下面的相关文章,希望大家以后多多支持码云笔记。

「点点赞赏,手留余香」

0

给作者打赏,鼓励TA抓紧创作!

微信微信 支付宝支付宝

还没有人赞赏,快来当第一个赞赏的人吧!

声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 admin@mybj123.com 进行投诉反馈,一经查实,立即处理!
码云笔记 » Mistral AI携手英伟达,打造“主权”AI基础设施与顶尖推理模型

发表回复