微软或将发布全新AI大模型，欲与GPT-4和Gemini一较高下

玄武黑科技2024-05-13 11:43

科技巨头微软正积极研发一款名为MAI-1的全新大型语言模型，该模型有望与谷歌Gemini、Anthropic的Claude以及OpenAI的GPT-4等顶尖模型展开竞争。

据The Information报道，这是微软自向OpenAI投资超过100亿美元获取其AI模型使用权以来，首次自主研发如此规模的AI模型。此前，OpenAI的GPT-4不仅为ChatGPT提供了技术支持，也为微软的Copilot产品赋能。

MAI-1项目的负责人是Mustafa Suleyman，他曾是谷歌AI领域的领军人物，后来担任AI初创公司Inflection的CEO。今年3月，微软以6.5亿美元收购了Inflection的大部分员工和知识产权。尽管MAI-1可能会借鉴前Inflection员工的技术，但据两位熟悉该项目的微软员工证实，它是一个全新的独立大型语言模型（LLM）。

MAI-1拥有约5000亿个参数，远超微软之前开源的模型，例如Phi-3。这意味着它需要更强大的计算能力和更多的训练数据，也使其与OpenAI的GPT-4（传闻拥有超过1万亿个参数）处于同一级别，并远远超过Meta和Mistral的700亿参数模型。

MAI-1的研发表明，微软正在采取双管齐下的AI策略，一方面关注适用于移动设备的小型本地语言模型，另一方面则着眼于由云端提供支持的大型先进模型。据悉，苹果公司也在探索类似的策略。这也突显了微软希望独立于OpenAI进行AI开发的意愿，而OpenAI的技术目前为微软最具雄心的生成式AI功能提供支持，例如Windows内置的聊天机器人。

The Information的消息人士称，MAI-1的确切用途尚未确定，其最理想的应用场景将取决于其性能表现。为了训练该模型，微软已分配了一大批配备Nvidia GPU的服务器，并从各种来源收集训练数据，包括由OpenAI的GPT-4生成的文本和公开的互联网数据。

据The Information报道，微软可能会在本月晚些时候的Build开发者大会上预览MAI-1。

MAI-1的发布将为AI领域带来新的竞争，并有望推动大型语言模型技术的进一步发展。

结语

本文转自同名宫棕号，欢迎关注获取每日AI快讯。