微软或将发布全新AI大模型,欲与GPT-4和Gemini一较高下

科技巨头微软正积极研发一款名为MAI-1的全新大型语言模型,该模型有望与谷歌Gemini、Anthropic的Claude以及OpenAI的GPT-4等顶尖模型展开竞争。

据The Information报道,这是微软自向OpenAI投资超过100亿美元获取其AI模型使用权以来,首次自主研发如此规模的AI模型。此前,OpenAI的GPT-4不仅为ChatGPT提供了技术支持,也为微软的Copilot产品赋能。

MAI-1项目的负责人是Mustafa Suleyman,他曾是谷歌AI领域的领军人物,后来担任AI初创公司Inflection的CEO。今年3月,微软以6.5亿美元收购了Inflection的大部分员工和知识产权。尽管MAI-1可能会借鉴前Inflection员工的技术,但据两位熟悉该项目的微软员工证实,它是一个全新的独立大型语言模型(LLM)。

MAI-1拥有约5000亿个参数,远超微软之前开源的模型,例如Phi-3。这意味着它需要更强大的计算能力和更多的训练数据,也使其与OpenAI的GPT-4(传闻拥有超过1万亿个参数)处于同一级别,并远远超过Meta和Mistral的700亿参数模型。

MAI-1的研发表明,微软正在采取双管齐下的AI策略,一方面关注适用于移动设备的小型本地语言模型,另一方面则着眼于由云端提供支持的大型先进模型。据悉,苹果公司也在探索类似的策略。这也突显了微软希望独立于OpenAI进行AI开发的意愿,而OpenAI的技术目前为微软最具雄心的生成式AI功能提供支持,例如Windows内置的聊天机器人。

The Information的消息人士称,MAI-1的确切用途尚未确定,其最理想的应用场景将取决于其性能表现。为了训练该模型,微软已分配了一大批配备Nvidia GPU的服务器,并从各种来源收集训练数据,包括由OpenAI的GPT-4生成的文本和公开的互联网数据。

据The Information报道,微软可能会在本月晚些时候的Build开发者大会上预览MAI-1。

MAI-1的发布将为AI领域带来新的竞争,并有望推动大型语言模型技术的进一步发展。

结语

本文转自同名宫棕号,欢迎关注获取每日AI快讯。

相关推荐
Coovally AI模型快速验证33 分钟前
当视觉语言模型接收到相互矛盾的信息时,它会相信哪个信号?
人工智能·深度学习·算法·机器学习·目标跟踪·语言模型
居7然34 分钟前
Attention注意力机制:原理、实现与优化全解析
人工智能·深度学习·大模型·transformer·embedding
Scabbards_35 分钟前
KGGEN: 用语言模型从纯文本中提取知识图
人工智能·语言模型·自然语言处理
LeonDL1681 小时前
【通用视觉框架】基于C#+Winform+OpencvSharp开发的视觉框架软件,全套源码,开箱即用
人工智能·c#·winform·opencvsharp·机器视觉软件框架·通用视觉框架·机器视觉框架
AI纪元故事会1 小时前
《目标检测全解析:从R-CNN到DETR,六大经典模型深度对比与实战指南》
人工智能·yolo·目标检测·r语言·cnn
Shang180989357261 小时前
T41LQ 一款高性能、低功耗的系统级芯片(SoC) 适用于各种AIoT应用智能安防、智能家居方案优选T41L
人工智能·驱动开发·嵌入式硬件·fpga开发·信息与通信·信号处理·t41lq
Bony-2 小时前
用于糖尿病视网膜病变图像生成的GAN
人工智能·神经网络·生成对抗网络
罗西的思考2 小时前
【Agent】 ACE(Agentic Context Engineering)源码阅读笔记---(3)关键创新
人工智能·算法
Elastic 中国社区官方博客2 小时前
通过混合搜索重排序提升多语言嵌入模型的相关性
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
猫头虎2 小时前
昆仑芯 X HAMi X 百度智能云 | 昆仑芯 P800 XPU/vXPU 双模式算力调度方案落地
人工智能·百度·开源·aigc·文心一言·gpu算力·agi