微软推出数款Phi 4“开放式”人工智能模型

微软周三推出了几款新的"开放式"人工智能模型,其中功能最强大的模型至少在一个基准测试上可与 OpenAI 的 o3-mini 相媲美。所有新的授权模型------Phi 4 mini reasoning、Phi 4 reasoning 和 Phi 4 reasoning plus------都是"推理"模型,这意味着它们能够花更多时间对复杂问题的解决方案进行事实核查。

它们扩展了微软一年前推出的 Phi"小型模型"系列,为在边缘构建应用程序的 AI 开发者提供了基础。

Phi 4 mini 推理机基于中国人工智能初创公司 DeepSeek 的 R1 推理模型生成的约 100 万道综合数学题进行训练。微软表示,Phi 4 mini 推理机的参数规模约为 38 亿,专为教育应用而设计,例如轻量级设备上的"嵌入式辅导"。

参数大致对应于模型解决问题的能力,具有更多参数的模型通常比具有较少参数的模型表现更好。

Phi 4 推理模型拥有 140 亿个参数,使用"高质量"网络数据以及 OpenAI 之前提到的 o3-mini 的"精选演示"进行训练。微软表示,它最适合数学、科学和编程应用。

至于 Phi 4 Reasoning Plus是微软先前发布的 Phi-4 模型的改进版,旨在提高特定任务的准确性。微软声称,Phi 4 Reasoning Plus 的性能已接近 R1 模型,而 R1 模型的参数数量显著增加(6710 亿)。该公司的内部基准测试结果还显示,Phi 4 Reasoning Plus 在数学技能测试 OmniMath 上的表现与 o3-mini 相当。

Phi 4 mini reasoning、Phi 4 reasoning、Phi 4 reasoning plus 已在AI 开发平台 Hugging Face上线,并附有详细的技术报告。

微软在一篇博客文章中写道:"通过提炼、强化学习和高质量数据,这些新模型在规模和性能之间取得了平衡。它们足够小,适合低延迟环境,同时又保持着可与更大模型相媲美的强大推理能力。这种融合使得即使是资源有限的设备也能高效地执行复杂的推理任务。"

相关推荐
飞哥数智坊2 小时前
AI编程实战:Cursor+Claude4助力15分钟完成大屏开发
人工智能·claude·cursor
Kier5 小时前
基于YOLO实现一个智能条码识别
人工智能·python·ai编程
我是王大你是谁5 小时前
SmolVLA:一种用于经济实惠和高效的机器人视觉-语言-动作模型
人工智能·llm
MarkGosling6 小时前
【语音合成】B 站开源 IndexTTS :声音克隆,吊打真人发音,断句精准度 98%
人工智能·python
数据智能老司机6 小时前
AI产品开发的艺术——搜索与检索增强生成
人工智能·产品经理·产品
机器之心6 小时前
逐个token太慢!大模型原生并行出token,CMU、英伟达新作Multiverse
人工智能·llm
AI大模型技术社7 小时前
⚙️企业级Transformer优化:混合精度×梯度裁剪×权重初始化最佳实践
人工智能·llm
机器之心7 小时前
首个转型AI公司的新势力,在全球AI顶会展示下一代自动驾驶模型
人工智能
机器之心7 小时前
同一天开源新模型,一推理一编程,MiniMax和月之暗面开卷了
人工智能
腾讯云开发者7 小时前
腾讯云TVP走进青岛啤酒,解码数字化驱动智慧零售增长引擎
人工智能