微软microsoft推出了最新的小型但强大的开源语言AI模型Phi-2

微软推出了最新的小型开源语言模型 Phi-2。该模型只有 27 亿个参数,却能超过比它大 25 倍的模型的性能。Phi-2 是微软 Phi 项目的一部分,旨在制作小而强大的语言模型。该项目包括 13 亿参数的 Phi-1,据称在 Python 编码方面实现了最先进的性能,以及擅长常识推理和语言理解的 Phi-1.5。Phi-2 比之前的版本更大,但性能更强。

它能实现与参数少于 130 亿个模型类似的最先进的性能。研究人员表示,与之前的 Phi 模型相比,该AI模型在输出方面更安全,并且比一些现有模型在毒性和偏差方面表现更好。为了提高 Phi 的性能,微软研究人员专注于使用 "教科书质量" 的数据进行训练,并利用合成数据集来支持模型。Phi-2 在各种基准测试中的表现优于 Meta 的 Llama 2-7b 和 Mistral-7B,甚至在编码方面超过了 Llama 2 的 700 亿参数版本。微软表示,Phi-2 的小尺寸使其成为研究人员的理想游乐场,可用于探索机械可解释性、安全性改进或对各种任务的微调实验。

微软研究人员还将 Phi-2 与谷歌新推出的 Gemini Nano 进行了测试,结果表明 Phi-2 在流行基准测试中的得分超过了 Gemini Nano。Phi-2 现在可以通过 Azure AI Studio 模型目录和 Hugging Face 获得。但需要注意的是,Phi-2 不能用于商业用途,只能用于非商业、研究导向的活动。任何试图以获取商业利益为目的的行为都将违反许可条款。

相关推荐
Lee川43 分钟前
mini-cursor 揭秘:从 Tool 定义到 Agent 循环的完整实现
前端·人工智能·后端
weelinking1 小时前
【产品】00_产品经理用Claude实现产品系列介绍
数据库·人工智能·sql·数据挖掘·github·产品经理
Agent产品评测局1 小时前
制造业模具管理AI系统,主流产品能力对比详解:2026年智能制造选型深度洞察
人工智能·ai·chatgpt·制造
canonical_entropy1 小时前
从 Spec-Driven Development 到 Attractor-Guided Engineering
前端·aigc·ai编程
研华科技Advantech2 小时前
如何用一套实训设备,打通工业AI预测性维护技术全流程?
人工智能
Lab_AI2 小时前
AI for Science: MaXFlow AI Agent+ 报告体验双升级,让AI智能体更高效易用!
人工智能·ai for science·ai agent·ai智能体
李坤2 小时前
让 Codex 和 Claude 互相 Review:告别手动复制
人工智能·openai·claude
南屹川2 小时前
【API设计】GraphQL实战:从REST到GraphQL的演进
人工智能
KJ_BioMed2 小时前
当计算生物学遇上生成式AI:从头设计生物分子的“新范式”初探
人工智能·从头设计·生命科学·生物医药·科研干货·科晶生物
明月醉窗台2 小时前
深度学习(17)YOLO训练中的超参数详解
人工智能·深度学习·yolo