微软microsoft推出了最新的小型但强大的开源语言AI模型Phi-2

微软推出了最新的小型开源语言模型 Phi-2。该模型只有 27 亿个参数,却能超过比它大 25 倍的模型的性能。Phi-2 是微软 Phi 项目的一部分,旨在制作小而强大的语言模型。该项目包括 13 亿参数的 Phi-1,据称在 Python 编码方面实现了最先进的性能,以及擅长常识推理和语言理解的 Phi-1.5。Phi-2 比之前的版本更大,但性能更强。

它能实现与参数少于 130 亿个模型类似的最先进的性能。研究人员表示,与之前的 Phi 模型相比,该AI模型在输出方面更安全,并且比一些现有模型在毒性和偏差方面表现更好。为了提高 Phi 的性能,微软研究人员专注于使用 "教科书质量" 的数据进行训练,并利用合成数据集来支持模型。Phi-2 在各种基准测试中的表现优于 Meta 的 Llama 2-7b 和 Mistral-7B,甚至在编码方面超过了 Llama 2 的 700 亿参数版本。微软表示,Phi-2 的小尺寸使其成为研究人员的理想游乐场,可用于探索机械可解释性、安全性改进或对各种任务的微调实验。

微软研究人员还将 Phi-2 与谷歌新推出的 Gemini Nano 进行了测试,结果表明 Phi-2 在流行基准测试中的得分超过了 Gemini Nano。Phi-2 现在可以通过 Azure AI Studio 模型目录和 Hugging Face 获得。但需要注意的是,Phi-2 不能用于商业用途,只能用于非商业、研究导向的活动。任何试图以获取商业利益为目的的行为都将违反许可条款。

相关推荐
草莓熊Lotso20 分钟前
Linux 文件描述符与重定向实战:从原理到 minishell 实现
android·linux·运维·服务器·数据库·c++·人工智能
Coder_Boy_1 小时前
技术发展的核心规律是「加法打底,减法优化,重构平衡」
人工智能·spring boot·spring·重构
会飞的老朱3 小时前
医药集团数智化转型,智能综合管理平台激活集团管理新效能
大数据·人工智能·oa协同办公
聆风吟º5 小时前
CANN runtime 实战指南:异构计算场景中运行时组件的部署、调优与扩展技巧
人工智能·神经网络·cann·异构计算
寻星探路5 小时前
【深度长文】万字攻克网络原理:从 HTTP 报文解构到 HTTPS 终极加密逻辑
java·开发语言·网络·python·http·ai·https
想用offer打牌6 小时前
MCP (Model Context Protocol) 技术理解 - 第二篇
后端·aigc·mcp
Codebee7 小时前
能力中心 (Agent SkillCenter):开启AI技能管理新时代
人工智能
聆风吟º8 小时前
CANN runtime 全链路拆解:AI 异构计算运行时的任务管理与功能适配技术路径
人工智能·深度学习·神经网络·cann
uesowys8 小时前
Apache Spark算法开发指导-One-vs-Rest classifier
人工智能·算法·spark