Google DeepMind发布Imagen 2文字到图像生成模型；微软在 HuggingFace 上发布了 Phi-2 的模型

🦉 AI新闻

🚀 Google DeepMind发布Imagen 2文字到图像生成模型

摘要：谷歌的Imagen 2是一种先进的文本到图像技术，可以生成与用户提示紧密对齐的高质量、逼真的图像。它通过使用训练数据的自然分布来生成更逼真的图像，而不是采用预先编程的风格。该技术还改善了图像-标题的理解，通过增加图像标题的描述，使模型更好地理解上下文和细微差别。Imagen 2还具备灵活的风格控制、高质量图像生成和图像编辑能力。为了确保技术的安全性，谷歌在设计、开发和部署过程中设置了强大的安全措施，包括数字水印和安全过滤器等。

🚀 ChatGPT 偷懒事件引发关注

摘要：近期，ChatGPT偷懒事件引发了网友的广泛关注。有人通过测试发现，ChatGPT在12月的输出平均少了200字符，引起了模仿人类放寒假的猜测。此外，还有研究表明ChatGPT的行为可能受到时间和温度设置的影响。尽管还没有确凿的证据支持，但网友们对这一事件仍旧兴趣高涨，并进行了进一步的探讨和验证。整体评分为80分。

🚀 微软的Phi-2模型优于谷歌的Gemini Nano-2模型

摘要：微软公司发布的Phi-2 2.7B模型在性能方面优于谷歌发布的Gemini Nano-2 3.2B。Phi-2拥有27亿参数，相较于之前版本有明显提升，性能高出同类模型10倍。该模型基于高质量数据进行训练，在逻辑推理和安全性方面表现出显著改进。相比于其他主流语言模型虽然小很多，但通过正确微调和定制，小型语言模型仍然是云和边缘应用程序的强大工具。对比谷歌的Gemini Nano-2模型，Phi-2在多项性能上均表现优越，甚至已经超过了其他参数较大的模型。微软的Phi-2模型在语言模型领域具有重要的新颖性和影响力。

🚀 美图推出移动端 AI 生图工具 WHEE，提供一站式 AI 视觉创作服务

摘要：美图公司的移动端AI生图工具WHEE已经上线，基于美图MiracleVision大模型，提供了一站式的AI视觉创作服务。WHEE是一款在线生成的AI视觉创作工具，面向大众用户和专业视觉创作者，提供文生图、图生图、画面拓展及局部修改等AIGC图像服务。此前，美图公司推出了AI模型MiracleVision 4.0版本，新版本将于2024年1月陆续应用于美图旗下产品。这次推出的WHEE工具将进一步丰富用户的视觉创作体验。

🚀 谷歌推出AI驱动的代码补全和生成工具Duet AI for Developers

摘要：谷歌宣布全面推出AI驱动的代码补全和生成工具Duet AI for Developers。该工具集成了来自25家合作伙伴公司的数据集，帮助开发人员完成特定平台的应用构建等任务。Duet AI还整合了来自合作伙伴的文档和知识，帮助开发人员进行测试自动化、问题解决和漏洞修复等工作。此举被谷歌定位为对开发人员编码技能的补充，旨在提高生产力。Duet AI的使用者Turing在使用后收入增长了33%。该工具目前支持20多种语言，提供了多项功能。Duet AI for Developers目前免费提供，之后每月收费19美元。

🗼 AI知识

🔥 微软在 HuggingFace 上发布了 Phi-2 的模型

Phi-2 的训练数据有 1.4 T 个 token，在 96 块 A100 GPU 上训练了 14 天。

Phi-2 是一个基础模型，没有经过人类反馈强化学习（RLHF）的校准，也没有进行过指令式微调。

从能力上来说，据微软自己公布的数据：2.7B 的 Phi-2 超过了目前开源领域表现最好的 Mistral 和 Llama-2 7B 和 13B，编程能力甚至超过了 Llama-2-70B。

🔥 LLM API市场的竞争与发展

这篇文章提到了LLM API市场的竞争和发展趋势。过去一年中，LLM市场出现了更多的竞争对手，导致OpenAI失去了垄断地位。在未来，LLM市场将出现高端和低端两个市场，价格将逐渐趋于最低成本。随着开源社区不断提高模型的质量和降低成本，大型实验室的利润空间将受到压力。随着工具的改进，开发者将选择最低成本的模型来完成任务。此外，成功的公司可能会开始自己训练模型，以降低API费用。总的来说，LLM API市场将向最低成本趋近，除非任务需要最佳模型，否则其他公司可以选择更便宜的模型。

更多AI工具，参考国内AiBard123，Github-AiBard123