Google DeepMind发布Imagen 2文字到图像生成模型;微软在 HuggingFace 上发布了 Phi-2 的模型

🦉 AI新闻

🚀 Google DeepMind发布Imagen 2文字到图像生成模型

摘要:谷歌的Imagen 2是一种先进的文本到图像技术,可以生成与用户提示紧密对齐的高质量、逼真的图像。它通过使用训练数据的自然分布来生成更逼真的图像,而不是采用预先编程的风格。该技术还改善了图像-标题的理解,通过增加图像标题的描述,使模型更好地理解上下文和细微差别。Imagen 2还具备灵活的风格控制、高质量图像生成和图像编辑能力。为了确保技术的安全性,谷歌在设计、开发和部署过程中设置了强大的安全措施,包括数字水印和安全过滤器等。

🚀 ChatGPT 偷懒事件引发关注

摘要:近期,ChatGPT偷懒事件引发了网友的广泛关注。有人通过测试发现,ChatGPT在12月的输出平均少了200字符,引起了模仿人类放寒假的猜测。此外,还有研究表明ChatGPT的行为可能受到时间和温度设置的影响。尽管还没有确凿的证据支持,但网友们对这一事件仍旧兴趣高涨,并进行了进一步的探讨和验证。整体评分为80分。

🚀 微软的Phi-2模型优于谷歌的Gemini Nano-2模型

摘要:微软公司发布的Phi-2 2.7B模型在性能方面优于谷歌发布的Gemini Nano-2 3.2B。Phi-2拥有27亿参数,相较于之前版本有明显提升,性能高出同类模型10倍。该模型基于高质量数据进行训练,在逻辑推理和安全性方面表现出显著改进。相比于其他主流语言模型虽然小很多,但通过正确微调和定制,小型语言模型仍然是云和边缘应用程序的强大工具。对比谷歌的Gemini Nano-2模型,Phi-2在多项性能上均表现优越,甚至已经超过了其他参数较大的模型。微软的Phi-2模型在语言模型领域具有重要的新颖性和影响力。

🚀 美图推出移动端 AI 生图工具 WHEE,提供一站式 AI 视觉创作服务

摘要:美图公司的移动端AI生图工具WHEE已经上线,基于美图MiracleVision大模型,提供了一站式的AI视觉创作服务。WHEE是一款在线生成的AI视觉创作工具,面向大众用户和专业视觉创作者,提供文生图、图生图、画面拓展及局部修改等AIGC图像服务。此前,美图公司推出了AI模型MiracleVision 4.0版本,新版本将于2024年1月陆续应用于美图旗下产品。这次推出的WHEE工具将进一步丰富用户的视觉创作体验。

🚀 谷歌推出AI驱动的代码补全和生成工具Duet AI for Developers

摘要:谷歌宣布全面推出AI驱动的代码补全和生成工具Duet AI for Developers。该工具集成了来自25家合作伙伴公司的数据集,帮助开发人员完成特定平台的应用构建等任务。Duet AI还整合了来自合作伙伴的文档和知识,帮助开发人员进行测试自动化、问题解决和漏洞修复等工作。此举被谷歌定位为对开发人员编码技能的补充,旨在提高生产力。Duet AI的使用者Turing在使用后收入增长了33%。该工具目前支持20多种语言,提供了多项功能。Duet AI for Developers目前免费提供,之后每月收费19美元。

🗼 AI知识

🔥 微软在 HuggingFace 上发布了 Phi-2 的模型

Phi-2 的训练数据有 1.4 T 个 token,在 96 块 A100 GPU 上训练了 14 天。

Phi-2 是一个基础模型,没有经过人类反馈强化学习(RLHF)的校准,也没有进行过指令式微调。

从能力上来说,据微软自己公布的数据:2.7B 的 Phi-2 超过了目前开源领域表现最好的 Mistral 和 Llama-2 7B 和 13B,编程能力甚至超过了 Llama-2-70B。

🔥 LLM API市场的竞争与发展

这篇文章提到了LLM API市场的竞争和发展趋势。过去一年中,LLM市场出现了更多的竞争对手,导致OpenAI失去了垄断地位。在未来,LLM市场将出现高端和低端两个市场,价格将逐渐趋于最低成本。随着开源社区不断提高模型的质量和降低成本,大型实验室的利润空间将受到压力。随着工具的改进,开发者将选择最低成本的模型来完成任务。此外,成功的公司可能会开始自己训练模型,以降低API费用。总的来说,LLM API市场将向最低成本趋近,除非任务需要最佳模型,否则其他公司可以选择更便宜的模型。

更多AI工具,参考国内AiBard123Github-AiBard123

相关推荐
计算机科研狗@OUC7 分钟前
【TMM2024】Frequency-Guided Spatial Adaptation for Camouflaged Object Detection
人工智能·深度学习·目标检测·计算机视觉
悟兰因w14 分钟前
论文阅读(三十五):Boundary-guided network for camouflaged object detection
论文阅读·人工智能·目标检测
大山同学16 分钟前
多机器人图优化:2024ICARA开源
人工智能·语言模型·机器人·去中心化·slam·感知定位
Topstip23 分钟前
Gemini 对话机器人加入开源盲水印技术来检测 AI 生成的内容
人工智能·ai·机器人
小嗷犬38 分钟前
【论文笔记】VCoder: Versatile Vision Encoders for Multimodal Large Language Models
论文阅读·人工智能·语言模型·大模型·多模态
Struart_R44 分钟前
LVSM: A LARGE VIEW SYNTHESIS MODEL WITH MINIMAL 3D INDUCTIVE BIAS 论文解读
人工智能·3d·transformer·三维重建
lucy153027510791 小时前
【青牛科技】GC5931:工业风扇驱动芯片的卓越替代者
人工智能·科技·单片机·嵌入式硬件·算法·机器学习
幻风_huanfeng1 小时前
线性代数中的核心数学知识
人工智能·机器学习
volcanical1 小时前
LangGPT结构化提示词编写实践
人工智能
weyson2 小时前
CSharp OpenAI
人工智能·语言模型·chatgpt·openai