好家伙,OpenAI 第一的位置屁股还没坐热呢,谷歌 Gemini 就重夺竞技场榜首了

谷歌 Gemini 模型重夺竞技场榜首

谷歌 AiStudio[7] 上新了实验性的 gemini-exp-1121 模型,该模型在 lmarena[8] 上超越了昨天 OpenAI 发布的新 4O 模型,重新夺得了榜首。好家伙,回合制,OpenAI 第一的位置屁股还没坐热呢。

阿里 In-Context LoRA:高效多场景精准出图

In-Context LoRA[1] 是阿里最近非常火的一个项目。上次介绍时,模型还未开放,现在官方已经放出了 10 个预训练模型。社区围绕它开发了多种工作流,如虚拟试穿、品牌设计、对象迁移和角色扮演等。

IC LoRA 基于 Flux 这玩意生成的效果非常好,电商领域一定能打出一片天。

配图使用 Logo in Context[2] 制作,这也是利用了 IC LoRA。配合图生图技术,可以将任何 Logo 融入到任何事物中。

京东健康开源音频驱动的数字人头项目 JoyVASA

JoyVASA[3] 是京东健康开源的一个音频驱动的数字人头项目,它不仅支持唇形一致和表情控制,还能为动物生成数字头。这类技术在市场上非常多,有需求的读者可以在三花上搜索'数字人',不过真正落地的不多,JoyVASA 看起来是个不错的选择。

Black Forest Labs 发布 FLUX Tools:官方支持的控制模型

黑森林实验室(Black Forest Labs)发布了 FLUX Tools[4] 系列模型,包括:

  • Fill 支持局部重绘和扩图
  • Depth & Canny 官方 Controlnet 模型
  • Redux 图像参考图生图 这些模型均已开放下载,并基于 Flux dev 的开源协议。ComfyUI 发文[5] 表示第一时间支持了这些模型,官方下场做生态,好日子来了。

Tülu 3:完全开放的大模型

Tülu 3[6] 70B & 8B 是一个完全开放数据、评估代码和训练算法的大模型。在 12 项基准测试中,其平均得分超越了许多同参数量开源模型,特别是 70B 模型,其表现甚至超越了 GPT4o-mini,直逼 claude 3.5 haiku。官方宣称,他们的目标是让任何人都能后训练模型,因此不仅开放了权重,还一并开放了整套基础设施。非常的酷

相关推荐
冬奇Lab13 小时前
一天一个开源项目(第60篇):IndexTTS - B 站开源的工业级零样本语音合成系统
人工智能·开源·资讯
冬奇Lab2 天前
一天一个开源项目(第59篇):Dream Recorder - 用 AI 把梦境变成视频的物理设备
开源·资讯
冬奇Lab4 天前
一天一个开源项目(第57篇):Unsloth - 2x 更快、70% 更省显存的 LLM 微调库
开源·aigc·资讯
冬奇Lab4 天前
一天一个开源项目(第56篇):人人都能用英语 - AI 时代的外语学习开源项目
人工智能·开源·资讯
不会前端的小鱼6 天前
AI时代的一人公司:给独立创业者的效率与增长实战指南
程序员·资讯
程序员鱼皮9 天前
微信正式接入 OpenClaw,Cursor 被锤套壳 Kimi… 本周最炸 AI 热点汇总
aigc·ai编程·资讯
冬奇Lab13 天前
一天一个开源项目(第55篇):Spec Kit - GitHub 开源的规范驱动开发工具包
开源·ai编程·资讯
冬奇Lab13 天前
一天一个开源项目(第54篇):Supabase - 开源的 Postgres 开发平台,Firebase 替代方案
后端·开源·资讯
冬奇Lab15 天前
一天一个开源项目(第53篇):PDF 补丁丁 - 功能全面的 PDF 工具箱,编辑书签、解除限制、合并拆分、OCR 识别
开源·资讯
冬奇Lab16 天前
一天一个开源项目(第52篇):OPB-Skills - 一人公司的 AI 团队,91 个专业 Skill 覆盖完整业务
人工智能·开源·资讯