OmniGen2:开源自然语言图像编辑模型

OmniGen2:开源自然语言图像编辑模型

OmniGen2[1] 是一个统一的多模态图像编辑模型,支持单图和多图编辑。

可以理解为开源领域的 Flux Context 替代方案,支持通过自然语言指令实现精准的局部图像编辑,包括:对象删除与替换、风格转绘、颜色调整、背景处理(删除/替换)、物品添加、表情修改以及动作修改等多种编辑任务。

模型权重已经发布,佬们可以在 Hugging Face Space[2] 体验。

Astra 发布:专业级 AI 视频超分辨率工具上线

Astra[3] 视频超分辨率工具现已正式上线。这款 AI 工具能够将低分辨率视频智能提升至 4K 画质。

官方定位是为 AI 视频创作者提供终极画质优化方案,解决内容生产的最后一公里问题。

目前标准版定价为 $39/月(约合人民币 280 元),仅仅只有画质升级的功能还是有点小贵。

相关推荐
LitchiCheng3 小时前
Mujoco 开源机械臂 RL 强化学习避障、绕障
人工智能·python·开源
我送炭你添花6 小时前
开源TR-069 ACS(自动配置服务器)GenieACS 的四个主要模块详细介绍
运维·服务器·开源
冬奇Lab6 小时前
一天一个开源项目(第9篇):NexaSDK - 跨平台设备端 AI 运行时,让前沿模型在本地运行
人工智能·开源
FIT2CLOUD飞致云6 小时前
飞致云开源社区月度动态报告(2026年1月)
开源·飞致云·月度报告·开源日报
江湖有缘8 小时前
基于华为openEuler部署EspoCRM开源客户关系管理平台
开源
zhangfeng11338 小时前
大模型微调主要框架 Firefly vs LLaMA Factory 全方位对比表
人工智能·语言模型·开源·llama
向哆哆8 小时前
Flutter × OpenHarmony 跨端实战:打造健身俱乐部「数据可视化仪表盘」模块
flutter·信息可视化·开源·鸿蒙·openharmony·开源鸿蒙
AI码上来9 小时前
开源实时语音克隆IndexTTS2,推理加速实测,支持情绪输入+语速控制
开源
wasp5209 小时前
【开源】Banana Slide:一个基于nano banana pro[特殊字符]的原生AI PPT生成应用,迈向真正的"Vibe PPT"
人工智能·开源
说私域9 小时前
破局互联网产品开发困境:开源AI智能名片链动2+1模式S2B2C商城小程序的实践与启示
人工智能·小程序·开源·私域运营