OmniGen2:开源自然语言图像编辑模型

OmniGen2:开源自然语言图像编辑模型

OmniGen2[1] 是一个统一的多模态图像编辑模型,支持单图和多图编辑。

可以理解为开源领域的 Flux Context 替代方案,支持通过自然语言指令实现精准的局部图像编辑,包括:对象删除与替换、风格转绘、颜色调整、背景处理(删除/替换)、物品添加、表情修改以及动作修改等多种编辑任务。

模型权重已经发布,佬们可以在 Hugging Face Space[2] 体验。

Astra 发布:专业级 AI 视频超分辨率工具上线

Astra[3] 视频超分辨率工具现已正式上线。这款 AI 工具能够将低分辨率视频智能提升至 4K 画质。

官方定位是为 AI 视频创作者提供终极画质优化方案,解决内容生产的最后一公里问题。

目前标准版定价为 $39/月(约合人民币 280 元),仅仅只有画质升级的功能还是有点小贵。

相关推荐
空灵之海6 小时前
Ubuntu环境Docker安装禅道项目管理软件开源版
ubuntu·docker·开源
同元软控7 小时前
即将开源:Sysplorer MCP Server+智能体重塑系统建模仿真工作流
人工智能·开源·mworks
路由侠内网穿透8 小时前
本地部署开源 LLM 应用观测与调试平台 Langfuse 并实现外部访问
运维·服务器·数据库·物联网·开源
❀͜͡傀儡师10 小时前
docker部署开源的SQL审核平台Yearning
sql·docker·开源
MicrosoftReactor10 小时前
技术速递|如何使用 GitHub Security Lab 的开源 AI 驱动框架进行漏洞扫描
人工智能·安全·开源·github·漏洞扫描
厚积而薄发152811 小时前
我复刻了一个“会避嫌”的登录页,还把它开源了
css·开源·用户体验
Are_You_Okkk_11 小时前
RAG技术落地:开源知识库让知识从存储到主动服务
人工智能·架构·开源
数据集_深度学习11 小时前
基于 OpenMVG + OpenMVS 的开源多视图三维重建系统(包括资源下载与演示视频、系统整体架构与核心原理)
架构·开源·音视频
程序员大辉11 小时前
LuxTTS 完整入门指南:150倍实时速度的开源声音克隆工具,1GB显存即可运行
ai·语言模型·开源·语音识别
XDHCOM11 小时前
Apache Mesos科普,提升资源利用率与系统扩展性的开源平台
开源·apache