图像生成

君为先-bey2 天前
人工智能·深度学习·计算机视觉·扩散模型·图像生成
JointDiT:使用扩散变换器增强RGB-深度联合建模JointDiT: Enhancing RGB-Depth Joint Modelingwith Diffusion Transformers
仰望尾迹云3 天前
stable diffusion·ai绘画·图像生成
灵感画廊入门:AI绘画零基础到精通“见微知著,凝光成影。将梦境的碎片,凝结为永恒的视觉诗篇。”你是否曾有过这样的瞬间?脑海中闪过一个绝妙的画面,却苦于无法用画笔将其呈现。或者,你渴望创作,却被复杂的软件和技法门槛拒之门外。今天,这一切都将改变。
摘星编程3 天前
ai绘画·扩散模型·图像生成·多图融合·seedream4.0
豆包Seedream 4.0多图融合实力派:田园犬+三花猫多场景创作,AI绘画新时代来了!🌟 Hello,我是摘星! 🌈 在彩虹般绚烂的技术栈中,我是那个永不停歇的色彩收集者。 🦋 每一个优化都是我培育的花朵,每一个特性都是我放飞的蝴蝶。 🔬 每一次代码审查都是我的显微镜观察,每一次重构都是我的化学实验。 🎵 在编程的交响乐中,我既是指挥家也是演奏者。让我们一起,在技术的音乐厅里,奏响属于程序员的华美乐章。
赵阿萌3 天前
ai绘画·图像生成·星图gpu·z-image turbo
实测Z-Image Turbo画板:小显存也能跑大图,AI绘画不再卡顿你有没有过这样的经历: 刚下载好AI绘画工具,满怀期待点开界面,输入“赛博朋克少女”,按下生成—— 进度条卡在87%,显存占用飙到98%,风扇开始咆哮,屏幕突然一黑…… 再刷新,报错:CUDA out of memory。 关掉所有程序重试,结果还是黑图、崩坏、NaN值、白边、肢体错位…… 最后只能默默打开手机相册,把“灵感”截图发给朋友:“你看,我脑子里真有这画面。”
BIG-HO3 天前
flux·图像生成·星图gpu·中文ai绘画
AI绘画新选择:麦橘超然与主流模型对比实测你是否试过在RTX 4060显卡上跑不动Stable Diffusion XL,却在同样设备上流畅生成出赛博朋克雨夜街景?是否厌倦了反复调试LoRA权重、调整CFG值、重装CUDA驱动,只为让一张人像不崩脸?这一次,我们把镜头对准一个真正“开箱即用”的新玩家——麦橘超然(MajicFLUX)离线图像生成控制台。它不靠堆参数取胜,而是用float8量化+DiT架构精简+中文提示词友好设计,在中低显存设备上交出了一份让人意外的答卷。
带娃的IT创业者7 天前
ai·图像生成·模型量化·本地部署·低资源推理
单比特奇迹:如何在本地设备运行 4B 图像生成模型?在生成式 AI 爆发的今天,每一次技术的飞跃似乎都伴随着硬件门槛的提升。当我们谈论最新的图像生成模型时,往往绕不开昂贵的显存需求。H100、A100 这些企业级显卡对于普通开发者而言遥不可及,即便是消费级旗舰 RTX 4090,在面对动辄几十亿参数的大模型时,也常常捉襟见肘。这种“算力焦虑”成为了阻碍 AI 技术普及的高墙。
爽新全效瓷兔膏16 天前
ai绘画·图像生成·webui·flux模型
从零开始学AI绘画:麦橘超然WebUI新手入门必看你是不是也试过打开一堆AI绘画工具,结果卡在安装、报错、显存不足、界面找不到按钮……最后关掉网页,默默刷了半小时小红书?别急,这次真不一样。麦橘超然WebUI不是又一个“看着很炫、用着崩溃”的Demo,而是一个专为普通用户打磨出来的离线图像生成控制台——它不挑显卡,不折腾环境,打开浏览器就能画;它不堆参数,不讲原理,但每一步都稳稳出图;它甚至把最让人头疼的“模型下载”和“量化加载”全打包进镜像里,你只需要写一句话、点一下按钮。
欧学东16 天前
ai绘画·图像生成·z-image-turbo·星图gpu
实测Z-Image-Turbo功能,AI绘画在实际场景中的表现最近在做一批电商视觉内容,需要快速产出不同风格的商品图、场景图和概念图。试过不少AI绘图工具,有的生成慢,有的细节糊,有的对中文提示理解偏差大。直到遇到这个由科哥二次开发的阿里通义Z-Image-Turbo WebUI镜像——它不光启动快、出图稳,关键是“说人话就能出好图”。今天不讲原理、不堆参数,就用真实工作流带你看看:它在日常设计任务里到底靠不靠谱。
这张生成的图像能检测吗17 天前
人工智能·生成对抗网络·图像生成·一维影像组学·数据扩充
(论文速读)基于GAN的一维医学数据增强论文题目:GAN-based one dimensional medical data augmentation(基于GAN的一维医学数据增强)
顾道长生'21 天前
图像生成·一步生成·扩散模型加速
CVPR 2026 | 当LoRA遇上RoPE! WaDi:面向单步图像生成的权重方向感知蒸馏论文链接:https://arxiv.org/abs/2603.08258代码链接:https://github.com/gudaochangsheng/WaDi
小何code24 天前
深度学习·生成对抗网络·gan·图像生成
人工智能【第31篇】生成对抗网络GAN入门:AI的创造力之源作者的话:在前面的文章中,我们学习了各种监督学习和无监督学习算法,以及深度学习中的CNN、RNN等架构。今天,我们将进入一个充满想象力的领域——生成对抗网络(GAN)。GAN让AI拥有了"创造力",可以生成逼真的图像、音乐、文本,甚至视频。从DeepFake到AI绘画,从风格迁移到超分辨率,GAN的应用无处不在。让我们一起探索这个让AI学会"造假"的神奇技术!
叶子Talk1 个月前
人工智能·gpt·计算机视觉·ai·openai·图像生成·gpt-image-2
GPT-Image-2正式发布:文字渲染99%,Image Arena三项第一,AI图像生成彻底变天了AI科技 2026年4月22日晚间,OpenAI正式向所有ChatGPT用户开放了全新一代图像生成模型——GPT-Image-2(ChatGPT Images 2.0)。
熊猫钓鱼>_>2 个月前
百度·ai·大模型·llm·ernie·image·图像生成
ERNIE-Image 深度测评:百度 8B 小模型如何撼动文生图格局2026 年 4 月 15 日,百度文心大模型团队扔下了一颗重磅炸弹——开源文生图模型 ERNIE-Image-2。在开源文生图领域被 SD3、Flux、Qwen-Image 等大模型盘踞的当下,百度带来了一个只有 8B 参数的“小模型”,却宣称能在消费级显卡上跑出媲美顶级商业模型的效果。
山顶夕景2 个月前
大模型·强化学习·图像生成·rl·agentic
【MLLM】GraphWalker:Deepresearch用于图像生成【Deepresearch用于图像生成思路】思路是用于图像生成的多模态深度搜索智能体,进行多跳推理与搜索,以获取图像生成所需的文本知识和参考图像,结论是在KnowGen上使Qwen-Image性能提高约16分,在WISE上提高约15分。GraphWalker: Agentic Knowledge Graph Question Answer-ing via Synthetic Trajectory Curriculum,https://arxiv.org/pdf/2603.28533,https://gen
Shining05963 个月前
人工智能·算法·stable diffusion·大模型·图像生成·ai编译器·infinitensor
AI 编译器系列(六)《Stable Diffusion 在 InfiniTensor 推理框架中的适配与工程实践》目录Stable Diffusion 介绍Stable Diffusion 概述扩散模型概念Stable Diffusion 架构
AI生成未来3 个月前
人工智能·计算机视觉·aigc·agent·图像生成
图像生成迎来“思考-研究-创造”新范式!Mind-Brush:统一意图分析、多模态搜索和知识推理文章链接:https://arxiv.org/pdf/2602.01756 Git链接:https://github.com/PicoTrex/Mind-Brush 数据集:https://huggingface.co/datasets/PicoTrex/Mind-Brush
杀生丸学AI4 个月前
aigc·三维重建·扩散模型·图像生成·视觉大模型·lora微调·空间智能
【三维生成】ShapeR:单目视频的条件三维形状生成标题:《ShapeR: Robust Conditional 3D Shape Generation from Casual Captures》 项目:facebookresearch.github.io/ShapeR 来源:Meta Reality Labs Research;Simon Fraser University
TTGGGFF5 个月前
图像生成
【实战教程】Flux.1-dev 360° 全景驾驶舱:从零到一的“零坑”部署指南Flux.1-dev 是目前开源界最强的文生图模型,但其高达 24GB+ 的参数量让 24G 显存(如 3090/4090)环境极易崩溃。本教程整理自真实踩坑记录,教你如何利用 ModelScope 极速下载、身份自动鉴权和显存顺序卸载技术,在单卡环境下完美复现。
OpenBayes5 个月前
人工智能·深度学习·自然语言处理·数据集·机器翻译·图像生成
HY-MT1.5-1.8B 支持多语言神经机器翻译;Med-Banana-50K 提供医学影像编辑基准数据6 个公共数据集:* Human faces 人脸数据集* SimpleQA 简明事实性问答评测数据集
梁辰兴6 个月前
人工智能·科技·ai·chatgpt·大模型·openai·图像生成
OpenAI更新ChatGPT Images:生成速度最高提升4倍,原生多模态模型你以为AI画图还停留在“等一分钟出四张”的龟速时代?OpenAI最新发布的GPT-Image1直接打破认知,实测512x512图像生成耗时缩短75%,程序员圈曾调侃的“冒烟GPU”梗竟成真预言。这波操作堪比给AI绘画装上涡轮增压引擎,但油门到底的秘诀,绝非单纯的算力堆砌,而是模型架构、硬件加速与长文本联动的三重革命。