技术栈
ai作画
阿杜杜不是阿木木
1 天前
人工智能
·
深度学习
·
ai
·
ai作画
·
lora
开始 ComfyUI 的 AI 绘图之旅-Flux.1 ControlNet (十)
本文将使用 Flux.1 ControlNet 来完成 ControlNet 的工作流示例。FLUX.1 Canny 和 Depth 是由 Black Forest Labs 推出的 FLUX.1 Tools 套件 中的两个强大模型。这套工具旨在为 FLUX.1 添加控制和引导能力,使用户能够修改和重新创建真实或生成的图像。
DisonTangor
2 天前
学习
·
ai作画
·
开源
·
aigc
字节开源 OneReward: 通过多任务人类偏好学习实现统一掩模引导的图像生成
我们提出OneReward——一种基于Qwen2.5-VL生成式奖励模型的全新视觉领域RLHF方法,通过增强多任务强化学习显著提升策略模型在多项子任务中的生成能力。基于OneReward,我们开发出Seedream 3.0 Fill统一图像编辑模型,能高效处理图像填充、延展、物体消除和文字渲染等多样化任务,其表现超越Ideogram、Adobe Photoshop和FLUX Fill [Pro]等多家顶尖商业与开源系统。最后,基于FLUX Fill [dev]版本,我们激动地发布FLUX.1-Fill-d
阿杜杜不是阿木木
2 天前
人工智能
·
ai
·
ai作画
·
aigc
·
图生图
开始 ComfyUI 的 AI 绘图之旅-Stable Diffusion图生图之局部重绘(Inpaint)和扩图(Outpaint)(三)
本篇指南将带你了解 ComfyUI 中的局部重绘工作流,并带你完成一个局部重绘的示例,以及遮罩编辑器的使用等 本篇将引导了解 AI 绘图中,局部重绘的概念,并在 ComfyUI 中完成局部重绘工作流生成,我们将接触以下内容:
阿杜杜不是阿木木
2 天前
人工智能
·
ai
·
ai作画
·
aigc
·
图生图
开始 ComfyUI 的 AI 绘图之旅-Stable Diffusion图生图(二)
图生图(Image to Image)是 ComfyUI 中的一种工作流,它允许用户将一张图像作为输入,并生成一张新的图像。 图生图可以使用在以下场景中:
阿杜杜不是阿木木
2 天前
人工智能
·
ai
·
ai作画
·
aigc
·
图生图
开始 ComfyUI 的 AI 绘图之旅-Flux.1文生图(全网首发,官网都没有更新)(七)
Black Forest Labs 开发的 FLUX.1 系列模型(FLUX.1-dev、FLUX.1-schnell、FLUX.1-Krea-dev)是针对不同场景优化的文本到图像生成模型,核心区别体现在技术架构、性能侧重点、适用场景和许可协议上。以下是具体分析:
三脚猫的喵
2 天前
前端
·
javascript
·
ai作画
·
微信小程序
微信小程序中实现AI对话、生成3D图像并使用xr-frame演示
具体的实现方法可点击链接: 具体实现示例进行详细查看源码,这个示例中,运用了微信小程序内置的AI方法和部署云函数两种方式,实现后的截图如下: 使用云函数的主要的实现思路 使用微信小程序内置的AI方法,局限性较多,不利于后期的使用和开发,下面介绍云函数的使用方法:
API流转日记
5 天前
人工智能
·
gpt
·
ai
·
chatgpt
·
ai作画
·
googlecloud
Gemini-2.5-Flash-Image-Preview 与 GPT-4o 图像生成能力技术差异解析
在 AI 图像生成领域,Google 的 Gemini-2.5-Flash-Image-Preview(又称 Nano Banana)与 OpenAI 的 GPT-4o 凭借各自独特的技术架构,成为开发者关注的焦点。作为 API 中转站服务提供商(官网:http://api.aaigc.top ),我们结合 GitHub 仓库(GitHub - JimmyLv/awesome-nano-banana: Awesome curated collection of images and prompts gen
API流转日记
6 天前
人工智能
·
gpt
·
ai
·
chatgpt
·
ai作画
对接gemini-2.5-flash-image-preview教程
本次对接的gemini-2.5-flash-image-preview模型,继承Gemini系列多模态特性,支持文本生成图片、文本结合图片编辑等功能。需注意该模型不支持仅输出图片,必须配置["TEXT", "IMAGE"]双模态输出;所有生成图片均含SynthID水印,当前支持英语、西班牙语(墨西哥)、日语、简体中文、印地语等语言提示词,暂不支持音频或视频输入。
siliconstorm.ai
9 天前
大数据
·
图像处理
·
人工智能
·
语言模型
·
ai作画
·
云计算
·
机器翻译
开源与闭源的再对决:从Grok到中国力量,AI生态走向何方?
马斯克的xAI近期宣布开源 Grok-2.5,并计划在半年后开放 Grok-3。这一动作在AI行业掀起了不小的震动,因为它不仅仅是一次技术层面的更新,更是 全球大模型竞争格局的重新洗牌。
阿枫同学
9 天前
ai
·
ai作画
海螺首尾帧杀疯了,一个能打的都没有!
最近短视频平台涌现出了非常多AI视频,你甚至还能看到猴哥和苏轼的自拍Vlog,就问你离不离谱吧?虽然这些视频看起来制作难度很高,但实际上可以通过“首尾帧”玩法轻松复刻,今天阿枫就把趣味玩法+工具一起打包分享给大家。
之歆
1 个月前
人工智能
·
pytorch
·
ai作画
Al大模型-本地私有化部署大模型-大模型微调
https://www.modelscope.cn/models/Qwen/Qwen2.5-0.5B-Instruct
软件测试-阿涛
1 个月前
人工智能
·
深度学习
·
计算机视觉
·
ai作画
·
stable diffusion
【AI绘画】Stable Diffusion webUI 常用功能使用技巧
Stable Diffusion webUI(以 Automatic1111 版本为代表)是目前最主流的本地化 AI 图像生成工具,支持文生图、图生图、局部重绘、姿态控制等全链路创作功能。截至 2025 年 7 月,最新版本为1.10.0,该版本正式支持 SD3 模型、新增多种采样调度器(如 Align Your Steps、KL Optimal)及采样器(DDIM CFG++),并优化了显存占用与生成效率。本教程基于该版本,详细讲解核心功能模块的操作技巧,帮助用户从入门到精通 AI 图像生成。
Chan16
1 个月前
java
·
人工智能
·
spring boot
·
后端
·
spring
·
ai
·
ai作画
【智能协同云图库】第七期:基于AI调用阿里云百炼大模型,实现AI图片编辑功能
摘要:AI 高速发展赋能传统业务,图库网站亦有诸多 AI 应用空间。以 AI 扩图功能为例,让我们来学习如何在项目中快速接入 AI 绘图大模型。用户可以选择一张已上传的图片,通过 AI 扩图得到新的图片,希望可以帮到大家。
爱分享的飘哥
1 个月前
人工智能
·
ai作画
·
ai视频生成
·
animatediff原理
·
时间卷积
·
video diffusion
·
sd动画
第三十五章:让AI绘画“动”起来:第一个AI视频诞生-AnimateDiff的时间卷积结构深度解析
AI绘画(文生图)已经取得了令人难以置信的进展,Stable Diffusion等模型能生成逼真的静态图片。但人类的世界是动态的。让AI学会生成连贯、高质量的视频,是当前AI领域最激动人心的前沿方向之一。 视频生成比图像生成复杂得多。它不仅要考虑每一帧的图像质量,更要考虑帧与帧之间的时序连贯性、运动轨迹和物理逻辑。
LDAHG14542
1 个月前
经验分享
·
ai作画
·
电脑
AI绘画模型生成 MZ 日系美感人像/极致cos
类型:LORA 基础算法:基础模型 F.1 功能描述:美感写实人像 推荐搭配:基础模型 F.1 推荐权重: 0.8 采样方法:Euler CFG:3.5
lm down
2 个月前
人工智能
·
macos
·
ai作画
·
视频
ComfyUI中运行Wan 2.1工作流,电影级视频,兼容Mac, Windows
魔当(LM Downloader)是一个大模型应用下载工具 ,目前 魔当 已经支持Wan 2.1视频模型的下载和使用。
MidJourney中文版
2 个月前
人工智能
·
ai作画
·
midjourney
视频模型国产PK国外?
当AI视频生成领域掀起创作革命, Midjourney V1与即梦(Dreamina Video)无疑是两颗耀眼的明星。它们并非冰冷的技术堆砌,而是承载着不同艺术灵魂的创作伙伴。本文将带你深入体验二者在艺术表达、工作流程与创意潜能上的本质差异,助你找到最契合的创作拍档。
龙萱坤诺
2 个月前
ai作画
·
midjourney
·
ai绘画
开发者如何集成AI绘画?智创聚合API简化Midjourney接入
在 AI 绘画领域,Midjourney 的大名如雷贯耳,其强大的图像生成能力,能将我们脑海中的奇思妙想,迅速转化为精美的视觉画面,深受设计师、艺术家以及广大创意爱好者的青睐。然而,使用 Midjourney 的过程中,费用与使用体验的问题,却像乌云般,给大家带来不少困扰。
取不好名字=
2 个月前
笔记
·
学习
·
ai作画
·
stable diffusion
【ComfyUI学习笔记01】下载安装 | 运行第一个工作流 | 学习思路
你好!这是博主学习ComfyUI时的心得笔记,从零开始。博主是工业设计专业的学生,学ComfyUI是为了批量和易控地渲染手绘图以及生成特定人物,主要面向应用,不会在底层原理上有过多深入。每期的推荐资料会放在文章末尾。 本系列一般不涉及节点参数的解读,推荐需要时,在Github上检索学习。 初来乍到,请多指教!
沐尘而生
2 个月前
数据库
·
人工智能
·
ai作画
·
音视频
·
娱乐
【AI智能体】智能音视频-搭建可视化智能体
可视化智能体是语音小伴侣智能体的升级版,支持语音与视频的双模态交互。本文详细介绍了音视频交互的实现原理、智能体搭建方法及效果测试,帮助开发者快速构建支持音视频交互的智能体。