ai作画

那个村的李富贵1 小时前
人工智能·ai作画·cann
从CANN到Canvas:AI绘画加速实战与源码解析摘要:本文以华为CANN(Compute Architecture for Neural Networks)仓库的模型优化能力为背景,结合AIGC领域最热门的AI绘画应用场景,通过一个完整的AI绘画加速实战项目,展示如何利用CANN优化模型推理性能。文章包含完整的代码实现、性能对比数据以及技术原理解析,为AIGC开发者提供实用的技术参考。 cann组织链接 ops-nn仓库链接
学易11 小时前
人工智能·ai作画·stable diffusion·报错·comfyui·缺失节点
第十五节.别人的工作流,如何使用和调试(上)?(2类必现报错/缺失节点/缺失模型/思路/实操/通用调试步骤)前面的课程,我们已经把工作流的底层逻辑、搭建方法和基础操作都讲透了。今天,咱们要跳出 “新手村”,直接进入实战模式。我们就拿一套能从文字生成静帧,再变成完整视频的 AI 短片全流程工作流为例,一步步教你把网上下载的陌生工作流,调试到能完美运行的状态。
acai_polo1 天前
人工智能·gpt·ai·语言模型·ai作画
如何在国内合规、稳定地使用GPT/Claude/Gemini API?中转服务全解析国内许多开发团队和企业在尝试集成GPT、Claude或Gemini等国际主流大模型时,常常会面临一个现实矛盾:技术上的强烈需求与网络访问上的客观限制。直接调用官方接口,不仅时常受到网络波动的影响,延迟和中断问题也让生产级应用变得遥不可及。在此背景下,API中转服务作为一种务实的技术方案逐渐普及,它核心是帮助开发者在符合常规技术路径的前提下,更顺畅地利用这些先进的AI能力。
love530love2 天前
人工智能·windows·python·ai作画·aigc·comfyui·攻关
【实战经验】解决ComfyUI加载报错:PytorchStreamReader failed reading zip archive: failed finding central directory在使用 ComfyUI 时,你可能会遇到这样的错误:关键报错信息:错误弹窗显示:这个错误表面上看起来是 PyTorch 无法读取模型文件,但实际上通常有以下几种原因:
愚公搬代码3 天前
人工智能·ai作画·音视频
【愚公系列】《AI短视频创作一本通》012-AI 短视频分镜头设计(AI绘画提示词入门)💎【行业认证·权威头衔】 ✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家 ✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主 ✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者
应用市场5 天前
人工智能·ai作画
#AI对话与AI绘画的底层原理:从概率预测到创意生成的完整解析本文深入剖析AI对话(如ChatGPT、Claude)和AI绘画(如Stable Diffusion、Midjourney)的核心原理,揭示它们的共同本质——基于概率的生成模型,同时解析两者在技术实现上的关键差异。读完本文,你将真正理解AI是如何"思考"和"创作"的。
学习吧~技术储备5 天前
ai作画·aigc
ComfyUI基础学习笔记本文记录AI图形界面工具ComfyUI如何使用,供大家学习参考。写的很基础。ComfyUI是一个AI图形界面工具,是基于节点工作流的图形用户界面。
badfl11 天前
人工智能·ai·ai作画
AI漫剧技术方案拆解:NanoBanana+Sora视频生成全流程过去,做一部动画漫剧,需要编剧、美术、分镜、剪辑,而现在——你只需要一个主题。AI 正在重构“内容生产”的底层逻辑:
向量引擎17 天前
人工智能·python·gpt·ai作画·架构·aigc·api调用
[硬核架构] 2026 企业级 AI 网关落地指南:从“连接超时”到“秒级响应”的架构演进(附 Python/Java 源码)摘要:在 AI 应用从 Demo 走向生产环境的过程中,开发者面临的最大挑战往往不是模型本身,而是如何构建一个高可用、低延迟、可扩展的 API 网关。本文将深入剖析 OpenAI 直连架构的痛点,详细解读“向量引擎”作为中间件的核心优势,并提供基于 Python 和 Java Spring Boot 的完整接入方案,以及 RAG 系统和多模型混合调度的实战代码。
da_vinci_x20 天前
游戏·3d·设计模式·ai作画·aigc·设计师·游戏美术
武器设计实战:一把大剑裂变 5 种属性?Structure Ref 的“换肤”魔法对于道具原画师来说,“同模换皮” 是最枯燥的“搬砖”活。 为了保证轮廓(Silhouette)不穿模,你必须小心翼翼地在固有色图层上涂抹,画完火焰材质还得重新画冰块的折射,稍不留神透视就画平了。
我的golang之路果然有问题21 天前
人工智能·ai作画·stable diffusion·人工智能作画
开源绘画大模型简单了解根据 c 站的分类来看SD 系列:SD 1.5,SD 1.5 LCM等 SD 开头的,相对来说最久远不过插件丰富
我的golang之路果然有问题22 天前
人工智能·macos·ai作画·人工智能作画·comfy
mac 上进行 comfyUI 等绘画的好处以及分享可以这么理解: Windows (RTX 显卡) 是一辆法拉利,跑得飞快,但后备箱(显存)很小,装不了太大的货物。 Mac (M芯片 + 统一内存) 是一辆大巴车,跑得比较慢,但空间巨大(统一内存),能装下巨型货物。
DisonTangor22 天前
人工智能·ai作画·数据挖掘·回归·aigc
GLM-Image:面向密集知识与高保真图像生成的自回归模型GLM-Image是一种采用混合自回归+扩散解码器架构的图像生成模型。在常规图像生成质量方面,GLM‑Image与主流潜在扩散方法相当,但在文本渲染和知识密集型生成场景中展现出显著优势。该模型在需要精确语义理解和复杂信息表达的任务上表现尤为突出,同时保持高保真度和细粒度细节生成的强大能力。除文生图功能外,GLM‑Image还支持丰富的图生图任务,包括图像编辑、风格迁移、身份保持生成以及多主体一致性生成等。
CoookeCola24 天前
人工智能·计算机视觉·ai作画·开源·音视频
新一代 AI 模型与多模态 Agent 项目(2026/01/14近期)…从自动化智能助手到视觉概念合成、从图像/视频内容编辑到生成式 3D 动作与音频理解,本篇博客带你一站式扫视 2025–2026 年最前沿的开源 AI 项目。
q_302381955625 天前
ai作画
7款Flux-LoRA风格模型全解析:一键解锁动漫、迪士尼、写实等AI绘画神技XLabs-AI团队在Hugging Face平台重磅推出的Flux-LoRA模型合集,堪称AI绘画爱好者的“风格百宝箱”。无需复杂调试,只需加载对应LoRA权重,就能让Flux模型精准切换7种专属风格,从日式动漫到迪士尼童话,从照片级写实到壮阔景观,覆盖绝大多数创作场景。以下是每款模型的核心亮点与实战指南,附官方提示词案例,帮你快速上手!
stephen one25 天前
人工智能·ai作画·stable diffusion·aigc·midjourney
2026 AI深度伪造危机:实测 Midjourney v7 与 Flux 2 Max 识别,谁才是 AI 检测的天花板?步入 2026 年,随着 Midjourney v7 的电影感光影和 Flux 2 Max 的极致写实,AI 生成内容与真实摄影的边界已彻底模糊。传统的检测工具(如 CNNDetection 等)在面对现代 DiT (Diffusion Transformer) 架构时,识别率已大幅衰减。
Dylan的码园1 个月前
人工智能·机器学习·ai作画·数据挖掘·boosting·oneflow
稀疏 MoE 与原生多模态双驱:2025 大模型技术演进全景AI是现在的潮流,我也试着收集了一些资料,分享一下,也是了解了解ai前言的东西~自 ChatGPT 掀起全球 AI 浪潮以来,大模型(Large Models)已成为人工智能领域的核心支柱,其能力边界不断拓展,从自然语言处理到计算机视觉,从单一任务适配到跨场景通用,深刻重塑了技术研发范式与产业应用逻辑。大模型的规模化发展带来了能力的跃升,但也面临着计算成本激增、多模态数据融合不彻底等核心挑战。在此背景下,稀疏 MoE(Mixture of Experts)与原生多模态双驱动技术应运而生,成为突破大模型性能
程序员佳佳1 个月前
人工智能·gpt·chatgpt·ai作画·aigc·api·ai编程
【万字硬核】从零构建企业级AI中台:基于Vector Engine整合GPT-5.2、Sora2与Veo3的落地实践指南前言:开发者面临的“至暗时刻”与破局之道在当下的技术圈。最让开发者头秃的不是代码报错。而是明明有最先进的生产力工具。
哥只是传说中的小白1 个月前
开发语言·数据库·ai作画·开源·aigc·php·api
Nano Banana Pro高并发接入Grsai Api实战!0.09/张无限批量生成(附接入实战+开源工具)设计师们,你们用的画图工具是不是生成一张图要几分钟,想批量生成还有数量限制? 工作效率实在低。企业开发们,你们调用的APi聚合平台是不是动不动就崩溃、超时还有并发限制?根本无法承接高并发需求,修复拖半天,价格还不便宜!
程序员佳佳1 个月前
开发语言·python·gpt·chatgpt·ai作画·aigc·api
【万字硬核】从GPT-5.2到Sora2:深度解构多模态大模型的“物理直觉”与Python全栈落地指南(内含Banana2实测)摘要: 当我们在谈论大模型时 我们在谈论什么 是参数量的暴力美学 还是Transformer架构的无限延展 2025年的AI界 已经不再满足于文本的生成 GPT-5.2-Pro开始具备了逻辑推理的“慢思考”能力 Sora2与Veo3正在试图模拟物理世界的运行规律 而Banana2则在图像生成的语义理解上达到了新的巅峰 对于开发者而言 这不仅仅是工具的更新 更是一场关于“认知重构”的技术革命 本文将避开枯燥的新闻通稿 从底层架构出发 深度解析新一代模型的“物理直觉” 并手把手教你构建企业级的高并发AI应用