技术栈
gpu优化
Emmamkq~~
5 天前
文生图
·
ai绘画
·
本地部署
·
gpu优化
造相-Z-Image技术白皮书精要:Z-Image模型结构与4090适配原理
如果你手头有一块RTX 4090显卡,想用它来跑AI画图,可能会遇到一些头疼的问题:生成图片时突然显存爆了、出来的图全黑一片、或者速度并没有想象中那么快。市面上通用的文生图工具,往往是为“通用显卡”设计的,并没有针对4090这块顶级消费卡做专门的优化。
凡狗蛋
18 天前
视频检测
·
ai部署
·
gpu优化
VideoAgentTrek-ScreenFilter高算力适配:GPU显存优化与推理加速技巧
如果你正在使用VideoAgentTrek-ScreenFilter处理视频内容,可能会遇到这样的场景:上传一个30秒的视频,等待时间却长得让人失去耐心;或者同时处理多个视频时,系统直接提示显存不足。这背后,其实是模型推理效率与硬件资源之间的博弈。
李大锤同学
20 天前
大语言模型
·
ai推理
·
gpu优化
Qwen3.5-4B-Claude-Opus部署教程:GPU显存监控与llama.cpp参数调优
Qwen3.5-4B-Claude-4.6-Opus-Reasoning-Distilled-GGUF是基于Qwen3.5-4B的推理蒸馏模型,特别强化了结构化分析、分步骤回答、代码与逻辑类问题的处理能力。该版本以GGUF量化形态交付,适合本地推理和Web镜像部署。
我是有底线的