qwen

进击切图仔3 天前
torch·tensorrt·qwen
微调 qwen 时候踩坑记录在把 Qwen2.5 等大模型真正部署到 GPU 服务器的过程中,环境配置、磁盘管理和推理加速的坑远比想象的多。本文将记录一次完整踩坑经历,覆盖系统盘告急、nvcc 消失、FlashAttention 编译慢、LoRA 合并陷阱、TensorRT 构建与推理等环节,并提供可复现的解决脚本。
故事还在继续吗9 天前
macos·llm·qwen
Mac 本地部署大模型环境信息整套本地 AI 系统分为五层,每层职责明确,可按需替换其中某个组件:本教程重点覆盖 Ollama 推理层 和 Open WebUI 界面层 的安装与联通,是整个系统的基础骨架。
YJlio14 天前
自动化运维·qwen·版本更新·ai agent·插件系统·openclaw·clawhub
OpenClaw v2026.3.23-2 更新解析:Qwen 接入、Knot 主题、插件稳定性、升级验证与避坑清单大家好,我是 杨利杰YJlio。这篇文章继续整理 OpenClaw 版本更新记录。本文重点看的是 OpenClaw v2026.3.23-2。
YJlio14 天前
自动化运维·qwen·版本更新·ai agent·插件系统·xai·openclaw
OpenClaw v2026.3.28 更新解析:Qwen 认证迁移、xAI Responses API、MiniMax 图像生成、插件审批与升级避坑大家好,我是 杨利杰YJlio。这篇文章继续整理 OpenClaw 版本更新记录。本文重点看的是 OpenClaw v2026.3.28。
今夕资源网19 天前
qwen·语音克隆·克隆声音·qwen3tts·qwentts·tts软件·音色设计
Qwen3-TTS官方原功能启动版一键启动包 支持3秒克隆 情绪控制 语音设计在 2026 年 1 月 22 日,Qwen 团队正式发布了 Qwen3-TTS 系列模型。这不仅仅是一次简单的版本更新,而是一次在语音生成技术上的重大突破。 作为基于 Qwen3-TTS-Tokenizer-12Hz 开发的强大语音生成工具,它为开发者和用户提供了目前市面上最全面的语音生成功能,彻底改变了人机交互的听觉体验。 🌟 为什么 Qwen3-TTS 如此强大? Qwen3-TTS 旨在打破传统语音合成的局限,它具备了多项令人瞩目的核心特性: 极致的低延迟流式生成 这是实时交互场景下的杀手锏。得
搬砖魁首23 天前
docker·qwen·openclaw·龙虾
基础能力系列 - 如何安全养虾? - 容器化部署龙虾参考: https://juejin.cn/post/7616025751746297862pairing required
Anesthesia丶25 天前
pytorch·python·lora·llm·qwen·vllm
Qwen2.5-1.5b 模型部署与LORA训练笔记这两天心血来潮,想了解一下小模型的部署与训练的过程,刚好家里有张3080魔改20g可以试试水于是说干就干~在这里简单记录以下相关的笔记。
搬砖的前端1 个月前
前端·ai·mac·ai编程·qwen·trae·qwen3.6
本地模型+TRAE CN 打造最优模型组合实测:开源主模型+本地辅模型,对标GPT5.2/5.3/Gemini-3-Flash由于Cursor / Trae 国际版等AI编辑器的计费方式改变导致使用成本增加,尤其会员额度一次次用光后(本人就是)。替代使用TRAE CN基本上都会遇到过一个痛点:热门模型(如GLM5.1/Doubao-speed-2.0-code等)排队严重,动辄等待十数分钟,严重拖慢开发效率。
碳基硅坊1 个月前
人工智能·qwen·qwen3.6
Mac Studio M3 Ultra 运行大模型实测:Qwen3.6 vs 6款主流模型工具调用对比苹果 M3 Ultra 芯片将统一内存容量推升至 512GB,让本地运行千亿参数大模型成为可能。这次测试在 Apple M3 Ultra + 256GB 内存环境下,对比 7 款主流大模型在工具调用、代码生成、推理速度等多个维度的表现。数据全部基于实测,Qwen 系列模型在工具调用方面展现出压倒性优势。
带娃的IT创业者1 个月前
人工智能·python·ai·开源·大模型·qwen·编程代理
深度解析 Qwen3.6-35B-A3B:重塑 AI 编程代理的开源新标杆在开源大模型领域,通义千问团队再次投下了一枚重磅炸弹。近日,Qwen3.6-35B-A3B 模型正式发布,并迅速登顶 Hacker News 热榜,获得 634 票的高度关注。这不仅仅是一个参数量的更新,更是一次针对“Agentic Coding(代理编程)”能力的深度优化。
mpr0xy1 个月前
人工智能·ai·大语言模型·qwen·deepseek
《AI怎么一步步变聪明的?》系列(六)中国大模型崛起之路:从“追赶者”到“解题人”站在2026年4月的春光里,当我们翻开最新的行业简报,一个足以载入史册的数据跃然纸上:中国AI大模型的周Token调用量,已经连续四周碾压美国,甚至在OpenRouter这类全球聚合平台上,中国大模型的消耗占比高达61%。
熊猫钓鱼>_>1 个月前
人工智能·音视频·agent·qwen·ollama·openclaw·happyhorse-1.0
私有化AI视频助手搭建实录:当Ollama遇上OpenClawAI视频生成的热度仍在攀升,从HappyHorse-1.0匿名屠榜到各家模型竞相开源,创作者似乎迎来了最好的时代。但一个现实问题始终悬而未决:云端服务固然方便,可谁愿意把未公开的脚本、商业素材甚至客户数据,毫无保留地交给一个黑盒API?
Cachel wood1 个月前
人工智能·python·自动化·llm·qwen·ollama·gemma4
Macbook M4 pro本地部署大模型|Ollama+Gemma4/Qwen3.524 GB内存安装ollama Ollama负责模型的下载、加载和运行,还自带本地API,不用手动配置,是目前新手最省事的方案,没有之一。
dax eursir1 个月前
qwen·视觉语言模型·多模态ai·ocr识别
Qwen3-VL-2B vs BLIP-2:轻量视觉模型部署效率对比分析你有没有遇到过这样的场景:想在一台没有显卡的办公电脑上跑一个能看图说话的AI工具,结果发现动辄十几GB的模型根本加载不动?或者在边缘设备上部署图文理解服务时,推理延迟高达几十秒,用户等得不耐烦直接关掉页面?
汀江游非侠1 个月前
qwen·ai模型下载
模型下载与使用根据个人电脑配置及使用场景,我选择模型为Qwen-4B-Chat-Q4_K_M模型需要从Huggingface模型库下载,需要使用平台工具来下载
gujunge2 个月前
ai·大模型·llm·openai·qwen·rag·spring ai·deepseek
Spring with AI (6): 记忆保持——会话与长期记忆本文代码: https://github.com/JunTeamCom/ai-demo/tree/release-6.0 (JDBC-MySQL版本的会话持久化)
gujunge2 个月前
ai·大模型·llm·openai·qwen·rag·spring ai·deepseek
Spring with AI (5): 搜索扩展——向量数据库与RAG(下)本文代码: https://github.com/JunTeamCom/ai-demo/tree/release-5.0 https://github.com/JunTeamCom/ai-demo-tools/tree/release-5.0/data-loader
gujunge2 个月前
ai·大模型·llm·openai·qwen·rag·spring ai·deepseek
Spring with AI (4): 搜索扩展——向量数据库与RAG(上)本文代码: https://github.com/JunTeamCom/ai-demo/tree/release-4.0 https://github.com/JunTeamCom/ai-demo-tools/tree/release-4.0/data-loader
碳基硅坊2 个月前
人工智能·qwen·模型微调
Qwen3.5-4B 微调实战:LLaMA-Factory 打造医疗AI助手最近在帮一个医疗创业团队做技术支持,他们想把通用大模型改造成能回答专业医疗问题的智能助手。今天就把整个过程整理出来,希望对有类似需求的朋友有所帮助。