qwen3.5-35b-a3b - qwen3.5-35b-a3b技术,学习,经验文章

晨欣

3 个月前

单卡 L20 48GB实测｜同是 Q8_0，为什么 Qwen3.6 在 llama.cpp 长上下文下比 Qwen3.5 更慢？关键词： Qwen3.5、Qwen3.6、llama.cpp、GGUF、Q8_0、TTFT、Prefill、长上下文、L20 48GB、推理性能、单卡部署