ollama v0.13.2 最新更新详解:Qwen3-Next首发与性能优化

2025年12月4日,ollama v0.13.2版本迎来预发布,并于2025年12月9日正式发布。本次更新在模型能力、性能优化和问题修复方面都有重要提升。

1. 新增模型

  • Qwen3-Next
    Qwen3-Next是Qwen3-Next系列的首个版本,在参数效率和推理速度方面表现优秀。该系列的引入旨在为用户提供更高效的推理过程,同时保持较低的资源占用。

2. 性能优化

  • 启用Flash Attention(适用于视觉模型)
    对包括mistral-3、gemma3、qwen3-vl在内的视觉模型,Flash Attention功能现已默认开启。这一优化提升了在提供图片作为输入时的显存利用率和整体性能,让视觉模型在处理图像任务时更加高效稳定。

3. 问题修复

  • 多GPU CUDA机器的GPU检测修复
    修复了在多GPU CUDA环境下的GPU检测问题,保证了部署时对硬件资源的正确识别与调用。
  • deepseek-v3.1思考状态问题修复
    修复了deepseek-v3.1在Ollama应用中,即使关闭"思考"功能仍然持续进行思考的问题,使其在应用场景中更符合用户的预期设置。

版本概述

代码地址:github.com/ollama/ollama

v0.13.2是一次兼顾功能拓展、性能优化和稳定性提升的更新,特别是首发的Qwen3-Next模型,以及Flash Attention在视觉模型中的默认启用,将为开发者和用户带来更顺畅的使用体验。

相关推荐
爪洼守门员4 小时前
前端性能优化
开发语言·前端·javascript·笔记·性能优化
行走的陀螺仪6 小时前
重绘和重排怎么触发?怎么优化?
前端·css·性能优化·css3·浏览器原理
UWA6 小时前
Gears 实测室:第八期・全面透视4X游戏性能瓶颈
游戏·性能优化·游戏开发·uwa
拾忆,想起9 小时前
Dubbo服务依赖问题终结指南:从根因分析到系统化解决方案
微服务·性能优化·架构·dubbo·safari
FrameNotWork9 小时前
HarmonyOS 应用性能优化全指南:渲染、状态管理、线程、内存、网络一站式提升
华为·性能优化·harmonyos
by__csdn9 小时前
javascript 性能优化实战:垃圾回收优化
java·开发语言·javascript·jvm·vue.js·性能优化·typescript
by__csdn10 小时前
JavaScript性能优化:减少重绘和回流(Reflow和Repaint)
开发语言·前端·javascript·vue.js·性能优化·typescript·vue
德昂信息dataondemand10 小时前
数据仓库性能优化:从模型到调度的系统性实践
数据仓库·性能优化
拾忆,想起10 小时前
Dubbo通信协议全景指南:如何为你的微服务选择最佳通信方案?
微服务·云原生·性能优化·架构·dubbo·safari