ollama v0.13.2 最新更新详解:Qwen3-Next首发与性能优化

2025年12月4日,ollama v0.13.2版本迎来预发布,并于2025年12月9日正式发布。本次更新在模型能力、性能优化和问题修复方面都有重要提升。

1. 新增模型

  • Qwen3-Next
    Qwen3-Next是Qwen3-Next系列的首个版本,在参数效率和推理速度方面表现优秀。该系列的引入旨在为用户提供更高效的推理过程,同时保持较低的资源占用。

2. 性能优化

  • 启用Flash Attention(适用于视觉模型)
    对包括mistral-3、gemma3、qwen3-vl在内的视觉模型,Flash Attention功能现已默认开启。这一优化提升了在提供图片作为输入时的显存利用率和整体性能,让视觉模型在处理图像任务时更加高效稳定。

3. 问题修复

  • 多GPU CUDA机器的GPU检测修复
    修复了在多GPU CUDA环境下的GPU检测问题,保证了部署时对硬件资源的正确识别与调用。
  • deepseek-v3.1思考状态问题修复
    修复了deepseek-v3.1在Ollama应用中,即使关闭"思考"功能仍然持续进行思考的问题,使其在应用场景中更符合用户的预期设置。

版本概述

代码地址:github.com/ollama/ollama

v0.13.2是一次兼顾功能拓展、性能优化和稳定性提升的更新,特别是首发的Qwen3-Next模型,以及Flash Attention在视觉模型中的默认启用,将为开发者和用户带来更顺畅的使用体验。

相关推荐
ohyeah12 小时前
打造 AI 驱动的 Git 提交规范助手:基于 React + Express + Ollama+langchain 的全栈实践
langchain·全栈·ollama
cn_mengbei16 小时前
从零到一:基于Qt on HarmonyOS的鸿蒙PC原生应用开发实战与性能优化指南
qt·性能优化·harmonyos
DemonAvenger16 小时前
Redis慢查询分析与优化:性能瓶颈排查实战指南
数据库·redis·性能优化
triumph_passion18 小时前
Zustand 从入门到精通:我的工程实践笔记
前端·性能优化
shughui18 小时前
JMter(六):jmete变量提取常用方式
jmeter·性能优化
dyxal20 小时前
Excel情感标注工具性能优化实战:从卡顿到流畅的蜕变
网络·性能优化·excel
小宇的天下20 小时前
Calibre 3Dstack --每日一个命令days8【connected】(3-8)
运维·服务器·性能优化
维度攻城狮20 小时前
科研提速!Zotero Awesome GPT 搭配本地 Ollama 模型使用指南
gpt·zotero·ollama·awesome gpt
山峰哥20 小时前
数据库工程与SQL调优实战:从原理到案例的深度解析
java·数据库·sql·oracle·性能优化·编辑器
IT大白21 小时前
性能优化篇
数据库·性能优化