ollama

福大大架构师每日一题2 天前
安全·性能优化·ollama
ollama v0.23.3 发布:MLX 性能优化、安全加固与传输并发控制2026年5月12日,Ollama 团队正式发布了 v0.23.3 版本。本次更新虽然只有 6 个 commit,但涉及 MLX 推理引擎优化、应用更新机制安全加固、传输并发控制、测试体系完善等多个关键领域。本文将基于官方发布说明,逐条解析本次更新的技术细节和实际影响。
魔极客3 天前
docker·1panel·ollama
1panel面板安装ollama的详细过程Ollama 是一个强大的开源工具,它允许您在本地轻松运行、管理和部署大型语言模型(LLM)。结合 1Panel 这款现代化的 Linux 服务器运维管理面板,我们可以通过图形化界面,以更便捷、更安全的方式完成 Ollama 的安装与配置。本教程将手把手带您完成整个过程。
周公3 天前
python·ai·llama·vllm·ollama
记一次在双 RTX 3090 工作站上部署 vLLM 与 Qwen3.6-35B-AWQ 的实战记录最近需要本地部署大模型推理服务,目标是运行 Qwen3.6-35B 的 INT4 量化版本(AWQ 格式),并使用高性能推理引擎 vLLM 提供服务。由于模型采用 AWQ 量化,且需要较新的 CUDA 环境,现有的 CUDA 11.5 和旧版驱动已经不满足要求。因此,决定将 NVIDIA 驱动和 CUDA Toolkit 升级到 CUDA 12.9 兼容版本,并在 Docker 容器中运行 vLLM,以实现环境隔离与快速部署。
Daydream.V6 天前
人工智能·langchain·ollama·functioncalling·大模型部署
从零搭建 AI Agent:LLM Agent+Function Calling+Dify 本地部署 + Coze 实战全攻略随着大模型技术快速发展,LLM Agent与Function Calling已成为 AI 应用落地的核心能力。传统 LLM 仅能处理文本生成,存在信息滞后、缺乏行动力、逻辑不精确三大痛点,而 Agent 通过自主规划、记忆、工具调用实现复杂任务,Function Calling 则打通大模型与外部世界的连接。
悟空码字7 天前
llm·aigc·ollama
别再让大模型吃灰!Ollama 从安装到生产级调优,一篇搞定大家好,我是小悟。Ollama 是一个轻量级、可扩展的本地大语言模型运行框架,旨在简化 LLM 的部署、管理和使用流程。它将复杂的模型下载、环境配置、API 服务封装为简单的命令行操作,让开发者能在个人电脑、服务器甚至边缘设备上快速运行 Llama、Mistral、Gemma、Qwen 等主流开源模型。
福大大架构师每日一题8 天前
缓存·ollama
ollama v0.23.2 更新:/api/show 缓存提升 6.7 倍,Claude Desktop 集成调整Ollama 在 2026 年 5 月 8 日正式发布了 v0.23.2 版本。本次更新虽然没有引入全新的模型架构或大规模功能扩展,但在核心性能优化、用户体验细节以及集成生态的管理上进行了重要的迭代。从更新日志来看,本次发布的重点在于提升 API 响应速度、优化备份机制、调整第三方集成策略,并对 MLX 运行时的图像生成界面进行了清理。
流放深圳10 天前
人工智能·大模型·ollama·springai
抓住 AI 人工智能的风口之第 1 章 —— 8万字熟练掌握 SpringAI 编程核心概念Spring AI 是 Spring 官方推出的 AI 应用开发框架,旨在帮助 Java 开发者以统一、便捷的方式将 AI 能力集成到企业级应用中。你可以把它理解为 Java 生态中的 "AI 万能转接头"。🎯 核心定位:简化 Java 开发者的 AI 集成。它的核心目标是解决 AI 模型 API 碎片化的问题。通过提供一套标准化的抽象接口,让开发者可以用一套代码调用 OpenAI、阿里云通义千问、DeepSeek 等几乎所有主流模型,更换底层服务只需修改配置,无需改动业务代码。
gs8014011 天前
ollama·openwebui
解决 Open WebUI 访问宿主机 Ollama API “连接超时/卡住”的终极指南目录解决 Open WebUI 访问宿主机 Ollama API “连接超时/卡住”的终极指南1. 现象描述:明明 IP 对了,为什么还是不通?
曲幽11 天前
python·ai·llm·agent·fastapi·web·chat·httpx·ollama
初探:用 FastAPI 搭建你的第一个 AI Agent 接口看到有朋友留言说想了解下 FastAPI 开发 AI Agent 相关的话题,之前有玩过一段时间,奈何本机电脑配置一般,跑起来不流畅,便作罢了,但该走的路,该踩的坑也是一样没落下,最近整理了下,把代码也再跑了下,后续会逐渐分享给各位参考,今天先开个头。
小明说Java14 天前
ollama·腾讯云ai代码助手
Ollama本地安装基础教程在安装ollama的时候,大家有没有下载了几个AI大模型后,惊讶地发现系统盘空间所剩无几?或者想要将模型文件集中管理,却不知道如何改变默认存储路径?本文,我将手把手教你如何完全掌控Ollama的安装和模型存储位置,让大模型“住”进你指定的文件夹!
福大大架构师每日一题14 天前
ollama
ollama v0.23.0 发布:原生支持 Claude Desktop 模型推荐与底层稳定性全面升级2026年5月3日,ollama正式推送v0.23.0最新版本,本次版本迭代带来了重量级功能适配、前端交互重构、底层兼容性修复以及代码健壮性增强等多项核心变更。版本累计提交5次代码合并,涉及42个文件改动,完成3466行代码新增与467行代码删减,从上层应用交互、命令行启动能力、前端模型展示逻辑,到底层GGML硬件初始化、Metal后端适配、Windows网络兼容、错误日志捕获机制都进行了全方位优化,同时原生接入Claude Desktop完整生态,实现Claude Cowork、Claude Code在
福大大架构师每日一题17 天前
架构·ollama
ollama v0.22.1 重大更新全解析:新增Poolside集成、模型推荐机制与多架构适配Ollama作为开源大模型本地化部署的核心工具,凭借轻量、易用、高效的特性,成为开发者实现大模型本地运行的首选方案。近日,Ollama正式发布v0.22.1版本,此次更新堪称一次全方位的功能升级与体验优化,涵盖新增Poolside集成、完善模型推荐机制、优化量化策略、适配多模型架构、修复核心Bug等多个维度,涉及代码修改文件数十个,新增代码数千行,进一步提升了Ollama的兼容性、实用性和性能表现。
不懒不懒17 天前
人工智能·分类·数据挖掘·大模型·ollama
【从零入门本地大模型:Ollama 安装部署 + Qwen2.5 实现零样本情感分类】目录一、准备工作二、安装 Ollama 客户端三、一键运行你的第一个大模型四、基于 Qwen2.5 实现零样本情感文本分类实战
岛雨QA18 天前
人工智能·llm·ollama
🎉Token自由-Ollama部署本地大模型超详细操作指南Ollama是一个专为macOS设计的开源工具,让你能在自己的Mac上轻松运行各类大语言模型。它最大的特点是“极简”--无需复杂的Python环境配置,无需CUDA驱动,只要一条命令就能完成模型的下载、安装和运行。
青龙小码农21 天前
elasticsearch·milvus·ollama·rga
milvus+elasticsearch+ollama实现企业级RAG搭建[安装参考](https://blog.csdn.net/wenwang3000/article/details/145705858) 这里需要2种类型的
福大大架构师每日一题23 天前
ollama
ollama v0.21.2 最新更新详解:OpenClaw 更稳了,模型推荐顺序终于固定,云端结构化输出说明也补上了2026年4月25日,ollama 发布了 v0.21.2 版本。 这次更新虽然版本号不大,但改动非常集中,主要围绕 launch 启动体验、OpenClaw 集成、模型推荐顺序固定、managed integration 配置漂移修复、文档补充 这几条主线展开。
nicepainkiller24 天前
ollama·coza
Coza 本地搭建 + Ollama支持我这边是 window11 系统,安装 coza 系统 需要一起安装很多 配套周边软件。 所以这边 选取 docker 的方式安装。docker 按照的好处是 通过配置文件 可以一件帮助我们把周边软件一起安装了。不必自己手动配置。 然后 wls2 我这边之前就已经安装好了。wls2 云运行 在 windos 上的 ubuntu 系统。Ubuntu 运行 跑 docker 更加的方便
java_logo24 天前
linux·docker·容器·ollama·open-webui·open-webui部署·open-webui教程
Docker 部署 Open WebUI + Ollama 完整教程(Windows / Linux 通用)—— 打造自己的本地OpenAI在本地搭建专属大模型平台,不用依赖云端服务,既能实现可视化聊天交互,又能保证数据隐私——今天就给大家分享最省心的方案:用 Docker 一键部署 Open WebUI + Ollama,全程步骤清晰,Windows 和 Linux 系统都能适配,还会解决部署中最常见的模型识别、容器通信等问题。
钟智强25 天前
安全·web安全·网络安全·ollama·deepseek
国内环境Ollama安装与DeepSeek-R1:1.5b部署全攻略你是否遇到过这样的困境:在安全测试中需要一个能理解复杂日志、分析攻击链路的AI助手,却又担心敏感数据传到云端?想部署本地大模型,却被繁琐的环境配置和龟速的模型下载劝退?今天,我们就来解决这个痛点——在国内网络环境下,用Ollama部署DeepSeek-R1:1.5b蒸馏模型,打造属于网安人的专属推理引擎。
千江明月1 个月前
开发语言·python·ollama·qwen模型
Ollama安装的详细步骤以及Python调用Qwen下面为整理的 Ollama 详细安装步骤 以及 Python 调用本地 Qwen 模型 的完整指南。Ollama 是目前最简单的本地大模型运行工具,它会自动处理驱动、依赖和量化问题。