Intel笔记本也能部署大模型（利用Ultra系列gpu通过优化版ollama实现）

努力改掉拖延症的小白2025-11-30 23:44

很多小伙伴是不是也想尝试一下用自己的笔记本私有化部署一个大模型，百度上搜了一些教程，发现ollama是最省事的，然后一顿操作，确实可以了，但是很慢，而且发现如下图所示，为什么这个NPU和GPU都没有用，其实是版本装错了， Ollama 默认配置没有启用你的 Intel Arc GPU 和 NPU，加上模型 / 系统适配问题导致资源没利用起来，今天教大家怎么充分利用GPU。

文章目录

[1.下载Ollama 英特尔优化版](#1.下载Ollama 英特尔优化版)
[2. 运行ollama](#2. 运行ollama)
[3. 下载大模型](#3. 下载大模型)
[4. 测试效果](#4. 测试效果)

1.下载Ollama 英特尔优化版

地址：https://www.modelscope.cn/models/intel/ollama/files

下载 Ollama 英特尔 Windows 优化版。

然后，将 zip 文件解压到一个文件夹中。

2. 运行ollama

打开刚才解压后的文件夹，在文件夹上面的路径中输入cmd，然后敲回车，就会出现一个cmd命令行目录。

在命令提示符中运行 start-ollama.bat 即可启动 Ollama Serve。随后会弹出一个窗口，如下所示

3. 下载大模型

在ollama官网中找到要下载的网站，最大显存可以对标自己笔记本内存*0.8。

模型网站：https://ollama.com/search

目前来看推荐qwen3，点开之后选择对应的版本，这里可以先下载一个4b的看看效果，如下图所示

接下来通过在相同的命令提示符（非弹出的窗口）中运行 ollama run qwen3:4b（可以将当前模型替换为你需要的模型），即可在 Intel GPUs 上使用 Ollama 运行 LLMs：

4. 测试效果

安装完大模型之后，可以随便问一个问题，这时候可以看到，GPU已经100%了，说明已经不是单纯靠cpu了，一定充分利用intel自带的GPU了。

上一篇：基于边缘计算的智能视频分析系统设计

下一篇：【Day7-10】开源鸿蒙组件封装实战（3）仿知乎日报的首页轮播图实现

热门推荐

01GitHub 镜像站点 02OpenClaw 使用和管理 MCP 完全指南 03OpenClaw + 飞书（Feishu）环境搭建指南 04OpenClaw优化飞书API 额度已耗尽问题 05Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 06小黑课堂计算机二级WPSoffice题库软件下载安装教程（2026年3月最新版）07Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 08Window 10部署openclaw报错node.exe : npm error code 128 09OpenClaw大龙虾机器人完整安装教程 10网站改了域名，如何查找？