Ollama和qwen2.5:7b本地部署

下载Ollama

方式1:通过官网直接使用命令通过脚本一键安装

bash 复制代码
curl -fsSL https://ollama.com/install.sh | sh

这种方式如果是国内用户一般会失败,因为命令会从国外资源下载。所以pass

方式2:到gitcode中提供的方式在线下载

bash 复制代码
curl -fsSL https://ollama.com/install.sh | sh

这个方式可以下载,就是太慢

方式3:到官网手动下载,通过命令离线安装

官网下载方式:https://docs.ollama.com/linux

方式4:通过网盘先下载,然后根据官网的安装命令,通过如下命令安装

bash 复制代码
sudo tar x -C /usr

我这里下载的是ollama-linux-amd64.tar.zst,这是一种新的压缩格式,,所以下载后需要下面方式解压:

复制代码
# 1. 先安装 zstd 工具(如果还没装)
sudo apt update
sudo apt install zstd -y

# 2. 使用正确的参数解压
sudo tar --use-compress-program=unzstd -xvf ollama-linux-amd64.tar.zst -C /usr

然后开始ollama的安装,如下:

bash 复制代码
# 1. 验证文件是否正确解压
ls -la /usr/bin/ollama
# 应该能看到 ollama 可执行文件

# 2. 创建 ollama 用户(用于运行服务)
sudo useradd -r -s /bin/false -m -d /var/lib/ollama ollama

# 3. 创建系统服务文件
sudo vim /etc/systemd/system/ollama.service

粘贴以下内容:

bash 复制代码
[Unit]
Description=Ollama Service
After=network-online.target

[Service]
ExecStart=/usr/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
Environment="OLLAMA_HOST=0.0.0.0:11434"

[Install]
WantedBy=multi-user.target
bash 复制代码
# 4. 启动服务
sudo systemctl daemon-reload
sudo systemctl start ollama
sudo systemctl enable ollama

# 5. 验证安装
ollama --version

到此Ollama已经安装成功了,下面开始安装大模型Qwen2.5-7B

bash 复制代码
ollama run qwen2.5:7b	直接运行,自动下载

安装后就可以开始对话了。

或者通过ollama的api方式调用qwen2.5也可以,如下:

bash 复制代码
curl http://localhost:11434/api/generate -d '{
  "model": "qwen2.5:7b",
  "prompt": "你好",
  "stream": true
}'

然后就会看到如下信息就表示成功啦:

bash 复制代码
{"model":"qwen2.5:7b","created_at":"2026-03-19T02:04:30.496331334Z","response":"你好","done":false}
{"model":"qwen2.5:7b","created_at":"2026-03-19T02:04:47.623658942Z","response":"有什么","done":false}
{"model":"qwen2.5:7b","created_at":"2026-03-19T02:04:54.659688354Z","response":"问题","done":false}       
相关推荐
Flittly1 天前
【SpringAIAlibaba新手村系列】(13)Tool Calling 函数工具调用技术
java·spring boot·spring·ai
花千树-0101 天前
IndexTTS2 推理性能分析
人工智能·深度学习·ai·语音识别·tts
FPGA-ADDA1 天前
第四篇:射频数据转换器(RF-DAC)——重构模拟信号的关键
ai·fpga·rfsoc·vu13p·xczu47dr
coder阿龙1 天前
基于SpringAI+Qdrant+Ollama本地模型和向量数据库开发问答和RAG检索
java·数据库·spring boot·ai·数据库开发
科技峰行者1 天前
闪存创新赋能全域,闪迪构建AI存储全栈版图
人工智能·ai·存储·闪存·闪迪
Elastic 中国社区官方博客1 天前
Elasticsearch:运用 JINA 来实现多模态搜索的 RAG
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·jina
木斯佳1 天前
前端八股文面经大全:腾讯前端一面(2026-04-04)·深度解析
前端·ai·鉴权·monorepo
UltraLAB-F1 天前
GPU显存不足时的分配策略:渲染与仿真的显存争夺战解决方案
图像处理·算法·3d·ai·硬件架构
knqiufan1 天前
拆解 Claude Code SubAgent:隔离、专业化与权限设计
ai·agent·claude code
Old Uncle Tom1 天前
Claude Code 上下文压缩分析
人工智能·ai·agent