ollma 本地部署大模型

因为我本地是 windows 的系统,所以这里直接写的是通过 docker 来实现本地大模型的部署。

windows 下 WSl 的安装这里就不做重复,详见 windows 部署 mindspore GPU 开发环境(WSL)

一、Docker 部署 ollma

1. 拉取镜像(笔记本没有对象显卡,所以拉取的镜像是CPU 版本的):
bash 复制代码
docker pull ollama/ollama:0.3.7-rc6
2. 启动镜像

仅 CPU 版本启动

bash 复制代码
docker run -d -v /home/jie/ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama:0.3.7-rc6

此时访问本地的 11434 端口,可以看到 Ollama is running 的字样

1.1 通过对话交互的方式启动 llama3

ollma 贴心的提供了很多模型和参数,详见 Ollama library⁠ 我这里选择启动的是 llama3 模型 参数量是 8b

bash 复制代码
docker exec -it ollama ollama run llama3.1

首次启动需要下载参数,所以会花费一些时间。

并在光标闪烁的地方开始对话

当然,8b 模型的结果有时候不太好,如果电脑内存在 60G 以上,可以大胆的尝试 70b 的模型。

1.2 通过服务的方式调用 llama3

bash 复制代码
curl http://localhost:11434/api/generate -d '{
  "model": "llama3.1", 
  "prompt": "帮我写一条Elasticsearch的聚合 a 字段的查询语句",
  "format": "json^C
  "stream": false
}'

参数 "model" 表示模型名,一定要 执行过 docker exec -it ollama ollama run 才可以正常响应。这种方式的响应时间比较长,原因有可能是每次请求的时候都会重新启动模型的原因(我并没有找到让模型一直保持启动状态的参数)。API列表

获取响应中的 response 字段就是大模型生成的回答。

二、附录

2.1 Ollama 常用命令

bash 复制代码
Usage:
  ollama [flags]
  ollama [command]

Available Commands:
  serve       Start ollama # 启动ollama
  create      Create a model from a Modelfile # 从模型文件创建模型
  show        Show information for a model # 显示模型信息
  run         Run a model # 运行模型,会先自动下载模型
  pull        Pull a model from a registry # 从注册仓库中拉取模型
  push        Push a model to a registry # 将模型推送到注册仓库
  list        List models # 列出已下载模型
  ps          List running models # 列出正在运行的模型
  cp          Copy a model # 复制模型
  rm          Remove a model # 删除模型
  
  help        Help about any command

Flags:
  -h, --help      help for ollama
  -v, --version   Show version information

Use "ollama [command] --help" for more information about a command.
相关推荐
摆烂小白敲代码9 分钟前
大一新生以此篇开启你的算法之路
c语言·数据结构·c++·人工智能·经验分享·算法
盘古信息IMS15 分钟前
构建数字生态,布局智能未来——驱动PCB行业新质生产力发展的引擎
大数据·人工智能
Qspace丨轻空间39 分钟前
光影漫游者:沉浸式科技空间,打造未来体验—轻空间
大数据·人工智能·科技·安全·娱乐
python1561 小时前
使用PyTorch Lightning力量精简空间分析
人工智能·pytorch·python
双木的木1 小时前
数据分析1480 | 汇总17个工作必备的Python自动化代码(下)建议收藏!
运维·人工智能·python·sql·数据挖掘·数据分析·自动化
EasyCVR1 小时前
视频监控平台是如何运作的?EasyCVR视频汇聚平台的高效策略与实践
人工智能·音视频·视频编解码·视频监控·监控视频接入
api茶飘香1 小时前
精准电商营销:基于京东商品详情API返回值的数据分析
大数据·服务器·数据库·人工智能·python·数据分析·django
AI服务老曹1 小时前
形式向好、成本较低、可拓展性较高的名厨亮灶开源了
大数据·人工智能·开源·智慧城市·能源
企智汇软件2 小时前
制造业项目管理系统:企智汇软件专为制造企业量身定制项目管理
大数据·人工智能·项目管理软件·项目管理系统·企智汇·企智汇软件
杰克逊的日记2 小时前
PyTorch----模型运维与实战
人工智能·pytorch·python·gpu