open-webui+ollama本地部署Llama3

前言

Meta Llama 3 是由 Meta 公司发布的下一代大型语言模型,拥有 80 亿和 700 亿参数两种版本,号称是最强大的开源语言模型。它在多个基准测试中超越了谷歌的 Gemma 7B 和 Mistral 7B Instruct 模型。

安装

1.gpt4all

https://github.com/nomic-ai/gpt4all

直接选择系统点击安装,Windows就点Windows,下载完后直接安装即可!

内置模型点击Download即可选择你喜欢的大语言模型,8G显存选LLama3 8B即可,70B需要40G的显存才能正常使用。其他模型类似

复制代码
C:\Users\admin\AppData\Local\nomic.ai\GPT4All           #下载模型保存路径(如果看不到显示隐藏文件)

也可以下载大模型(或者你微调的模型)放入该路径,重新启动即可,当做一个webui界面

2.open-webui+ollama

ollama

https://github.com/ollama/ollama?tab=readme-ov-file

选择对应系统安装

安装完后cmd命令行窗口,运行

复制代码
ollama run llama3             #下载Llama3 8b
ollama run llama3:70b      #下载Llama3 70b  参考下图

模型保存在改路径下,

安装完Ollama后用open-webui可视化

open-webui

https://github.com/open-webui/open-webui?tab=readme-ov-file

使用docker安装

左下角搜索启用或关闭Windows功能,勾选适用于Linux的Windows子系统 ,确定,先不重启

安装docker

https://www.docker.com/products/docker-desktop/

下载完直接安装,重启,确定即可

打开ollama和docker,cmd命令行:(打开全局代理)

复制代码
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

下载完后

http://127.0.0.1:3000

点击右上角设置,选择简体中文

下载模型 llama3:8b ,点击下载

最后可以愉快玩耍了

补:lmstudio(问题多)

https://lmstudio.ai/

国内安装显示没网,开全局代理也没用,版本更新也快,把huggingface换成国内镜像hf-mirror,没用,又把downloads.json文件更换下载地址,能下但是下载速度贼慢,

有兴趣可以看看https://www.bilibili.com/video/BV1dw4m1f7zQ/?spm_id_from=333.337.search-card.all.click&vd_source=69a72fa3fe0bf11ff1588ccaeb91737a

最好找个老版本

相关推荐
bulingg5 小时前
大模型——LLAMA框架介绍(含手撕)
llama
love530love7 小时前
冷门干货!llama.cpp 自带原生网页聊天 UI,无需第三方依赖一键开启
人工智能·windows·ui·llama·flash-attention·switch-cuda
HyperAI超神经1 天前
数据集汇总丨英伟达/OpenAI及多所科研机构开源推理数据集,覆盖数学/全景空间/Wiki问答/科研任务/视觉常识等
人工智能·深度学习·机器学习·数据集·ai编程·llama·图像合成
黑蛋同志2 天前
Ubuntu安装llama.cpp
linux·ubuntu·llama
耶夫斯计3 天前
Agent入门-Agent实战(skills\tools\prompt\subagents)
人工智能·prompt·llama
qq_452396233 天前
【模型手术室】第四篇:全流程实战 —— 使用 LLaMA-Factory 开启你的第一个微调任务
人工智能·python·ai·llama
忧郁的橙子.3 天前
11-Xtuner具体使用以及LLama Factory与Xtuner多卡微调大模型
llama·xtuner·分布式微调大模型
bugs_more_more3 天前
ollama下通过LLaMa-Factory微调qwen2.5:0.5b
llama
摸鱼仙人~4 天前
拆解 Llama 3.1 8B:从模型结构看懂大语言模型的核心设计
人工智能·语言模型·llama
python百炼成钢4 天前
16_RK3588 Llama-3-8B模型部署
linux·服务器·人工智能·llama