文章目录
llamafile 是一种可在你自己的电脑上运行的可执行大型语言模型(LLM),它包含了给定的开放 LLM 的权重,以及运行该模型所需的一切。让人惊喜的是,你无需进行任何安装或配置。
Github
官网
本地部署
- 下载llava-v1.5-7b-q4.llama 文件 (3.97 GB)
bash
# 执行权限
chmod +x llava-v1.5-7b-q4.llamafile
# 运行 llama
./llava-v1.5-7b-q4.llamafile -ngl 9999