Mac环境 llamafile 部署大语言模型LLM

文章目录

llamafile 是一种可在你自己的电脑上运行的可执行大型语言模型(LLM),它包含了给定的开放 LLM 的权重,以及运行该模型所需的一切。让人惊喜的是,你无需进行任何安装或配置。

Github

官网

本地部署

bash 复制代码
# 执行权限
chmod +x llava-v1.5-7b-q4.llamafile
# 运行 llama
./llava-v1.5-7b-q4.llamafile -ngl 9999


相关推荐
米优10 分钟前
C/C++中实现自定义自动释放堆内存空间类
c语言·开发语言·c++
Hncj202215 分钟前
项目02--JsonRpc
linux·c++·ubuntu·rpc
挖矿大亨36 分钟前
C++中的引用
开发语言·c++
Larry_Yanan1 小时前
Qt多进程(四)QTcpSocket
开发语言·c++·qt·ui
superman超哥1 小时前
仓颉内存管理深度探索:引用计数的实现原理与实战
c语言·开发语言·c++·python·仓颉
TechPioneer_lp2 小时前
27届暑期实习内推:网易美团京东快手等
数据结构·c++·人工智能·笔记·机器学习·面试
小无名呀2 小时前
RAII 智能指针
c++
空白诗2 小时前
昇腾 NPU 落地 Llama3-8B:模型获取到数学解题推理的全流程实战
人工智能·ai·语言模型·npu
Once_day2 小时前
CC++八股文之基础语法(2)
c语言·c++