LocalAI 开源AI引擎,本地运行多模态模型无需GPU

文章目录

  • [LocalAI 开源AI引擎,本地运行多模态模型无需GPU](#LocalAI 开源AI引擎,本地运行多模态模型无需GPU)

LocalAI 开源AI引擎,本地运行多模态模型无需GPU

mudler 开源的 LocalAI 项目,目前获得 46,139 个 Star:

LocalAI 是开源AI引擎,支持运行多种AI模型,包括大语言模型、视觉模型、语音模型、图像生成模型、视频生成模型,可在任意硬件上运行,无需GPU。

LocalAI 兼容 OpenAI、Anthropic、ElevenLabs 等主流API接口,现有36+后端支持,包括 llama.cpp、vLLM、transformers、whisper、diffusers、MLX 等。

LocalAI 适配多种硬件平台,包括 NVIDIA、AMD、Intel、Apple Silicon、Vulkan,也支持仅使用CPU运行。

LocalAI 支持多用户使用,提供API密钥认证、用户配额、角色权限控制等功能。

LocalAI 内置AI代理,支持自主代理工具调用、RAG、MCP、技能扩展等能力。

LocalAI 采用隐私优先设计,所有数据处理均在用户本地基础设施完成,不会向外传输。

项目由 Ettore Di Giacinto 创建,目前由 LocalAI 团队维护。

快速安装

macOS 安装

用户可直接下载DMG安装包,安装后需执行命令清除隔离属性:

bash 复制代码
sudo xattr -d com.apple.quarantine /Applications/LocalAI.app

容器安装

LocalAI 提供 Docker、podman 等容器镜像,用户可根据硬件选择对应版本:

仅使用CPU运行:

bash 复制代码
docker run -ti --name local-ai -p 8080:8080 localai/localai:latest

使用NVIDIA GPU运行:

bash 复制代码
# CUDA 13
docker run -ti --name local-ai -p 8080:8080 --gpus all localai/localai:latest-gpu-nvidia-cuda-13
# CUDA 12
docker run -ti --name local-ai -p 8080:8080 --gpus all localai/localai:latest-gpu-nvidia-cuda-12

使用AMD GPU运行:

bash 复制代码
docker run -ti --name local-ai -p 8080:8080 --device=/dev/kfd --device=/dev/dri --group-add=video localai/localai:latest-gpu-hipblas

使用Intel GPU运行:

bash 复制代码
docker run -ti --name local-ai -p 8080:8080 --device=/dev/dri/card1 --device=/dev/dri/renderD128 localai/localai:latest-gpu-intel

使用Vulkan GPU运行:

bash 复制代码
docker run -ti --name local-ai -p 8080:8080 localai/localai:latest-gpu-vulkan

模型加载

LocalAI 支持多种来源的模型加载:

bash 复制代码
# 从模型库加载
local-ai run llama-3.2-1b-instruct:q4_k_m
# 从Huggingface加载
local-ai run huggingface://TheBloke/phi-2-GGUF/phi-2.Q8_0.gguf
# 从Ollama OCI registry加载
local-ai run ollama://gemma:2b
# 从YAML配置加载
local-ai run https://gist.githubusercontent.com/.../phi-2.yaml
# 从标准OCI registry加载
local-ai run oci://localai/phi-2:latest

LocalAI 可自动检测GPU能力,下载对应后端,无需用户手动配置。

2026年4月更新内容包括语音识别、人脸识别、Ollama API兼容、视频生成、后端版本自动升级、模型固定与按需加载切换、通用模型导入器,新增sglang、ik-llama-cpp、TurboQuant等多个后端。

项目开源地址:https://github.com/mudler/LocalAI

增sglang、ik-llama-cpp、TurboQuant等多个后端。

项目开源地址:https://github.com/mudler/LocalAI

相关推荐
云烟成雨TD12 小时前
Spring AI Alibaba 1.x 系列【69】Token 用量统计
java·人工智能·spring
十三画者12 小时前
【AI学习笔记】:DeepSeek 大模型本地部署与调用实战指南
人工智能
丁常彦-自媒体-常言道12 小时前
从首发4nm智驾芯片到兜底城市领航安全,比亚迪开启AI新征程
人工智能
小杨在厦门14 小时前
从AI验布到智能质检:纺织企业智能化升级的三个台阶
人工智能·服装·服装厂·服装机械·铺布机
达之云*驭影14 小时前
解锁流量密码:详解抖音AI智能推荐封面功能
人工智能
火山引擎开发者社区14 小时前
ArkClaw 投研助理 —— 零门槛做投研,从一句话开始产出你的第一份深度研报
人工智能
码农小白AI14 小时前
AI报告审核加速融入自动化实验室:IACheck破解智能设备时代报告管理新挑战
运维·人工智能·自动化
xingyuzhisuan14 小时前
自建聚合网关VS第三方聚合平台,适配场景与数据实测
人工智能·ai·云计算·oneapi
tedcloud12314 小时前
DeepSeek-TUI部署教程:打造CLI AI助手环境
服务器·人工智能·word·excel·dreamweaver