【大语言模型】-- 私有化部署


文章目录

文章目录

大模型私有化部署的分类

一、按交付形态

一体机 整机柜出厂即交付,插电即用

纯软件 仅授权模型+推理框架,客户自购服务器

私有化 SaaS 模型以容器/Helm 包交付,部署在客户私有 K8s 上

二、按模型参数规模

规模显存/内存需求常见形态轻量 ≤3B6-8 GB 显存可跑手机、车机、边缘盒标准 7-13B16-24 GB 显存单卡 4090/A10 即可私有化大型 30-70B多卡 40-80 GBA100×2 / H100×2超大型 百亿-千亿80 GB×8 以上机群,需分布式并行框架

三、按模态类型

类别说明语言大模型LLaMA3、Qwen2、DeepSeek-R1视觉大模型ViT-e、SwinV2-G,用于工业质检语音大模型Whisper-Large-v3,私有化客服语音转写多模态大模型BLIP-2、Qwen-VL-Chat,图文混合检索

按照使用方式的不同,主要分为源码部署和应用部署:

源码部署,是自行配置相关的 python 以及开发环境。

应用部署,是使用一些厂商预先提供好的工具直接安装后进行部署使用。(如:ollama 本地部署、LM Studio本地部署)

实践(LM Studio本地部署)

LM Studio 下载地址:LM Studio - Local AI on your computer

在搜索框中,找到一下需要下载的大模型:

进入对话框中,即可对话:

系列文章

【大语言模型】-- OpenAI定义的五个AGI发展阶段
【大语言模型】-- Fine-tuning 微调
【大语言模型】-- 私有化部署
【大语言模型】-- Prompt Engineering 提示工程
【大语言模型】-- Function Calling函数调用
【大语言模型】-- RAG
【大语言模型】-- Agent
【大语言模型】-- 一些概念

相关推荐
吴佳浩5 小时前
Python入门指南(七) - YOLO检测API进阶实战
人工智能·后端·python
tap.AI5 小时前
RAG系列(二)数据准备与向量索引
开发语言·人工智能
老蒋新思维6 小时前
知识IP的长期主义:当AI成为跨越增长曲线的“第二曲线引擎”|创客匠人
大数据·人工智能·tcp/ip·机器学习·创始人ip·创客匠人·知识变现
货拉拉技术6 小时前
出海技术挑战——Lalamove智能告警降噪
人工智能·后端·监控
wei20236 小时前
汽车智能体Agent:国务院“人工智能+”行动意见 对汽车智能体领域 革命性重塑
人工智能·汽车·agent·智能体
LinkTime_Cloud6 小时前
快手遭遇T0级“黑色闪电”:一场教科书式的“协同打击”,披上了AI“智能外衣”的攻击
人工智能
PPIO派欧云7 小时前
PPIO上线MiniMax-M2.1:聚焦多语言编程与真实世界复杂任务
人工智能
隔壁阿布都7 小时前
使用LangChain4j +Springboot 实现大模型与向量化数据库协同回答
人工智能·spring boot·后端
Coding茶水间7 小时前
基于深度学习的水面垃圾检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
图像处理·人工智能·深度学习·yolo·目标检测·机器学习·计算机视觉
乐迪信息7 小时前
乐迪信息:煤矿皮带区域安全管控:人员违规闯入智能识别
大数据·运维·人工智能·物联网·安全