【大语言模型】-- 私有化部署


文章目录

文章目录

大模型私有化部署的分类

一、按交付形态

一体机 整机柜出厂即交付,插电即用

纯软件 仅授权模型+推理框架,客户自购服务器

私有化 SaaS 模型以容器/Helm 包交付,部署在客户私有 K8s 上

二、按模型参数规模

规模显存/内存需求常见形态轻量 ≤3B6-8 GB 显存可跑手机、车机、边缘盒标准 7-13B16-24 GB 显存单卡 4090/A10 即可私有化大型 30-70B多卡 40-80 GBA100×2 / H100×2超大型 百亿-千亿80 GB×8 以上机群,需分布式并行框架

三、按模态类型

类别说明语言大模型LLaMA3、Qwen2、DeepSeek-R1视觉大模型ViT-e、SwinV2-G,用于工业质检语音大模型Whisper-Large-v3,私有化客服语音转写多模态大模型BLIP-2、Qwen-VL-Chat,图文混合检索

按照使用方式的不同,主要分为源码部署和应用部署:

源码部署,是自行配置相关的 python 以及开发环境。

应用部署,是使用一些厂商预先提供好的工具直接安装后进行部署使用。(如:ollama 本地部署、LM Studio本地部署)

实践(LM Studio本地部署)

LM Studio 下载地址:LM Studio - Local AI on your computer

在搜索框中,找到一下需要下载的大模型:

进入对话框中,即可对话:

系列文章

【大语言模型】-- OpenAI定义的五个AGI发展阶段
【大语言模型】-- Fine-tuning 微调
【大语言模型】-- 私有化部署
【大语言模型】-- Prompt Engineering 提示工程
【大语言模型】-- Function Calling函数调用
【大语言模型】-- RAG
【大语言模型】-- Agent
【大语言模型】-- 一些概念

相关推荐
haing20195 分钟前
三次 B 样条曲线基于曲率极值的限速速度规划方法
人工智能·b样条·曲率极值限速
AutumnorLiuu10 分钟前
【红外小目标检测实战 四】使用风车卷积和Neck多层融合改进
人工智能·目标检测·计算机视觉
亿林-智企AI23 分钟前
AI数字人技术浪潮:亿林数据引领人机交互新范式
人工智能·人机交互·智能客服·ai数字人·ai智能体·算力一体机
TechMasterPlus24 分钟前
openhands论文解读
人工智能
YangYang9YangYan42 分钟前
2026年中专计算机专业证书报考指南:高性价比认证与职业路径规划
大数据·人工智能·学习·计算机视觉
DMD1681 小时前
从仓库到门店:AI如何重构零售供应链的“最后一公里”
人工智能·科技·重构·零售·数字化转型·产业升级·ai技术开发
秃头小饼干1 小时前
虚拟机性能优化实战技术文章大纲
人工智能·云计算
番茄迷人蛋1 小时前
欢迎使用AI美食大师项目
人工智能·ai
InfiSight智睿视界1 小时前
即时零售仓网管理的AI 智能化演进
大数据·人工智能·零售
汽车仪器仪表相关领域1 小时前
MTX-AL:传统指针美学与现代数字科技的完美融合 - 模拟宽带空燃比计
大数据·人工智能·科技·单元测试·汽车·压力测试·可用性测试