用FastAPI部署深度学习模型

FastAPI 部署深度学习模型的方法

安装依赖

确保安装 FastAPI 和 Uvicorn:

bash 复制代码
pip install fastapi uvicorn

如果模型依赖其他库(如 PyTorch、TensorFlow),需一并安装:

bash 复制代码
pip install torch tensorflow
创建 FastAPI 应用

新建一个 Python 文件(如 main.py),初始化 FastAPI 应用:

python 复制代码
from fastapi import FastAPI
app = FastAPI()
加载模型

在应用启动时加载预训练模型。以 PyTorch 为例:

python 复制代码
import torch
from transformers import pipeline

model = pipeline("text-classification", model="distilbert-base-uncased-finetuned-sst-2-english")
定义预测接口

创建一个 POST 接口接收输入数据并返回预测结果:

python 复制代码
from pydantic import BaseModel

class InputText(BaseModel):
    text: str

@app.post("/predict")
def predict(input: InputText):
    prediction = model(input.text)
    return {"prediction": prediction}
运行服务

使用 Uvicorn 启动服务:

bash 复制代码
uvicorn main:app --reload

访问 http://127.0.0.1:8000/docs 可查看交互式 API 文档。

异步支持(可选)

对于高并发场景,可以使用异步方式加载模型:

python 复制代码
from fastapi import FastAPI
import asyncio

app = FastAPI()

async def load_model():
    return pipeline("text-classification", model="distilbert-base-uncased-finetuned-sst-2-english")

model = asyncio.run(load_model())
生产环境部署

使用 Gunicorn 管理多进程:

bash 复制代码
pip install gunicorn
gunicorn -w 4 -k uvicorn.workers.UvicornWorker main:app
Docker 容器化

创建 Dockerfile

dockerfile 复制代码
FROM python:3.9
WORKDIR /app
COPY requirements.txt .
RUN pip install -r requirements.txt
COPY . .
CMD ["gunicorn", "-w", "4", "-k", "uvicorn.workers.UvicornWorker", "main:app"]

构建并运行容器:

bash 复制代码
docker build -t model-api .
docker run -p 8000:8000 model-api
相关推荐
常宇杏起在5 分钟前
AI安全专项:AI云服务的安全风险与防护策略
人工智能
cooldog123pp6 分钟前
cplex完全安装手册,适配matlab和python!
人工智能·python·matlab·cplex
richdata7 分钟前
需求预测终极指南:零售商品预测方法、算法与AI实践
人工智能·算法·零售
mimu345611 分钟前
做PPT方案适合搭配哪些办公效率工具
人工智能
蓝速科技13 分钟前
蓝速科技 AI 数字人部署与交互实战指南
人工智能·科技·交互
雪隐16 分钟前
个人电脑玩AI-03让5060 Ti给你打工——paddleOCR
人工智能·后端
Coffeeee21 分钟前
Codachi — 藏在 Claude Code 状态栏里的电子宠物
人工智能·程序员·claude
张某布响丸辣24 分钟前
Spring AI 极简入门:Java 开发者快速上手 AI 开发
java·人工智能·spring·springai
Deepoch32 分钟前
VLA多模态架构加持 采摘机器人实现精细化智能采收
人工智能·机器人·开发板·具身模型·deepoc·采摘
橘子星33 分钟前
基于 Vite 的多模态生图前端工程实践
前端·javascript·人工智能