用FastAPI部署深度学习模型

FastAPI 部署深度学习模型的方法

安装依赖

确保安装 FastAPI 和 Uvicorn:

bash 复制代码
pip install fastapi uvicorn

如果模型依赖其他库(如 PyTorch、TensorFlow),需一并安装:

bash 复制代码
pip install torch tensorflow
创建 FastAPI 应用

新建一个 Python 文件(如 main.py),初始化 FastAPI 应用:

python 复制代码
from fastapi import FastAPI
app = FastAPI()
加载模型

在应用启动时加载预训练模型。以 PyTorch 为例:

python 复制代码
import torch
from transformers import pipeline

model = pipeline("text-classification", model="distilbert-base-uncased-finetuned-sst-2-english")
定义预测接口

创建一个 POST 接口接收输入数据并返回预测结果:

python 复制代码
from pydantic import BaseModel

class InputText(BaseModel):
    text: str

@app.post("/predict")
def predict(input: InputText):
    prediction = model(input.text)
    return {"prediction": prediction}
运行服务

使用 Uvicorn 启动服务:

bash 复制代码
uvicorn main:app --reload

访问 http://127.0.0.1:8000/docs 可查看交互式 API 文档。

异步支持(可选)

对于高并发场景,可以使用异步方式加载模型:

python 复制代码
from fastapi import FastAPI
import asyncio

app = FastAPI()

async def load_model():
    return pipeline("text-classification", model="distilbert-base-uncased-finetuned-sst-2-english")

model = asyncio.run(load_model())
生产环境部署

使用 Gunicorn 管理多进程:

bash 复制代码
pip install gunicorn
gunicorn -w 4 -k uvicorn.workers.UvicornWorker main:app
Docker 容器化

创建 Dockerfile

dockerfile 复制代码
FROM python:3.9
WORKDIR /app
COPY requirements.txt .
RUN pip install -r requirements.txt
COPY . .
CMD ["gunicorn", "-w", "4", "-k", "uvicorn.workers.UvicornWorker", "main:app"]

构建并运行容器:

bash 复制代码
docker build -t model-api .
docker run -p 8000:8000 model-api
相关推荐
好奇龙猫2 小时前
【人工智能学习-AI入试相关题目练习-第七次】
人工智能·学习
Mao.O4 小时前
开源项目“AI思维圆桌”的介绍和对于当前AI编程的思考
人工智能
钱彬 (Qian Bin)4 小时前
项目实践17—全球证件智能识别系统(开发基于LabelMe标注的可视化审核接口)
qt·fastapi·全球证件识别
jake don4 小时前
AI 深度学习路线
人工智能·深度学习
信创天地5 小时前
信创场景软件兼容性测试实战:适配国产软硬件生态,破解运行故障难题
人工智能·开源·dubbo·运维开发·risc-v
幻云20105 小时前
Python深度学习:从筑基到登仙
前端·javascript·vue.js·人工智能·python
bst@微胖子5 小时前
LlamaIndex之核心概念及部署以及入门案例
pytorch·深度学习·机器学习
无风听海5 小时前
CBOW 模型中的输出层
人工智能·机器学习
汇智信科5 小时前
智慧矿山和工业大数据解决方案“智能设备管理系统”
大数据·人工智能·工业大数据·智能矿山·汇智信科·智能设备管理系统
静听松涛1335 小时前
跨语言低资源场景下的零样本迁移
人工智能