用FastAPI部署深度学习模型

FastAPI 部署深度学习模型的方法

安装依赖

确保安装 FastAPI 和 Uvicorn:

bash 复制代码
pip install fastapi uvicorn

如果模型依赖其他库(如 PyTorch、TensorFlow),需一并安装:

bash 复制代码
pip install torch tensorflow
创建 FastAPI 应用

新建一个 Python 文件(如 main.py),初始化 FastAPI 应用:

python 复制代码
from fastapi import FastAPI
app = FastAPI()
加载模型

在应用启动时加载预训练模型。以 PyTorch 为例:

python 复制代码
import torch
from transformers import pipeline

model = pipeline("text-classification", model="distilbert-base-uncased-finetuned-sst-2-english")
定义预测接口

创建一个 POST 接口接收输入数据并返回预测结果:

python 复制代码
from pydantic import BaseModel

class InputText(BaseModel):
    text: str

@app.post("/predict")
def predict(input: InputText):
    prediction = model(input.text)
    return {"prediction": prediction}
运行服务

使用 Uvicorn 启动服务:

bash 复制代码
uvicorn main:app --reload

访问 http://127.0.0.1:8000/docs 可查看交互式 API 文档。

异步支持(可选)

对于高并发场景,可以使用异步方式加载模型:

python 复制代码
from fastapi import FastAPI
import asyncio

app = FastAPI()

async def load_model():
    return pipeline("text-classification", model="distilbert-base-uncased-finetuned-sst-2-english")

model = asyncio.run(load_model())
生产环境部署

使用 Gunicorn 管理多进程:

bash 复制代码
pip install gunicorn
gunicorn -w 4 -k uvicorn.workers.UvicornWorker main:app
Docker 容器化

创建 Dockerfile

dockerfile 复制代码
FROM python:3.9
WORKDIR /app
COPY requirements.txt .
RUN pip install -r requirements.txt
COPY . .
CMD ["gunicorn", "-w", "4", "-k", "uvicorn.workers.UvicornWorker", "main:app"]

构建并运行容器:

bash 复制代码
docker build -t model-api .
docker run -p 8000:8000 model-api
相关推荐
晚霞的不甘7 小时前
CANN 编译器深度解析:TBE 自定义算子开发实战
人工智能·架构·开源·音视频
愚公搬代码7 小时前
【愚公系列】《AI短视频创作一本通》016-AI短视频的生成(AI短视频运镜方法)
人工智能·音视频
哈__8 小时前
CANN内存管理与资源优化
人工智能·pytorch
极新8 小时前
智启新篇,智创未来,“2026智造新IP:AI驱动品牌增长新周期”峰会暨北京电子商务协会第五届第三次会员代表大会成功举办
人工智能·网络协议·tcp/ip
island13148 小时前
CANN GE(图引擎)深度解析:计算图优化管线、内存静态规划与异构任务的 Stream 调度机制
开发语言·人工智能·深度学习·神经网络
艾莉丝努力练剑8 小时前
深度学习视觉任务:如何基于ops-cv定制图像预处理流程
人工智能·深度学习
禁默8 小时前
大模型推理的“氮气加速系统”:全景解读 Ascend Transformer Boost (ATB)
人工智能·深度学习·transformer·cann
User_芊芊君子8 小时前
CANN大模型加速核心ops-transformer全面解析:Transformer架构算子的高性能实现与优化
人工智能·深度学习·transformer
格林威8 小时前
Baumer相机玻璃制品裂纹自动检测:提高透明材质检测精度的 6 个关键步骤,附 OpenCV+Halcon 实战代码!
人工智能·opencv·视觉检测·材质·工业相机·sdk开发·堡盟相机
点云SLAM8 小时前
Concentrate 英文单词学习
人工智能·英文单词学习·雅思备考·concentrate·集中·浓缩 / 集中物