解决vllm服务漏扫问题

在 vLLM 中屏蔽 /docs(Swagger UI)和 /redoc 等自动生成的 API 文档页面,可以通过在启动命令中添加 --disable-fastapi-docs 参数来实现。

具体操作方法

在使用 vllm servepython -m vllm.entrypoints.openai.api_server 启动服务时,加入以下参数:

复制代码
-disable-fastapi-docs 

示例命令

‌**方式一:使用 vllm serve 命令(推荐)**‌

复制代码
vllm serve Qwen/Qwen-7B-Chat \ --host 0.0.0.0 \ --port 8000 \ --disable-fastapi-docs 

方式二:使用 Python 模块启动

复制代码
python -m vllm.entrypoints.openai.api_server \ --model Qwen/Qwen-7B-Chat \ --host 0.0.0.0 \ --port 8000 \ --disable-fastapi-docs 

原理说明

vLLM 的 API 服务器基于 FastAPI 构建。默认情况下,FastAPI 会自动生成并暴露 Swagger UI (/docs) 和 ReDoc (/redoc) 页面。

当设置 --disable-fastapi-docs 为真时,vLLM 在初始化 FastAPI 应用时会显式地将 openapi_urldocs_urlredoc_url 设置为 None,从而禁用这些文档端点的访问。这不仅可以隐藏文档界面,还能略微减少服务器的内存占用和潜在的安全暴露面。

验证

启动服务后,尝试访问 http://<your-ip>:8000/docs,如果配置成功,将返回 ‌404 Not Found‌ 错误,而不是显示 Swagger UI 界面。

相关推荐
映翰通朱工18 小时前
工业4G网关无公网IP远程运维实战(内网终端异地访问方案)
运维·服务器·网络·安全·智能路由器
CTA量化套保19 小时前
期货量化程序 time.sleep 卡死:天勤单线程与 deadline 替代
python·区块链
GIS数据转换器19 小时前
城市排水生命线安全运行监测平台深度解析
java·运维·人工智能·python·安全·数据挖掘·无人机
贤哥哥yyds20 小时前
GBK转UTF\-8编码自动转换工具 使用文档
python
数量技术宅20 小时前
2026量化前沿:从Reddit热帖到Python实战,如何用赫斯特指数(Hurst)狙击虚假突破?
开发语言·python
华如锦20 小时前
面了很多 Java转AI Agent方向,一些面试题总结
java·开发语言·人工智能·python·ai
戴西软件20 小时前
戴西 DLM 许可授权管理系统:破解无网络环境下工业软件授权难题,助力制造企业降本增效
网络·人工智能·python·深度学习·程序人生·算法·制造
Dxy123931021620 小时前
Python线程锁:为什么多线程会“打架“,以及怎么解决
开发语言·前端·python
小白学大数据21 小时前
线上故障急救:依托 OpenClaw 日志排查 403 和 503 问题
爬虫·python·selenium·数据分析
databook21 小时前
用SymPy自动因式分解:从面积拼图到代数恒等式
python·数学·动效