技术栈
vllm
放飞自我的Coder
1 个月前
linux
·
python
·
vllm
【linux 安装vllm=0.5.4】
环境创建环境安装ninjia安装vllm启动openai-server不要从源码安装,很多的问题!!
alxe_made
3 个月前
llm
·
vllm
·
llava
VLM系列文章1-LLaVA
作为VLM系列的第一篇文章,打算以LLaVA入手,毕竟是VLM领域较为经典的工作。核心思想就是将视觉特征嵌入到LLM中,作为LLM的prefix(前缀),LLM作为建模的主体。
汀、人工智能
4 个月前
人工智能
·
自然语言处理
·
llm
·
agent
·
ai大模型
·
vllm
·
大模型部署
LLM 大模型学习必知必会系列(十三):基于SWIFT的VLLM推理加速与部署实战
GPU设备: A10, 3090, V100, A100均可.vllm不支持bnb量化的模型. vllm支持的模型可以查看支持的模型.
engchina
5 个月前
人工智能
·
vllm
·
llama3
·
llama3-8b
使用 vllm 运行 Llama3-8b-Instruct
此文章主要介绍使用 vllm 运行 Llama3-8b。创建虚拟环境,安装 Ray 和 Vllm,安装 flash-attention,
又见阿郎
5 个月前
chatglm
·
vllm
聊聊ChatGLM3多用户并发API调用的问题
转载请备注出处:https://www.cnblogs.com/zhiyong-ITNote目前在公司内部4张A10的GPU服务器上部署了ChatGLM3开源模型;然后部署了官方默认的web_demo、api_demo两种模式;重新设计了前端,支持H5和安卓两个客户端调用。但却发现了不能并发访问的问题。
shui123546yi
9 个月前
llm
·
aigc
·
vllm
·
大模型推理
vLLM介绍
vLLM 工程github地址 Paged attention论文地址vLLM: A high-throughput and memory-efficient inference and serving engine for LLMs. SkyPilot: A framework for easily and cost effectively running machine learning workloads on any cloud.