vllm

放飞自我的Coder1 个月前
linux·python·vllm
【linux 安装vllm=0.5.4】环境创建环境安装ninjia安装vllm启动openai-server不要从源码安装,很多的问题!!
alxe_made3 个月前
llm·vllm·llava
VLM系列文章1-LLaVA作为VLM系列的第一篇文章,打算以LLaVA入手,毕竟是VLM领域较为经典的工作。核心思想就是将视觉特征嵌入到LLM中,作为LLM的prefix(前缀),LLM作为建模的主体。
汀、人工智能4 个月前
人工智能·自然语言处理·llm·agent·ai大模型·vllm·大模型部署
LLM 大模型学习必知必会系列(十三):基于SWIFT的VLLM推理加速与部署实战GPU设备: A10, 3090, V100, A100均可.vllm不支持bnb量化的模型. vllm支持的模型可以查看支持的模型.
engchina5 个月前
人工智能·vllm·llama3·llama3-8b
使用 vllm 运行 Llama3-8b-Instruct此文章主要介绍使用 vllm 运行 Llama3-8b。创建虚拟环境,安装 Ray 和 Vllm,安装 flash-attention,
又见阿郎5 个月前
chatglm·vllm
聊聊ChatGLM3多用户并发API调用的问题转载请备注出处:https://www.cnblogs.com/zhiyong-ITNote目前在公司内部4张A10的GPU服务器上部署了ChatGLM3开源模型;然后部署了官方默认的web_demo、api_demo两种模式;重新设计了前端,支持H5和安卓两个客户端调用。但却发现了不能并发访问的问题。
shui123546yi9 个月前
llm·aigc·vllm·大模型推理
vLLM介绍vLLM 工程github地址 Paged attention论文地址vLLM: A high-throughput and memory-efficient inference and serving engine for LLMs. SkyPilot: A framework for easily and cost effectively running machine learning workloads on any cloud.