← 返回首页

EasyRouter 易路由

vLLM logo

vLLM

海外官方平台

平台介绍

vLLM是开源的高吞吐量LLM推理引擎,采用PagedAttention技术优化显存使用。支持连续批处理和分布式推理,推理吞吐量提升10-20倍。是部署开源LLM的首选推理引擎。

支持模型

高吞吐量PagedAttention开源推理引擎分布式

价格信息

开源免费

官方网站

https://vllm.ai →