Groq ✓
平台介绍
Groq是使用自研LPU(Language Processing Unit)芯片的极速推理平台。提供Llama、Mixtral等开源模型的超低延迟推理,响应时间低至10ms。免费层提供慷慨的请求限制,是追求极致速度和实时对话应用的最佳选择。
支持模型
价格信息
$0.05-0.59/1M tokens
Groq是使用自研LPU(Language Processing Unit)芯片的极速推理平台。提供Llama、Mixtral等开源模型的超低延迟推理,响应时间低至10ms。免费层提供慷慨的请求限制,是追求极致速度和实时对话应用的最佳选择。