NVIDIA NIM ✓
平台介绍
NVIDIA NIM(NVIDIA Inference Microservices)是NVIDIA提供的GPU加速推理服务,支持129+主流大模型。基于NVIDIA H100/H200 GPU,提供业界领先的推理吞吐量和延迟表现。免费层提供40 RPM请求限制,适合高性能AI应用和需要GPU加速的场景。
支持模型
价格信息
免费 40 RPM + 按量付费
NVIDIA NIM(NVIDIA Inference Microservices)是NVIDIA提供的GPU加速推理服务,支持129+主流大模型。基于NVIDIA H100/H200 GPU,提供业界领先的推理吞吐量和延迟表现。免费层提供40 RPM请求限制,适合高性能AI应用和需要GPU加速的场景。