Cerebras ✓
平台介绍
Cerebras是使用WSE(Wafer Scale Engine)芯片的极速AI推理平台,提供Llama系列模型的超高速推理服务。单芯片拥有90万核心,推理速度比传统GPU快10-100倍。目前提供免费API访问,是追求极致推理速度的开发者的理想选择。
支持模型
价格信息
免费
Cerebras是使用WSE(Wafer Scale Engine)芯片的极速AI推理平台,提供Llama系列模型的超高速推理服务。单芯片拥有90万核心,推理速度比传统GPU快10-100倍。目前提供免费API访问,是追求极致推理速度的开发者的理想选择。