扩展

阅读有关如何在 BentoCloud 上扩展推理的操作指南。

自动伸缩

配置并发和自动伸缩,为您的 AI 工作负载实现最佳资源利用率和成本效率。

并发与自动伸缩