BentoCloud BYOC AWS 设置指南

作为我们致力于确保顺利高效的入门流程的一部分,我们准备了本设置指南,以帮助您的 DevOps 团队将 BentoCloud 集成到您的 AWS 账户中。

请求配额

为确保集群设置不出现延迟,请在开始设置前确保您的 AWS 账户中有足够的 服务配额。如果不够,请在您将部署 BentoCloud 的区域请求增加配额。

如何请求配额

  1. 访问您所在区域的 AWS 服务配额控制台

  2. 根据您的部署计划请求配额。详细配额请参见下表

    类型

    配额名称

    所需数量

    用途

    CPU

    正在运行的 按需 标准型 (A, C, D, H, I, M, R, T, Z) 实例

    32 vCPU

    运行基础设施工作负载、镜像构建器作业和 CPU 服务实例。

    GPU

    根据需要

    • T4/A10G GPU: 正在运行的 按需 G VT 实例

    • A100/H100 GPU: 正在运行的 按需 P 实例

    根据需要

    运行需要 GPU 的工作负载。

设置

此设置过程将建立一个 IAM 角色,为 BentoCloud 提供访问特定 AWS 服务的必要权限。此访问对于 BentoCloud 在您的 AWS 环境中部署和管理云组件至关重要。该过程利用了一个预定义的 CloudFormation 模板,具体步骤如下所述。

  1. 登录到您组织的 AWS 账户。

  2. 转到 CloudFormation Web 控制台。确保您位于所需的 AWS 区域。如有必要,切换区域。

  3. 堆栈 页面上,选择 创建堆栈 > 使用新资源(标准)

    Screenshot of AWS CloudFormation console showing the "Create stack with new resources" option
  4. 创建堆栈 部分,选择 选择现有模板Amazon S3 URL,粘贴以下 URL,然后点击 下一步

    https://customer-helpdesk.s3.us-west-1.amazonaws.com/create-bentocloud-copilot-role-v6.json
    
    Screenshot of AWS CloudFormation "Create stack" interface showing template selection with Amazon S3 URL option
  5. 指定堆栈详细信息 部分,提供以下信息并点击 下一步

    • 堆栈名称: bentocloud

    • BentoCloudCopilot: arn:aws:iam::303081928216:user/bentocloud-copilot-[organization_name]

    Screenshot of AWS CloudFormation "Specify stack details" page showing stack name and BentoCloudCopilot ARN input fields
  6. 配置堆栈选项 部分,保留默认选择并点击 下一步

  7. 审核并创建 部分,向下滚动到 功能 以确认 IAM 角色创建,然后点击 提交

  8. 与 BentoML 团队分享 InstallerRole 的值。

    1. 转到 CloudFormation > 堆栈 > bentocloud,然后等待堆栈进入以下状态

      Screenshot of AWS CloudFormation console showing the stack creation in progress Screenshot of AWS CloudFormation console showing the stack creation completed successfully
    2. 转到 输出 标签页,复制 InstallerRole 的值。

      Screenshot of AWS CloudFormation Outputs tab showing the InstallerRole value that needs to be shared with the BentoML team

设置后

完成上述步骤后,请通知您的主要 BentoML 联系人,并与 BentoML 团队分享 InstallerRole 的值您的 AWS 区域

之后,BentoML 自动化将继续进行集群设置,这通常需要 1 个工作日。BentoML 团队通常会在您的 AWS 账户上运行一个小型测试部署,以确保系统端到端正常工作。

(可选)授予和撤销授权

在没有进行中的支持工单时,您可以撤销对 BentoCloud copilot 的授权。

  1. 转到 身份和访问管理 (IAM) 控制台

  2. 在导航窗格中,选择 角色 > copilot 角色

    Screenshot of AWS IAM console showing the BentoCloud copilot role that can be used to grant or revoke authorization
  3. Principal 字段中删除/添加 AWS 行将撤销/授予对 BentoCloud copilot 的授权。

获取帮助和故障排除

如果您在设置过程中遇到任何问题或有疑问,请随时与我们联系。我们的支持团队可以为您提供以下帮助:

  • 各步骤的详细指导

  • 常见问题的故障排除

  • 在您的 AWS 环境中管理 BentoCloud 的最佳实践

您可以通过 support@bentoml.com 或通过我们的支持 Slack 频道联系我们的支持团队。