利用 CI/CD 加速顶级财产和意外险保险公司的灾难恢复

客户


一家知名的财产和意外伤害 (P&C) 保险公司通过可重复使用的基础设施模板和灾难恢复模式增强其云基础,以确保弹性、可扩展性和安全运营。

商业挑战


  • 不一致的灾难恢复准备:应用程序团队缺乏标准化、可重复使用的框架来实施 AWS 服务的灾难恢复。
  • IAM 凭证轮换:由于 IAM 凭证过期而频繁发生中断,影响部署连续性。
  • 手动资源设置:高强度的配置会减慢产品上市时间并引入部署错误。
  • 孤立的环境:应用程序与共享基础设施紧密耦合,使得独立扩展变得困难。

方法


Trianz 开发了可重复使用的自动化驱动模式,以实现整个企业云环境中灾难恢复的工业化:

  • 可重复使用的 CDK 库创建:使用带有 CRR、MRAP 和 IAM 的 AWS CDK for S3 构建标准化基础设施即代码模板。
  • 多区域弹性:启用主动-主动和主动-被动复制策略,以支持跨业务部门的 DR 层。
  • CloudForge 产品:向内部市场发布了两个模块化 DR 组件,以供自助采用。
  • IAM 强化:引入可信策略来绕过秘密过期瓶颈,提高 90 天部署周期的连续性。
  • S3 + RDS DR 模板:为 S3 和 Amazon RDS 开发预配置模式,具有跨区域支持和基于角色的访问。
  • CI/CD 支持:将可重复使用的库集成到 CI/CD 工作流中,实现自动化、一致的基础设施部署。
  • IAM 访问模式:标准化共享 IAM 用户策略,以减少摩擦并改善秘密管理。
  • 容器化平台:采用 ECS Fargate 以最小的运营开销部署 DR 控制平面应用程序。
  • 自动监控:利用 CloudWatch 进行 DR 准备情况跟踪和审计合规性报告。
  • 跨团队支持:培训内部小组使用新创建的模块独立实施 DR 模式。

技术组件


云服务

  • 亚马逊 S3(CRR、MRAP)
  • 亚马逊 RDS PostgreSQL
  • 亚马逊 ECS Fargate
  • AWS IAM
  • 亚马逊秘密管理器
  • 亚马逊SNS
  • 亚马逊云监控
  • 亚马逊 KMS
  • 亚马逊CloudTrail
  • AWS VPC

应用程序堆栈

  • Django
  • Python
  • TypeScript
  • AWS CDK
  • CloudFormation 模板 (CFT)

基础设施工具

  • Amazon 应用程序负载均衡器
  • 亚马逊 53 号公路
  • AWS 定价计算器、Trust Advisor、Cost Explorer

转型效应


  • 标准化灾难恢复框架:支持跨应用程序团队更快、可重复地部署灾难恢复基础设施
  • 提高部署敏捷性:减少 IAM 凭证问题并简化新团队的入职流程
  • 可重复使用的基础设施模板:通过内部市场为工程师提供即插即用的组件
  • 提高成本可见性: TCO 分析指导适当规模的配置和长期成本可预测性
  • 解耦工作负载:产品小组实现了与共享存储桶的独立性,并可以自由地发展灾难恢复逻辑

联系我们

让我们帮助您
转型和成长


提交您的信息即表示您同意我们修改后的内容  隐私声明.