中小企業 (SMB) をサポートする米国を拠点とする金融サービス プロバイダーは、リアルタイムの応答を提供し、オンボーディングの遅延を削減するスケーラブルな AI 駆動型アシスタントを導入することで、クライアント サービス モデルを近代化する必要がありました。
老朽化した導入アプローチ: FirstHope は、自己管理型インフラストラクチャでホストされるオープンソース LLM を試していましたが、その環境はコストがかかり、柔軟性に欠け、予測不可能な SMB トラフィックに合わせて拡張することが困難でした。
市場投入までの時間が長い: AI チャットボットの導入には 3 か月以上かかり、より迅速なオンボーディングとセルフサービス機能を必要とする中小企業のクライアントにとってボトルネックとなっていました。
セキュリティとコンプライアンスのギャップ:エンタープライズ グレードの IAM、データ保護、監査の準備が不足しているため、規制の厳しい業界での導入が妨げられています。
高い運用オーバーヘッド:手動でのインフラ管理、スケーリング、監視により、膨大な IT リソースが消費されていました。
柔軟性の制限:厳格な展開では、新しい LLM モデルや SaaS ベースの拡張機能を迅速に統合することができませんでした。
Trianz は、AWS サーバーレスサービスを使用して完全なクラウドネイティブの再アーキテクチャを主導し、インフラの複雑さを軽減し、安全でコンプライアンスに準拠したスケーラブルな AI 主導の顧客支援を実現しました。
サーバーレスの再設計: LLM 駆動型生成応答のために自己管理型インフラを Amazon Bedrock (Anthropic Claude) に置き換え、モデル インフラのオーバーヘッドを排除しました。
リアルタイム検索の拡張:知識検索のために Amazon Kendra を統合し、SMB クエリの正確性とコンテキスト応答を保証します。
ビジネスアシスタントレイヤー:事前に統合されたワークフローとドメイン適応に Amazon Q Business を活用しました。
スケーラブルなセッション管理: AWS AppSync と DynamoDB をデプロイして、チャット履歴、メタデータ、セッション状態をクライアント間で保持します。
イベント駆動型オーケストレーション: AWS Lambda を使用して、オーケストレーション、検索拡張生成 (RAG)、自動スケーリングロジックを処理しました。
安全なフロントエンド配信: Amazon CloudFront、Amplify、Cognito を組み合わせ、フェデレーション認証と分離を備えたグローバルに分散されたフロントエンドを実現します。
モニタリングとガバナンス:レイテンシーモニタリング、SLA ダッシュボード、分析主導の最適化のために CloudWatch と QuickSight を有効にしました。
エンタープライズセキュリティ: DDoS 保護とクライアントテナント全体の IAM ベースの分離のために AWS WAF と Shield を適用しました。
コア AWS サービス: Amazon Bedrock、Kendra、Q Business、DynamoDB、AppSync、Lambda、CloudFront、Cognito、QuickSight、WAF、Shield。
インフラストラクチャ ツール: IAM、CloudWatch、マルチ AZ デプロイメント。
導入が 3 倍高速化:オンボーディング チャットボットの展開が 3 か月から 2 週間に短縮されました。
生産性が 90% 向上:リアルタイム検索による AI 応答の高速化により、ユーザー エクスペリエンスが向上しました。
ほぼ完璧な信頼性:マルチ AZ アーキテクチャにより 98% の稼働率を実現。
TCO が 30% 削減:オンプレミスのインフラを AWS サーバーレスに置き換えることで 3 年間のコストが削減されました。
監査対応コンプライアンス:修正なしで業界監査に合格しました。