機械学習サービスでコンテンツをモデレートしてユーザーを保護する
このガイダンスは、サーバーレスアーキテクチャを実装して、ユーザー投稿コンテンツや機密情報の流入の増加を効率的に緩和するのに役立ちます。これらのコンテンツや情報は、ゲーム、ソーシャルメディア、e コマース、医療や金融サービスなどの規制環境など、さまざまな業界から提供されている可能性があります。
アーキテクチャ図
ステップ 1
コンテンツを AWS クラウドにアップロードします。
ステップ 2
コンテンツが Amazon Simple Storage Service (Amazon S3) バケットまたは別のデータストアに安全に保管されます。
ステップ 3
ワークフロー、パブリッシャー/サブスクリプションパターン、カスタムコードをアクティブ化して、コンテンツをモデレートします。
ステップ 4
Amazon Transcribe と Amazon Rekognition を使用して動画ストリーム内の音声ストリームを処理し、シンプルな API を使用してコンテンツモデレーションカテゴリを抽出します。
ステップ 5
Amazon Transcribe で音声をテキストに変換し、Amazon Comprehend を使用して自然言語処理 (NLP) を活用します。
ステップ 6
Amazon Textract を使用してコンテンツを抽出し、Amazon Comprehend の自然言語処理でコンテンツのモデレーションを行います。
ステップ 7
Amazon SageMaker Ground Truth を使用して人間の労働力を統合し、モデルボキャブラリーと画像ラベルをカスタマイズします。
ステップ 8
Amazon Augmented AI (Amazon A2I) を使用して完全に自動化できないシナリオのループでは、人間も関わります。
Well-Architected Pillars
AWS Well-Architected フレームワークは、クラウドでシステムを構築する際に行う決定の長所と短所を理解するのに役立ちます。フレームワークの 6 つの柱により、信頼性が高く、安全かつ効率的で、費用対効果が高く、持続可能なシステムを設計および運用するためのアーキテクチャのベストプラクティスを学ぶことができます。AWS マネジメントコンソールで無料で提供されている AWS Well-Architected Tool を使用し、各柱の一連の質問に回答することで、これらのベストプラクティスに照らしてワークロードを確認できます。
上記のアーキテクチャ図は、Well-Architected のベストプラクティスを念頭に置いて作成されたソリューションの例です。完全に Well-Architected であるためには、可能な限り多くの Well-Architected ベストプラクティスに従う必要があります。
-
オペレーショナルエクセレンス
Lambda と Amazon S3 を選択することで、共有の設計標準を実装できます。作成したアセットは複数のアカウント、環境、チーム間で共有することができます。
-
セキュリティ
このガイダンスでは、責任共有モデルの一環としてセキュリティ管理タスクを削減するためにマネージドサービスを活用します。このガイダンスの範囲外ですが、Lambda 関数で実行するソフトウェアの整合性を検証することもできます。
マネージドサービスを選択することで、すべての AWS API コールが TLS 通信を使用して HTTPS エンドポイントを介して行われるようになり、転送中のデータが保護されます。
-
信頼性
Amazon API Gateway を使用することで、追加費用なく、このガイダンスのパブリックエンドポイントの可用性の高いネットワーク接続を保証できるだけでなく、AWS Shield で分散型サービス拒否 (DDoS) 攻撃に対する保護を自動的に行うことができます。
Amazon EventBridge と Amazon Simple Queue Service (Amazon SQS) の組み合わせることにより、疎結合の依存関係を実装できるため、コンポーネントの動作をそれに依存するその他のコンポーネントから分離し、回復性と俊敏性を向上させることができます。
-
パフォーマンス効率
マネージドサーバーレスサービスを選択することで、スケーリング要件を管理する必要がなくなります。コードをアップロードするだけで、Lambda がそのコードの実行とスケーリングに必要なすべての要素を管理します。また、Amazon API Gateway は、最大で数十万件に上る同時 API コールの受け入れと処理に関連するあらゆるタスクを処理します。
-
コストの最適化
このガイダンスでは、サーバーレスまたはアプリケーションサービスの Lambda と Amazon SQS を利用することで、リソース管理の手間を省きます。
マネージドサービスとサーバーレスサービスの両方を選択することで、十分な容量を確保できる属性を設定できます。超過容量を最小限に抑えてパフォーマンスを最大化するために、これらの属性を設定およびモニターする必要があります。
-
持続可能性
マネージドサービスを選択することで、リソースの使用率が低い期間や未使用期間を特定する必要がなくなります。
このガイダンスでは、キュー駆動型アーキテクチャを使用して、非同期ジョブとスケジュールジョブ用にソフトウェアとアーキテクチャを最適化します。さまざまなユーザー投稿コンテンツは即時アクションを必要としないため、スケジュールすることで、同時実行による負荷のスパイクやリソースの競合を回避できます。
実装リソース
AWS アカウント内で実験および使用するための詳細なガイドが提供されています。ガイダンス構築の各段階 (デプロイ、使用、およびクリーンアップを含む) は、デプロイに向けて準備するために詳細に検討されています。
サンプルコードは出発点です。これは業界で検証済みであり、規範的ではありますが決定的なものではなく、内部を知ることができ、開始に役立ちます。
関連コンテンツ
Content moderation design patterns with AWS managed AI services
Utilize AWS AI services to automate content moderation and compliance
Protect your users, brand, and budget with AI-powered content moderation
免責事項
サンプルコード、ソフトウェアライブラリ、コマンドラインツール、概念の実証、テンプレート、またはその他の関連技術 (私たちの担当者から提供される前述のものを含む) は、AWS カスタマーアグリーメント、またはお客様と AWS との間の関連文書契約 (いずれか該当する方) に基づき、AWS コンテンツとしてお客様に提供されるものです。お客様は、この AWS コンテンツを、お客様の本番アカウント、または本番データもしくはその他の重要なデータで使用すべきではありません。お客様は、サンプルコードなどの AWS コンテンツを、お客様固有の品質管理手法および基準に基づいて、本番グレードでの使用に適したテスト、セキュリティ確保、および最適化を行う責任を負います。AWS コンテンツのデプロイには、Amazon EC2 インスタンスの実行や Amazon S3 ストレージの使用など、AWS の課金対象リソースを作成または使用するための AWS 料金が発生する場合があります。
本ガイダンスにおける第三者のサービスまたは組織への言及は、Amazon または AWS と第三者との間の承認、後援、または提携を意味するものではありません。AWS からのガイダンスは技術的な出発点であり、アーキテクチャをデプロイするときにサードパーティのサービスとの統合をカスタマイズできます。