概要
AWS でのコンテンツローカリゼーションは、人工知能 (AI) を利用して多言語字幕を作成することで、ビデオオンデマンドコンテンツのリーチを拡大するのに役立ちます。動画用の正確な多言語字幕の制作は複雑で手間がかかり、メディアアセットの文字起こし、字幕作成、翻訳、レビューに多くの人員が費やされます。この AWS ソリューションでは、こうした手動プロセスを自動化したまま、結果をコントロールできます。ネイティブの AWS AI サービスを使用して動画ファイルから貴重なメタデータをアップロード、分析、抽出できるシンプルな UI が含まれています。
メリット
動画をアップロードおよび分析し、シンプルなウェブベースのユーザーインターフェイスを使用して、自動生成された動画字幕を使用します。
アプリケーション内で字幕を確認して修正できます。字幕に問題がなければ、修正された入力を使用してワークフローを再実行し、ダウンストリームの結果を再生成します。
字幕に修正を加えたら、カスタムの語彙や用語集を作成できます。動画をアップロードして自動ワークフローを設定する際に、これらのカスタマイズを提供します。
技術的な詳細情報
このアーキテクチャは、実装ガイドと関連する AWS CloudFormation テンプレートを使用して自動的にデプロイできます。
ステップ 1
AWS CloudFormation テンプレートは、Media Insights on AWS ソリューションのインスタンスを展開します。
ステップ 2
ソリューションのウェブアプリケーションを提供するための Amazon CloudFront ディストリビューション。
ステップ 3
静的ウェブアプリケーションをホストするための Amazon Simple Storage Service (Amazon S3) ウェブソースバケット。
ステップ 4
ユーザーディレクトリを提供する Amazon Cognito ユーザープール。
ステップ 5
ウェブアプリケーションへの認証と承認のために AWS Identity and Access Management(IAM) とのフェデレーションを提供する Amazon Cognitoアイデンティティプール。
ステップ 6
Media Insights on AWS のワークフロー API 用の Amazon API Gateway、Media Insights on AWS のデータプレーン API、および Amazon OpenSearch Service の API エンドポイント。
ステップ 7
Media Insights on AWS によって作成された AWS Step Functions のワークフロー。コンテンツローカリゼーションワークフローは、Amazon Transcribe、Amazon Translate、AWS Elemental MediaConvert、および Amazon Polly でジョブを実行する AWS Lambda 関数で構成されています。
また、これらの Lambda 関数は、メディア分析ジョブから返されたメディアオブジェクトとメタデータを保存および取得するために、Media Insights on AWS データプレーン API と連動します。ワークフローでは、入力の追加分析結果を取得するために、オプションで Amazon Rekognition と Amazon Comprehend を実行することもできます。
ステップ 8
メディアメタデータを AWS データパイプラインから OpenSearch Serviceクラスターに抽出、変換、ロードする Lambda関数。 この Lambda関数は、Media Insights on AWS データプレーンでアセットメタデータが変更されるたびに、Media Insights on AWS データプレーンのAmazon DynamoDBストリームによって呼び出されます。
ステップ 9
メディアメタデータをインデックスするためのOpenSearch Serviceクラスター。
関連コンテンツ
Media Insights on AWS は、デベロッパーが AWS で AI およびマルチメディアサービスを使用して、動画、画像、音声、およびテキストを処理するビルドサーバーレスアプリケーションをより簡単に構築できるようにするフレームワークです。このソリューションは、機械学習サービスをメディアワークフローに適用するための開発フレームワークです。