ソリューションコンポーネント
AWS クラウドは、ワークロードやタスクに合わせて選択できる、幅広いスケーラブルで柔軟なインフラストラクチャサービスを提供します。これにより、特定のアプリケーションに最適なリソースの組み合わせを選択することができます。 クラウドコンピューティングにより、インフラストラクチャコンポーネントとアーキテクチャ設計を容易に試すことができます。以下に HPC ソリューションコンポーネントとして記載されているサービスは、HPC クラスターの設定および管理を始める最適な出発点ですが、最も低いコストで最高のパフォーマンスを見つけるために、さまざまなインスタンスタイプ、EBS ボリュームタイプ、デプロイ方法などをテストすることを常にお勧めします。
データ管理とデータ転送
クラウドで HPC アプリケーションを実行することは、必要なデータをクラウドに移動することから始まります。AWS Snowball は、大量のデータを AWS クラウドとの間で安全に転送するデータ転送ソリューションです。Snowball を使用すると、高いネットワークコスト、長時間かかる転送、セキュリティ面の懸念といった、大規模なデータ転送に関する一般的な課題を解決できます。AWS DataSync は、オンプレミスストレージと Amazon S3 または Amazon Elastic File System (Amazon EFS) との間のデータの移動を自動化するデータ転送サービスです。DataSync は、独自のインスタンスの実行、暗号化の処理、スクリプトの管理、ネットワークの最適化、データ整合性の検証など、移行を遅らせたり、IT 運用に負担をかけたりするデータ転送に関連する多くのタスクを自動的に処理します。AWS Direct Connect はお客様の設備から AWS への専用ネットワーク接続の構築をシンプルにするクラウドサービスソリューションです。AWS Direct Connect を使用すると、AWS とデータセンター、オフィス、またはコロケーション環境との間にプライベート接続を確立することができます。これにより、多くの場合、ネットワークのコストを削減し、帯域幅のスループットを向上させ、インターネットベースの接続よりも安定したネットワークエクスペリエンスをお客様に提供することが可能となりました。
コンピューティングとネットワーキング
AWS HPC ソリューションでは、第 3 世代インテル® Xeon® プロセッサ、第 3 世代 AMD EPYC プロセッサ、Arm ベースの AWS Graviton2 プロセッサ、最新の NVIDIA GPU ベースのインスタンス、フィールドプログラマブルゲートアレイ (FPGA) 搭載インスタンスなど、ニーズに合わせて設定できるさまざまなコンピューティングインスタンスタイプから選択できます。
コンピューティング集約型: ほとんどのお客様は、Hpc6a または C5n インスタンスのいずれかが、ほとんどのコンピューティング集約型ワークロードのコア要件を満たすと考えます。これらのインスタンスは、計算流体力学 (CFD)、コンピュータ支援エンジニアリング (CAE)、材料科学から貯留層シミュレーションまで、多くの一般的なワークロードに対応するように設計されています。Hpc6a インスタンスには、最大 3.6 GHz オールコアターボ周波数を備えた 96 個の第 3 世代 AMD EPYC プロセッサと、384 GB の RAM が搭載されています。Hpc6a インスタンスは、同等のコンピューティング最適化された x86 ベースのインスタンスよりも最大 65% 優れた料金パフォーマンスを提供します。インテルのコンプライヤで最適に動作するアプリケーションをお持ちのお客様や、アプリケーションのライセンスコストのためにコアあたりのパフォーマンスを最大化する必要があるお客様は、C5n インスタンスをご検討ください。C5n インスタンスには、持続的な全コアターボ CPU クロック速度が最大 3.5 GHz のインテル Xeon スケーラブル Platinum 8000 シリーズ (Skylake) プロセッサが搭載されています。
ストレージ
HPC ソリューションを検討する場合、ストレージオプションとストレージコストは重要な要素です。AWS では、一時的および永続的なストレージ要件に合わせて、柔軟なオブジェクト、ブロック、ファイルストレージを提供しています。Amazon Elastic Block Store (Amazon EBS) は、Amazon EC2 で使用するための永続的なブロックストレージボリュームを提供します。プロビジョンド IOPS では、必要なサイズのストレージボリュームを割り当て、これらの仮想ボリュームを EC2 インスタンスにアタッチすることができます。Amazon Simple Storage Service (S3) は、インターネットを介してあらゆる種類のデータを保存およびアクセスするように設計されており、HPC の入出力データを長期にわたって保存するために使用できます。データ移行プロジェクトを再度実行する必要はありません。Amazon FSx for Lustre は、要求の厳しい HPC ワークロード向けに設計された高性能ファイルストレージサービスで、AWS クラウド内の Amazon EC2 で使用できます。Amazon FSx for Lustre は Amazon S3 とネイティブに連携し、ハイパフォーマンスファイルシステムを使用したクラウドデータセットの処理を簡単にします。S3 バケットとリンクさせると、FSx for Lustre ファイルシステムは S3 オブジェクトをファイルとして透過的に表示します。これにより結果を S3 に書き込むことができます。また、FSx for Lustre はスタンドアロンなハイパフォーマンスファイルシステムとしても使用でき、ワークロードをオンプレミスからクラウドにバーストすることができます。オンプレミスデータを FSx for Lustre ファイルシステムにコピーすることで、そのデータを AWS で実行しているコンピューティングインスタンスで高速処理することも可能です。Amazon Elastic File System (Amazon EFS) では、AWS クラウドで Amazon EC2 インスタンスと組み合わせて使用する、シンプルでスケーラブルなファイルストレージを提供しています。
オートメーションとオーケストレーション
基盤となる HPC インフラストラクチャを効率的に使用するには、ジョブの送信プロセスを自動化し、送信されたジョブを所定のポリシーと優先順位に従ってスケジューリングすることが不可欠です。 AWS Batch では、ジョブ要件に基づいて適切な種類と量のコンピューティングリソースを動的にプロビジョニングすることで、数百から数千のバッチコンピューティングジョブを実行できます。AWS Parallel Computing Service は、マネージド Slurm クラスターを構築および運用するためのマネージドサービスです。 AWS Parallel Cluster は、HPC クラスターをアセンブルおよび運用するために使用されるオープンソースの分散ツールです。Amazon EnginFrame は、標準ブラウザを使用して HPC 対応インフラストラクチャへの効率的なアクセスを提供するように設計されたウェブポータルです。EnginFrame は、ユーザーにやさしい HPC ジョブ送信、ジョブ制御、およびジョブ監視環境を提供します。
オペレーションと管理
インフラストラクチャのモニタリングと予算超過の回避は、HPC システム管理者が組織の HPC ニーズを効率的に管理するのに役立つ最も重要な機能の 2 つです。 Amazon CloudWatch は、開発者、システムオペレーター、サイトリライアビリティエンジニア (SRE)、IT マネージャーのために構築したモニタリングおよび管理サービスです。CloudWatch では、データと実用的なインサイトを利用して、アプリケーションのモニタリング、システム全体のパフォーマンスの変化に関する理解と対応、リソース使用率の最適化、および運用状態の統合的な確認を行うことができます。AWS 予算には、カスタム予算を設定して、コストまたは使用量が予算額や予算量を超えたとき (あるいは、超えると予測されたとき) にアラートを発信できる機能が用意されています。
可視化ツール
クラウドとの間で大量のデータをやり取りすることなくエンジニアリングシミュレーションの結果を可視化できることは、HPC スタックの重要な側面です。リモートビジュアライゼーションでは、エンジニアリング設計の所要時間を大幅に短縮するのに役立ちます。 Amazon DCV を使用すると、標準ネットワークを介して 2D/3D インタラクティブアプリケーションにリモートアクセスできるようになります。また、もう 1 つの完全マネージド型アプリケーションストリーミングサービスである Amazon AppStream 2.0 でも、任意のコンピュータまたはワークステーション上のブラウザに、アプリケーションセッションを安全に配信できます。
セキュリティとコンプライアンス
セキュリティ管理と法令遵守は、クラウドで HPC を実行する上でのほかの重要な側面です。AWS では複数のセキュリティ関連サービスとクイック起動テンプレートを提供しており、HPC クラスターの作成と、データセキュリティと法令順守のベストプラクティスを実装するプロセスが簡素化されます。 AWS インフラストラクチャでは、お客様のプライバシーを保護するための、強力な安全対策が用意されています。すべてのデータは安全性が非常に高い AWS データセンターに保存されます。 AWS Identity and Access Management (IAM) は、特定のデータソースにアクセスする権限を持つユーザー、役割、およびグループを管理するための堅牢なソリューションを提供します。組織は、ユーザーとシステムに個々の ID と認証情報を発行するか、Amazon Security Token Service (Amazon STS) を使用して一時的なアクセス認証情報を提供することができます。 AWS では、インフラストラクチャ内で数多くのコンプライアンスプログラムを管理できます。つまり、コンプライアンスの一部は最初から達成されているということです。AWS インフラストラクチャは、HIPAA、FISMA、FedRAMP、PCI、ISO 27001、SOC 1 といった関連する多数の業界規制に準拠しています。