お客様事例/ライフサイエンス

2022 年
Vertex のロゴ

Vertex Pharmaceuticals が AWS を利用して cryo-EM データの保存と処理のコストを 50% 削減

Vertex Pharmaceuticals が cryo-EM ワークフローを AWS で実行することで創薬を加速させる方法をご覧ください。

2 倍

改善されたパフォーマンス

>50%

削減されたコスト

数日

改善されたデータ処理時間

3 か月

新しいアーキテクチャのプロトタイプの完成に要した期間

強化された

スケーラビリティと向上した生産性

概要

Vertex Pharmaceuticals (Vertex) は、重篤な疾患を持つ人々のために、革新的な医薬品を生み出す科学的イノベーションに投資するグローバルなバイオテクノロジー企業です。Vertex は低温電子顕微鏡法 (cryo-EM) を用いて、タンパク質の 3D 構造や潜在的な創薬標的の構造に関する高度な画像やインサイトを生成します。このプロセスを通じて、同社の化学者は、ターゲットに結合するように構造を最適化することでより優れた薬物分子を設計できます。
 
ただし、cryo-EM のワークフローには、膨大な量のコンピューティングおよびストレージのリソースが必要です。複数の研究施設で分析を行う科学者は、ペタバイト規模のデータを生成します。Vertex は、研究を加速させるために十分な処理能力を提供しつつ、拡大し続けるニーズに対応できるようにインフラストラクチャをスケーラブルにする必要がありました。
 
Vertex はデータの保存と処理を Amazon Web Services (AWS) に移行しました。同社は Amazon Elastic Compute Cloud (Amazon EC2) を含むいくつかの AWS サービスを利用していました。Amazon EC2 は、事実上あらゆるワークロードをサポートするために、安全でサイズ変更可能なコンピューティング性能を提供します。Vertex は、ハイパフォーマンスコンピューティング (HPC) ワークロードのパフォーマンスを改善し、データ分析を高速化し、システムをスケーラブルにすると同時に、ストレージとコンピューティングのコスト全体を 50% 超削減しました。
研究室で働く科学者

機会 | cryo-EM ワークフローの処理パフォーマンスを加速して、より短時間でインサイトを生み出す 

Vertex 社は cryo-EM を活用して、潜在的な創薬標的の分子構造を解析することで疾患の治療法を発見しています。「cryo-EM を使用することで、ほんの数年前には調べることができなかったタンパク質構造についてのより深いインサイトを得るために十分な解像度を得ることができます」と Vertex Pharmaceuticals の主任研究科学者である David Posson 氏は述べています。
 
ただし、この高度なテクノロジーによって新しい発見や治療の可能性が開かれる一方で、ストレージとコンピューティング性能に対するニーズも高まっています。「cryo-EM 用の顕微鏡を稼働させることで、毎日テラバイト規模のデータが生成されます」と Vertex Pharmaceuticals のソフトウェアエンジニアリング担当シニアディレクターである Roberto Iturralde 氏は述べています。「1 年間で 1 PB のデータが生成されるのはよくあることです」。 さらに、科学者はインサイトを迅速に得る必要があります。Vertex の cryo-EM ワークロードを実行するためのオンプレミスインフラストラクチャでは、急速に高まるコンピューティングとストレージの需要に対応するのが大変でした。
 
Vertex は当初、外部施設にある顕微鏡のすべてのデータをハードディスクを使用してデータセンターに転送する必要がありましたが、これには数週間かかっていました。新しいデータが取り込まれる際に、同社のオンプレミスの HPC クラスターは、アクティビティの急増を効率的に処理できませんでした。また、アクティビティが少ない時期にスケールダウンすることもできませんでした。
 
データを長期的に保存するには、別の課題もありました。数週間が経過した後に、科学者が古い顕微鏡データにアクセスすることはほとんどありませんでした。しかし、Vertex のオンプレミス環境は、使用状況やアクセスパターンに基づいてコストを節約するように最適化されていませんでした。この分野が急速に進化するにつれて、cryo-EM インフラストラクチャをオンプレミスで管理するために必要なハードウェア、ソフトウェア、ネットワーク、およびセキュリティの継続的なアップグレードに対応するのに多額のコストがかかるようになりました。2022 年の早い時期に、Vertex は、よりパフォーマンスが高く、より伸縮性のあるソリューションが必要であることに気付きました。
 
Vertex は 2015 年以降、さまざまなワークロード向けに既に AWS を利用していました。AWS re:Invent 2021 でリリースされた新機能にインスピレーションを得て、Vertex は cryo-EM ワークロード全体を再設計し、AWS に移行しました。同社はわずか 3 か月で新しいアーキテクチャのプロトタイプを作成しました。「AWS は、Vertex で利用したいと考えている、極めて幅広く奥深い一連のクラウドネイティブテクノロジーを備えています」と Iturralde 氏は述べています。「当社は AWS を利用して、科学者の進化し続ける要件をより良く満たす新しい設計にすぐに切り替えました」。
kr_quotemark

AWS を利用することで、イノベーションを起こす方法により多くの時間を割くことができるようになりました。当社はクリエイティブになり、クラウドを活用して科学の進歩を加速させることができるのです」。

Roberto Iturralde 氏
Vertex Pharmaceuticals、ソフトウェアエンジニアリング担当シニアディレクター

ソリューション | AWS ParallelCluster を利用したデータの保存コストの削減と処理の高速化 

Vertex は AWS に移行することで、Amazon Simple Storage Service (Amazon S3) にデータが到達する場所のより近くにワークロードを移行しました。Amazon S3 は、業界をリードするスケーラビリティ、データの可用性、セキュリティ、パフォーマンスを提供するオブジェクトストレージサービスです。また、Vertex は Amazon FSx for Lustre も使用しています。Amazon FSx for Lustre は、世界でも有数の人気を誇る高性能ファイルシステム上に構築されたフルマネージド型の共有ストレージで、科学者が多くの分析を行うときに必要なだけの量のストレージリソースを提供します。

処理が完了すると、Vertex はデータを Amazon S3 に送り返します。同社は、Amazon S3 ライフサイクルポリシー (Amazon S3 がオブジェクトのグループに適用するアクションを定義する一連のルール) を使用してデータを効率的にソートしています。「Amazon S3 ライフサイクルポリシーを使用することで、データをさまざまな階層に配置して、ストレージのコストを削減できます」と Iturralde 氏は述べています。また、同社はストレージをシームレスにスケールできるため、データセンターのオーバーヘッドを抑えることができます。

データ処理のためのコンピューティングを管理するために、Vertex は AWS ParallelCluster を利用しています。AWS ParallelCluster は、伸縮性の高い HPC クラスターを AWS に簡単にデプロイして管理できるようにする、オープンソースのクラスター管理ツールです。分析ソフトウェアの要求に応じて HPC ノードをスピンアップおよびスピンダウンします。「作業が完了した後には、支払額をほぼゼロに戻すことができます」と Iturralde 氏は述べています。「科学の進歩が当社のリソースを圧迫したり、インフラストラクチャの維持に労力をかけたりすることを心配しなくてもよいのです」。

コンピューティングコストをワークロードの需要に合わせることで、Vertex はコストを 50% 削減しました。さらに、以前のアーキテクチャと比較して、そのパフォーマンスは 2 倍向上しました。また、Vertex は、cryo-EM チームが他のグループとリソースを共有する際にオンプレミス環境で頻繁に生じていたボトルネックを解消しました。「これまでは、他の誰もリソースを使用していなくても、cryo-EM データの分析には数週間かかっていました」と Posson 氏は述べています。「今では、AWS を利用してデータを 1 週間以内に確実に提供できるようになりました」。

Vertex は、Amazon Cognito を使用したネイティブなシングルサインオンサポートを追加しました。Amazon Cognito は、ウェブアプリやモバイルアプリにサインアップ、サインイン、アクセスコントロールを迅速かつ簡単に追加するために企業が利用できるサービスです。「Amazon Cognito を利用することで、適切な従業員だけがソフトウェアにアクセスできるという安心感がさらに高まります」と Iturralde 氏は述べています。これに加えて、Vertex は Application Load Balancer を使用しています。Application Load Balancer は、モダンアプリケーションの配信に対応することを目的とした高度なリクエストルーティングで HTTP と HTTPS のトラフィックを負荷分散し、ネットワークを保護します。

AWS では、Vertex は手作業によるメンテナンスを減らしながら、プロセスの効率、スケーラビリティ、費用対効果を高めることができました。また、AWS で構築するということは、データセンターのハードウェアの調達に伴う数か月にわたるリードタイムなしに、同社が最新のコンピューティングおよび GPU のリソースにアクセスできることも意味します。例えば、Vertex は、CPU、ホストメモリ、GPU 容量の強力な組み合わせを提供する Amazon EC2 G5 インスタンスを実行しています。cryo-EM プロセスをクラウドで実行することで、科学者はほぼリアルタイムで分析できます。Vertex は、顕微鏡の使用に伴って多額のコストが発生する時間をより効率的に使用し、科学的な進歩を促進します。

成果 | Amazon EC2 を利用して、データ処理を高速化して研究をスピードアップ 

Vertex は既に分析結果の提供に必要な時間を短縮しており、さらに加速させたいと考えています。「ライブ処理により、顕微鏡のデータを取得し次第、すぐに分析を開始できます」と Posson 氏は述べています。「1 週間かかっていた作業を、半分の時間で完了できるようになるかもしれません」。
 
また、Vertex は、今後も HPC インフラストラクチャの伸縮性を高め、クラウドネイティブなものにして、コストを節約することも計画しています。「AWS を利用することで、イノベーションを起こす方法により多くの時間を割くことができるようになりました」と Iturralde 氏は述べています。「当社はクリエイティブになり、クラウドを活用して科学の進歩を加速させることができるのです」。

Vertex Pharmaceuticals について

Vertex はボストンに本社を置く製薬企業で、世界中の最新の顕微鏡テクノロジーを利用して、複雑な分子を研究し、重篤な疾患の治療法を研究しています。

利用されている AWS のサービス

Amazon S3

Amazon Simple Storage Service (Amazon S3) は、業界随一のスケーラビリティ、データ可用性、セキュリティ、パフォーマンスを提供するオブジェクトストレージサービスです。

詳細はこちら »

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) は、事実上あらゆるワークロードに対応するために、安全でサイズ変更可能なコンピューティング性能を提供します。

詳細はこちら »

AWS ParallelCluster

AWS ParallelCluster は、オープンソースのクラスター管理ツールで、AWS でハイパフォーマンスコンピューティング (HPC) クラスターをデプロイして管理することを容易にします。

詳細はこちら »

Amazon FSx for Lustre

Amazon FSx for Lustre は、人気のある Lustre ファイルシステムのスケーラビリティとパフォーマンスを備えたフルマネージド共有ストレージを提供します。

詳細はこちら »

今すぐ始める

あらゆる業界のさまざまな規模の組織が AWS を活用してビジネスを変革し、日々ミッションを遂行しています。当社のエキスパートにお問い合わせいただき、今すぐ AWS ジャーニーを開始しましょう。