Illumina が AWS を利用してサンプルから採取したゲノミクスを回答に導く
2021 年
過去 10 年間で、ゲノミクスは専門研究分野から強力な臨床ツールへと進化し、患者中心のヘルスケアの新時代を切り開きました。ゲノム配列決定と解析はより簡単、低コスト、そしてより包括的になり、臨床医が個々の患者の遺伝子検査を注文し、研究者が何千ものサンプルを調べて遺伝的変異と人間の病気との関係を明らかにすることが現実的になりました。最初のヒトゲノムの配列決定には数十年かかりましたが、科学者は現在、24 時間以内にヒトゲノム全体を効率的に配列決定できます。
Illumina のミッションは、人間の健康を改善するためにゲノムの力を解き放つことです。AWS パートナーである同社は、ゲノミクスの分野における技術的進歩の原動力となっており、配列決定用の機器のベンダーから完全なゲノミクスソリューションプロバイダーへと進化し、2013年以来、アマゾン ウェブ サービス (AWS) でソフトウェアソリューションをデプロイしています。AWS を利用した Illumina のソフトウェアソリューションは、参入障壁を低くして、研究者が日々新しい発見を生み出すのを支援し、創薬などを推進しています。
「ゲノミクス業界は、D2C (Direct to Consumer) 検査から個別化されたがんワクチンまで、あらゆる方向に拡大しています」と Illumina の最高商務責任者である Susan Tousi 氏は述べています。「Illumina の目標は、世界中のゲノミクステクノロジーへのアクセスを民主化することです。当社は最初から AWS と提携して、お客様が必要とする答えを提供してきました。過去 10 年間で、AWS で利用可能なソフトウェアポートフォリオを拡張し、すぐにデプロイしたり、特定のニーズに合わせてカスタマイズしたりできる、シームレスで包括的なソリューションスイートを提供してきました」
当社は、安全な AWS 環境で、サンプル準備から三次解析までの完全なワークフローを提供します。これにより、配列決定の前後に生成されたすべての情報を集約して解析できます」
Rami Mehio 氏
Illumina、バイオインフォマティクスおよび機器ソフトウェア担当バイスプレジデント
サンプルから出発して回答に至る
完全な次世代ゲノミクスワークフローは、サンプルの収集、準備、および配列決定から始まりますが、それはほんの始まりにすぎません。その後には、生データのリードの品質管理、データ前処理、およびアライメントから始めて、バイオインフォマティクスの大変な作業が待ち受けています。その後、科学者は Variant Calling などの二次解析に移行し、最後に、関心に基づいて高度な三次解析を実行できます。これらの三次解析には、系統アノテーション、遺伝子型と表現型の関連などが含まれる場合があります。バイオインフォマティクスの専門家ではない研究者や臨床医は、別々のプラットフォームで各ステップを実行することの大変さをすぐに実感することでしょう。
Illumina は、このゲノミクスワークフロー全体を顧客のために合理化し、すべてのステップにおいて統合ソリューションを提供します。最初の段階から見てみましょう。BaseSpaceTM Clarity LIMS (Laboratory Information Management Systems) は、ゲノミクスの顧客がサンプルを追跡し、配列決定ワークフローを最適化するのに役立ちます。配列決定用の機器は、データを Illumina Connected Analytics (ICA) プラットフォームに直接アップロードできます。このプラットフォームでは、ユーザーはデータセットを管理し、AWS 上のプラットフォーム内で解析ツールを活用できます。DRAGENTM Bio-IT プラットフォームは、正確で超高速な二次解析結果を提供します。同時に、BaseSpace Correlation Engine は、個人のデータセットとクエリを、オープンアクセスおよびアクセスコントロールされたパブリックデータセットのリポジトリに統合して、さまざまな三次解析を可能にします。
これらのプラットフォームのデータは、スケーラブルなオブジェクトストレージサービスである Amazon Simple Storage Service (Amazon S3) に保存されます。Illumina の顧客は、クラウドにおいて安全でサイズ変更可能なコンピューティング性能を提供するウェブサービスである Amazon Elastic Compute Cloud (Amazon EC2) で実行される DRAGEN を利用して、解析を強化し、劇的に加速します。
「当社は、安全な AWS 環境で、サンプル準備から三次解析までの完全なワークフローを提供します。これにより、配列決定の前後に生成されたすべての情報を集約して解析できます」と Illumina のソフトウェアおよびバイオインフォマティクス担当バイスプレジデントの Rami Mehio 氏は述べています。「これは、時間の経過に合わせてサンプルを追跡し、公開されているデータベースとデータを相互参照し、より迅速な結果を得るためにインサイトを収集したいお客様にとって強力なツールとなります」
上級ユーザーは ICA や DRAGEN などのツールをカスタマイズしてニッチな調査を実行できますが、Illumina は、特定の用途向けにすぐに利用できる機能を備えたエンドツーエンドのクラウドソリューションも提供しています。これらには、希少疾患のインサイトを明らかにするためのバリアント解析ソフトウェアソリューションである TruSightTM Software Suite、および腫瘍を解析してがん免疫バイオマーカーを明らかにするためのきめ細かく調整された配列決定アッセイである TruSight Oncology 500 が含まれます。
「当社は、ゲノミクス固有のアルゴリズムの設計に集中することを可能にしてくれるバックボーンとして、AWS ツールの強みを活用しています」と Mehio 氏は述べています。「研究者や臨床医のニーズの変化に応じて、当社は製品の新しい機能やバージョンを簡単にデプロイできます」
AWS でコストを削減する
Illumina は創業以来、ムーアの法則を超える速度でゲノミクステクノロジーのコストを削減してきました。 2001 年には、単一のヒトゲノムの配列決定には 1 億 USD を超える費用がかかっていました。20 年後、それはわずか 600 USD に抑えることができます。
「当社はゲノミクステクノロジーへのアクセスを民主化したいと考えています。コスト削減をお客様に還元することは、この取り組みにおいて大きな比重を占めています」と Tousi 氏は述べています。「コストは、研究や臨床応用の決定要因であってはなりません。配列決定と解析は、データをどのように利用できるのかに関する予測に純粋に基づいて実行される必要があるのです」
Amazon S3 Storage Classes は、さまざまなデータニーズに応じてカスタマイズできるため、Illumina は最大限のコスト削減を実現するために容易に最適化できます。Illumina のお客様は、アクセス頻度の低いペタバイト規模のデータを Amazon S3 Glacier Deep Archive に保存することで、ストレージコストを 90% 超節約できます。同様に、DRAGEN は Amazon EC2 F1 インスタンスで実行され、Illumina が必要とする並列プロセスをサポートできる高速コンピューティングを手頃な料金で提供します。F1 インスタンス では、DRAGEN FPGA によるカスタマイズ可能なハードウェアアクセラレーションが提供されます。 F1 インスタンス全体で DRAGEN をスケールするために、同社は AWS Batch を利用しました。これは、バッチコンピューティングワークロードを計画、スケジュール、および実行するフルマネージドバッチ処理サービスです。
「AWS は、スピード、柔軟性、コストを最適化し、エンドカスタマーのユースケースとニーズに対応するためのオプションを提供してくれます」と Mehio 氏は述べています。「遺伝子解析を可能な限り迅速に実行したいと考えるユーザーもいるかもしれませんし、コストを低く抑えて研究費を節約するためにある程度の速度を犠牲にすることを選ぶ学術ユーザーもいるかもしれません。さまざまな F1 インスタンスタイプとストレージオプションを活用することで、ユーザーは、柔軟性と、必要に応じてスケールアップおよびスケールダウンする機能を維持することができます」
Illumina はまた、Amazon EC2 スポットインスタンスでプラットフォームのコンピューティングジョブの多くを実行することにより、顧客のためにコストを削減します。これは、オンデマンド料金と比較して最大 90% の割引で利用できます。 「当社の顧客は、過去 1 年間だけで数十万時間のスポットインスタンスを利用しており、これにより大幅なコスト削減が実現しました」と Tousi 氏は述べています。
コスト削減と技術的なメリットは密接に関連しています。Illumina は最近、三次解析用の Correlation Engine を AWS に移行し、データインジェストパイプラインを 6 倍に拡張しつつ、コストを削減し、ナレッジベースをより速く成長させ、より強力にすることができました。
グローバルゲノミクスをスケールするための安全なソリューション
ヒトゲノムデータは極めて個人的な健康情報と関連付けられる場合があるため、データ漏えいは世界中の医療機関にとってますます増大するリスクとなっています。その結果、セキュリティは Illumina とその顧客にとって最も重要な考慮事項となっており、その多くはますます厳しくなるデータ管理に関する規制を遵守しなければなりません。
「セキュリティは『0 番目の仕事 (job zero)』です。すなわち、当社が行うすべての中心となっています」と Tousi 氏は述べています。「土台の部分として、当社は、基盤となるクラウドインフラストラクチャがエンタープライズレベルのセキュリティとコンプライアンスを維持できるように、AWS 責任共有モデルを活用できます。Amazon EC2 リージョンをグローバルに活用することで、データについてコンピューティングを活用し、すべてのリージョンのお客様をサポートしながら、データ主権を維持できるようにしています」
AWS は、HIPAA、GDPR、ISO 27001、ISO 13485 など、何千ものセキュリティ標準とコンプライアンス認定をサポートしており、お客様がゲノミクスワークフロー全体でコンプライアンス要件を満たすのを支援します。Illumina は、Amazon Virtual Private Cloud (Amazon VPC) でデータ管理を提供することにより、お客様にさらなる安心を提供します。Amazon VPC は、あるお客様のデータを別のお客様のデータから分離する、論理的に分離されたカスタム仮想ネットワークで他の AWS リソースを起動します。
このグローバルなスケーラビリティとデプロイにより、長期的なプロジェクトと適切な危機対応の両方で有意義なコラボレーションが促進されます。世界中の研究者が、2020 年と 2021 年の前半に、Illumina の新型コロナウイルス (COVID-19) BaseSpace アプリで 371,000 を超える新型コロナウイルス (COVID-19) 関連のサンプルを処理しました。「お客様がオンプレミスでしかこれを実行できなかったとしたら、当社は深刻な制約に直面していたでしょう。したがって、クラウドはそのレベルで世界的なパンデミックに対応できるようにするための鍵でした」と Tousi 氏は述べています。
ゲノミクスとバイオテクノロジーの未来を築く
大規模な集団遺伝学イニシアティブが増加し、ICA などの強力な解析ソフトウェアソリューションへのアクセスを拡大している Illumina は、ゲノミクスにおける「ビッグデータ」の力を十全に活用して、顧客が大量の配列決定データから豊富なインサイトを得るのをサポートしています。これらのプロジェクトは、パーソナライズされたゲノミクスの新時代の到来を後押しするものであり、より小さなサンプルでは明らかではなかった遺伝子と健康上の発生事象との関係を研究者が明らかにすることを可能にします。
Illumina のプラットフォームは、研究がマルチオミクスの未来にシームレスに移行するのにも役立ちます。例えば、クラウドベースの DRAGEN Single-Cell RNA Pipeline を利用すると、科学者は個々の細胞の遺伝子発現にアノテーションを付けることができます。DRAGEN アクセラレーションを利用すると、プラットフォームは 3 つの細胞サンプルを約 53 分で同時並行処理できます。
「当社は、ICA、DRAGEN、および AWS 上にデプロイされた他のツールを利用して、お客様が NGS や健康データを含むあらゆるデータタイプを集約し、それらの大規模なコホートから新しい情報を抽出し、人間の健康を大規模に改善できるソリューションを提供しています」と Mehio 氏は述べています。
詳細はこちら
人間の健康を改善するために他の主要なライフサイエンス組織を AWS がどのようにサポートしているかをご覧ください。
Illumina について
Illumina は、遺伝的変異と生物学的機能を解析するための統合システムを開発、製造、販売しています。
AWS のメリット
- サンプルから出発して解析に至る、合理化され、統一された、カスタマイズ可能なワークフローへのアクセスを促進
- Amazon EC2 スポットインスタンスと Amazon S3 Glacier を利用して、コンピューティングとストレージのコストを大幅に削減
- 安全で準拠した環境でゲノミクスソリューションの堅牢なポートフォリオをグローバルにデプロイ
- 371,000 を超える新型コロナウイルス (COVID-19) 関連のサンプルを処理するために、研究を加速し、世界中の顧客のコラボレーションを促進
利用されている AWS のサービス
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) は、安全でサイズ変更可能なコンピューティング性能をクラウド内で提供するウェブサービスです。デベロッパーがウェブスケールのクラウドコンピューティングを簡単に利用できるように設計されています。
Amazon S3
Amazon Simple Storage Service (Amazon S3) は、業界をリードするスケーラビリティ、データ可用性、セキュリティ、およびパフォーマンスを提供するオブジェクトストレージサービスです。
AWS Virtual Private Cloud
Amazon Virtual Private Cloud (Amazon VPC) は、定義した論理的に分離された仮想ネットワークで AWS リソースを起動できるようにするサービスです。
Amazon EC2 スポットインスタンス
Amazon EC2 スポットインスタンスを使うと、AWS クラウド内の使用されていない EC2 キャパシティーを活用できます。スポットインスタンスは、オンデマンド料金に比べ最大 90% の割引価格でご利用いただけます。
使用を開始する
あらゆる業界のさまざまな規模のお客様が、AWS を活用してビジネスを日々変革しています。当社のエキスパートにお問い合わせの上、今すぐ AWS クラウドジャーニーを開始しましょう。