75 TB 以上が
現在までに Amazon S3 にアップロード
100 台を超える
実験機器が 6 つのサイトから接続
5 分未満で
データがクラウドで使用可能
3 か月未満で
インフラを構築
保存中および転送中の
データを暗号化
概要
Amazon Web Services (AWS) のさまざまなサービスを使用して、Resilience は各研究および製造拠点からのデータをクラウド内に安全にアップロード、保存、管理、検出結果用グローバル接続システムを構築しました。Resilience は、6 つの企業サイトにわたる 100 台を超えるクラウドに接続されたラボデバイスのネットワークを利用することで、実験からインサイトまでの所要時間を短縮すると同時に、お客様が生産を加速できるよう支援しました。
機会 | Resilience のデータ転送の自動化と加速
2020 年に設立された Resilience は、革新的なバイオマニュファクチャリングを推進しています。大手製薬会社やバイオテクノロジー企業に向け、遺伝子治療、核酸合成、タンパク質精製などのための、大規模的に市販可能なバイオマニュファクチャリングモダリティを幅広く提供します。また、バイオリアクター、フローサイトメーター、顕微鏡、ゲノムシーケンサーなど、大規模な機器ネットワークを監督します。
生産を加速し、実験を実施してからインサイトを得るまでの時間を短縮するために、Resilience は各研究施設および製造拠点にクラウドとの接続を構築する必要がありました。しかし、データの膨大な量と数多くあるデータの種類を考慮すると、接続されたデータネットワークの構築は簡単な作業ではありませんでした。「弊社には数多くの製品分野があり、それらを開発するには同じくらい幅広い実験機器が必要です。そのため、データの異質性が高くなります」と Resilience の Data Engineering 部門 Associate Director の Adam Mendez 氏は言います。「そのことから、データタイプにとらわれず、すべての実験設備からクラウドにデータを迅速かつ安全にアップロードできる、頼もしいデータ転送システムが必要でした」。 弊社は、安全でスケーラブルなインフラストラクチャと強力なモノのインターネット (IoT) 機能により、AWS がプロジェクトに最適なソリューションであると判断したのです。
AWS のデータストレージ用に一元管理されたシステムにより、サードパーティサービスとしてのソフトウェアソリューションであろうと、社内で開発されたソリューションであろうと、他のアプリケーションや分析ソフトウェアとシームレスに統合できるようになりました"
Adam Mendez 氏
Resilience の Data Engineering 部門 Associate Director
ソリューション | 6 つの研究拠点にある 100 台を超える実験機器をクラウドに接続
Resilience の Digital Research & Development 組織はデータエンジニアリングチームやネットワーキングチームなどと緊密に協力し、3 か月足らずで、グローバルに接続されたシステムを強化する AWS インフラストラクチャーを構築しました。このソリューションでは、データ転送を自動化および高速化する安全なオンラインサービスである AWS DataSync を使用して、オンプレミスシステムから AWS クラウドにデータを移動します。データをインターネットに公開せず、仮想プライベートクラウドと AWS サービスの間に接続を確立する AWS PrivateLink を使用して、このデータを安全に転送します。このデータは、どこからでも任意の量のデータを取得できるように構築されたオブジェクトストレージサービスである Amazon Simple Storage Service (Amazon S3) に保存され、Resilience の組織全体の科学ユーザーとビジネスユーザーの両方がアクセスできるようにしています。「AWS のデータストレージを一元管理できるシステムがあれば、サードパーティの Software-as-a-service ソリューションも、社内で開発されたものも、他のアプリケーションや分析ソフトウェアとシームレスに統合できます」と Mendez 氏は言います。
現在までに、Resilience は 100 台を超えるさまざまなラボデバイスから 75 TB 以上の研究データを Amazon S3 にアップロードしました。同社の科学ユーザーとビジネスユーザーは、Amazon S3 で機器データを確認、処理、分析できるようになり、研究開発の目標を達成することができるようになりました。同社は、オープンソースのエッジランタイムおよびクラウドサービスである AWS IoT Greengrass などの AWS モノのインターネットサービスを利用して、移行タスクを需要に応じて自動的に呼び出すことで、科学者がクラウド上のデータに 5 分以内にアクセスできるようにしています。一般的なプログラミング言語を使用してクラウド開発を加速する AWS Cloud Development Kit (AWS CDK) を使用することで、アプリケーションをモデル化し、Resilience は新しいデバイスを導入する際も数日でサイト全体をオンラインに組み込めるようにしました。Resilience は、「コードとしてのインフラストラクチャ」というアプローチによって、何十もの研究チームが作業を迅速に行えるよう支援しています。「各サイトからほぼリアルタイムのデータアップロードを容易にすることで、強力なデータバックアップを提供すると同時に、チームが部門やサイトを超えてインサイトを利用できるように支援できます」と Resilience の Lab Systems Engineer である Jonathan Rivernider 氏は言います。「これにより、データが科学者の手に届くまでの時間が短縮され、学習サイクルが加速します」。
クラウドでは、Resilience のラボデータを、科学者がデータを使用する方法に合わせて整理する必要がありました。これを実現するために、チームはデータレイクアーキテクチャに関する AWS 規範ガイダンスを使用して Amazon S3 データレイクをデザインし、AWS パートナーである Quilt Data と協力して、ガバナンスコントロールを割り当てました。これらのコントロールにより、機器のデータセットはグラフや PowerPoint を含むデータパッケージ、未加工のオリジナルラボデータ、分析されたデータ、および関連するラボファイルの変更不可の記録に変換されます。現在、科学者によるデータの分析段階が進むにつれて、データパッケージはバージョニング、メタデータ、リネージ情報とともに Amazon S3 で管理されています。このデータは、アクセス許可のあるラボやビジネスユーザーのユーザーポータルで検索でき、電子図書館ノートブックと統合されます。
チームは、さまざまな AWS リソースの運用上のインサイトを提供するモニタリングサービスである Amazon CloudWatch を使用することで、すべてのデータ転送タスクに対応する頼もしいログインシステムを構築することもできました。現在、Resilience は適切なアラートが発生していることを確認して、システムおよび各実験機器の動作状態を確認できるようになります。「研究データの機密性を考慮すると、このシステムにはセキュリティが最優先事項です」と Resilience の Senior Systems Engineer である古賀次郎氏は言います。「AWS PrivateLink を使用して厳しいネットワークファイアウォールルール、クライアント証明書、安全なエンドポイントを組み込むことで、すべてのデータの送信中も保管中も暗号化されて安全に転送されます」。
成果 | 医薬品開発のための学習サイクルを加速し続ける
「あらゆるサイトで使える再利用可能なパターンを作成することで、さまざまな AWS のサービスを接続して、全体的なデータ管理システムを構築する方法を示しました」と Resilience の Digital Research and Development 部門の Global Head である Brian McNatt 氏は言います。「Resilience の製造拠点が増え続け、より多くの拠点とより多くの主要な研究設備を接続しなければならないため、AWS データネットワークを拡大し続けるつもりです」。
Resilience について
Resilience は、複雑な医薬品へのアクセスを拡大することに専念するテクノロジーに着目するバイオマニュファクチュアリング企業です。同社が 2020 年に設立され、現在および将来の疾患治療を迅速、安全、大規模に行うことができるように、ハイテクでエンドツーエンドの製造ソリューションの持続可能なネットワークを構築しています。
利用している AWS のサービス
AWS DataSync
AWS DataSync は、オンプレミスと AWS ストレージサービス間のデータ移動を自動化および加速する安全なオンラインサービスです。
AWS CDK
AWS Cloud Development Kit (AWS CDK) は、一般的なプログラミング言語を使用してアプリケーションをモデル化し、クラウド開発を加速します。
詳細はこちら »
AWS PrivateLink
AWS PrivateLink は、仮想プライベートクラウド (VPC)、サポートされる AWS のサービス、およびお客様のオンプレミスネットワーク間のプライベート接続を、お客様のトラフィックを公衆インターネットに公開することなく提供します。
詳細はこちら »
Amazon CloudWatch
Amazon CloudWatch は、リアルタイムのログ、メトリクス、イベントデータを収集して自動化されたダッシュボードに視覚化し、インフラストラクチャとアプリケーションのメンテナンスを合理化します。
詳細はこちら »
今すぐ始める
あらゆる業界のさまざまな規模の組織が AWS を活用してビジネスを変革し、日々ミッションを遂行しています。当社のエキスパートにお問い合わせいただき、今すぐ AWS ジャーニーを開始しましょう。