Genentech の企業ロゴ

Genentech が AWS を利用して臨床バイオマーカーのデータの価値を最大化

2022 年

人々が橋渡し研究について考えるとき、そのほとんどは Bench to Bedside の橋渡しを思い浮かべます。この形式では、インサイトは研究室から始まり、最終的には新しい治療法や治療戦略として臨床に反映されることになります。しかし、ライフサイエンス分野におけるビッグデータの時代には、研究者は、診療所で収集された情報が研究室での新しい発見につながる「逆橋渡し」についても考えることができます。しかし、これらのインサイトを得るには、臨床データが安全で、アクセスしやすく、安定していて、検索可能である必要があります。多くの場合、「言うは易く行うは難し」です。 

「質の高い適切なデータが必要です。役に立たない大量のデータを高度な分析アルゴリズムにかけたとしても、結局役に立たないデータが抽出されるだけです」と Genentech の開発科学インフォマティクス部門のデータ管理およびエンジニアリング責任者である Christina Lu 氏は述べています。 

Roche Group に属している Genentech は、バイオテクノロジーおよび製薬業界の大手企業です。同社は、長年にわたる臨床試験および研究から、現実世界の生物学的データを豊富に蓄積してきました。2017 年、Genentech の開発科学グループは、「当社は次にどのような医薬品をターゲットとするか」、「完了した臨床試験から得られたデータを将来の試験デザインにどのように役立てることができるのか」などの重要な質問に対する回答を得ることを目的として、そのデータを研究開発用に最適化する戦略を策定しました。 この戦略には、AWS プラットフォーム上にデータエコシステムを構築して、データを遡及的に集めて検索可能なリポジトリに整理し、今後のデータ管理のためのツールとプロセスを導入することが含まれていました。

HCLS Symposium 2021: Genentech, A Member of the Roche Group (Roche Group に属する Genentech) (12:46)
kr_quotemark

臨床データ分析にはこれまで数週間を要していましたが、研究者はほんの数時間で分析を完了できるようになりました。こうして、すべてのデータポイントを重視することで、適切な患者に適切な薬を適切なタイミングで届けることができるのです"

Christina Lu 氏
Genentech、開発科学インフォマティクス部門、データ管理およびエンジニアリング責任者

データのキュレーションによって臨床的インサイトを得る

「私たちは臨床研究の転換点にいます。データが揃っていなければ、新しい治療法を開発して患者の治療を改善する大きな機会を逃していることになります」と Lu 氏は述べています。Genentech の場合、こうした機会の多くは、病気の経過や分子メカニズムを理解する事を目的としたバイオマーカー (特定の生物学的状態に関連する人体内の測定可能な分子) の分析に関係しています。

「データを揃える」ための目標は、FAIR (見つけられる、アクセスできる、相互運用できる、再利用できる) の基準を満たすことです。2018 年の報告書によると、欧州連合 (EU) の経済だけでも、FAIR の基準を満たしていない研究データを利用することにより、1 年間で 102 億 EUR の損失が発生していると推定されています。しかし、現状では、データサイエンティストは自らの時間の最大 80% を費やして、データを手作業で収集、クリーニング、整理しています。本来であれば、これらの時間を使って自らの専門知識をモデルの構築やその他の専門タスクの実行に活用する方が好ましいはずです。

「レガシーデータのキュレーションにはコストと時間がかかり、スケーラブルではありません」と Lu 氏は述べています。コストを削減し、高いスケーラビリティと効率性を実現するために、Genentech は、オブジェクトストレージサービスである Amazon Simple Storage Service (Amazon S3) でホストされる、適切に管理された一元的なリポジトリに、医薬品開発業務受託機関 (CRO) のネットワークから既存のバイオマーカーデータを統合および転送しました。これにより、Genentech の科学者や外部の研究者はより多くの情報に効率的にアクセスできるようになり、ひいては新しい遺伝子治療やがん治療薬の標的を明らかにする可能性のある研究が統計的な面で強化されます。

「先を見越してこれらのデータキュレーション戦略を適用できれば、当社は人間の健康に好ましい影響をもたらすためにさらに多くのことを成し遂げることができるでしょう」と Lu 氏は述べています。

AWS でデータエコシステムを構築

「当社が AWS 上に構築したバイオマーカーデータリポジトリは、数ペタバイト規模の探索的バイオマーカーデータを格納しており、科学者が特定の研究に必要なデータを簡単に見つけることができるインターフェイスを備えています」と Lu 氏は述べています。

バイオマーカーリポジトリは Amazon S3 に保存され、マネージド型リレーショナルデータベースサービスである Amazon Relational Database Service (Amazon RDS) が関連付けられているメタデータを処理し、Amazon Elasticsearch Service がインデックス作成と高速検索を可能にしています。Genentech は、Amazon API Gateway を利用して、必要に応じて研究に特化した安全なアクセスを研究者に提供する API を作成しています。

「臨床データ分析にはこれまで数週間を要していましたが、この合理化されたアーキテクチャのおかげで、研究者はほんの数時間で分析を完了できるようになりました」と Lu 氏は述べています。「こうして、すべてのデータポイントを重視することで、適切な患者に適切な薬を適切なタイミングで届けることができるのです」。

詳細はこちら


Genentech について

Roche Group に属している Genentech は、生命を脅かす重篤な疾患の新しい治療法の開発を専門とするバイオテクノロジー企業です。

AWS のメリット

  • ペタバイト規模の探索的バイオマーカーデータを安全に保存
  • (遡及的にも将来的にも) FAIR (見つけられる、アクセスできる、相互運用できる、再利用できる) の基準を満たすようにデータを収集


利用されている AWS のサービス

Amazon RDS

Amazon Relational Database Service (Amazon RDS) を使用すると、クラウド上のリレーショナルデータベースのセットアップ、オペレーション、スケールが簡単になります。

詳細はこちら »

Amazon S3

Amazon Simple Storage Service (Amazon S3) は、業界をリードするスケーラビリティ、データ可用性、セキュリティ、およびパフォーマンスを提供するオブジェクトストレージサービスです。

詳細はこちら »

Amazon API Gateway

フルマネージドサービスの Amazon API Gateway を利用すれば、デベロッパーは規模にかかわらず簡単に API の作成、公開、保守、モニタリング、保護を行えます。

詳細はこちら »

AWS Lambda

AWS Lambda は、新しい情報やイベントに迅速に対応するアプリケーションを構築できるようにするコンピューティングサービスです。

詳細はこちら »

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) は、極めて幅広く、詳細な機能を提供するコンピューティングプラットフォームを提供します。また、ワークロードのニーズに最適に対応できるように、500 を超えるインスタンスを提供するほか、最新のプロセッサ、ストレージ、ネットワーク、オペレーティングシステム、購入モデルを選択できます。

詳細はこちら »

Amazon Elasticsearch Service

Amazon Elasticsearch Service は、Elasticsearch の導入、セキュリティ確保、運用をコスト効率よく大規模に行うことを容易にするフルマネージドサービスです。

詳細はこちら »


開始方法

あらゆる業界のさまざまな規模のお客様が、AWS を活用してビジネスを日々変革しています。AWS のエキスパートにお問い合わせのうえ、今すぐ AWS クラウドジャーニーを開始しましょう。