史丹佛大學的 DDRCC 使用 AWS 進行運用多模態資料的精準醫療研究
2022 年
史丹佛大學的深度資料研究運算中心 (DDRCC) 是源自史丹佛 Synder Labs 以外的眾多計劃之一,屬於位於加州帕洛阿爾托的史丹佛醫學院遺傳學部的一部分。其目標是創造能夠彌合生物學與電腦科學之間差距的工具,並協助精準醫療領域的研究人員實現明確的醫療解決方案。
為了促進精準醫學研究,DDRCC 為消費者建立了我的個人健康儀表板 (MyPHD),這是一種安全,可擴展且可交互運用的健康管理系統。MyPHD 為使用 Amazon Web Services (AWS) 的研究人員提供有效率的資料擷取、儲存和近乎即時的分析功能。該團隊還開發了 Stanford Data Ocean (SDO),這是第一個讓研究人員能透過程式碼和資料進行教育,創新和協作的無伺服器精準醫療教育解決方案。透過在 AWS 上建置,DDRCC 使用雲端的彈性、可擴展性和安全性為消費者和生物學家創造優勢,並提升精準醫療領域。
「無論您身處何處,都可以存取這些龐大的醫療資料集。我們透過在 AWS 上執行基礎架構來達成此一目標。」
Amir Bahmani博士
史丹佛大學深度資料研究運算中心 (DDRCC) 主任
利用多模態資料設計精準醫療研究解決方案
精準醫療研究仰賴對多模態資料 (如基因體、微生物體和蛋白質體資料) 的個人化理解,讓臨床醫生和研究人員因此能為病患提供個人化的治療方法。來自穿戴式感應器、電子醫療記錄和分子設定檔的大量資料增加了另一個維度。這種增加的規模和複雜性會引發有關資料可用性、擷取、儲存、整合和分析的新挑戰。因此,研究人員必須制定敏捷且具彈性的資料策略。 「深度資料是醫學的未來。我們需要它來監測健康狀況並取得診斷結果、預後症狀和治療方法,所有這些都在個人層面上,」史丹佛大學遺傳學主任及教授 Michael Snyder 表示。
DDRCC 的 MyPHD 為大規模的生物識別資料分析提供了一個安全的全方位環境。它可以儲存、整理和處理複雜的健康狀態資料集,並支援在個人和同類群組層級上近乎即時的資料分析和視覺化。這是為了提高診斷和醫療處方的準確性,並改善精準醫療。為了支援大規模分析參加者的個人健康管理資料,DDRCC 可以根據工作負載調整 MyPHD 的資源。它也將 AWS 安全服務用為醫療應用程式的基礎,處理大量高度敏感的個人資料。
精準醫療仰賴整合不同的多模態資料集來推出結論。這些資料集通常數量龐大,並且分散在不同的來源中。對研究人員而言,重要的是要決定將複雜的運算演算法套用在這些大型資料集所需的正確運算和儲存設定。DDRCC 團隊開發了 SDO,以協助研究人員有效地分配資源以進行程式碼實驗。使用 SDO,研究人員可以探索有關精準醫療的重要問題,並擴展創新解決方案。透過在 AWS 上執行 SDO 工作負載,DDRCC 在滿足嚴格的安全要求的同時實現了高度的可擴展性。
在 AWS 上建立適用於多模態資料分析的創新解決方案
為了提高生物學家完成重要健康研究的能力,DDRCC 使用 Amazon SageMaker 和 Service Workbench on AWS。使用 SageMaker,生物資訊學家可以透過全受管的基礎架構、工具和工作流程,為幾乎任何使用案例建置、訓練和部署機器學習模型。該團隊使用 Service Workbench on AWS 來促進對研究人員所需的資料存取、工具和運算能力進行安全、可重複和聯合的控制。研究人員可以安全地存取 Amazon Simple Storage Service (Amazon S3) 上的大型資料集,這是一種具備領先業界的可擴展性、資料可用性、安全性和效能的物件儲存服務。
DDRCC 需要高度可擴展性才能處理來自 MyPHD 和 SDO 的資料,並仰賴 Amazon Elastic Compute Cloud (Amazon EC2),這是一種在雲端中提供安全、可調整大小的運算容量的 Web 服務。「我們不僅可以擴展 MyPHD 並支援不同數量的使用者,還可以根據工作負載數量擴展演算法,」Arash Alavi 博士 (史丹佛大學 DDRCC 研究與發展組長) 表示。為了針對大型基因體和轉錄應用程式執行預處理管道,該團隊還使用 Amazon Genomics CLI (適用於基因體和生命科學客戶的開放原始碼工具) 和 AWS Batch (適用於幾乎任何規模的全受管批次處理服務)。Amazon 基因體 CLI 會簡化和自動化雲端基礎架構部署,而 AWS Batch 則可讓您在 AWS 上輕鬆執行成千上萬個批次運算任務。
DDRCC 還使用 Amazon Athena,這是一種互動式查詢服務,可協助使用標準 SQL 對存放在 Amazon S3 中的資料進行分析。由於這項服務具有高度彈性,因此研究人員可以隨需查詢 SDO 和 MyPHD 收集的資料,並在其專案中更快速地移動。此外,Athena 無伺服器,因此 DDRCC 無需管理任何基礎架構。該團隊只需支付他們執行的查詢費用,可降低成本。「根據工作負載的大小 (即按用量付費模式) 動態擴展資源的能力非常驚人,」Amir Bahmani 博士 (史丹佛大學 DDRCC 主任) 表示。
安全性是處理醫療資料的應用程式的主要要求。DDRCC 的解決方案不會使用、儲存或處理受保護的健康資訊,並且所有傳輸中和靜態資料都經過完全加密和匿名處理。為了保持高度的安全性,DDRCC 採用了 Amazon Cognito 之類的 AWS 服務,這類服務可讓團隊對 Web 和行動應用程式新增使用者註冊、登入和存取控制。「AWS 提供的安全功能包括立即可用的記錄、稽核和監控,我們可用以保護資料,」Bahmani 表示。
精準醫療方面的協作
關於史丹佛深度資料研究運算中心
史丹佛大學深度資料研究運算中心位於加州帕洛阿爾托的史丹佛醫學院遺傳學部。該團隊致力於大型生物醫學應用程式的系統和智慧解決方案的設計和開發。
AWS 的優勢
- 提高精準醫療解決方案的安全性
- 可為幾乎任何數量的使用者實現 MyPHD 的可擴展性
- 提升 SDO 的彈性以供教育用途
- 利用按使用量付費模式降低成本
- 提高協作研究的適應性
使用的 AWS 服務
Service Workbench on AWS
Amazon Athena
Amazon Athena 是一種互動式查詢服務,可讓您使用標準 SQL 輕鬆分析 Amazon S3 中的資料。
Amazon S3
Amazon Simple Storage Service (Amazon S3) 物件儲存服務提供領先業界的可擴展性、資料可用性、安全性及效能。
Amazon EC2
Amazon EC2 提供安全且可調整大小的運算容量,以支援幾乎所有工作負載。
Amazon Cognito
開始使用
各行各業各種規模的組織每天都在使用 AWS 來變革其業務和履行其使命。
聯絡我們的專家,立即開始您自己的 AWS 雲端之旅。