Logo von Stanford DDRCC

Das DDRCC der Stanford University nutzt AWS für die Forschung in der Präzisionsmedizin unter Nutzung multimodaler Daten

2022

Das Deep Data Research Computing Center (DDRCC) der Stanford University, eine der vielen Initiativen, die von Stanford Synder Labs stammen, ist Teil der Abteilung für Genetik der Stanford Medicine in Palo Alto, Kalifornien. Ziel ist es, Werkzeuge zu entwickeln, die die Lücke zwischen Biologie und Informatik schließen und Forschern in der Präzisionsmedizin dabei zu helfen, konkrete medizinische Lösungen zu finden.

Um die Forschung in der Präzisionsmedizin zu erleichtern, hat das DDRCC das My Personal Health Dashboard (MyPHD) entwickelt, ein sicheres, skalierbares und interoperables Gesundheitsmanagement-System für Verbraucher. MyPHD bietet effiziente Datenerfassungs-, -speicher- und -analysefunktionen nahezu in Echtzeit für Forscher, die Amazon Web Services (AWS) verwenden. Das Team entwickelte auch den Stanford Data Ocean (SDO), die erste Serverless-Schulungslösung für Präzisionsmedizin, mit der Forscher über Code und Daten informieren, innovieren und zusammenarbeiten können. Durch die Nutzung von AWS nutzt DDRCC die Elastizität, Skalierbarkeit und Sicherheit der Cloud, um sowohl Verbrauchern als auch Biologen zu helfen und den Bereich der Präzisionsmedizin zu verbessern.

Das DDRCC-Team
kr_quotemark

Sie können überall auf der Welt sein und trotzdem auf diese großen medizinischen Datensätze zugreifen. Dies haben wir erreicht, indem wir unsere Infrastruktur auf AWS betrieben haben.“

Dr. Amir Bahmani
Director of Deep Data Research Computing Center (DDRCC), Stanford

 

Entwicklung von Lösungen für die Präzisionsmedizin-Forschung unter Verwendung multimodaler Daten

Präzisionsmedizin-Forschung beruht auf einem individualisierten Verständnis multimodaler Daten (wie genomische, mikrobiologische und proteomische Daten), sodass Kliniker und Forscher die Therapie für Patienten personalisieren können. Die große Datenmenge, die von tragbaren Sensoren, elektronischen Patientenakten und molekularen Profilen abgeleitet wird, fügt eine weitere Dimension hinzu. Dieser erhöhte Umfang und die zunehmende Komplexität stellen neue Herausforderungen in Bezug auf Datenverfügbarkeit, -erfassung, -speicherung, -integration und -analyse dar. Daher ist es für Forscher unerlässlich, über eine agile und elastische Datenstrategie zu verfügen. „Deep Data ist die Zukunft der Medizin. Wir benötigen Deep Data für die Gesundheitsüberwachung sowie für Diagnosen, Prognosen und Behandlungen, alles auf persönlicher Ebene,“ sagt Dr. Michael Snyder, Vorsitzender und Professor für Genetik an der Stanford University.

MyPHD von DDRCC bietet eine sichere, umfassende Umgebung für biometrische Datenanalysen in großem Maßstab. MyPHD kann komplexe Gesundheitsdatensätze speichern, organisieren und verarbeiten und unterstützt Datenanalysen und -visualisierungen nahezu in Echtzeit auf einzelner und Kohortenebene. Dies dient dazu, die Genauigkeit von Diagnosen und ärztlichen Verschreibungen zu verfeinern und die Präzisionsmedizin zu verbessern. Um die groß angelegte Analyse der Teilnehmerdaten für das individuelle Gesundheitsmanagement zu unterstützen, kann DDRCC die Ressourcen für MyPHD auf der Grundlage der Anzahl der Workloads skalieren. DDRCC verwendet auch die AWS-Sicherheitsdienste als Grundlage für seine medizinischen Anwendungen, die mit großen Mengen äußerst vertraulicher personenbezogener Daten umgehen.

Die Präzisionsmedizin hängt von der Integration unterschiedlicher, multimodaler Datensätze ab, um daraus Schlüsse zu ziehen. In der Regel sind diese Datensätze groß und auf Silos in unterschiedlichen Quellen verteilt. Für Forscher ist es wichtig, die richtigen Rechen- und Speicherkonfigurationen zu bestimmen, die erforderlich sind, um komplexe Rechenalgorithmen auf diese großen Datensätze anzuwenden. Das DDRCC-Team entwickelte SDO, um Forschern dabei zu helfen, Ressourcen für das Experimentieren mit Code effizient zuzuweisen. Mithilfe von SDO können Forscher wichtige Fragen rund um die Präzisionsmedizin untersuchen und innovative Lösungen skalieren. Durch die Ausführung von SDO-Workloads auf AWS hat DDRCC eine hohe Skalierbarkeit erreicht und gleichzeitig strenge Sicherheitsanforderungen erfüllt.

Entwickeln von innovativen Lösungen auf AWS für die multimodale Datenanalyse

Um die Fähigkeit der Biologen zu verbessern, wichtige Gesundheitsforschungen durchzuführen, verwendet DDRCC Amazon SageMaker und Service Workbench auf AWS. Mit SageMaker können Bioinformatiker Modelle für Machine Learning für praktisch jeden Anwendungsfall mit vollständig verwalteter Infrastruktur, Tools und Workflows erstellen, trainieren und bereitstellen. Das Team verwendet Service Workbench auf AWS, um die Bereitstellung einer sicheren, wiederholbaren und föderierten Kontrolle des Zugriffs auf Daten, Tools und Rechenleistung, die Forscher benötigen, zu ermöglichen. Forscher können mit Amazon Simple Storage Service (Amazon S3), einem Objektspeicher-Service mit branchenführender Skalierbarkeit, Datenverfügbarkeit, Sicherheit und Leistung, sicher auf große Datensätze zugreifen.

DDRCC erfordert eine hohe Skalierbarkeit, um Daten von MyPHD und SDO zu verarbeiten, und stützt sich auf Amazon Elastic Compute Cloud (Amazon EC2), einen Webservice, der sichere, anpassbare Rechenkapazität in der Cloud bereitstellt. „Wir können MyPHD nicht nur skalieren und eine unterschiedliche Anzahl von Benutzern unterstützen, sondern wir können unsere Algorithmen auch auf der Grundlage der Anzahl der Workloads skalieren“, sagt Dr. Arash Alavi, Forschungs- und Entwicklungsleiter des DDRCC an der Stanford University. Für den Betrieb von Vorverarbeitungspipelines für groß angelegte Genomik- und Transkriptomikanwendungen verwendet das Team außerdem Amazon Genomics CLI, ein Open-Source-Tool für Kunden aus den Bereichen Genomik und Biowissenschaften, und AWS Batch, einen Service für die vollständig verwaltete Batchverarbeitung in praktisch jeder Größenordnung. Amazon Genomics CLI vereinfacht und automatisiert die Bereitstellung von Cloud-Infrastrukturen, während AWS Batch die Ausführung von Hunderttausenden von Batch-Computing-Aufgaben auf AWS vereinfacht.

DDRCC verwendet auch Amazon Athena, einen interaktiven Abfrage-Service, um die Analyse der in Amazon S3 gespeicherten Daten mithilfe von Standard-SQL zu erleichtern. Da dieser Service sehr elastisch ist, können Forscher die von SDO und MyPHD gesammelten Daten bei Bedarf abfragen und ihre Projekte schneller voranbringen. Darüber hinaus ist Athena Serverless, sodass es keine Infrastruktur gibt, die DDRCC verwalten könnte. Das Team zahlt nur für die Abfragen, die ausgeführt werden, wodurch die Kosten gesenkt werden. „Die Fähigkeit, Ressourcen dynamisch auf der Grundlage der Größe des Workloads zu skalieren – dieses Pay-as-you-go-Modell – ist erstaunlich“, sagt Dr. Amir Bahmani, Direktor des DDRCC an der Stanford University.

Sicherheit ist eine wichtige Anforderung für Anwendungen, die medizinische Daten verarbeiten. Die Lösungen von DDRCC verwenden, speichern oder verarbeiten keine geschützten Gesundheitsinformationen und alle Daten während der Übertragung und Speicherung sind vollständig verschlüsselt und anonymisiert. Um ein hohes Maß an Sicherheit zu gewährleisten, hat DDRCC AWS-Services wie Amazon Cognito eingeführt, einen Service, mit dem Teams Benutzerregistrierung, Anmeldung und Zugriffskontrolle für Web- und mobile Apps hinzufügen können. „Zu den Sicherheitsfunktionen, die AWS bietet, gehören sofort einsatzbereite Protokollierung, Prüfung und Überwachung, mit denen wir unsere Daten schützen“, sagt Bahmani. 

Zusammenarbeit im Bereich Präzisionsmedizin

Auf AWS entwickelte das DDRCC-Team seine MyPHD- und SDO-Lösungen, um große medizinische Datenbanken sicher, mit hoher Geschwindigkeit und zu niedrigen Kosten zu importieren, abzufragen und zu analysieren. „Jedes einzelne unserer Tools hat einzigartige Bedürfnisse, insbesondere wenn sie außerhalb der Forschungsumgebung für klinische Zwecke eingesetzt werden“, sagt Dr. Philip Tsao, stellvertretender Stabschef für Präzisionsmedizin des VA Palo Alto Health Care Systems und Professor für Medizin an der Stanford University. „Um skalierbare und sichere medizinische Anwendungen zu entwickeln, ist es wichtig, funktionsübergreifende Expertenteams zu bilden und eine effektive Zusammenarbeit zu ermöglichen.“
 
Die Unterstützung von AWS war für DDRCC unglaublich wertvoll und das Unternehmen plant, weiterhin AWS-Services zu nutzen, um innovative und kreative Lösungen für die Präzisionsmedizin in der Cloud zu entwickeln. „Sie können überall auf der Welt sein und auf diese großen medizinischen Datensätze zugreifen“, sagt Bahmani. „Das haben wir erreicht, indem wir unsere Infrastruktur auf AWS betrieben haben.“

Über das Stanford Deep Data Research Computing Center

Das Stanford Deep Data Research Computing Center befindet sich in der Abteilung für Genetik der Stanford Medicine in Palo Alto, Kalifornien. Das Team arbeitet am Design und der Entwicklung systematischer und intelligenter Lösungen für biomedizinische Anwendungen in großem Maßstab.

Vorteile von AWS

  • Verbessert die Sicherheit von Lösungen für die Präzisionsmedizin
  • Erreicht die Skalierbarkeit von MyPHD für nahezu die gesamte Anzahl von Benutzern
  • Verbessert die Elastizität des SDO für den Einsatz im Unterricht
  • Senkt die Kosten mit dem nutzungsabhängigen Modell
  • Verbessert die Anpassungsfähigkeit für kollaborative Forschung

Genutzte AWS-Services

Service Workbench in AWS

Mit der Service Workbench auf AWS können IT-Teams eine sichere, wiederholbare und föderierte Kontrolle des Zugriffs auf Daten, Tools und Rechenleistung bereitstellen, die Forscher benötigen.

Weitere Informationen »

Amazon Athena

Amazon Athena ist ein interaktiver Abfrageservice, der die Analyse von Daten in Amazon S3 mit Standard-SQL erleichtert.

Weitere Informationen »

Amazon S3

Amazon Simple Storage Service (Amazon S3) ist ein Objektspeicherservice, der branchenführende Skalierbarkeit, Datenverfügbarkeit, Sicherheit und Leistung bietet.

Weitere Informationen »

Amazon EC2

Amazon EC2 stellt sichere und skalierbare Rechenkapazität zur Unterstützung von praktisch jedem Workload bereit.

Weitere Informationen »

Amazon Cognito

Mit Amazon Cognito können Sie die Registrierung und Anmeldung von Benutzern und die Zugriffskontrolle schnell und einfach Ihren Web- und mobilen Anwendungen hinzufügen.

Weitere Informationen »


Erste Schritte

Organisationen aller Größen aus verschiedenen Sektoren transformieren und erfüllen ihre Missionen täglich mithilfe von AWS.
Kontaktieren Sie unsere Experten und beginnen Sie noch heute Ihren Weg in AWS Cloud.