AWS Glue ist ein Serverless-Datenintegrationsservice, der mehrere Datenintegrations-Engines zur Unterstützung Ihrer Benutzer und Workloads bietet. Mit AWS Glue können Sie die entsprechende Engine für jede beliebige Workload je nach Eigenschaften der Workload und Vorlieben Ihrer Entwickler und Analysten verwenden.
Schlüsselfunktionen
AWS Glue für Apache Spark
AWS Glue stellt eine leistungsoptimierte, serverlose Infrastruktur zum Ausführen von Apache Spark für Datenintegrations- und ETL-Aufträge (Extrahieren, Transformieren und Laden) bereit. AWS Glue für Apache Spark unterstützt Batch- und Streamverarbeitung und beschleunigt die Datenerfassung, -verarbeitung und -integration. Sie können dann Ihren Data Lake und Ihr Data Warehouse schnell erstellen und aktualisieren und Erkenntnisse schneller aus Daten extrahieren.
AWS Glue for Ray
Mit AWS Glue for Ray können Ihre Dateningenieure und Entwickler große Datensätze mit Python und gängigen Python-Bibliotheken verarbeiten. AWS Glue verwendet Ray (Ray.io), ein vereinheitlichtes Open-Source-Framework für die Datenverarbeitung zum Skalieren von Python-Workloads. AWS Glue for Ray enthält beliebte Python-Datenverarbeitungsbibliotheken, sodass Sie Ihre eigenen Bibliotheken mitbringen können, um Ihren Datenintegrationsauftrag anzupassen.
AWS Glue for Python Shell
Mit AWS Glue for Python Shell können Sie einen Python Shell-Auftrag zum Ausführen von Python-Skripten in AWS Glue verwenden. Über diese Aufträge können Sie komplexe Datenintegrations- und Analyseaufträge in Python schreiben. AWS Glue for Python Shell-Aufträge bieten häufige Analysebibliotheken sofort einsatzbereit an, darunter Pandas, NumPy und Amazon SageMaker Data Wrangler. Sie können jetzt die gebündelte Funktionalität nutzen, um Verbindungen zu einer Vielzahl von Datenbanken, Data Warehouses und AWS-Services herzustellen.