Erstellen Sie End-to-End-Streaming-Pipelines mit Amazon Managed Service for Apache Flink Blueprints mit einem einzigen Klick. Weitere Informationen.
Amazon Managed Service für Apache Flink vereinfacht die Entwicklung und Ausführung von Anwendungen zur Echtzeit-Stream-Verarbeitung mit Apache Flink. Amazon Managed Service für Apache Flink stellt Ihre Flink-Cluster bereit und konfiguriert sie. Außerdem wird die Verwaltung von Flink-Aufträgen orchestriert. Es richtet Überwachung und Alarme ein, bietet Auto Scaling und ist für hohe Verfügbarkeit ausgelegt (einschließlich Failover für Verfügbarkeitszonen). Der Service bietet Zugriff auf die ausdrucksstarken APIs von Apache Flink. Mit Amazon Managed Service für Apache Flink Studio können Sie in wenigen Schritten interaktiv Datenströme abfragen oder zustandsbehaftete Anwendungen starten. Mit diesem verwalteten Service können Sie mit Apache Flink loslegen und Ihre Anwendungen zur Verarbeitung von Datenströmen schnell bereitstellen und ausführen.
Mit Amazon Managed Service für Apache Flink haben Sie Zugriff auf die gesamte Palette der branchenführenden Funktionen von Apache Flink, einschließlich Datenverarbeitung mit geringer Latenz und hohem Durchsatz, genau einmaliger Verarbeitung und dauerhaftem Anwendungsstatus. Mit Amazon Managed Service für Apache Flink können Sie sichere, konforme und hochverfügbare Anwendungen bereitstellen. Amazon Managed Service für Apache Flink repliziert Daten und Workloads mühelos über mehrere Availability Zones hinweg und sorgt so für unterbrechungsfreie Leistung und Zuverlässigkeit, ohne für zusätzliche Kapazitäten bezahlen zu müssen.
Die Anwendungsentwicklung ist mit Amazon Managed Service für Apache Flink einfacher, da der Service die flexiblen APIs von Flink in Java, Scala, Python und SQL unterstützt. Amazon Managed Service für Apache Flink lässt sich mit Hunderten von Datenquellen und -zielen integrieren, z. B. Amazon Managed Streaming für Apache Kafka (Amazon MSK), Amazon Kinesis Data Streams, Amazon Kinesis Data Firehose, Amazon Simple Storage Service (Amazon S3), Amazon DynamoDB, JDBC-Konnektoren und benutzerdefinierte Konnektoren.
Anwendungen zur Stream-Verarbeitung unter Verwendung von Apache Flink
Open-Source
Amazon Managed Service für Apache Flink beinhaltet Open-Source-Bibliotheken wie Apache Flink, Apache Beam, Apache Zeppelin, AWS-SDK und AWS-Serviceintegrationen. Apache Flink ist ein Framework und eine Engine zum Erstellen hochverfügbarer und präziser Streaming-Anwendungen. Apache Beam ist ein einheitliches Modell zur Definition von Streaming- und Batch-Anwendungen für die Datenverarbeitung, die über mehrere Laufzeit-Engines ausgeführt werden. AWS-SDKs tragen dazu bei, die Komplexität der Codierung für viele AWS-Services zu reduzieren, indem diese APIs in Ihrer bevorzugten Sprache bereitstellen und AWS-Bibliotheken, Codebeispiele und Dokumentation enthalten.
Flexible APIs
Amazon Managed Service für Apache Flink unterstützt die flexiblen APIs von Flink in Java, Scala, Python und SQL, die auf verschiedene Anwendungsfälle spezialisiert sind, einschließlich zustandsbehafteter Ereignisverarbeitung, Streaming-ETL („Extract, Transform and Load“) und Echtzeitanalysen. Mit vorgefertigten Operatoren und Analysefunktionen können Sie eine Apache Flink Streaming-Anwendung in Stunden statt in Monaten erstellen. Die Bibliotheken sind erweiterbar, so dass Sie Echtzeitverarbeitung für eine Vielzahl von Anwendungsfällen durchführen können.
AWS-Service-Integrationen
Sie können eine Datenquelle oder ein Datenziel mit minimalem Code einrichten und integrieren. Verwenden Sie den Amazon Managed Service für Apache-Flink-Bibliotheken zur Integration mit den folgenden AWS-Services:
Erweiterte Integrationsmöglichkeiten
Zusätzlich zu den AWS-Integrationen enthalten die Bibliotheken von Amazon Managed Service für Apache Flink mehr als 40 Apache-Flink-Konnektoren und die Möglichkeit, benutzerdefinierte Integrationen zu erstellen. Mit ein paar weiteren Codezeilen können Sie das Verhalten jeder Integration mit erweiterten Funktionen ändern. Sie können auch benutzerdefinierte Integrationen mit einer Reihe von Apache-Flink-Primitiven erstellen. Dadurch können Sie von Dateien, Verzeichnissen, Sockets oder anderen Quellen, auf die über das Internet zugegriffen wird, lesen und schreiben.
Exactly-once-Verarbeitung
Mit Amazon Managed Service für Apache Flink können Sie Anwendungen erstellen, bei denen verarbeitete Datensätze die Ergebnisse genau einmal beeinflussen, was als genau einmalige Verarbeitung bezeichnet wird. Selbst im Falle einer Anwendungsunterbrechung, wie z. B. einer internen Servicewartung oder einer vom Benutzer initiierten Anwendungsaktualisierung, stellt der Service sicher, dass alle Daten verarbeitet werden und keine doppelten Daten vorhanden sind.
Statusbehaftete Verarbeitung
Der Service speichert frühere und laufende Berechnungen oder Status im laufenden Anwendungsspeicher. Vergleichen Sie Echtzeit- und vergangene Ergebnisse über einen beliebigen Zeitraum hinweg und gewährleisten Sie eine schnelle Wiederherstellung bei Anwendungsunterbrechungen. Der Status wird immer verschlüsselt und schrittweise im laufenden Anwendungsspeicher gespeichert.
Dauerhafte Anwendungsdatensicherungen
Über einen einfachen API-Aufruf dauerhafte Anwendungsdatensicherungen erstellen und löschen. Sie können Ihre Anwendungen nach einer Unterbrechung sofort aus dem letzten Backup wiederherstellen oder auf eine frühere Version zurücksetzen.
ML-Integration
Amazon Managed Service für Apache Flink unterstützt Machine-Learning-Algorithmen (ML). Sie können Echtzeitanwendungen für Klassifizierung, Clustering, Auswertung, Empfehlungen für die Feature Engineering, Regressionen und Statistik erstellen.
Kompatibilität mit AWS Glue Schema Registry
Amazon Managed Service für Apache Flink ist mit AWS Glue Schema Registry kompatibel. Die Schema Registry hilft Ihnen dabei, die Datenqualität zu verbessern und sich vor unerwarteten Änderungen zu schützen. Dabei werden Kompatibilitätsprüfungen durchgeführt, die die Schemaentwicklung für Ihre Schemas in Workloads von Amazon Managed Service für Apache Flink steuern, die mit Apache Kafka, Amazon MSK oder Amazon Kinesis Data Streams als Quell- oder Senken-Konnector verbunden sind.
Amazon Kinesis Data Analytics Studio
Stream-Inspektion und Visualisierung
Kinesis Data Analytics Studio unterstützt Abfragen im Sekundentakt mit integrierten Visualisierungen. Sie können Ad-hoc-Abfragen durchführen, um Ihren Datenstrom schnell zu untersuchen und die Ergebnisse in Sekundenschnelle anzuzeigen.
Einfache Build-and-Run-Umgebung
Studio-Notebooks bieten eine Entwicklungsumgebung mit einer einzigen Oberfläche für die Entwicklung, das Debugging von Code und die Ausführung von Stream-Verarbeitungsanwendungen.
Verarbeitung mit SQL, Python oder Scala
Kinesis Data Analytics Studio unterstützt SQL, Python und Scala in der gleichen Entwicklungsumgebung. Syntaxhervorhebung, Validierung und kontextabhängige Vorschläge führen Sie innerhalb des Notebooks zur Interaktion mit Ihren Daten mit integrierter Unterstützung für Apache-Flink-spezifische Funktionen.
Schnelle Anwendungsentwicklung mit Serverless-Stream-Verarbeitung
Sie müssen keine Server bereitstellen, verwalten oder skalieren. Schreiben Sie Code und bezahlen Sie für die Ressourcen, die Ihre Anwendungen verbrauchen. Stellen Sie Ihren Code im Notebook einfach zu einer kontinuierlich laufenden Stream-Verarbeitungsanwendung mit Autoskalierung und dauerhaftem Zustand bereit.
Open Source
Kinesis Data Analytics Studio läuft auf Apache Flink und produziert Apache-Flink-Anwendungen, die in der Produktion eingesetzt werden. Apache-Zeppelin-Notebooks bieten eine vertraute Erfahrung mit einfacher Bedienung für die Erstellung von Streaming-Anwendungen in einer Sprache Ihrer Wahl.
Integriert mit dem AWS Glue Data Catalog
Der AWS-Glue-Datenkatalog ist ein persistenter Metadatenspeicher, der als zentrales Repository mit Tabellendefinitionen dient. Sie können mithilfe des AWS Glue Data Catalog schnell mehrere AWS-Datensätze durchsuchen. Kinesis Data Analytics Studio ist mit dem AWS Glue Data Catalog kompatibel, in dem Sie das Schema für Ihre Quell- und Zieltabellen definieren können.
Erste Schritte mit Amazon Kinesis Data Analytics
Besuchen Sie die Seite der Preisgestaltung für Amazon Kinesis Data Analytics.
Weitere Informationen zur Verwendung von Amazon Kinesis Data Analytics finden Sie in dieser Schritt-für-Schritt-Anleitung für SQL und Apache Flink.
Erstellen Sie Ihre Streaming-Anwendung mit der Amazon-Kinesis-Data-Analytics-Konsole.