Was ist Daten-Governance?

Daten-Governance ist eine Methode, die sicherstellt, dass sich die Daten in einem geeigneten Zustand befinden, um Geschäftsinitiativen und Abläufe zu unterstützen. Die Abstimmung von Daten-Governance auf Geschäftsinitiativen hat viele Vorteile.

  • Die Finanzierung des Daten-Governance-Programms begründen
  • Die Beteiligung der Geschäftswelt motivieren
  • Die Priorität von Daten-Governance-Aktivitäten fördern
  • Das erforderliche Maß an Datenintegration in den teilnehmenden Geschäftsbereichen fördern
  • Helfen Sie mit, das richtige Betriebsmodell zu finden, insbesondere den erforderlichen Grad der Zentralisierung und Dezentralisierung.

Warum ist Daten-Governance wichtig?

Laut Gartner werden bis 2025 80 % der Unternehmen, die ihr digitales Geschäft skalieren wollen, scheitern, weil sie keinen modernen Ansatz für die Verwaltung von Daten und Analysen verfolgen. Es ist kein Wunder, dass Chief Data Officer Daten-Governance als oberste Priorität für ihre Dateninitiativen bezeichnen. In einer Umfrage von 2023 unter 350 CDOs und CDO-äquivalenten Rollen stellte MIT CDOIQ fest, dass 45 % der Chief Data Officer Daten-Governance als oberste Priorität einstufen. Diese Datenexperten wollen ein Governance-Modell einführen, das es ihnen ermöglicht, Daten den richtigen Personen und Anwendungen zur Verfügung zu stellen, wenn sie sie benötigen – und gleichzeitig die Daten mit entsprechenden Kontrollen sicher und geschützt zu halten. 

In der Vergangenheit wurde Governance eingesetzt, um Daten in Silos einzuschließen, um Datenlecks oder Datenmissbrauch zu verhindern. Datensilos haben jedoch zur Folge, dass legitime Benutzer Hindernisse überwinden müssen, um Zugriff auf Daten zu erhalten, wenn sie diese benötigen. Ungewollt werden datengesteuerte Innovationen unterdrückt.

Sie haben zwei Hebel, um Governance zu einem Motor für Innovation zu machen: Zugriff und Kontrolle. Der Schlüssel zum Erfolg liegt darin, das richtige Gleichgewicht zwischen Zugriff und Kontrolle zu finden – und dieses Gleichgewicht ist für jedes Unternehmen anders. Wenn Sie zu viel Kontrolle ausüben, werden die Daten in Silos gesperrt und Benutzer können nicht auf die Daten zugreifen, wenn sie sie benötigen. Dies hemmt nicht nur die Kreativität, sondern führt auch zur Schaffung von Schatten-IT-Systemen, die dafür sorgen, dass Daten veraltet und ungesichert sind. Wenn Sie andererseits zu viel Zugriff gewähren, landen Daten in Anwendungen und Datenspeichern, was das Risiko von Datenlecks erhöht.

Die Einrichtung der richtigen Governance – eine, die Zugriff und Kontrolle in Einklang bringt – gibt den Menschen Vertrauen in die Daten, indem sie die angemessene Erfassung, Pflege, Schutz und gemeinsame Nutzung von Daten fördert. Dies fördert Innovationen und schützt gleichzeitig die Daten.

Was ist Analytics-Governance?

Analytics-Governance regelt sowohl Daten für die Verwendung in Analyseanwendungen als auch die Nutzung von Analysesystemen. Ihr Analytics-Governance-Team kann Governance-Mechanismen wie die Versionsverwaltung und Dokumentation von Analyseberichten einrichten. Wie immer sollten Sie die regulatorischen Anforderungen im Auge behalten, Unternehmensrichtlinien festlegen und der gesamten Organisation Integritätsschutz bieten.

Was ist Machine Learning (ML)-Governance?

ML-Governance wendet viele der gleichen Daten-Governance-Praktiken auf ML an. Datenqualität und Datenintegration müssen die Daten bereitstellen, die für das Modelltraining und die Produktionsbereitstellung erforderlich sind (Feature Stores sind dabei ein wichtiger Aspekt). Verantwortungsvolle künstliche Intelligenz (KI) legt besonderes Augenmerk auf die Verwendung sensibler Daten zur Erstellung von Modellen. Zu den zusätzlichen ML-Governance-Funktionen gehören die Beteiligung von Mitarbeitern an der Modellerstellung, Bereitstellung und Überwachung, die Dokumentation von Modelltraining, Versionsverwaltung, unterstützten Anwendungsfällen und Leitlinien für die ethische Modellnutzung sowie die Überwachung des Modells in der Produktion auf Genauigkeit, Abweichung, Überanpassung und Unteranpassung.

Generative KI erfordert zusätzliche Daten-Governance wie Qualität und Integrität der Daten zur Unterstützung der Anpassung von Basismodellen für das Training und Schlussfolgerungen, die Steuerung der Toxizität und generativer KI sowie den Betrieb des Basismodells (FM): FMOPs.

Sie können KI/ML mit demselben Daten-Governance-Programm unterstützen. Datenaufbereitung ist notwendig, um Daten in eine Form umzuwandeln, die KI/ML-Modelle für Schulungen und Produktionsableitungen verwenden können. Die effizienteste Datenaufbereitung ist jedoch die Aufbereitung, die Sie nicht vornehmen müssen. Datenwissenschaftler verbringen zu viel Zeit mit der Vorbereitung von Daten für jeden Anwendungsfall. Ihr Daten-Governance-Team kann Ihnen helfen, diese undifferenzierte schwere Arbeit zu erleichtern. Darüber hinaus kann Daten-Governance die Erstellung von Shaped Feature Stores überwachen, die in KI- und ML-Anwendungsfällen verwendet werden können.

Schließlich müssen sensible Daten angemessen geschützt werden, damit Ihr Team die Risiken minimieren kann, die entstehen, wenn sensible Daten zur Schulung der Basismodelle verwendet werden.

Ähnlich wie bei Analysen im Allgemeinen müssen Sie die Verwendung von KI/ML-Modellen, die Sie erstellen oder anpassen, regeln. Idealerweise sollte dies eng mit der Analytics-Governance verknüpft sein, da diese Funktion weiß, wie sie verschiedene Geschäftsbereiche unterstützen kann.

Was sind die wichtigsten Herausforderungen der Daten-Governance?

Die häufigste strategische Herausforderung für Daten-Governance besteht darin, Ihr Programm an Geschäftsinitiativen auszurichten, anstatt den Wert von Data Governance direkt zu vermitteln. Sie könnten beispielsweise vorschlagen, dass Endbenutzern das Auffinden der Daten, nach denen sie suchen, erleichtert werden sollte, oder Sie könnten vorschlagen, dass es sinnvoll ist, Datenqualitätsprobleme zu lösen. Dies sind jedoch Lösungen auf der Suche nach einem Problem. Wenn Sie so vorgehen, werden Sie am Ende mit Geschäftsinitiativen, die Sie unterstützen sollten, um Finanzierung und Sponsoring konkurrieren. Stattdessen sollten Sie Daten-Governance so positionieren, dass sie Geschäftsinitiativen unterstützt. Jede große Geschäftsinitiative benötigt Daten. Daten-Governance sollte sicherstellen, dass sich die Daten im richtigen Zustand befinden, um den Erfolg von Geschäftsinitiativen zu unterstützen. Übersehen Sie nicht die Berichts- und Prüfungspraktiken, die zeigen, wie Daten-Governance diese Initiativen unterstützt.

Eine weitere häufige strategische Herausforderung für Daten-Governance besteht darin, zu vermeiden, dass Daten-Governance zu eng angewendet wird. Eine zu enge Definition könnte darin bestehen, das Programm auf einzelne Geschäftsbereiche oder Anwendungsfälle auszurichten, ohne einen breiteren Blick auf die Geschäftsbereiche zu werfen. Eine enge Definition könnte auch bedeuten, dass Daten-Governance nur anhand von ein oder zwei Daten-Governance-Funktionen definiert wird. Ein Datenkatalog stellt beispielsweise kein Daten-Governance-Programm dar.

Welche Arten von Daten-Governance gibt es?

Ihr Daten-Governance-Programm sollte Zentralisierung und Dezentralisierung (einschließlich Self-Service) in Einklang bringen. In Ihrem Unternehmen wird es eine Mischung aus zentraler, föderierter und dezentraler Governance geben – wiederum abhängig von den Geschäftsanforderungen. Sie sollten die Domain-Teams so weit wie möglich befähigen und gleichzeitig die Domain-übergreifende Kohärenz wahren (z. B. die Fähigkeit, Daten miteinander zu verknüpfen).  

  • Zentralisierte Daten-Governance: Zentrale Organisationen sind letztlich für Leitbilder, Richtlinien, Toolauswahl und mehr verantwortlich. Die täglichen Aktionen werden oft in die Geschäftsbereiche (LOB) verlagert.
  • Föderierte Daten-Governance: Föderierte Daten-Governance ermöglicht es einzelnen Geschäftsbereichen oder Geschäftsinitiativen, so zu arbeiten, wie es ihren Bedürfnissen am besten entspricht. Mit föderierter Daten-Governance gibt es immer noch ein kleineres, zentralisiertes Team, das seine Arbeit auf die Lösung der am häufigsten wiederkehrenden Probleme konzentriert, einschließlich beispielsweise unternehmensweiter Datenqualitätstools.
  • Self-Serve oder dezentrale Daten-Governance: Jedes LOB tut, was es für sein spezifisches Projekt benötigt. Jedes Projekt verwendet alle Tools oder Prozesse aus anderen Projekten, für die es eine Eignung gibt. Mit zunehmender Beliebtheit von Themen wie Data Mesh (selbst dezentralisiert) nimmt auch Self-Service-Daten-Governance zu. 

Wer entwickelt Daten-Governance?

Der Aufbau eines geschäftsorientierten Daten-Governance-Programms erfordert viele berufliche Funktionen.

  • Führende Sponsoren kennen viele Geschäftsinitiativen auf der Unternehmens-Roadmap und können bei der Festlegung von Prioritäten für die Unterstützung von Daten-Governance helfen.
  • Datenverantwortliche kommen aus dem Unternehmen und sind täglich an den Einzelheiten der Projekte beteiligt. Sie helfen dabei, die Datenprobleme zu verstehen, die bei gezielten Geschäftsinitiativen wahrscheinlich zu Problemen führen werden.
  • Dateninhaber legen Richtlinien zu den Daten fest, unter anderem, wer unter welchen Umständen Zugriff auf die Daten haben sollte, wie Vorschriften auszulegen und anzuwenden sind, und Definitionen wichtiger Begriffe
  • Dateningenieure kommen (normalerweise) aus der IT und stellen Tools zur Verfügung, mit denen Daten gesichert, die Datenqualität verwaltet, Daten aus einer Vielzahl von Quellen integriert und die richtigen Daten gefunden werden können.

Wie funktioniert Daten-Governance?

Daten-Governance erfordert Personal-, Prozess- und Technologielösungen mit einer Vielzahl von Funktionen.

Kuratieren Sie Daten in großem Maßstab, um die Datenflut zu einzudämmen. Um Ihre Daten in großem Maßstab zu kuratieren, müssen Sie Ihre wertvollsten Datenquellen, einschließlich Datenbanken, Data Lakes und Data Warehouses, identifizieren und verwalten, sodass Sie die Verbreitung und Transformation kritischer Datenbestände begrenzen können. Daten zu kuratieren bedeutet auch sicherzustellen, dass die richtigen Daten korrekt, aktuell und frei von vertraulichen Informationen sind. So können die Benutzer Vertrauen in datengestützten Entscheidungen und in die Daten, die die Anwendungen speisen, haben.

Funktionen: Datenqualitätsmanagement, Datenintegration und Stammdatenmanagement

Entdecken und verstehen Sie Ihre Daten im Kontext, um datengestützte Entscheidungen zu beschleunigen. Wenn Sie Ihre Daten im Kontext verstehen, können alle Benutzer die Bedeutung ihrer Daten erkennen und verstehen, sodass sie sie vertrauensvoll nutzen können, um den Geschäftswert zu steigern. Mit einem zentralen Datenkatalog können Daten leicht gefunden, der Zugriff angefordert und Daten für Geschäftsentscheidungen verwendet werden.

Funktionen: Daten-Profiling, Datenherkunft und Datenkataloge

Schützen und teilen Sie Ihre Daten sicher mit Kontrolle und Vertrauen. Ihre Daten zu schützen bedeutet, das richtige Gleichgewicht zwischen Datenschutz, Sicherheit und Zugriff zu finden. Es ist wichtig, den Datenzugriff über Unternehmensgrenzen hinweg steuern zu können, und zwar mit Tools, die sowohl für Geschäfts- als auch für technische Anwender intuitiv sind.

Funktionen: Datenlebenszyklus, Datenkonformität und Datensicherheit

Reduzieren Sie das Geschäftsrisiko und verbessern Sie die Einhaltung gesetzlicher Vorschriften. Um Risiken zu reduzieren, müssen Sie verstehen, wie und von wem diese Daten verwendet werden. AWS-Services helfen Ihnen bei der Überwachung und Prüfung des Datenzugriffs – einschließlich des Zugriffs über ML-Modelle – um die Datensicherheit und die Einhaltung gesetzlicher Vorschriften zu gewährleisten. Machine Learning erfordert auch Prüfungstransparenz, um einen verantwortungsvollen Umgang und eine vereinfachte Berichterstattung zu gewährleisten.

Funktionen: Nutzungsprüfung für Daten und ML

Wie können Sie Ihre Daten-Governance-Teams verbessern?

Der Schlüssel zu einem effektiven Daten-Governance-Programm liegt in der Verknüpfung mit bereits finanzierten Geschäftsinitiativen. Stellen Sie sicher, dass Ihr Team weiß, welche Daten-Domains, Quellen und Elemente zur Unterstützung dieser Initiativen benötigt werden.

  • Erstellen Sie eine Daten-Governance-Roadmap, die zeigt, dass gezielte Geschäftsinitiativen unterstützt werden. Beginnen Sie dann damit, Datenüberschneidungen zwischen ausgewählten Geschäftsinitiativen zu identifizieren.
  • Identifizieren Sie Anwendungen und Business-Intelligence-Anwendungsfälle, die von den Daten unterstützt und gespeist werden müssen, einschließlich der Anforderungen an Aktualität und Datenschutz.
  • Erfahren Sie, wie zweckdienliche Daten für jede ausgewählte Geschäftsinitiative aussehen.
  • Unterstützen und erweitern Sie das Daten-Governance-Programm durch Einbettung in das Betriebsmodell des Unternehmens, sodass Datenplanung und -implementierung zu einem natürlichen Bestandteil des Unternehmensbetriebs werden.
  • Organisieren Sie die Analytics-Community für Self-Service und Konsistenz.
  • Unterstützen Sie künstliche Intelligenz (KI) und Machine Learning (ML) mit Daten-Governance und ML-Governance. Verwenden Sie dasselbe Daten-Governance-Programm, erweitern Sie es jedoch um Feature Stores und ML-Modelle.

Was sind die AWS-Angebote für Daten-Governance?

Mit durchgängiger Daten-Governance auf AWS haben Unternehmen die Kontrolle darüber, wo sich ihre Daten befinden, wer Zugriff darauf hat und was mit ihnen in jedem Schritt des Datenworkflows gemacht werden kann. Daten-Governance mit AWS unterstützt Unternehmen dabei, datengesteuerte Entscheidungen zu beschleunigen, indem es den richtigen Personen und Anwendungen erleichtert wird, die richtigen Daten sicher zu finden, darauf zuzugreifen und sie zu teilen, wenn sie sie benötigen. Sie können Daten kuratieren, indem Sie die Datenintegration und Datenqualität automatisieren, um die Verbreitung von Daten zu begrenzen. Mit zentralisierten Katalogen, die die Datenkompetenz verbessern, können Sie Ihre Daten entdecken und verstehen. Sie können Ihre Daten mit präzisen Berechtigungen schützen, mit denen Sie Daten vertrauensvoll teilen können. Sie können Risiken reduzieren und die Einhaltung gesetzlicher Vorschriften verbessern, indem Sie den Datenzugriff überwachen und prüfen.

  • Amazon DataZone – Daten über Unternehmensgrenzen hinweg mit integrierter Governance freigeben
  • AWS Glue – Alle Ihre Daten in beliebigem Umfang entdecken, vorbereiten und integrieren
  • AWS Lake Formation – Data Lakes innerhalb weniger Tage erstellen, verwalten und sichern
  • Amazon QuickSight vereinheitlichte Business Intelligence auf Hyperskalierung
  • Amazon SageMaker – Machine-Learning-Modelle für Anwendungsfälle mit vollständig verwalteter Infrastruktur, Tools und Workflows erstellen, trainieren und bereitstellen
  • ML-Governance-Webseite
  • Amazon Bedrock – Generative KI-Anwendungen mit Basismodellen (FMs) erstellen und skalieren
  • Amazon Macie – sensible Daten in großem Maßstab erkennen und schützen
  • Amazon Simple Storage Service (Amazon S3) Access Points – Objektspeicher für den Abruf beliebiger Datenmengen von jedem Ort aus
  • AWS Data Exchange – Daten von Drittanbietern in der Cloud einfach finden, abonnieren und verwenden
  • AWS Clean Rooms – Clean Rooms in wenigen Minuten erstellen, um mit Ihren Partnern zusammenzuarbeiten, ohne Rohdaten teilen zu müssen

Beginnen Sie mit Daten-Governance in AWS, indem Sie noch heute ein kostenloses Konto erstellen.

Nächste Schritte auf AWS

Zusätzliche produktbezogene Ressourcen ansehen
Weitere Informationen zu AWS Analytics Services 
Für ein kostenloses Konto registrieren

Sie erhalten sofort Zugriff auf das kostenlose Kontingent von AWS.

Registrieren 
Mit der Entwicklung in der Konsole starten

Starten Sie mit der Entwicklung in der AWS-Managementkonsole.

Anmeldung