Was ist Amazon DataZone?
Amazon DataZone ist ein Daten-Management-Service, der Unternehmen dabei unterstützt, ihre Datenbestände zu katalogisieren, zu entdecken und sicher zu teilen. Der Service bietet ein zentrales Business-Datenportal, über das Mitarbeiter relevante Daten finden und für ihre Analysen nutzen können.
DataZone löst eine der größten Herausforderungen im modernen Datenmanagement: die Kluft zwischen vorhandenen Daten und den Teams, die diese Daten benötigen. Durch automatisierte Metadaten-Erfassung, einheitliche Governance-Richtlinien und Self-Service-Zugriff demokratisiert DataZone den Datenzugang im Unternehmen.
Der Service integriert sich nahtlos mit bestehenden AWS-Datenservices wie Redshift, Athena, Glue und S3. Datenproduzenten können Assets in einem Katalog veröffentlichen, während Konsumenten über ein Portal nach relevanten Daten suchen und Zugriff beantragen.
Kernfunktionen
- Business-Datenportal: Zentrales Portal, über das Nutzer Daten entdecken, verstehen und für Analysen anfordern können
- Automatische Metadaten-Erfassung: Crawlt und katalogisiert Metadaten aus verbundenen Datenquellen automatisch
- Governance-Workflows: Strukturierte Genehmigungs-Workflows für Datenzugriffsanfragen mit Audit-Trail
- Domänen und Projekte: Organisationsmodell zur logischen Gruppierung von Daten und Teams
- Datenqualitäts-Integration: Einbindung von Datenqualitätsmetriken direkt in den Katalog
Typische Anwendungsfälle
Unternehmensdatenkatalog: Große Organisationen nutzen DataZone, um einen zentralen, durchsuchbaren Katalog aller Datenbestände aufzubauen. Mitarbeiter finden relevante Daten ohne IT-Support und verstehen deren Kontext durch Business-Metadaten.
Daten-Governance: Compliance-Teams setzen DataZone ein, um einheitliche Governance-Richtlinien über alle Datenquellen hinweg durchzusetzen. Jeder Zugriff wird dokumentiert, und sensible Daten werden automatisch klassifiziert.
Self-Service-Analytics: Analysten und Data Scientists nutzen das DataZone-Portal, um eigenständig relevante Datensätze zu finden, Zugriff zu beantragen und diese in ihre Analytics-Umgebungen zu laden.
Vorteile
- Zentraler Datenkatalog reduziert Silos und Doppelarbeit
- Self-Service-Zugriff beschleunigt datengetriebene Entscheidungen
- Automatisierte Governance stellt Compliance sicher
- Nahtlose Integration mit dem bestehenden AWS-Daten-Ökosystem
Integration mit innFactory
Als AWS Reseller unterstützt innFactory Sie bei Amazon DataZone: von der Planung der Daten-Governance-Strategie über die Einrichtung von Domänen und Projekten bis zur Integration bestehender Datenquellen und Schulung der Fachabteilungen.
Typische Anwendungsfälle
Häufig gestellte Fragen
Was ist Amazon DataZone?
Amazon DataZone ist ein Daten-Management-Service, der es ermöglicht, Daten im gesamten Unternehmen zu katalogisieren, zu entdecken, zu teilen und zu verwalten. Er bietet ein Business-Datenportal für Self-Service-Zugriff auf kuratierte Datenbestände.
Welche Datenquellen unterstützt DataZone?
DataZone integriert sich nativ mit AWS-Datenquellen wie Amazon Redshift, Amazon Athena, AWS Glue und Amazon S3. Über benutzerdefinierte Konnektoren können auch externe Datenquellen angebunden werden.
Wie funktioniert die Zugriffskontrolle in DataZone?
DataZone verwendet ein Konzept von Domänen und Projekten, um Datenzugriff zu organisieren. Datenproduzenten veröffentlichen Assets in einem Katalog, und Datenkonsumenten können über Abonnements Zugriff beantragen, der von Dateneignern genehmigt wird.