Zum Hauptinhalt springen
Cloud / AWS / Produkte / AWS Glue - Serverless ETL

AWS Glue - Serverless ETL

AWS Glue ist ein serverloser ETL-Service für Datenintegration, Transformation und Katalogisierung in Data Lakes.

Analytics
Preismodell Pay per DPU-hour
Verfügbarkeit All major regions
Datensouveränität EU regions available
Zuverlässigkeit 99.9% availability SLA

Was ist AWS Glue?

AWS Glue ist ein serverloser ETL-Service (Extract, Transform, Load) für die Datenintegration. Der Service automatisiert das Entdecken, Vorbereiten und Kombinieren von Daten für Analytics und Machine Learning. Glue besteht aus drei Hauptkomponenten: Data Catalog, ETL Engine und Glue Studio für visuelle ETL-Entwicklung.

Kernfunktionen

  • Data Catalog: Zentrales Metadaten-Repository, das Schemas automatisch erkennt und mit Athena, Redshift und EMR kompatibel ist
  • Glue Crawlers: Automatisches Scannen von Datenquellen und Schema-Erkennung für S3, RDS und JDBC-Datenbanken
  • Glue ETL: Serverlose Spark-basierte Transformationen in Python oder Scala
  • Glue Studio: Visueller ETL-Editor für Drag-and-Drop Pipeline-Entwicklung
  • Glue DataBrew: No-Code Datenaufbereitung mit über 250 vorgefertigten Transformationen

Typische Anwendungsfälle

Data Lake Aufbau

Glue Crawlers scannen verschiedene Datenquellen und erstellen einen einheitlichen Katalog. ETL-Jobs transformieren Rohdaten in analysierbare Formate wie Parquet und laden sie in S3-basierte Data Lakes.

Data Warehouse Integration

Daten aus operativen Systemen werden transformiert und in Amazon Redshift geladen. Glue übernimmt Schema-Mapping, Datentyp-Konvertierung und inkrementelle Loads.

Machine Learning Datenvorbereitung

DataBrew bereinigt und normalisiert Daten für ML-Workflows. Fehlende Werte werden behandelt, Outlier erkannt und Features für das Training vorbereitet.

Vorteile

  • Keine Infrastruktur-Verwaltung: automatische Skalierung der Spark-Cluster
  • Pay-per-Use Abrechnung nach DPU-Stunden
  • Integration mit dem gesamten AWS Analytics-Stack
  • Wiederverwendbare Transformationen und Job-Bookmarks für inkrementelle Verarbeitung

Integration mit innFactory

Als AWS Reseller unterstützt innFactory Sie bei AWS Glue: Aufbau von Data-Lake-Architekturen, Entwicklung von ETL-Pipelines in Python/Scala und Integration mit bestehenden Data-Warehouse-Systemen.

Typische Anwendungsfälle

ETL
Data catalog
Data preparation
Data integration

AWS Cloud Expertise

innFactory ist AWS Reseller mit zertifizierten Cloud-Architekten. Wir bieten Beratung, Implementierung und Managed Services für AWS.

Ähnliche Produkte anderer Cloud-Anbieter

Andere Cloud-Anbieter bieten vergleichbare Services in dieser Kategorie. Als Multi-Cloud Partner helfen wir bei der richtigen Wahl.

33 vergleichbare Produkte bei anderen Cloud-Anbietern gefunden.

Bereit, mit AWS Glue - Serverless ETL zu starten?

Unsere zertifizierten AWS Experten helfen bei Architektur, Integration und Optimierung.

Beratung vereinbaren