Zum Hauptinhalt springen
Cloud / Google Cloud / Produkte / Dataform - SQL-Workflows für Datentransformation

Dataform - SQL-Workflows für Datentransformation

Dataform ist Googles verwalteter Service für SQL-basierte Datentransformation und ELT-Workflows in BigQuery.

Data Analytics
Preismodell Kostenlos (BigQuery-Kosten)
Verfügbarkeit Global mit EU-Regionen
Datensouveränität EU-Regionen verfügbar
Zuverlässigkeit 99,9% SLA

Was ist Dataform?

Dataform ist ein vollständig verwalteter Service von Google Cloud für SQL-basierte Datentransformation in BigQuery. Der Service ermöglicht Data-Teams, Transformationspipelines als Code zu definieren, mit Abhängigkeitsmanagement, automatisierten Tests und Git-basierter Versionierung.

Dataform nutzt SQLX, eine erweiterte SQL-Syntax, die Referenzen zwischen Tabellen, Assertions und JavaScript-Templating unterstützt. Dies macht Data-Warehouse-Pipelines wartbarer und testbarer als lose Sammlungen von SQL-Skripten.

Kernfunktionen

  • SQLX-Workflows: Erweiterte SQL-Syntax mit Abhängigkeiten, Referenzen und Makros
  • Abhängigkeitsmanagement: Automatische Ausführungsreihenfolge basierend auf Tabellenabhängigkeiten
  • Assertions und Tests: Automatisierte Datenqualitätsprüfungen als Teil der Pipeline
  • Git-Integration: Versionierung und Code-Review für Transformationslogik

Typische Anwendungsfälle

Data-Warehouse-Modellierung

Data-Teams nutzen Dataform, um Rohdaten in BigQuery in strukturierte, analysierbare Modelle zu transformieren. Staging-, Zwischen- und Mart-Tabellen werden als SQLX-Dateien definiert und automatisch in der richtigen Reihenfolge ausgeführt.

ELT-Pipelines

In ELT-Architekturen übernimmt Dataform den Transformationsschritt nach dem Laden der Rohdaten in BigQuery. Regelmäßige Ausführungen stellen sicher, dass Analysetabellen aktuell bleiben.

Vorteile

  • Nativ in BigQuery und Google Cloud integriert
  • Verwaltete Ausführungsumgebung ohne eigene Infrastruktur
  • Bessere Code-Qualität durch Tests und Code-Review
  • Kostenlos (nur BigQuery-Verarbeitungskosten)

Integration mit innFactory

Als Google Cloud Partner unterstützt innFactory Sie bei Dataform: Data-Warehouse-Architektur, SQLX-Pipeline-Entwicklung und Best Practices für Datentransformation.

Typische Anwendungsfälle

SQL-basierte Datentransformation
ELT-Pipelines
Data-Warehouse-Modellierung

Häufig gestellte Fragen

Was ist Dataform?

Dataform ist ein verwalteter Service von Google Cloud für SQL-basierte Datentransformation in BigQuery. Es ermöglicht die Definition von Transformationspipelines als SQLX-Code mit Abhängigkeitsmanagement, Tests und Versionierung.

Was ist SQLX?

SQLX ist eine Erweiterung von SQL, die Dataform nutzt. Sie fügt Features wie Referenzen zwischen Tabellen, Assertions (Tests), JavaScript-Templating und wiederverwendbare Makros hinzu.

Wie unterscheidet sich Dataform von dbt?

Dataform und dbt verfolgen ähnliche Konzepte. Dataform ist nativ in Google Cloud und BigQuery integriert mit einer verwalteten Ausführungsumgebung. dbt bietet eine breitere Datenbank-Unterstützung.

Google Cloud Partner

innFactory ist zertifizierter Google Cloud Partner. Wir bieten Beratung, Implementierung und Managed Services.

Google Cloud Partner

Ähnliche Produkte anderer Cloud-Anbieter

Andere Cloud-Anbieter bieten vergleichbare Services in dieser Kategorie. Als Multi-Cloud Partner helfen wir bei der richtigen Wahl.

AWS

Amazon Kinesis Data Streams - Echtzeit-Datenstreaming

Amazon Kinesis Data Streams ist ein AWS-Service für skalierbares Echtzeit-Datenstreaming mit geringer Latenz.

Preismodell Bezahlung pro shard hour und PUT payload …
SLA 99,9% Verfügbarkeit
Vergleichen →
AWS

Amazon OpenSearch Service - Such- und Analytics-Engine

Amazon OpenSearch ist eine verwaltete Such- und Analytics-Engine für Log-Analyse, Full-Text-Suche und Observability.

Preismodell Bezahlung für Instanzstunden und …
SLA 99,9% Verfügbarkeit
Vergleichen →
AWS

AWS Lake Formation - Data Lake Management

AWS Lake Formation vereinfacht Aufbau und Verwaltung von Data Lakes. Zentrale Governance, Sicherheit und …

Preismodell Bezahlung für zugrunde liegenden …
SLA N/A
Vergleichen →
AWS

Amazon QuickSight - Business Intelligence

Amazon QuickSight ist ein serverloser BI-Service für interaktive Dashboards und Datenvisualisierung. ML-gestützte …

Preismodell Bezahlung pro user per month
SLA 99,9% Verfügbarkeit
Vergleichen →
Azure

Azure HDInsight - Verwaltete Apache Hadoop, Spark und Kafka Cluster

Azure HDInsight ist ein verwalteter Service für Apache Hadoop, Spark, Hive, Kafka und HBase für Big Data Analysen in der …

Preismodell Bezahlung pro Stunde (cluster nodes)
SLA 99,9%
Vergleichen →
Azure

Power BI Embedded - Einbettung von Power BI Analysen in Anwendungen

Power BI Embedded ermöglicht die Integration von interaktiven Power BI Reports und Dashboards in eigene Anwendungen und …

Preismodell Stündlich nach Kapazität
SLA 99,9%
Vergleichen →

39 vergleichbare Produkte bei anderen Cloud-Anbietern gefunden.

Bereit, mit Dataform - SQL-Workflows für Datentransformation zu starten?

Unsere zertifizierten Google Cloud Experten helfen bei Architektur, Integration und Optimierung.

Beratung vereinbaren