STACKIT Dremio ist eine vollständig verwaltete Data-Lakehouse-Plattform, die auf dem Apache Dremio Open-Source-Projekt basiert. Der Dienst ermöglicht SQL-Abfragen auf heterogenen Datenquellen wie Object Storage (S3-kompatibel), Dateisystemen und relationalen Datenbanken – ohne Datenbewegung. Als Teil der STACKIT-Plattform erfüllt Dremio alle Anforderungen der DSGVO und wird ausschließlich in deutschen Rechenzentren betrieben.
Funktionen
- Apache Arrow Flight: Hochperformante Datenabfragen mit columnar In-Memory-Verarbeitung
- Data Virtualization: Abfragen auf Daten ohne vorherige ETL-Bewegung
- Automatische Reflections: Materialisierende Caches für beschleunigte Wiederholungsabfragen
- Souveräne Datenhaltung: Vollständige Datensouveränität in deutschen Rechenzentren
- Integration: Verbindung zu STACKIT Object Storage, PostgreSQL Flex, und weiteren STACKIT-Diensten
Typische Anwendungsfälle
Data Lakehouse: Unternehmen speichern Rohdaten im STACKIT Object Storage und führen SQL-Analysen direkt auf diesen Daten durch – ohne teure ETL-Pipelines oder Datenduplizierung.
Self-Service Analytics: Business-Teams können mit vertrauten SQL-Tools auf verteilte Datenquellen zugreifen, ohne auf IT-Unterstützung angewiesen zu sein.
Vorteile
- DSGVO-konform: Alle Daten verbleiben in deutschen Rechenzentren
- Kein Lock-in: Basiert auf Apache Dremio Open Source
- Kosteneffizient: Keine Datenbewegung reduziert Speicher- und Transferkosten
- Skalierbar: Horizontale Skalierung für große Datenmengen
Integration mit innFactory
Als offizieller STACKIT Partner unterstützt innFactory Sie bei der Einrichtung von Dremio: Datenquellenanbindung, Performance-Optimierung mit Reflections und Integration in bestehende Data-Plattform-Architekturen.
