Was ist Cloud Run worker pools?
Cloud Run worker pools ist ein Cloud-Run-Ressourcentyp für non-HTTP, pull-basierte Hintergrund-Workloads. Die Instanzen sind langlebig und ziehen kontinuierlich Arbeit aus Quellen wie Pub/Sub-Pull-Subscriptions, Kafka- oder Redis-Task-Queues und selbst gehosteten GitHub-Actions-Runnern. Im Gegensatz zu Cloud Run Services haben worker pools keinen lastverteilten Endpunkt und keine URL und skalieren nicht auf Basis eingehender HTTP-Requests.
Worker pools lösen das Problem, dass requestgetriebene Serverless-Modelle schlecht zu dauerhaft laufender Verarbeitung passen. Wer Nachrichten aus Queues konsumiert, verteilte KI/ML-Jobs ausführt oder CI/CD-Runner betreibt, brauchte bisher entweder selbst verwaltete VMs oder Kubernetes. Mit Cloud Run worker pools läuft diese Hintergrundarbeit auf der serverlosen Cloud-Run-Plattform, mit ressourcenbasierter Abrechnung und GPU-Support, ohne dass ein eigener Cluster betrieben werden muss.
Kernfunktionen
- Pull-basierte Hintergrundverarbeitung: Langlebige Instanzen ziehen kontinuierlich Arbeit aus Queues wie Pub/Sub, Kafka und Redis, ohne lastverteilten Endpunkt oder URL.
- GPU-Support für KI/ML: NVIDIA L4 (24 GB VRAM) und NVIDIA RTX PRO 6000 Blackwell (96 GB VRAM), maximal eine GPU pro Instanz, für verteilte Inferenz- und Batch-Jobs.
- Manuelles Scaling und große Instanzen: Instanzanzahl wird manuell konfiguriert; Instanzen bis zu 44 vCPU und 176 GB RAM, mit bis zu 10 Containern (ein Hauptcontainer plus bis zu neun Sidecars).
- Volle Cloud-Run-Integration: Umgebungsvariablen, Secrets, Health Checks, VPC-Egress und -Ingress, NFS- und Cloud-Storage-Volumes sowie unveränderliche Revisionen pro Deployment.
Typische Anwendungsfälle
Queue-Konsumenten: Worker pools verarbeiten kontinuierlich Nachrichten aus Pub/Sub-Pull-Subscriptions, Kafka-Topics oder Redis-Task-Queues und ersetzen dafür selbst verwaltete Worker auf VMs oder in Kubernetes.
Verteilte KI/ML-Jobs: Mit GPU-Support lassen sich Inferenz- und Batch-Verarbeitung für KI-Modelle serverlos ausführen, ohne dass ein GPU-Cluster bereitgestellt und betrieben werden muss.
Selbst gehostete CI/CD-Runner: Worker pools betreiben selbst gehostete GitHub-Actions-Runner, die dauerhaft auf neue Jobs warten und sich nach Bedarf skalieren lassen.
Vorteile
- Serverloses Modell für dauerhaft laufende Hintergrundarbeit ohne eigene VMs oder Kubernetes-Cluster
- Ressourcenbasierte Abrechnung, laut Google rund 40 Prozent günstiger als requestgetriebene Services oder Jobs für lange laufende Arbeit
- GPU-Support für KI/ML-Workloads direkt auf der Cloud-Run-Plattform
- EU-Regionen verfügbar (europe-west1, europe-west4) für datenschutzkonforme Verarbeitung
Integration mit innFactory
Als zertifizierter Google Cloud Partner unterstützt innFactory Sie bei Einführung und Betrieb dieses Service.
Typische Anwendungsfälle
Häufig gestellte Fragen
Was ist Cloud Run worker pools?
Cloud Run worker pools ist ein Cloud-Run-Ressourcentyp für non-HTTP, pull-basierte Hintergrund-Workloads. Die Instanzen sind langlebig und ziehen kontinuierlich Arbeit aus Queues wie Pub/Sub-Pull-Subscriptions, Kafka oder Redis. Anders als Cloud Run Services haben worker pools keinen lastverteilten Endpunkt und keine URL und skalieren nicht auf Basis eingehender Requests.
Wann sollte ich Cloud Run worker pools einsetzen?
Worker pools eignen sich, wenn Sie dauerhaft laufende Konsumenten für Nachrichten-Queues betreiben (Pub/Sub, Kafka, Redis), verteilte KI/ML-Inferenz- oder Batch-Jobs mit GPU ausführen oder selbst gehostete CI/CD-Runner wie GitHub-Actions-Runner bereitstellen. Für requestgetriebene HTTP-Endpunkte sind Cloud Run Services die richtige Wahl.
Was kostet Cloud Run worker pools?
Die Abrechnung ist ressourcenbasiert und erfolgt pay-per-use. vCPU und Speicher werden über die gesamte Laufzeit der Instanz abgerechnet, GPU pro Sekunde inklusive Idle-Uptime. Es gelten regionale Tier-1- und Tier-2-Raten. Für lange laufende Hintergrundarbeit ist diese Abrechnung laut Google rund 40 Prozent günstiger als requestgetriebene Services oder Jobs. Aktuelle Preise nennt die offizielle Cloud-Run-Pricing-Seite.
Welche GPUs und Limits gelten für worker pools?
GPU-Support ist allgemein verfügbar mit NVIDIA L4 (24 GB VRAM) und NVIDIA RTX PRO 6000 Blackwell (96 GB VRAM), maximal eine GPU pro Instanz. GPU-worker-pools können nicht autoskaliert werden. Instanzen lassen sich mit bis zu 44 vCPU und 176 GB RAM konfigurieren, mit bis zu 10 Containern pro Instanz (ein Hauptcontainer plus bis zu neun Sidecars).
