Zum Hauptinhalt springen
Cloud / Google Cloud / Produkte / Cloud Run worker pools - Pull-basierte Hintergrund-Workloads

Cloud Run worker pools - Pull-basierte Hintergrund-Workloads

Cloud Run worker pools: serverlose Ressource für non-HTTP, pull-basierte Workloads aus Queues wie Pub/Sub und Kafka, mit GPU-Support für KI/ML-Jobs.

Serverless
Preismodell Pay-per-use, ressourcenbasiert (vCPU plus Speicher über die Instanz-Laufzeit; GPU pro Sekunde inkl. Idle)
Verfügbarkeit Mehrere Regionen inkl. EU (z.B. europe-west1 Belgien, europe-west4 Niederlande)
Datensouveränität EU-Regionen verfügbar (europe-west1, europe-west4)
Zuverlässigkeit 99,95% (Cloud Run SLA) SLA

Was ist Cloud Run worker pools?

Cloud Run worker pools ist ein Cloud-Run-Ressourcentyp für non-HTTP, pull-basierte Hintergrund-Workloads. Die Instanzen sind langlebig und ziehen kontinuierlich Arbeit aus Quellen wie Pub/Sub-Pull-Subscriptions, Kafka- oder Redis-Task-Queues und selbst gehosteten GitHub-Actions-Runnern. Im Gegensatz zu Cloud Run Services haben worker pools keinen lastverteilten Endpunkt und keine URL und skalieren nicht auf Basis eingehender HTTP-Requests.

Worker pools lösen das Problem, dass requestgetriebene Serverless-Modelle schlecht zu dauerhaft laufender Verarbeitung passen. Wer Nachrichten aus Queues konsumiert, verteilte KI/ML-Jobs ausführt oder CI/CD-Runner betreibt, brauchte bisher entweder selbst verwaltete VMs oder Kubernetes. Mit Cloud Run worker pools läuft diese Hintergrundarbeit auf der serverlosen Cloud-Run-Plattform, mit ressourcenbasierter Abrechnung und GPU-Support, ohne dass ein eigener Cluster betrieben werden muss.

Kernfunktionen

  • Pull-basierte Hintergrundverarbeitung: Langlebige Instanzen ziehen kontinuierlich Arbeit aus Queues wie Pub/Sub, Kafka und Redis, ohne lastverteilten Endpunkt oder URL.
  • GPU-Support für KI/ML: NVIDIA L4 (24 GB VRAM) und NVIDIA RTX PRO 6000 Blackwell (96 GB VRAM), maximal eine GPU pro Instanz, für verteilte Inferenz- und Batch-Jobs.
  • Manuelles Scaling und große Instanzen: Instanzanzahl wird manuell konfiguriert; Instanzen bis zu 44 vCPU und 176 GB RAM, mit bis zu 10 Containern (ein Hauptcontainer plus bis zu neun Sidecars).
  • Volle Cloud-Run-Integration: Umgebungsvariablen, Secrets, Health Checks, VPC-Egress und -Ingress, NFS- und Cloud-Storage-Volumes sowie unveränderliche Revisionen pro Deployment.

Typische Anwendungsfälle

Queue-Konsumenten: Worker pools verarbeiten kontinuierlich Nachrichten aus Pub/Sub-Pull-Subscriptions, Kafka-Topics oder Redis-Task-Queues und ersetzen dafür selbst verwaltete Worker auf VMs oder in Kubernetes.

Verteilte KI/ML-Jobs: Mit GPU-Support lassen sich Inferenz- und Batch-Verarbeitung für KI-Modelle serverlos ausführen, ohne dass ein GPU-Cluster bereitgestellt und betrieben werden muss.

Selbst gehostete CI/CD-Runner: Worker pools betreiben selbst gehostete GitHub-Actions-Runner, die dauerhaft auf neue Jobs warten und sich nach Bedarf skalieren lassen.

Vorteile

  • Serverloses Modell für dauerhaft laufende Hintergrundarbeit ohne eigene VMs oder Kubernetes-Cluster
  • Ressourcenbasierte Abrechnung, laut Google rund 40 Prozent günstiger als requestgetriebene Services oder Jobs für lange laufende Arbeit
  • GPU-Support für KI/ML-Workloads direkt auf der Cloud-Run-Plattform
  • EU-Regionen verfügbar (europe-west1, europe-west4) für datenschutzkonforme Verarbeitung

Integration mit innFactory

Als zertifizierter Google Cloud Partner unterstützt innFactory Sie bei Einführung und Betrieb dieses Service.

Typische Anwendungsfälle

Kontinuierliches Verarbeiten von Pub/Sub-Pull-Subscriptions
Konsumenten für Kafka- und Redis-Task-Queues
Verteilte KI/ML-Inferenz- und Batch-Jobs mit GPU
Selbst gehostete GitHub-Actions-Runner

Häufig gestellte Fragen

Was ist Cloud Run worker pools?

Cloud Run worker pools ist ein Cloud-Run-Ressourcentyp für non-HTTP, pull-basierte Hintergrund-Workloads. Die Instanzen sind langlebig und ziehen kontinuierlich Arbeit aus Queues wie Pub/Sub-Pull-Subscriptions, Kafka oder Redis. Anders als Cloud Run Services haben worker pools keinen lastverteilten Endpunkt und keine URL und skalieren nicht auf Basis eingehender Requests.

Wann sollte ich Cloud Run worker pools einsetzen?

Worker pools eignen sich, wenn Sie dauerhaft laufende Konsumenten für Nachrichten-Queues betreiben (Pub/Sub, Kafka, Redis), verteilte KI/ML-Inferenz- oder Batch-Jobs mit GPU ausführen oder selbst gehostete CI/CD-Runner wie GitHub-Actions-Runner bereitstellen. Für requestgetriebene HTTP-Endpunkte sind Cloud Run Services die richtige Wahl.

Was kostet Cloud Run worker pools?

Die Abrechnung ist ressourcenbasiert und erfolgt pay-per-use. vCPU und Speicher werden über die gesamte Laufzeit der Instanz abgerechnet, GPU pro Sekunde inklusive Idle-Uptime. Es gelten regionale Tier-1- und Tier-2-Raten. Für lange laufende Hintergrundarbeit ist diese Abrechnung laut Google rund 40 Prozent günstiger als requestgetriebene Services oder Jobs. Aktuelle Preise nennt die offizielle Cloud-Run-Pricing-Seite.

Welche GPUs und Limits gelten für worker pools?

GPU-Support ist allgemein verfügbar mit NVIDIA L4 (24 GB VRAM) und NVIDIA RTX PRO 6000 Blackwell (96 GB VRAM), maximal eine GPU pro Instanz. GPU-worker-pools können nicht autoskaliert werden. Instanzen lassen sich mit bis zu 44 vCPU und 176 GB RAM konfigurieren, mit bis zu 10 Containern pro Instanz (ein Hauptcontainer plus bis zu neun Sidecars).

Google Cloud Partner

innFactory ist zertifizierter Google Cloud Partner. Wir bieten Beratung, Implementierung und Managed Services.

Google Cloud Partner

Ähnliche Produkte anderer Cloud-Anbieter

Andere Cloud-Anbieter bieten vergleichbare Services in dieser Kategorie. Als Multi-Cloud Partner helfen wir bei der richtigen Wahl.

AWS

AWS Lambda durable functions - Stateful Workflows

AWS Lambda durable functions: stateful, mehrstufige Workflows mit Checkpointing, Laufzeit bis zu einem Jahr und keiner …

Preismodell Pay-per-use (Standard-Lambda: Requests + …
SLA 99,95% (AWS Lambda SLA)
Vergleichen →
AWS

AWS Lambda Managed Instances - Funktionen auf EC2

AWS Lambda Managed Instances führt Lambda-Funktionen auf dediziertem EC2-Compute aus: vorhersagbare Performance, bis 32 …

Preismodell Bezahlung für EC2-Compute …
SLA N/A
Vergleichen →
Azure

Azure CycleCloud - HPC-Cluster orchestrieren

Azure CycleCloud orchestriert HPC-Umgebungen auf Azure: Infrastruktur bereitstellen, Scheduler ausrollen und Cluster …

Preismodell Keine Lizenz- oder Abogebühr, nur …
SLA N/A (Tool ohne eigenes SLA, abhängig von den genutzten Azure-Diensten)
Vergleichen →
Azure

Azure Modeling and Simulation Workbench - Design-Umgebung

Azure Modeling and Simulation Workbench: sichere On-Demand-Umgebung für Engineering-Design und Simulation mit Chambers, …

Preismodell Pay-as-you-go (Verbrauch): Chamber-SKU, …
SLA N/A
Vergleichen →
Azure

Azure Service Fabric: Microservices-Plattform

Azure Service Fabric: Plattform für verteilte Systeme zum Bereitstellen und Verwalten von Microservices und Containern, …

Preismodell Kostenloser Dienst, Abrechnung nur für …
SLA Abhängig von der Cluster-Konfiguration (zugrundeliegende VM-Scale-Sets)
Vergleichen →
STACKIT

STACKIT Run Command

STACKIT Run Command ermöglicht die sichere Remote-Ausführung von Skripten und Befehlen auf STACKIT Compute …

Preismodell Inklusive in Compute Engine
SLA 99,9% Verfügbarkeit
Vergleichen →

49 vergleichbare Produkte bei anderen Cloud-Anbietern gefunden.

Bereit, mit Cloud Run worker pools - Pull-basierte Hintergrund-Workloads zu starten?

Unsere zertifizierten Google Cloud Experten helfen bei Architektur, Integration und Optimierung.

Beratung vereinbaren