Cloud Run worker pools - Pull-basierte Hintergrund-Workloads · innFactory

Was ist Cloud Run worker pools?

Cloud Run worker pools ist ein Cloud-Run-Ressourcentyp für non-HTTP, pull-basierte Hintergrund-Workloads. Die Instanzen sind langlebig und ziehen kontinuierlich Arbeit aus Quellen wie Pub/Sub-Pull-Subscriptions, Kafka- oder Redis-Task-Queues und selbst gehosteten GitHub-Actions-Runnern. Im Gegensatz zu Cloud Run Services haben worker pools keinen lastverteilten Endpunkt und keine URL und skalieren nicht auf Basis eingehender HTTP-Requests.

Worker pools lösen das Problem, dass requestgetriebene Serverless-Modelle schlecht zu dauerhaft laufender Verarbeitung passen. Wer Nachrichten aus Queues konsumiert, verteilte KI/ML-Jobs ausführt oder CI/CD-Runner betreibt, brauchte bisher entweder selbst verwaltete VMs oder Kubernetes. Mit Cloud Run worker pools läuft diese Hintergrundarbeit auf der serverlosen Cloud-Run-Plattform, mit ressourcenbasierter Abrechnung und GPU-Support, ohne dass ein eigener Cluster betrieben werden muss.

Kernfunktionen

Pull-basierte Hintergrundverarbeitung: Langlebige Instanzen ziehen kontinuierlich Arbeit aus Queues wie Pub/Sub, Kafka und Redis, ohne lastverteilten Endpunkt oder URL.
GPU-Support für KI/ML: NVIDIA L4 (24 GB VRAM) und NVIDIA RTX PRO 6000 Blackwell (96 GB VRAM), maximal eine GPU pro Instanz, für verteilte Inferenz- und Batch-Jobs.
Manuelles Scaling und große Instanzen: Instanzanzahl wird manuell konfiguriert; Instanzen bis zu 44 vCPU und 176 GB RAM, mit bis zu 10 Containern (ein Hauptcontainer plus bis zu neun Sidecars).
Volle Cloud-Run-Integration: Umgebungsvariablen, Secrets, Health Checks, VPC-Egress und -Ingress, NFS- und Cloud-Storage-Volumes sowie unveränderliche Revisionen pro Deployment.

Typische Anwendungsfälle

Queue-Konsumenten: Worker pools verarbeiten kontinuierlich Nachrichten aus Pub/Sub-Pull-Subscriptions, Kafka-Topics oder Redis-Task-Queues und ersetzen dafür selbst verwaltete Worker auf VMs oder in Kubernetes.

Verteilte KI/ML-Jobs: Mit GPU-Support lassen sich Inferenz- und Batch-Verarbeitung für KI-Modelle serverlos ausführen, ohne dass ein GPU-Cluster bereitgestellt und betrieben werden muss.

Selbst gehostete CI/CD-Runner: Worker pools betreiben selbst gehostete GitHub-Actions-Runner, die dauerhaft auf neue Jobs warten und sich nach Bedarf skalieren lassen.

Vorteile

Serverloses Modell für dauerhaft laufende Hintergrundarbeit ohne eigene VMs oder Kubernetes-Cluster
Ressourcenbasierte Abrechnung, laut Google rund 40 Prozent günstiger als requestgetriebene Services oder Jobs für lange laufende Arbeit
GPU-Support für KI/ML-Workloads direkt auf der Cloud-Run-Plattform
EU-Regionen verfügbar (europe-west1, europe-west4) für datenschutzkonforme Verarbeitung

Integration mit innFactory

Als zertifizierter Google Cloud Partner unterstützt innFactory Sie bei Einführung und Betrieb dieses Service.

Häufig gestellte Fragen

Was ist Cloud Run worker pools?

Cloud Run worker pools ist ein Cloud-Run-Ressourcentyp für non-HTTP, pull-basierte Hintergrund-Workloads. Die Instanzen sind langlebig und ziehen kontinuierlich Arbeit aus Queues wie Pub/Sub-Pull-Subscriptions, Kafka oder Redis. Anders als Cloud Run Services haben worker pools keinen lastverteilten Endpunkt und keine URL und skalieren nicht auf Basis eingehender Requests.

Wann sollte ich Cloud Run worker pools einsetzen?

Worker pools eignen sich, wenn Sie dauerhaft laufende Konsumenten für Nachrichten-Queues betreiben (Pub/Sub, Kafka, Redis), verteilte KI/ML-Inferenz- oder Batch-Jobs mit GPU ausführen oder selbst gehostete CI/CD-Runner wie GitHub-Actions-Runner bereitstellen. Für requestgetriebene HTTP-Endpunkte sind Cloud Run Services die richtige Wahl.

Was kostet Cloud Run worker pools?

Die Abrechnung ist ressourcenbasiert und erfolgt pay-per-use. vCPU und Speicher werden über die gesamte Laufzeit der Instanz abgerechnet, GPU pro Sekunde inklusive Idle-Uptime. Es gelten regionale Tier-1- und Tier-2-Raten. Für lange laufende Hintergrundarbeit ist diese Abrechnung laut Google rund 40 Prozent günstiger als requestgetriebene Services oder Jobs. Aktuelle Preise nennt die offizielle Cloud-Run-Pricing-Seite.

Welche GPUs und Limits gelten fÃ¼r worker pools?

GPU-Support ist allgemein verfügbar mit NVIDIA L4 (24 GB VRAM) und NVIDIA RTX PRO 6000 Blackwell (96 GB VRAM), maximal eine GPU pro Instanz. GPU-worker-pools können nicht autoskaliert werden. Instanzen lassen sich mit bis zu 44 vCPU und 176 GB RAM konfigurieren, mit bis zu 10 Containern pro Instanz (ein Hauptcontainer plus bis zu neun Sidecars).

Cloud Run worker pools - Pull-basierte Hintergrund-Workloads

Was ist Cloud Run worker pools?

Kernfunktionen

Typische Anwendungsfälle

Vorteile

Integration mit innFactory

Typische Anwendungsfälle

Häufig gestellte Fragen

Was ist Cloud Run worker pools?

Wann sollte ich Cloud Run worker pools einsetzen?

Was kostet Cloud Run worker pools?

Welche GPUs und Limits gelten fÃ¼r worker pools?

Schnellzugriff

Google Cloud Partner

Ähnliche Produkte anderer Cloud-Anbieter

Amazon EC2 - Virtual Servers

Amazon EC2 Auto Scaling - Automatische Kapazitätsanpassung

Amazon Lightsail - Einfaches Cloud Hosting

Amazon Linux 2023 - Optimierte Linux-Distribution für AWS

AWS App Runner - Container-Hosting ohne Infrastruktur

AWS Batch - Batch-Computing in der Cloud

Bereit, mit Cloud Run worker pools - Pull-basierte Hintergrund-Workloads zu starten?