Was ist Azure CycleCloud?
Azure CycleCloud ist ein Tool zur Orchestrierung und Verwaltung von High-Performance-Computing-Umgebungen (HPC) auf Azure. Es stellt die nötige Infrastruktur bereit, rollt vertraute HPC-Scheduler aus und skaliert die Cluster automatisch, damit Jobs in jeder Größenordnung effizient laufen. Über CycleCloud lassen sich verschiedene Dateisysteme erstellen und an die Compute-Knoten mounten, um HPC-Workloads abzubilden.
Organisationen mit langjährigen HPC-Umgebungen haben oft tiefes Wissen und eigene Tools rund um einen bestimmten Scheduler aufgebaut. CycleCloud löst das Problem, diese Setups ohne Neuaufbau nach Azure zu bringen: Es kapselt die Azure-Bausteine wie VMs, Scale Sets, Netzwerkschnittstellen und Datenträger, sodass HPC-Administratoren weiter mit Cluster und Scheduler in gewohnter Form arbeiten. CycleCloud ist dabei selbst kein Scheduler, sondern eine Management-Plattform zum Aufbau und Betrieb von HPC-Ressourcen.
Kernfunktionen
- Scheduler-agnostische Orchestrierung: Integrierte Unterstützung samt Autoscaling-Plugins für Slurm, PBS Pro, IBM LSF, Grid Engine und HTCondor. Eigene Scheduler lassen sich über die Autoscaling-REST-API anbinden.
- Automatisches Skalieren: CycleCloud passt Clustergröße und Komponenten anhand von Joblast, Verfügbarkeit und Zeitvorgaben an, ohne dass Anwender eigene Autoscaling-Routinen schreiben müssen.
- Deklarative Templates: Komplette HPC-Umgebungen inklusive NFS-Servern, parallelen Dateisystemen, Authentifizierungs- und Lizenzservern entstehen über ein einziges Management-Plane und lassen sich teilen und replizieren.
- Azure-Integration und APIs: Anbindung an Azure Monitor und Microsoft Cost Management sowie an Dienste wie Azure NetApp Files und Microsoft Entra ID, ergänzt um eine RESTful-API und eine eingebaute CLI.
Typische Anwendungsfälle
Migration bestehender HPC-Umgebungen: Teams verlagern langjährige On-Premises-Setups mit etablierten Schedulern nach Azure, ohne Abläufe und Werkzeuge neu aufzubauen.
Simulation und Forschung: Wissenschaftliche und technische Simulationen laufen auf Clustern, die sich nach Bedarf vergrößern und nach Abschluss der Jobs wieder verkleinern.
Reproduzierbare Umgebungen für mehrere Teams: Per Template definierte HPC-Setups lassen sich konsistent für verschiedene Teams und Projekte ausrollen.
Vorteile
- Vertraute Scheduler weiternutzen statt neuer Werkzeuge erlernen
- Automatisches Skalieren reduziert Leerlaufkosten und manuellen Aufwand
- Keine Lizenzgebühr für CycleCloud, Abrechnung nur für genutzte Azure-Ressourcen
- EU-Regionen für Workloads mit Anforderungen an die Datenhoheit verfügbar
Integration mit innFactory
Als Microsoft Solutions Partner unterstützt innFactory Sie bei Einführung und Betrieb dieses Service.
Typische Anwendungsfälle
Häufig gestellte Fragen
Was ist Azure CycleCloud?
Azure CycleCloud ist ein Tool zur Orchestrierung und Verwaltung von High-Performance-Computing-Umgebungen auf Azure. Es stellt die Infrastruktur bereit, rollt vertraute HPC-Scheduler aus und skaliert Cluster automatisch entsprechend der Joblast. CycleCloud ist dabei selbst kein Scheduler, sondern eine Plattform zum Aufbau kompletter HPC-Systeme.
Wann sollte ich Azure CycleCloud einsetzen?
CycleCloud passt, wenn Sie eine bestehende HPC-Umgebung mit einem etablierten Scheduler wie Slurm, PBS Pro, LSF, Grid Engine oder HTCondor nach Azure verlagern und dabei Ihre gewohnten Abläufe behalten wollen. Sinnvoll ist es ebenso für Simulations- und Forschungs-Workloads, die nach Bedarf skalierende Cluster brauchen, sowie für reproduzierbare HPC-Setups über mehrere Teams hinweg.
Was kostet Azure CycleCloud?
Für CycleCloud selbst fällt keine Lizenz- oder Abogebühr an. Sie zahlen ausschließlich für die zugrunde liegenden Azure-Ressourcen wie VMs, Scale Sets, Datenträger, Storage und Netzwerk im Pay-as-you-go-Modell. Spot-VMs und reservierte Kapazitäten lassen sich nutzen, um die Compute-Kosten weiter zu senken.
Welche HPC-Scheduler unterstützt Azure CycleCloud?
CycleCloud ist scheduler-agnostisch und bietet integrierte Unterstützung samt Autoscaling-Plugins für Slurm, PBS Pro, IBM LSF, Grid Engine und HTCondor. Über die Autoscaling-REST-API können Sie zusätzlich einen eigenen Scheduler anbinden.
