Was ist AWS Lambda Managed Instances?
AWS Lambda Managed Instances ist eine Lambda-Option, die Funktionen auf dedizierten, EC2-gestützten Instanzen ausführt. Sie wählen den Instanztyp, etwa Graviton4 oder speicheroptimierte Varianten, und AWS übernimmt den vollständigen Betrieb: Instanz-Lifecycle, Patching von Betriebssystem und Runtime, Routing, Load Balancing und Autoscaling. So kombiniert AWS Lambda Managed Instances das vertraute Lambda-Programmiermodell mit der Leistung und Hardware-Auswahl von EC2.
Der Service löst zwei Grenzen von Standard-Lambda. Erstens stehen pro Funktion bis zu 32 GB Arbeitsspeicher und Zugriff auf spezialisierte Hardware wie GPUs und High-Bandwidth-Netzwerk zur Verfügung, was AI/ML- und HPC-Workloads ermöglicht. Zweitens entfallen Cold Starts, da Kapazität asynchron nach CPU-Auslastung skaliert. Damit eignet sich AWS Lambda Managed Instances für vorhersagbaren Traffic mit konstanter Performance.
Kernfunktionen
- Dedizierte EC2-Instanzen: Ausführung auf Instanztypen Ihrer Wahl inklusive Graviton4 und speicheroptimierter Typen mit bis zu 32 GB RAM pro Funktion.
- Spezialisierte Hardware: Zugriff auf GPUs sowie High-Bandwidth- und EFA-Netzwerk für AI/ML-Inferenz und HPC.
- Capacity Provider: Definieren VPC-Konfiguration, Instanzanforderungen und Scaling-Policies und bilden zugleich die Sicherheitsgrenze. Alle Funktionen eines Capacity Providers müssen gegenseitig vertrauenswürdig sein.
- Skalierung ohne Cold Starts: Asynchrone Skalierung nach CPU-Auslastung. Jede Ausführungsumgebung verarbeitet mehrere Invocations gleichzeitig, was IO-lastige Anwendungen begünstigt und Thread-Safety erfordert.
Typische Anwendungsfälle
Speicherintensive Anwendungen: Workloads, die mehr als die Standard-Lambda-Grenzen benötigen, laufen mit bis zu 32 GB RAM auf einer einzelnen Funktion, ohne dass Sie Instanzen selbst verwalten.
AI/ML-Inferenz: Modelle profitieren von GPU-Instanzen und High-Bandwidth-Netzwerk. AWS Lambda Managed Instances stellt die spezialisierte Hardware bereit, während das Lambda-Modell erhalten bleibt.
Vorhersagbarer Produktiv-Traffic: Anwendungen mit konstanter Last vermeiden Cold Starts durch utilisationsbasiertes Scaling und nutzen EC2 Savings Plans oder Reserved Instances zur Kostenoptimierung.
Vorteile
- Lambda-Programmiermodell mit Zugriff auf größere und spezialisierte Hardware
- Keine Cold Starts durch asynchrones, utilisationsbasiertes Scaling
- Bis zu rund 33 Prozent Einsparung gegenüber Standard-Lambda bei vorhersagbaren Workloads
- AWS verwaltet Patching, Routing, Load Balancing und Autoscaling
Integration mit innFactory
Als AWS Reseller unterstützt innFactory Sie bei Einführung und Betrieb dieses Service.
Typische Anwendungsfälle
Häufig gestellte Fragen
Was ist AWS Lambda Managed Instances?
Lambda Managed Instances führt Lambda-Funktionen auf dedizierten Amazon-EC2-Instanzen Ihrer Wahl aus, etwa Graviton4 oder speicheroptimierten Typen. AWS verwaltet Instanz-Lifecycle, OS- und Runtime-Patches, Routing, Load Balancing und Autoscaling. Sie behalten das Lambda-Programmiermodell und gewinnen Zugriff auf größere und spezialisierte Hardware.
Wann sollte ich AWS Lambda Managed Instances einsetzen?
Sinnvoll bei speicherintensiven Anwendungen bis 32 GB RAM, AI/ML-Inferenz auf GPUs, HPC-Workloads mit High-Bandwidth-Netzwerk und bei vorhersagbarem Traffic, bei dem Cold Starts vermieden werden sollen. Auch für bestehende Lambda-Funktionen geeignet, die mehr Performance oder spezialisierte Hardware benötigen.
Was kostet AWS Lambda Managed Instances?
Die Abrechnung erfolgt nach EC2-Compute in Instance-Stunden statt pro Invocation und GB-Sekunde wie bei Standard-Lambda. Für vorhersagbare Workloads sind Einsparungen von bis zu rund 33 Prozent gegenüber Standard-Lambda möglich. EC2 Savings Plans und Reserved Instances sind anrechenbar. Aktuelle Preise stehen auf der AWS-Pricing-Seite.
Welche Runtimes und Limits unterstützt AWS Lambda Managed Instances?
Unterstützt werden Java 21 und höher, Python 3.13 und höher, Node.js 22 und höher, .NET 8 und höher sowie Rust. Pro Funktion sind bis zu 32 GB Arbeitsspeicher möglich. Skalierung erfolgt asynchron nach CPU-Auslastung ohne Cold Starts. Verdoppelt sich der Traffic innerhalb von rund fünf Minuten, kann es zu Throttling kommen, während Kapazität nachskaliert wird.