Zum Hauptinhalt springen
Cloud / Google Cloud / Produkte / Vertex AI: Googles KI- und ML-Plattform

Vertex AI: Googles KI- und ML-Plattform

Vertex AI vereint Gemini, Model Garden und MLOps für Training, Deployment und KI-Agenten auf Google Cloud. DSGVO-konform in EU-Regionen.

AI/ML
Preismodell Nutzungsbasiert nach Tokens, Compute-Stunden und API-Aufrufen, dazu Provisioned Throughput, Batch und Context Caching
Verfügbarkeit Mehrere EU-Regionen, darunter europe-west4 (Niederlande), europe-west1 (Belgien) und europe-west3 (Frankfurt)
Datensouveränität EU-Datenresidenz mit Verarbeitung und Speicherung in europäischen Rechenzentren
Zuverlässigkeit 99,9% für Online Prediction Endpoints SLA

Vertex AI ist Googles einheitliche KI- und Machine-Learning-Plattform, die generative KI, klassisches ML und MLOps unter einer konsistenten API und Oberfläche vereint. Die Plattform unterstützt den gesamten Workflow von der Datenvorbereitung über Training und Deployment bis zu Monitoring und KI-Agenten in Produktion, inklusive direktem Zugang zu Googles Gemini-Modellen. Google führt Vertex AI inzwischen unter dem Namen Gemini Enterprise Agent Platform.

Was ist Google Vertex AI?

Vertex AI führt alle KI- und ML-Services von Google Cloud unter einer konsistenten API und Benutzeroberfläche zusammen. Die Plattform deckt den gesamten Lebenszyklus ab: von der Datenvorbereitung über Training und Deployment bis hin zu Monitoring, Retraining und dem Betrieb von KI-Agenten. Damit löst Vertex AI die fragmentierte Landschaft der vorherigen AI Platform ab und bietet einen durchgängigen Workflow für Data Scientists, ML Engineers und Anwendungsteams.

Ein zentrales Merkmal ist die Integration von Googles Gemini-Modellen. Die aktuelle Generation umfasst Gemini 2.5 Pro für anspruchsvolles Reasoning und Coding mit bis zu 1 Million Token Kontext, Gemini 2.5 Flash für latenzkritische Anwendungen und Gemini 2.5 Flash-Lite für hohe Volumina zu niedrigen Kosten. Dazu kommen Imagen für Bilderzeugung, Veo für Video und Gemini Embedding für Vektorrepräsentationen. Die früheren PaLM- und Codey-APIs wurden eingestellt und durch die Gemini-Familie abgelöst. Model Garden bietet darüber hinaus Zugriff auf über 200 Modelle von Google und Partnern, darunter Anthropic Claude, Meta Llama, Mistral und Googles offene Gemma-Modelle.

Vertex AI unterscheidet zwischen AutoML für automatisiertes Machine Learning ohne Code und Custom Training für volle Kontrolle über Modellarchitektur und Trainingslogik. Vertex AI Workbench und Colab Enterprise stellen managed Notebook-Umgebungen bereit, während Vertex Pipelines MLOps-Workflows orchestriert. Der BigQuery-basierte Feature Store ermöglicht zentrales Feature Management, und Tools wie Model Monitoring und Explainable AI erkennen Model Drift und Performance-Degradation. Mit Agent Builder und Agent Engine entwickeln und betreiben Sie KI-Agenten mit Grounding auf eigenen Daten und Tool-Nutzung. Training kann auf CPUs, GPUs oder Cloud TPUs erfolgen, mit Support für gängige Frameworks wie TensorFlow, PyTorch, JAX und scikit-learn.

Der Service rechnet nutzungsbasiert ab: Gemini-Modelle nach Tokens, Training und Predictions nach Compute. Für planbare Lasten gibt es Provisioned Throughput, Batch-Verarbeitung und Context Caching. Vertex AI ist in mehreren EU-Regionen mit DSGVO-Compliance und EU-Datenresidenz verfügbar. SLA: 99,9% für Online Prediction Endpoints.

Vertex AI im Vergleich

vs. AWS SageMaker: Vertex AI bietet direkten Zugang zu Google Foundation Models wie Gemini, während SageMaker stärker auf AWS-Ökosystem fokussiert ist. Vertex AI hat einfachere Preismodelle und bessere BigQuery-Integration für Datenanalysen.

vs. Azure Machine Learning: Vertex AI punktet mit TPU-Verfügbarkeit und Google-Expertise in großskaligem ML-Training. Azure hat bessere Integration in Microsoft-Ökosysteme, während Vertex AI stärkere Open-Source-Orientierung zeigt.

vs. STACKIT AI Model Serving: STACKIT bietet deutsche Datensouveränität und lokale Rechenzentren, während Vertex AI eine breitere Palette an Foundation Models und globale Verfügbarkeit liefert.

Kernfunktionen

  • Gemini und Model Garden: Direkter Zugriff auf Gemini 2.5 Pro, Flash und Flash-Lite sowie über 200 weitere Modelle, darunter Imagen, Veo, Gemma, Anthropic Claude, Meta Llama und Mistral.
  • KI-Agenten: Agent Builder, Agent Engine und Agent Garden zum Entwickeln, Testen und Betreiben von Agenten mit Grounding, Tool-Nutzung und Code-Ausführung in isolierten Sandboxes.
  • MLOps: Vertex Pipelines, Model Registry, Experiment Tracking und Metadata Management für reproduzierbare und automatisierte ML-Workflows.
  • Training und Tuning: AutoML ohne Code, Custom Training mit voller Kontrolle und Supervised Fine-Tuning für Gemini, auf CPUs, GPUs und Cloud TPUs.
  • Feature Store und Daten: BigQuery-basierter Feature Store mit Bigtable Online Serving für konsistente Features zwischen Training und Serving.
  • Monitoring und Governance: Model Monitoring für Drift, Explainable AI für Feature Attributions und Evaluation-Tools für die laufende Qualitätssicherung.

Typische Anwendungsfälle

LLM Fine-Tuning mit Gemini für Kundenservice

Ein E-Commerce-Unternehmen nutzt Vertex AI, um Gemini 2.5 Flash per Supervised Fine-Tuning mit eigenen Produktdaten und Kundeninteraktionen anzupassen. Das Modell beantwortet produktspezifische Fragen präziser als generische LLMs. Über Vertex AI Pipelines wird das Modell wöchentlich mit neuen Daten nachtrainiert, während Model Monitoring die Antwortqualität überwacht.

Computer Vision für Retail-Qualitätskontrolle

Ein Produzent setzt AutoML Vision für automatisierte Qualitätsprüfung in der Fertigung ein. Tausende Produktbilder pro Stunde werden analysiert, Defekte in Echtzeit erkannt. Das System wurde in vier Wochen mit AutoML trainiert, ohne ML-Expertise. Batch Predictions verarbeiten historische Daten zur Trendanalyse.

Demand Forecasting mit Custom Training

Eine Einzelhandelskette nutzt Custom Training mit XGBoost auf Vertex AI für präzise Nachfrageprognosen. Der Feature Store zentralisiert Features wie Wetterdaten, Feiertage und historische Verkäufe. Vertex Pipelines orchestriert tägliches Retraining, Online Predictions liefern Prognosen für Bestellsysteme in unter 100ms.

Fraud Detection mit Real-Time Predictions

Eine Bank deployed ein Fraud-Detection-Modell auf Vertex AI mit Online Predictions. Transaktionen werden in Echtzeit bewertet, verdächtige Aktivitäten sofort blockiert. Model Monitoring erkennt neue Betrugsmuster, triggert automatisches Retraining. Die Lösung verarbeitet 50.000 Transaktionen pro Sekunde mit p99-Latenz unter 20ms.

Personalisierte Recommendation Engine

Eine Streaming-Plattform nutzt Vertex AI für personalisierte Content-Empfehlungen. Der Feature Store speichert User-Features und Content-Embeddings, ein Custom Training Modell generiert Recommendations. Vertex Explainable AI zeigt, welche Features Empfehlungen beeinflussen. A/B-Tests über Vertex Experiments optimieren das Modell kontinuierlich.

Document Processing mit Document AI Integration

Ein Versicherer kombiniert Vertex AI mit Document AI für automatisierte Schadenbearbeitung. Document AI extrahiert Daten aus Formularen, ein Custom Classification Model auf Vertex AI kategorisiert Schadentypen. Vertex Pipelines orchestriert den gesamten Workflow von Upload bis Entscheidung, reduziert Bearbeitungszeit um 70%.

Multi-Cloud MLOps mit Vertex Pipelines

Ein Technologieunternehmen nutzt Vertex Pipelines für reproduzierbare ML-Workflows über mehrere Teams. Pipelines orchestrieren Data Validation, Training, Evaluation und Deployment. Metadata Tracking dokumentiert jeden Run, Model Registry verwaltet Versionen. Das Setup reduziert Time-to-Production von Monaten auf Wochen.

Best Practices für Vertex AI

AutoML vs. Custom Training richtig wählen

AutoML eignet sich für schnelle Prototypen, Standardaufgaben wie Bildklassifikation oder Tabellendaten und Teams ohne ML-Expertise. Custom Training ist notwendig bei komplexen Architekturen, speziellen Loss Functions, bestehenden TensorFlow/PyTorch-Modellen oder wenn Sie volle Kontrolle über Hyperparameter benötigen. Nutzen Sie AutoML für initiale Baselines, migrieren Sie zu Custom Training wenn Anpassungen nötig werden.

MLOps mit Vertex Pipelines etablieren

Vertex Pipelines orchestriert reproduzierbare ML-Workflows mit Kubeflow Pipelines oder TFX. Definieren Sie Pipelines als Code, versionieren Sie diese in Git. Automatisieren Sie Data Validation, Training, Evaluation und Deployment in einer Pipeline. Nutzen Sie Conditional Steps für A/B-Tests und Rollback-Mechanismen. Pipeline-Templates reduzieren Boilerplate für wiederkehrende Workflows.

Model Monitoring und automatisches Retraining

Konfigurieren Sie Model Monitoring für Prediction Drift und Training-Serving Skew ab dem ersten Deployment. Setzen Sie Alerting-Schwellwerte basierend auf Business-Metriken, nicht nur ML-Metriken. Implementieren Sie automatische Retraining-Pipelines, die bei Drift-Detection triggern. Nutzen Sie Shadow Deployments für neue Modellversionen vor Production-Rollout.

Feature Store strategisch einsetzen

Der Vertex AI Feature Store zentralisiert Features und vermeidet redundantes Feature Engineering über Teams hinweg. Definieren Sie Features einmal, nutzen Sie diese für Training und Serving. Versionieren Sie Features, um Konsistenz zwischen historischen und aktuellen Daten zu gewährleisten. Nutzen Sie Online Serving für Low-Latency Predictions und Offline Serving für Batch-Jobs und Training.

Hyperparameter Tuning effizient durchführen

Vertex AI bietet Vizier für Bayesian Optimization bei Hyperparameter-Suche. Definieren Sie sinnvolle Search Spaces basierend auf Domänenwissen, vermeiden Sie zu breite Ranges. Nutzen Sie Parallel Trials für schnellere Konvergenz, aber beachten Sie Compute-Kosten. Early Stopping reduziert Ressourcenverschwendung bei erfolglosen Trials. Für explorative Suchen nutzen Sie Random Search vor Grid Search.

Kosten optimieren mit Preemptible VMs und Batch Predictions

Preemptible VMs reduzieren Training-Kosten um bis zu 80%, sind aber nur für fault-tolerante Workloads geeignet. Implementieren Sie Checkpointing für Preemptible Training Jobs. Nutzen Sie Batch Predictions statt Online Predictions wenn Echtzeit nicht nötig ist, Kosten pro Prediction sind deutlich niedriger. Wählen Sie kleinere Machine Types für Predictions wenn möglich, skalieren Sie nur bei Bedarf.

Responsible AI Practices umsetzen

Nutzen Sie Vertex Explainable AI um Modellentscheidungen nachvollziehbar zu machen. Feature Attributions zeigen, welche Inputs Predictions beeinflussen. Testen Sie Modelle auf Bias über verschiedene demografische Gruppen mit What-If-Tool. Implementieren Sie Fairness-Metriken in Model Evaluation. Dokumentieren Sie Modellverhalten und Limitationen in Model Cards für Stakeholder-Transparenz.

Vorteile

  • Eine Plattform für KI und ML: Generative KI, klassisches ML, MLOps und KI-Agenten arbeiten unter einer API zusammen, statt verteilt auf einzelne Tools.
  • Zugang zu führenden Modellen: Gemini und über 200 Modelle in Model Garden geben Ihnen Wahlfreiheit zwischen Google-, Partner- und Open-Source-Modellen ohne Anbieterwechsel.
  • DSGVO und EU-Datenresidenz: Mehrere EU-Regionen mit Verarbeitung und Speicherung in europäischen Rechenzentren erfüllen strenge Compliance-Anforderungen.
  • Flexible Kostenmodelle: Nutzungsbasierte Abrechnung, Provisioned Throughput für planbare Lasten, Batch und Context Caching senken die Kosten gezielt.
  • Enge Google-Cloud-Integration: Native Anbindung an BigQuery, Cloud Storage und Document AI beschleunigt Datenfluss und produktive Anwendungen.

Integration mit innFactory

Als Google Cloud Partner unterstützt innFactory Sie bei Vertex AI: Architektur-Design, Migration bestehender ML-Workloads, Aufbau von KI-Agenten, MLOps-Setup, Kostenoptimierung und Team-Enablement.

Kontaktieren Sie uns für eine Beratung zu Vertex AI und Google Cloud.

Verfügbare Varianten & Optionen

Vertex AI AutoML

Stärken
  • Kein Code erforderlich
  • Automatisiertes Feature Engineering
  • Schneller Time-to-Value
Einschränkungen
  • Weniger Kontrolle
  • Höhere Kosten pro Prediction

Vertex AI Workbench

Stärken
  • Jupyter Notebook Umgebung
  • Vorkonfigurierte Frameworks
  • Kollaborationsfunktionen
Einschränkungen
  • Compute-Kosten
  • Erfordert aktives Management

Typische Anwendungsfälle

Generative KI-Anwendungen mit Gemini
KI-Agenten mit Agent Builder und Agent Engine
Entwicklung eigener ML-Modelle
Computer Vision und Bildklassifizierung
Natural Language Processing und RAG
Empfehlungssysteme
Predictive Analytics
MLOps und Model Management

Technische Spezifikationen

Agents Agent Builder, Agent Engine, Agent Garden, Grounding
Compute Cloud TPU (v5e, v6e Trillium), GPU A100/H100/L4, Spot VMs
Deployment Online und Batch Prediction, Model Garden, Provisioned Throughput
Features Feature Store (BigQuery-basiert), Model Registry, Vertex Pipelines, Vertex AI Workbench, Colab Enterprise
Foundation models Gemini 2.5 Pro, Gemini 2.5 Flash, Gemini 2.5 Flash-Lite, Imagen, Veo, Lyria, Gemini Embedding, plus Claude, Llama, Mistral und Gemma über Model Garden
Frameworks TensorFlow, PyTorch, scikit-learn, XGBoost, Keras, JAX
Mlops Vertex Pipelines, Experiment Tracking, Metadata Management
Monitoring Model Monitoring, Drift Detection, Explainable AI, Evaluation
Training AutoML, Custom Training, verteiltes Training auf CPUs/GPUs/TPUs

Häufig gestellte Fragen

Was ist der Unterschied zwischen Vertex AI und der alten AI Platform?

Vertex AI ist die neue, vereinheitlichte ML-Plattform von Google Cloud, die AutoML und AI Platform unter einer Oberfläche zusammenführt. Sie bietet verbesserte MLOps-Funktionen, Zugang zu Foundation Models wie Gemini und eine durchgängige API. Die alte AI Platform wird durch Vertex AI ersetzt.

Wie kann ich Gemini-Modelle in Vertex AI nutzen?

Gemini-Modelle sind über die Vertex AI API verfügbar. Sie können Gemini 2.5 Pro, Flash und Flash-Lite für multimodale Aufgaben mit bis zu 1 Million Token Kontext nutzen, Modelle per Supervised Fine-Tuning anpassen oder über Model Garden auf vortrainierte Varianten zugreifen. Die Integration erfolgt über REST API, Python SDK oder direkt in Vertex AI Workbench.

Was kann ich mit Agent Builder und Agent Engine bauen?

Agent Builder und Agent Engine sind die agentischen Bausteine von Vertex AI. Agent Builder unterstützt die Entwicklung von KI-Agenten mit Grounding auf eigenen Daten, Tool-Nutzung und Code-Ausführung in isolierten Sandboxes. Agent Engine stellt eine managed Laufzeit für Produktion bereit. Über Agent Garden greifen Sie auf vorgefertigte Agent-Vorlagen und Beispiele zu.

Wann sollte ich AutoML statt Custom Training verwenden?

AutoML eignet sich für schnelle Prototypen und Standardaufgaben ohne tiefes ML-Know-how. Es automatisiert Feature Engineering und Hyperparameter-Tuning. Custom Training bietet mehr Kontrolle über Modellarchitektur und ist notwendig bei speziellen Anforderungen, komplexen Architekturen oder wenn Sie bestehenden Code migrieren.

Wie funktioniert das Preismodell von Vertex AI?

Vertex AI rechnet nutzungsbasiert ab: Gemini-Modelle nach Input- und Output-Tokens, Custom Training nach Compute-Stunden und Online Predictions nach Knotenlaufzeit. Für planbare Lasten gibt es Provisioned Throughput mit reservierter Kapazität, dazu Batch-Verarbeitung und Context Caching zur Kostensenkung. Spot VMs reduzieren Trainingskosten zusätzlich. Aktuelle Preise finden Sie in der Google Cloud Preisliste.

Welche Deployment-Optionen bietet Vertex AI?

Vertex AI unterstützt Online Predictions für Echtzeit-Anfragen mit automatischem Scaling, Batch Predictions für große Datenmengen und Edge Deployment für On-Device-Inferenz. Sie können auch private Endpoints für VPC-Integration nutzen und Multi-Region-Deployments für hohe Verfügbarkeit konfigurieren.

Sind TPUs in Vertex AI verfügbar und wann sollte ich sie nutzen?

Ja, Vertex AI bietet Cloud TPUs inklusive der Generationen v5e und v6e (Trillium) für Training und Inferenz, dazu GPUs wie A100, H100 und L4. TPUs sind optimal für große Transformer-Modelle, LLM-Training und Workloads mit hohen Matrix-Operationen. Für PyTorch oder kleine Modelle sind GPUs oft kosteneffizienter.

Was ist Model Garden und wie nutze ich es?

Model Garden ist der zentrale Katalog mit über 200 Modellen in Vertex AI. Er umfasst Google-Modelle wie Gemini, Imagen und Veo, offene Modelle wie Gemma und Llama sowie Partnermodelle von Anthropic (Claude) und Mistral. Sie können Modelle direkt deployen, fine-tunen oder als Basis für eigene Entwicklungen nutzen, ohne Training from Scratch.

Wie funktioniert der Feature Store in Vertex AI?

Der aktuelle Vertex AI Feature Store nutzt BigQuery als Datenquelle und legt eine Metadaten- und Serving-Schicht darüber, sodass Sie Daten nicht in einen separaten Store kopieren müssen. Online Serving läuft über Bigtable für niedrige Latenzen. Er ermöglicht Feature-Sharing zwischen Teams und Konsistenz zwischen Training und Serving. Der frühere Legacy Feature Store (V1) ist abgekündigt, eine Migration zu Bigtable Online Serving wird empfohlen.

Welche Möglichkeiten gibt es für Model Monitoring?

Vertex AI bietet automatisches Monitoring für Prediction Drift, Training-Serving Skew und Feature Attribution Drift. Sie können Alerting-Regeln konfigurieren und Dashboards für Model Performance nutzen. Das System erkennt Qualitätsverschlechterungen und kann automatisch Retraining-Pipelines triggern.

Ist Vertex AI DSGVO-konform und in der EU verfügbar?

Ja, Vertex AI ist in mehreren EU-Regionen verfügbar, darunter europe-west4 (Niederlande), europe-west1 (Belgien) und europe-west3 (Frankfurt), und erfüllt DSGVO-Anforderungen. Google Cloud bietet EU-Datenresidenz mit Verarbeitung und Speicherung in europäischen Rechenzentren, Data Processing Agreements und umfassende Compliance-Zertifizierungen. Sie können Training und Predictions vollständig in EU-Regionen durchführen, wobei die regionale Modellverfügbarkeit je nach Modell variiert.

Google Cloud Partner

innFactory ist zertifizierter Google Cloud Partner. Wir bieten Beratung, Implementierung und Managed Services.

Google Cloud Partner

Bereit, mit Vertex AI: Googles KI- und ML-Plattform zu starten?

Unsere zertifizierten Google Cloud Experten helfen bei Architektur, Integration und Optimierung.

Beratung vereinbaren