Gemini auf Vertex AI ist die programmatische API für Googles Foundation-Model-Familie, die sich an Entwickler und Unternehmen richtet, die Sprachmodelle in eigene Anwendungen und Produkte integrieren wollen. Es handelt sich dabei um einen anderen Zugangsweg als Gemini in Google Workspace: Während Google Workspace Gemini Endnutzer-Features wie Gmail-Zusammenfassungen oder Docs-Assistenten adressiert, bietet die Vertex-AI-API vollständigen programmatischen Zugriff für Entwickler.
Die Gemini-Modellfamilie auf Vertex AI
Die Gemini-2.0-Familie bietet mehrere spezialisierte Modelle für unterschiedliche Anforderungen: Gemini 2.0 Flash ist das kostengünstige, schnelle Modell für hohe Durchsatzanforderungen und ist vollständig multimodal (Text, Bild, Video, Audio). Gemini 2.0 Pro ist für komplexe Reasoning-Aufgaben, Code-Generierung und analytische Fragestellungen optimiert. Die Gemini-1.5-Serie bleibt mit ihrem bis zu 2-Millionen-Token-Kontext für Aufgaben relevant, die sehr lange Dokumente oder Codeversionsstände verarbeiten müssen.
Ein wichtiges Unterscheidungsmerkmal der Vertex-AI-API ist Grounding mit Google Search: Modelle können aktuelle Informationen aus dem Web abrufen, was Halluzinationen bei zeitkritischen Themen reduziert. Darüber hinaus ist Fine-Tuning für alle Hauptmodelle verfügbar, sodass Unternehmen Gemini auf eigene Daten anpassen und in EU-Regionen betreiben können. Die API unterstützt Streaming-Antworten, parallele Funktionsaufrufe und strukturierte Ausgabe (JSON-Mode) für produktionsreife Integrationen.
Die Abrechnung erfolgt tokenbasiert mit unterschiedlichen Preisen je nach Modellgröße und Modalität. Für EU-Compliance stehen die Regionen europe-west1 (Belgien), europe-west4 (Niederlande) und europe-west3 (Frankfurt) zur Verfügung. Unternehmensdaten werden nicht für das Gemini-Training genutzt, wenn die Vertex-AI-API über Google Cloud genutzt wird.
Integration mit innFactory
Als Google Cloud Partner unterstützt innFactory bei der Integration von Gemini in Ihre Anwendungen: API-Anbindung, Prompt-Engineering, Fine-Tuning-Projekte und Architektur-Beratung für produktionsreife Gemini-Deployments.
Kontaktieren Sie uns für eine technische Beratung zu Gemini auf Vertex AI.
