RAG Engine (ex Vertex AI) - Verwaltete RAG-Pipelines · innFactory

Was ist RAG Engine?

RAG Engine ist eine vollständig verwaltete Orchestrierungslaufzeit für Retrieval-Augmented Generation (RAG), heute Teil der Gemini Enterprise Agent Platform von Google (ehemals unter der Marke Vertex AI geführt). Der Dienst nimmt Ihnen den Aufbau und Betrieb einer kompletten RAG-Pipeline ab und reichert die Antworten von Large Language Models mit Ihren eigenen, privaten Daten an. Dadurch antworten Modelle wie Gemini präziser, und Halluzinationen werden reduziert, weil die Generierung auf nachweisbaren Quellen aufsetzt statt allein auf dem Trainingswissen des Modells.

RAG Engine folgt einer sechsstufigen Pipeline: Datenaufnahme, Transformation mit Chunking, Embedding, Indexierung in einem Korpus, Retrieval und gegroundete Generierung. Chunk-Größe und Überlappung sind konfigurierbar, sodass sich die Retrieval-Qualität auf den Anwendungsfall abstimmen lässt. Der Dienst ist nativ in die Gemini API als Retrieval-Tool eingebunden und nutzt darüber hinaus zahlreiche Modelle aus dem Model Garden der Plattform, darunter Gemini, Claude und Llama.

Kernfunktionen

Sechsstufige RAG-Pipeline: Datenaufnahme, Transformation und Chunking, Embedding, Korpus-Indexierung, Retrieval und gegroundete Generierung als verwalteter, durchgängiger Ablauf mit konfigurierbarer Chunk-Größe und Überlappung.
Native Gemini-Integration: Einbindung als Retrieval-Tool der Gemini API sowie Zugriff auf zahlreiche Generierungsmodelle aus dem Model Garden wie Gemini, Claude und Llama.
Pluggable Vektordatenbanken: Auswahl zwischen RagManagedDb (Standard), Vector Search, Feature Store und Drittanbietern wie Pinecone und Weaviate.
Breite Datenquellen-Anbindung: Aufnahme aus Cloud Storage, Google Drive, BigQuery-Datasets, lokalen Dateien und Websites sowie über weitere Konnektoren.

Typische Anwendungsfälle

Wissensbasierte Chatbots und Assistenten: RAG Engine stützt Antworten auf interne Dokumente, Handbücher und Wissensdatenbanken. So beantworten Assistenten Fragen zu unternehmensspezifischen Inhalten, die kein allgemeines Modell kennt.

Frage-Antwort-Systeme mit Quellenbelegen: Durch das Grounding auf einen Korpus lassen sich Antworten auf konkrete Quellen zurückführen. Das erhöht die Nachvollziehbarkeit in Bereichen wie Support, Recht oder Compliance.

RAG-Backends für Agenten und Suche: RAG Engine dient als Retrieval-Schicht für Agenten (z.B. in Agent Studio/Agent Runtime) und Suchanwendungen und liefert den relevanten Kontext, den Agenten zur Aufgabenlösung benötigen.

Vorteile

Vollständig verwaltete Pipeline ohne eigenen Betrieb von Embedding-, Index- und Retrieval-Infrastruktur.
Flexible Wahl von Vektordatenbank und Datenquellen, dadurch keine Bindung an eine einzelne Speicherlösung.
Pay-per-use mit zusammengesetzten Kosten: Sie zahlen nur für genutzte Komponenten.

Integration mit innFactory

Als zertifizierter Google Cloud Partner unterstützt innFactory Sie bei Einführung und Betrieb von RAG Engine im Rahmen der Gemini Enterprise Agent Platform.

Kontaktieren Sie uns für eine Beratung zu RAG Engine und Google Cloud.

Häufig gestellte Fragen

Was ist RAG Engine (ehemals Vertex AI RAG Engine)?

RAG Engine ist eine verwaltete Orchestrierungslaufzeit für Retrieval-Augmented Generation, heute Teil der Gemini Enterprise Agent Platform (ehemals Vertex AI). Der Dienst führt die komplette Pipeline aus: Datenaufnahme, Chunking, Embedding, Indexierung in einem Korpus, Retrieval und gegroundete Generierung. Er reichert LLM-Antworten mit eigenen Daten an, um Halluzinationen zu reduzieren.

Wann sollte ich RAG Engine einsetzen?

Setzen Sie RAG Engine ein, wenn Gemini- oder andere Modellantworten auf interne Dokumente, Wissensdatenbanken oder strukturierte Daten gestützt werden sollen. Typische Szenarien sind wissensbasierte Chatbots, Frage-Antwort-Systeme mit Quellenbelegen und RAG-Backends für Agenten, bei denen Sie die Pipeline nicht selbst betreiben wollen.

Was kostet RAG Engine?

RAG Engine rechnet pay-per-use mit zusammengesetzten Kosten ab: Zugriff auf Datenquellen über den Standard-Parser, LLM-Parser-Aufrufe, Vektorspeicher, Embedding sowie Nutzung des Generierungsmodells werden anteilig berechnet. Details liefert die offizielle Preisliste, es gibt keine pauschale Grundgebühr.

Welche Vektordatenbanken und Datenquellen unterstützt RAG Engine?

Als Vektorspeicher sind unter anderem RagManagedDb (Standard), Vector Search (ehemals Vertex AI Vector Search) und Feature Store sowie Drittanbieter wie Pinecone und Weaviate anbindbar. Als Datenquellen lassen sich Cloud Storage, Google Drive, BigQuery-Datasets, lokale Dateien, Websites sowie weitere Konnektoren nutzen.

Wie hängt RAG Engine mit Vertex AI und der Gemini Enterprise Agent Platform zusammen?

RAG Engine war ursprünglich Teil von Vertex AI und wurde 2026 zusammen mit dem gesamten Vertex-AI-Portfolio in die Gemini Enterprise Agent Platform überführt. Der Produktname RAG Engine selbst blieb erhalten, nur der Plattform-Name und einzelne Nachbarkomponenten (z.B. Agent Engine zu Agent Runtime) wurden umbenannt.

RAG Engine (ex Vertex AI) - Verwaltete RAG-Pipelines

Was ist RAG Engine?

Kernfunktionen

Typische Anwendungsfälle

Vorteile

Integration mit innFactory

Typische Anwendungsfälle

Häufig gestellte Fragen

Was ist RAG Engine (ehemals Vertex AI RAG Engine)?

Wann sollte ich RAG Engine einsetzen?

Was kostet RAG Engine?

Welche Vektordatenbanken und Datenquellen unterstützt RAG Engine?

Wie hängt RAG Engine mit Vertex AI und der Gemini Enterprise Agent Platform zusammen?

Schnellzugriff

Google Cloud Partner

Ähnliche Produkte anderer Cloud-Anbieter

Amazon Augmented AI (A2I) - Menschliche Überprüfung für ML

Amazon Bedrock AgentCore - Runtime für KI-Agenten

Amazon Bedrock Agents (Classic): Status und Alternative

Amazon Bedrock Data Automation - Daten strukturieren

Amazon Bedrock Guardrails - Sicherheit für generative KI

Amazon Bedrock Knowledge Bases: Managed RAG

Bereit, mit RAG Engine (ex Vertex AI) - Verwaltete RAG-Pipelines zu starten?