Microsoft Foundry auf Microsoft Azure
Was ist Microsoft Foundry?
Microsoft Foundry (ehem. Azure AI Foundry, davor Azure AI Studio) ist Microsofts einheitliche Plattform für die Entwicklung, Evaluierung und den Betrieb von KI-Anwendungen und Agenten. Die Plattform vereint Modelle, Agenten und Tools unter einer Azure-Ressource und deckt den kompletten Lebenszyklus ab: von der Modellauswahl über Prompt Engineering und Agent-Orchestrierung bis hin zu Deployment, Monitoring und Governance. Damit löst Foundry ein zentrales Problem in Enterprise-KI-Projekten: die Fragmentierung zwischen Entwicklung, Testing und Produktion.
Der Kern von Microsoft Foundry ist der Model Catalog mit über 1.900 Modellen von Microsoft, OpenAI, Anthropic, Mistral, xAI, Meta, DeepSeek und Hugging Face. Dazu gehören GPT-5 für komplexes Reasoning und multimodale Szenarien, GPT-4.1 als Balance aus Qualität und Kosten, Anthropic Claude, xAI Grok, Mistral, DeepSeek-R1, Microsoft Phi-4 für ressourcenarme Umgebungen sowie Meta Llama für eigenes Fine-Tuning. Diese Vielfalt erlaubt es Unternehmen, das passende Modell pro Use Case zu wählen, ohne sich an einen Anbieter zu binden. Über den Model Router adressieren Sie alle Modelle über einen Endpunkt, das System routet automatisch zum passenden Modell.
Über die reine Modellnutzung hinaus bietet Foundry den Agent Service für produktionsreife KI-Agenten, Foundry IQ als zitierfähigen Knowledge-Layer für RAG sowie integrierte Observability mit Tracing, Evaluations und Content Safety. Der Foundry Control Plane bringt Governance, rollenbasierte Zugriffskontrolle (RBAC) und Azure-Policy-Integration für den unternehmensweiten Betrieb.
Kernfunktionen
- Model Catalog mit über 1.900 Modellen (GPT-5, GPT-4.1, Claude, Grok, Mistral, DeepSeek-R1, Phi-4, Llama) und Model Router über einen Endpunkt
- Foundry Agent Service mit Multi-Agent-Orchestrierung, Tool-Katalog (über 1.400 Tools), Memory und Veröffentlichung nach Microsoft 365 oder Teams
- Foundry IQ: zitierfähiger Knowledge-Layer für RAG über OneLake, Snowflake, S3 und Web-Inhalte
- Integrierte Observability: Tracing, kontinuierliche Evaluations, Monitoring und Azure AI Content Safety
- Flexible Deployments: Standard (Token-basiert), Provisioned Throughput (PTU) und Batch, jeweils als Global, Data Zone oder Regional
- Foundry Control Plane für Governance, RBAC, Networking und Azure-Policy-Integration
Typische Anwendungsfälle
Produktionsreife KI-Agenten
Unternehmen bauen mit dem Foundry Agent Service Agenten, die Tools aufrufen, Kontext über Memory halten und mehrere Spezialagenten orchestrieren. Der Service übernimmt Konversationen, Identität, Safety und Observability, sodass Teams keinen eigenen Orchestrator schreiben müssen. Typisches Szenario: ein Self-Service-Agent, der über Foundry IQ in Unternehmensdaten recherchiert und Aktionen in nachgelagerten Systemen ausführt.
Document Intelligence mit RAG
Finanzdienstleister und Versicherungen verarbeiten Verträge, Policen und regulatorische Dokumente automatisiert. Foundry IQ kombiniert zitierfähiges Retrieval mit GPT-5 oder GPT-4.1 für natürlichsprachige Zusammenfassungen. Die integrierten Evaluations messen Groundedness, um faktisch korrekte Antworten sicherzustellen. So lassen sich Prüfprozesse deutlich beschleunigen, ohne die Nachvollziehbarkeit zu verlieren.
Customer-Service-Bots
Unternehmen entwickeln Kundenservice-Assistenten auf Basis von GPT-5 oder Claude. Gesprächsabläufe orchestriert der Agent Service, Unternehmenswissen bindet Foundry IQ in Echtzeit ein. Content Safety verhindert unangemessene Antworten. Beispiel: ein Support-Assistent, der in Confluence- und Jira-Daten sucht und Tickets eröffnet.
Code-Assistenten nach Copilot-Muster
Softwareunternehmen implementieren interne Code-Assistenten. Mit Fine-Tuning auf der eigenen Codebasis lernt das Modell unternehmensspezifische Patterns und Libraries. Provisioned Throughput (PTU) garantiert konstante Latenz für Entwickler-Workflows, der Agent Service orchestriert Generierung, Tests und Review.
Content Moderation für User-Generated Content
Community- und Social-Plattformen nutzen Azure AI Content Safety aus Foundry Tools für automatisierte Moderation. Die Modelle erkennen Hate Speech, sexuelle Inhalte, Gewalt und Selbstgefährdung in Text und Bildern. Custom Categories ermöglichen branchenspezifische Filter, die Integration erfolgt per API in bestehende Content-Pipelines.
Multi-modale KI-Anwendungen
Marketing-Teams kombinieren Text, Bild und Audio. Ein GPT-5-Modell analysiert Produktbilder, generiert Beschreibungen und erstellt Social-Media-Posts, Bildmodelle erzeugen Varianten, Speech-Modelle konvertieren Text zu Audio. Der Agent Service orchestriert den Workflow, Evaluations messen die Qualität.
Enterprise Search mit semantischer Suche
Große Organisationen bauen intelligente Suche über interne Wissensquellen wie SharePoint, OneDrive und OneLake. Foundry IQ liefert zitierfähige Antworten samt Quellenangaben für Compliance. Nutzer erhalten nicht nur Antworten, sondern auch die Belege dafür.
Vorteile
- Eine Plattform statt fragmentierter Tools: Modelle, Agenten und Tools unter einer Azure-Ressource mit einheitlichem RBAC, Networking und Policies
- Anbieterunabhängigkeit: über 1.900 Modelle direkt vergleichbar, Model Router optimiert automatisch Qualität, Kosten und Latenz
- Schnellerer Weg in die Produktion: der Agent Service übernimmt Orchestrierung, Identität, Safety und Observability
- Vertrauenswürdige KI: Content Safety, Evaluations und Tracing sind integriert, nicht nachgerüstet
- Planbare Kosten: Token-, PTU- und Batch-Deployments lassen sich pro Workload kombinieren
- EU-Compliance: EU Data Zone und Data Boundary mit Regionen wie Sweden Central, West Europe und Germany West Central
Best Practices für Microsoft Foundry
Modellauswahl aus dem Catalog
Beginnen Sie mit klaren Kriterien: Latenz, Kosten, Qualität. Vergleichen Sie GPT-5, GPT-4.1, Claude und Mistral im Playground. Für produktionsreife Entscheidungen: Erstellen Sie ein Evaluations-Dataset mit 100 bis 200 repräsentativen Beispielen und messen Sie Groundedness, Relevance und Coherence. Für gemischte Workloads lohnt der Model Router, der automatisch zum passenden Modell routet.
Agenten mit dem Agent Service bauen
Nutzen Sie den Foundry Agent Service statt eigenem Orchestrierungs-Code. Definieren Sie Tools aus dem Katalog, aktivieren Sie Memory für mehrstufige Aufgaben und versionieren Sie Agent-Versionen. Setzen Sie Multi-Agent-Orchestrierung für komplexe Workflows ein und prüfen Sie kritische Schritte per Human-in-the-Loop.
RAG-Implementierung mit Foundry IQ
Erschließen Sie Datenquellen über Foundry IQ und nutzen Sie zitierfähige Antworten, um Quellen nachvollziehbar zu machen. Messen Sie Retrieval-Präzision und Answer-Groundedness getrennt. Für tiefe Integration in Microsoft Fabric und Microsoft 365 stehen Fabric IQ und Work IQ bereit.
Responsible AI von Anfang an
Integrieren Sie Azure AI Content Safety aus Foundry Tools von Beginn an, nicht nachträglich. Definieren Sie Custom Categories für Ihren Use Case und nutzen Sie die Observability für kontinuierliches Monitoring. Dokumentieren Sie Model Cards für Transparenz und Compliance.
Evaluation und Monitoring
Etablieren Sie ab Tag 1 ein Evaluations-Framework: definieren Sie Metriken, erstellen Sie Golden Datasets und automatisieren Sie Evaluations bei jedem Deployment. In Produktion: Tracing aller Agent-Schritte, Sampling für Human Review, kontinuierliche Evaluation über das Observability-Dashboard.
Cost Optimization mit Deployment-Typen
Für vorhersehbaren Traffic bieten Provisioned Throughput Units (PTU) planbare Kosten und niedrige Latenz. Für asynchrone Massenverarbeitung nutzen Sie Global Batch mit rund 50 Prozent niedrigeren Kosten. Für variablen Traffic eignet sich Token-basiertes Standard-Pricing. Kombinieren Sie die Modelle: PTU für Baseline, Batch für Bulk-Jobs, Standard für Peaks.
Security mit Managed Identity und Private Endpoints
Vermeiden Sie API-Keys im Code und nutzen Sie Azure Managed Identity. Implementieren Sie Private Endpoints, um Traffic im Azure-Netzwerk zu halten, und aktivieren Sie Customer-Managed Keys für Encryption at Rest. Für regulierte Industrien: Data-Zone-Deployments in der EU mit Data-Residency-Garantien.
Häufig gestellte Fragen zu Microsoft Foundry
Was ist der Unterschied zwischen Microsoft Foundry und Azure OpenAI?
Azure OpenAI bietet Zugriff speziell auf OpenAI-Modelle wie GPT-5 und GPT-4.1. Microsoft Foundry ist die übergeordnete Plattform: Sie umfasst Azure OpenAI als Teilbereich und bietet zusätzlich über 1.900 Modelle weiterer Anbieter, den Foundry Agent Service, Foundry IQ, Model Router sowie Tracing, Evaluations und Governance. Eine bestehende Azure-OpenAI-Ressource lässt sich unter Beibehaltung von Endpunkt und API-Keys zu einer Foundry-Ressource upgraden.
Welche Modelle stehen im Foundry Model Catalog zur Verfügung?
Der Catalog umfasst über 1.900 Modelle von Microsoft, OpenAI, Anthropic, Mistral, xAI, Meta, DeepSeek und Hugging Face. Zu den wichtigsten Familien gehören GPT-5 für komplexes Reasoning, GPT-4.1 als Balance aus Qualität und Kosten, Anthropic Claude, xAI Grok, Mistral, DeepSeek-R1, Microsoft Phi-4 und Meta Llama. Modelle lassen sich im Playground direkt vergleichen und evaluieren.
Was ist der Foundry Agent Service?
Der Foundry Agent Service bringt Agenten von Prototyp zu Produktion, ohne dass Sie einen eigenen Orchestrator schreiben. Er übernimmt Konversationen, Tool-Calls, Identität, Safety und Observability. Multi-Agent-Orchestrierung lässt sich per SDK für C# und Python bauen, über 1.400 Tools sind im Katalog anbindbar, Memory hält Kontext über Interaktionen hinweg. Agenten lassen sich nach Microsoft 365, Teams oder als Container veröffentlichen.
Wie funktioniert RAG mit Foundry IQ?
Foundry IQ ist der Knowledge-Layer von Microsoft Foundry. Er verbindet Agenten mit Unternehmens- oder Web-Inhalten und liefert zitierfähige Antworten statt eines einfachen Vektor-Lookups. Foundry IQ erschließt Datenquellen wie OneLake, Snowflake oder S3 und macht Retrieval zu einem dynamischen Reasoning-Prozess. Für tiefere Integration in Microsoft Fabric und Microsoft 365 stehen Fabric IQ und Work IQ bereit.
Kann ich Modelle mit eigenen Daten fine-tunen?
Ja, Microsoft Foundry unterstützt Fine-Tuning für zahlreiche Modelle, darunter OpenAI-Modelle, Llama, Mistral und Phi. Sie laden Trainingsdaten hoch, Foundry trainiert das Modell und stellt es als privates Deployment bereit. Use Cases: domänenspezifische Sprache für Legal oder Medical, konsistenter Tone-of-Voice für Brands sowie Optimierung auf spezifische Tasks. Abgerechnet wird pro Training plus Hosting des Custom Models.
Was kostet Microsoft Foundry und welche Deployment-Typen gibt es?
Die Plattform selbst ist kostenlos, abgerechnet wird pro Deployment. Standard-Deployments sind Token-basiert (Pay-per-Token, Input und Output getrennt). Provisioned Throughput (PTU) reserviert feste Kapazität für planbare Kosten und Latenz. Global Batch verarbeitet asynchrone Jobs mit etwa 24 Stunden Zieldurchlauf und rund 50 Prozent niedrigeren Kosten als Global Standard. Jede Variante gibt es als Global, Data Zone oder Regional je nach Compliance-Anforderung.
Wie funktioniert Content Filtering und Responsible AI?
Foundry integriert Azure AI Content Safety: Filter für Hate Speech, sexuelle Inhalte, Gewalt und Selbstgefährdung in mehreren Severity-Stufen. Sie konfigurieren Thresholds pro Use Case, Custom Categories ermöglichen branchenspezifische Filter. Die Observability zeigt Evaluations für Groundedness und Qualität sowie Tracing über alle Agent-Schritte. Filter wirken in Echtzeit auf Input und Output und loggen Verstöße für Compliance.
Wo werden meine Daten verarbeitet und ist Foundry DSGVO-konform?
Microsoft Foundry unterstützt EU-Datenresidenz über die EU Data Zone und die EU Data Boundary. EU-Regionen wie Sweden Central, West Europe und Germany West Central halten Daten in der EU. Mit Data-Zone-Deployments bleibt die Verarbeitung innerhalb der EU. Microsoft bietet Data Processing Agreements, und für Azure OpenAI in Foundry werden Prompts nicht für das Training von Microsoft-Modellen verwendet. Customer-Managed Keys ermöglichen zusätzliche Kontrolle über die Verschlüsselung.
Kann ich Foundry on-premises oder in Hybrid-Szenarien nutzen?
Microsoft Foundry ist ein Cloud-Service und läuft auf Azure. Für Hybrid-Szenarien binden Sie On-Premises-Daten über Azure Arc, VPN oder ExpressRoute an. RAG-Implementierungen können lokale Datenquellen einbeziehen, etwa On-Prem-SharePoint per Connector. Für lokale Inferenz bietet Microsoft mit Foundry Local ausgewählte Modelle auf eigenen Geräten, jedoch nicht die komplette Foundry-Plattform.
Integration mit innFactory
Als Microsoft Solutions Partner unterstützt innFactory Sie bei der Implementierung von Microsoft Foundry in Ihre bestehende Infrastruktur. Wir helfen bei der Modellauswahl, entwickeln produktionsreife Agenten mit dem Foundry Agent Service, bauen zitierfähige RAG-Lösungen mit Foundry IQ, implementieren Responsible-AI-Praktiken und optimieren Kosten durch die richtige Kombination aus Token-, PTU- und Batch-Deployments.
Unsere Expertise umfasst die Integration von Foundry mit Azure AI Search, Microsoft Fabric und Ihren Unternehmensdaten sowie den Aufbau von Governance über den Foundry Control Plane für regulierte Branchen.
Kontaktieren Sie uns für eine unverbindliche Beratung zu Microsoft Foundry und Enterprise-KI-Projekten.
Technische Spezifikationen
Häufig gestellte Fragen
Was ist der Unterschied zwischen Microsoft Foundry und Azure OpenAI?
Azure OpenAI bietet Zugriff speziell auf OpenAI-Modelle wie GPT-5 und GPT-4.1. Microsoft Foundry (ehem. Azure AI Foundry) ist die übergeordnete Plattform: Sie umfasst Azure OpenAI als Teilbereich und bietet zusätzlich über 1.900 Modelle weiterer Anbieter, den Foundry Agent Service, Foundry IQ, Model Router sowie Tracing, Evaluations und Governance. Eine bestehende Azure-OpenAI-Ressource lässt sich unter Beibehaltung von Endpunkt und API-Keys zu einer Foundry-Ressource upgraden.
Welche Modelle stehen im Foundry Model Catalog zur Verfügung?
Der Catalog umfasst über 1.900 Modelle von Microsoft, OpenAI, Anthropic, Mistral, xAI, Meta, DeepSeek und Hugging Face. Zu den wichtigsten Familien gehören GPT-5 für komplexes Reasoning, GPT-4.1 als Balance aus Qualität und Kosten, Anthropic Claude, xAI Grok, Mistral, DeepSeek-R1, Microsoft Phi-4 für ressourcenarme Umgebungen und Meta Llama für Fine-Tuning. Modelle lassen sich im Playground direkt vergleichen und evaluieren.
Was ist der Foundry Agent Service?
Der Foundry Agent Service bringt Agenten von Prototyp zu Produktion, ohne dass Sie einen eigenen Orchestrator schreiben. Er übernimmt Konversationen, Tool-Calls, Identität, Safety und Observability. Multi-Agent-Orchestrierung lässt sich per SDK für C# und Python bauen, über 1.400 Tools sind im Katalog anbindbar, Memory hält Kontext über Interaktionen hinweg. Agenten lassen sich nach Microsoft 365, Teams oder als Container veröffentlichen.
Wie funktioniert RAG mit Foundry IQ?
Foundry IQ ist der Knowledge-Layer von Microsoft Foundry. Er verbindet Agenten mit Unternehmens- oder Web-Inhalten und liefert zitierfähige Antworten, statt eines einfachen Vektor-Lookups. Foundry IQ erschließt Datenquellen wie OneLake, Snowflake oder S3 und macht Retrieval zu einem dynamischen Reasoning-Prozess. Für tiefere Integration in Microsoft Fabric und Microsoft 365 stehen Fabric IQ und Work IQ bereit.
Was kostet Microsoft Foundry und welche Deployment-Typen gibt es?
Die Plattform selbst ist kostenlos, abgerechnet wird pro Deployment. Standard-Deployments sind Token-basiert (Pay-per-Token, Input und Output getrennt). Provisioned Throughput (PTU) reserviert feste Kapazität für planbare Kosten und Latenz. Global Batch verarbeitet asynchrone Jobs mit etwa 24 Stunden Zieldurchlauf und rund 50 Prozent niedrigeren Kosten als Global Standard. Jede Variante gibt es als Global, Data Zone oder Regional je nach Compliance-Anforderung.
Wo werden meine Daten verarbeitet und ist Foundry DSGVO-konform?
Microsoft Foundry unterstützt EU-Datenresidenz über die EU Data Zone und die EU Data Boundary. EU-Regionen wie Sweden Central, West Europe und Germany West Central halten Daten in der EU. Mit Data-Zone-Deployments bleibt die Verarbeitung innerhalb der EU. Microsoft bietet Data Processing Agreements, und für Azure OpenAI in Foundry werden Prompts nicht für das Training von Microsoft-Modellen verwendet. Customer-Managed Keys ermöglichen zusätzliche Kontrolle über die Verschlüsselung.
