Zum Hauptinhalt springen
Cloud / AWS / Produkte / Amazon Polly - Text-to-Speech

Amazon Polly - Text-to-Speech

Amazon Polly wandelt Text in natürliche Sprache um. Über 60 Stimmen in 30+ Sprachen für Anwendungen und Content.

Machine Learning
Preismodell Bezahlung pro character
Verfügbarkeit Alle wichtigen Regionen
Datensouveränität EU-Regionen verfügbar
Zuverlässigkeit 99,9% Verfügbarkeit SLA

Was ist Amazon Polly?

Amazon Polly ist ein Text-to-Speech-Service, der Text in natürlich klingende Sprache umwandelt. Der Service bietet über 60 Stimmen in mehr als 30 Sprachen und eignet sich für Anwendungen, Accessibility-Features und Content-Erstellung.

Polly nutzt Deep Learning für Neural Text-to-Speech (NTTS) mit besonders natürlich klingenden Stimmen. Die einfache API ermöglicht Integration in Minuten.

Kernfunktionen

  • Neuronale Stimmen: Natürlich klingende Sprache mit NTTS-Technologie
  • 30+ Sprachen: Deutsch, Englisch, Französisch, Spanisch und viele weitere
  • SSML-Support: Feinsteuerung von Aussprache, Pausen und Betonung
  • Speech Marks: Timing-Informationen für Lip-Sync und Texthervorhebung
  • Lexicons: Benutzerdefinierte Aussprachewörterbücher

Typische Anwendungsfälle

Voice Assistants: Sprachausgabe für Chatbots, IVR-Systeme und Smart Home Devices. Neuronale Stimmen sorgen für natürliche Konversationen.

Accessibility: Vorlesen von Web-Inhalten, Dokumenten und Apps für sehbehinderte Nutzer. WCAG-Compliance durch Audio-Alternativen.

Content-Erstellung: Audio-Versionen von Artikeln, E-Learning-Inhalten und Podcasts. Automatisierte Produktion spart Zeit und Kosten.

Vorteile

  • Natürlich klingende Sprache mit Neural TTS
  • Pay-per-Character ohne Mindestgebühren
  • Einfache REST-API für schnelle Integration
  • Unterstützung für deutsche Stimmen

Integration mit innFactory

Als AWS Reseller unterstützt innFactory Sie bei Amazon Polly: Wir helfen bei der Integration in Ihre Anwendungen, der Optimierung der Sprachqualität mit SSML und der Kombination mit anderen AWS-Services wie Lex und Connect.

Typische Anwendungsfälle

Text-to-speech
Voice assistants
Accessibility
Content creation

Häufig gestellte Fragen

Was ist Amazon Polly?

Amazon Polly ist ein Text-to-Speech-Service, der Text in natürlich klingende Sprache umwandelt. Er bietet über 60 Stimmen in mehr als 30 Sprachen, einschließlich neuronaler Stimmen mit hoher Sprachqualität.

Was sind neuronale Stimmen?

Neural Text-to-Speech (NTTS) nutzt Deep Learning für natürlichere Sprachsynthese. Die Stimmen klingen menschenähnlicher mit besserer Intonation und Betonung als Standard-Stimmen.

Welche Ausgabeformate werden unterstützt?

MP3, OGG Vorbis, PCM und JSON mit Speech Marks. Speech Marks liefern Timing-Informationen für Lip-Sync oder Texthervorhebung.

Wie kann ich die Aussprache anpassen?

SSML-Tags ermöglichen Kontrolle über Pausen, Betonung, Aussprache und Sprechgeschwindigkeit. Lexicons speichern benutzerdefinierte Aussprachewörterbücher.

AWS Cloud Expertise

innFactory ist AWS Reseller mit zertifizierten Cloud-Architekten. Wir bieten Beratung, Implementierung und Managed Services für AWS.

Ähnliche Produkte anderer Cloud-Anbieter

Andere Cloud-Anbieter bieten vergleichbare Services in dieser Kategorie. Als Multi-Cloud Partner helfen wir bei der richtigen Wahl.

Google Cloud

Agent Development Kit (ADK) - Multi-Agent-Framework

Agent Development Kit (ADK): Open-Source-Framework von Google für den Bau, das Testen und Deployment von Single- und …

Preismodell Kostenlos / Open Source (Apache 2.0); …
SLA N/A (Framework); SLA abhängig vom gewählten Deployment-Ziel
Vergleichen →
Azure

Foundry IQ - Wissensschicht für Agenten

Foundry IQ ist die Wissens- und Retrieval-Schicht für Microsoft Foundry: Agenten greifen über einen Endpunkt auf …

Preismodell Pay-as-you-go (Free Tier + …
SLA N/A (einige Funktionen in Preview, ohne SLA)
Vergleichen →
Azure

Foundry Local - Lokale KI auf dem Endgerät

Foundry Local: Cross-Plattform KI-Runtime, die Modelle on-device via ONNX Runtime ausführt. OpenAI-kompatible API, ohne …

Preismodell Kostenlos, keine Token-Kosten
SLA N/A (lokale Ausführung ohne Service-SLA)
Vergleichen →
Google Cloud

Gemini auf Vertex AI: Foundation Models per API

Gemini auf Vertex AI: Googles Foundation Models (Gemini 3, 2.5 Pro, Flash) mit langem Kontext und Multimodalität über …

Preismodell Pay-per-use (Tokens), zusätzlich Batch, …
SLA 99,9%
Vergleichen →
Google Cloud

GKE Inference Gateway - LLM-Routing auf Kubernetes

GKE Inference Gateway: Kubernetes-natives Gateway zum Serving generativer KI auf GKE mit LLM-bewusstem Routing und …

Preismodell Keine separate Produktgebühr, Abrechnung …
SLA N/A (keine eigene SLA, GKE-SLA gilt für den Cluster)
Vergleichen →
Azure

Microsoft Discovery - Agentische KI für F&E

Microsoft Discovery ist eine agentische KI-Plattform auf Azure, die Forschungsagenten, Wissensgraphen und HPC für …

Preismodell Pay-per-use (Azure-Verbrauch + User …
SLA N/A
Vergleichen →

68 vergleichbare Produkte bei anderen Cloud-Anbietern gefunden.

Bereit, mit Amazon Polly - Text-to-Speech zu starten?

Unsere zertifizierten AWS Experten helfen bei Architektur, Integration und Optimierung.

Beratung vereinbaren