Schlagwort-Archive: OpenAI

Neue OpenAI Sprachmodelle: Verbesserte OpenAI Text-to-Speech Funktionalitäten unter Python genutzt

Vor etwa einem Jahr habe ich mir die Text-to-Speech Funktion von OpenAI angeschaut. Die Sprachausgabe war damals noch verbesserungswürdig. Mittlerweile hat OpenAI die sogenannte Realtime API veröffentlicht, mit der relative verzögerungsfrei Gespräche in höherer Qualität möglich sind. Sicherlich werden viele Lernanbieter bald auf diese neuen Funktionen aufspringen – spätestens wenn die Preise sinken.

Durch diese neuen Funktionalitäten gibt es nun über einen kleinen Umweg Zugang zu den verbesserten Stimmen. Dies funktioniert über sogenannte Chat-Completions. Das bedeutet, dass kein klassisches Text-To-Speech angeboten wird. Stattdessen reagiert ein spezielles GPT-Modell auf ein Prompt mit Audioausgaben. Instruiert man GPT nun durch ein entsprechendes Systemprompt nur einen bestimmten Text zu sprechen, kann man das Modell auch für einfache Text-to-Speech Anwendungen nutzen.

Spezifische Anweisungen zur Sprechweise möglich

Neue OpenAI Sprachmodelle: Verbesserte OpenAI Text-to-Speech Funktionalitäten unter Python genutzt weiterlesen
Roboter mit Sprechblase

Text-to-Speech mit der OpenAI API und Python

(Schaut auch in den neuen Artikel vom 11.12.2024: Neue OpenAI Stimmen – Text-To-Speech mit Python.)

Im April 2023 hatte ich bereits ChatGPT als Podcast-Gast zum Thema New Learning . Nun stehe ich vor der Veröffentlichung einer neuen Podcastfolge mit ChatGPT zum Thema Microlearning und war auf der Suchte nach einer kostengünstigen Text-to-Speech-Lösung.

API von OpenAI Text-to-Speech

Obwohl es einige, sicher gute, kostenpflichtige Optionen für TTS, wie Elevenlabs oder Murf gibt, wollte ich für eine einzelne Podcastfolge kein Abo abschließen und verschiedene Lösungen ausprobieren. Glücklicherweise stieß ich in der neuesten OpenAI API Version auf die Text-to-Speech-Option. Sicherlich sind andere Angebote dieser Variante überlegen, aber für den angedachten Zweck reichte es mir aus. Dazu kommt noch, dass die OpenAI API die Kosten verbrauchsabhängig berechnet. Meine Schätzung liegt bei weniger als 10 Cent für 3 Minuten Audio.

Erfahrungen mit der OpenAI API

Text-to-Speech mit der OpenAI API und Python weiterlesen