Archiv der Kategorie: Generative AI

Neue OpenAI Sprachmodelle: Verbesserte OpenAI Text-to-Speech Funktionalitäten unter Python genutzt

Vor etwa einem Jahr habe ich mir die Text-to-Speech Funktion von OpenAI angeschaut. Die Sprachausgabe war damals noch verbesserungswürdig. Mittlerweile hat OpenAI die sogenannte Realtime API veröffentlicht, mit der relative verzögerungsfrei Gespräche in höherer Qualität möglich sind. Sicherlich werden viele Lernanbieter bald auf diese neuen Funktionen aufspringen – spätestens wenn die Preise sinken.

Durch diese neuen Funktionalitäten gibt es nun über einen kleinen Umweg Zugang zu den verbesserten Stimmen. Dies funktioniert über sogenannte Chat-Completions. Das bedeutet, dass kein klassisches Text-To-Speech angeboten wird. Stattdessen reagiert ein spezielles GPT-Modell auf ein Prompt mit Audioausgaben. Instruiert man GPT nun durch ein entsprechendes Systemprompt nur einen bestimmten Text zu sprechen, kann man das Modell auch für einfache Text-to-Speech Anwendungen nutzen.

Spezifische Anweisungen zur Sprechweise möglich

Neue OpenAI Sprachmodelle: Verbesserte OpenAI Text-to-Speech Funktionalitäten unter Python genutzt weiterlesen
GenAI Upskilling trifft Peer Learning

GenAI Upskilling trifft Peer Learning: Matthias Wiencke zu Gast bei AI4L&D Use Cases

Im neuen Podcast von Jan Foelsing: AI 4 L&D Use Cases habe ich einen Upskillingansatz für GenAI vorgestellt. „GenAI Upskilling trifft Peer Learning“. Bei dieser strukturierten „GenAI Learning Journey“ lernen Teilnehmende selstorganisiert in Kleingruppen bessere Anweisungen (Prompts) für GenAI Anwendungen zu schreiben. Bei dem sehr erfolgreiche Programm, an dem sich bereits über 7000 Mitarbeitende angemeldet haben, treffen sich die Teilnehmenden wöchentlich für einen Zeitraum von 8 Wochen. Während dieser Zeit führen die Teilnehmenden verschiedenste Übungen durch, geben sich Feedback und arbeiten zusätzlich an eigenen Use-Cases.

Mehr Details erfahrt ihr in dem Video von Jan und mir:

Roboter mit Sprechblase

Text-to-Speech mit der OpenAI API und Python

(Schaut auch in den neuen Artikel vom 11.12.2024: Neue OpenAI Stimmen – Text-To-Speech mit Python.)

Im April 2023 hatte ich bereits ChatGPT als Podcast-Gast zum Thema New Learning . Nun stehe ich vor der Veröffentlichung einer neuen Podcastfolge mit ChatGPT zum Thema Microlearning und war auf der Suchte nach einer kostengünstigen Text-to-Speech-Lösung.

API von OpenAI Text-to-Speech

Obwohl es einige, sicher gute, kostenpflichtige Optionen für TTS, wie Elevenlabs oder Murf gibt, wollte ich für eine einzelne Podcastfolge kein Abo abschließen und verschiedene Lösungen ausprobieren. Glücklicherweise stieß ich in der neuesten OpenAI API Version auf die Text-to-Speech-Option. Sicherlich sind andere Angebote dieser Variante überlegen, aber für den angedachten Zweck reichte es mir aus. Dazu kommt noch, dass die OpenAI API die Kosten verbrauchsabhängig berechnet. Meine Schätzung liegt bei weniger als 10 Cent für 3 Minuten Audio.

Erfahrungen mit der OpenAI API

Text-to-Speech mit der OpenAI API und Python weiterlesen