Microsoft – VALL-E podcastet für Dich – Podential.de

KI – Fluch oder Segen? Das ist hier die Frage!

Ich bin schon ein technisch versierter Mensch und betrachte mich selbst durchaus als early adopter aber irgendwo gibt es auch Sachen, denen ich sehr skeptisch entgegensehe.

Die technische Entwicklung lässt sich nicht aufhalten und das Thema KI (künstliche Intelligenz) ist derzeit in aller Munde.

Bereits im Oktober 2022 habe ich im Artikel „Du sagst etwas, was Du nie gesagt hast – KI als Gefahr oder Segen?“ meine Bedenken bezüglich dieser Thematik geäußert.

Microsoft setzt jetzt noch einen oben drauf und hat mit VALL-E eine KI vorgestellt, die die Text-zu-Sprache-Synthese (TTS) auf ein neues Niveau anhebt.

Neu ist nicht, dass Text automatisiert in Sprache umgewandelt wird sondern, dass Sprachmuster und Sprachstil einer realen Person nachempfunden werden können.

VALL-E benötigt dafür eine originale Sprachsequenz von lediglich 3 Sekunden.

Im Originalartikel heißt es dazu:

„In der Pre-Trainingsphase skalieren wir die TTS-Trainingsdaten auf 60.000 Stunden englischer Sprache, was Hunderte Male mehr ist als bei bestehenden Systemen. VALL-E verfügt über kontextbezogene Lernfähigkeiten und kann mit nur einer 3-Sekunden-Aufnahme eines unbekannten Sprechers als akustische Eingabeaufforderung hochwertige personalisierte Sprache synthetisieren. Experimentelle Ergebnisse zeigen, dass VALL-E das State-of-the-Art Zero-Shot TTS-System in Bezug auf die Natürlichkeit der Sprache und die Ähnlichkeit der Sprecher deutlich übertrifft. Darüber hinaus zeigt sich, dass VALL-E die Emotionen des Sprechers und die akustische Umgebung des akustischen Prompts in der Synthese bewahren kann.“

Mit dieser Aussicht heißt es also nun: zurücklehnen, ein paar Texte tippen und dann per VALL-E eine Podcastepisode für Dich generieren lassen.

Naja, ganz so weit ist es noch nicht, da diese Funktion momentan der Allgemeinheit noch nicht zur Verfügung steht aber was nicht ist, kann ja noch werden.

Der Originalartikel inclusive einiger Sprachbeispiele ist hier zu finden:

VALL-E Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers

Quelle: VALL-E Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers
Beitragsbild: Designed by macrovector / Freepik

Schreibe einen Kommentar Antwort abbrechen

Google Podcast – Ende Juni 2024 ist endgültig Schluss – Podential.de – Podcaster News im Überblick - Google Podcast wird eingestellt – Migration zu YouTube Music startet

[…] habe mittlerweile schon öfter darüber berichtet, dass Google seine eigene Podcastsparte […]

CTHTC - Audacity – KI Tool für Podcaster wird integriert

Hallo Eddy. Ich hatte damals nur die Pressemeldung von Audacity hier veröffentlicht. Mit dem Programm selber arbeite isch nicht und…

Eddy - Audacity – KI Tool für Podcaster wird integriert

hi, https://podential.de/blog/2024/01/04/audacity-ki-tool-fuer-podcaster-wird-integriert/ du schreibst: Die Transkription unterstützte von Whisper.cpp kann Wörter sowohl transkribieren als auch übersetzen und auf einer Etikettenspur…

Google bietet Podcastumzug zu YouTube an – Podential.de – Podcaster News im Überblick - YouTube Music – Podcasts können per RSS hinzugefügt werden

[…] Im Grunde ist das aber auch nichts anderes, als wenn man seinen RSS Feed bei YouTube veröffentlicht. […]

Spotify – Neue Funktionen werden ausgerollt – Podential.de – Podcaster News im Überblick - Spotify – KI-Pilot lässt übersetzte Podcasts in Originalstimme erklingen

[…] kürzlich hat Spotify angekündigt, dass Podcasts per KI so übersetzt werden sollen, dass diese wie vom Originalsprecher […]

Cookie	Dauer	Beschreibung
cookielawinfo-checkbox-analytics	11 Monate	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt. Das Cookie wird verwendet, um die Zustimmung des Benutzers für die Cookies in der Kategorie „Analytics“ zu speichern.
cookielawinfo-checkbox-functional	11 Monate	Das Cookie wird durch die DSGVO-Cookie-Zustimmung gesetzt, um die Zustimmung des Benutzers für die Cookies in der Kategorie "Funktional" zu erfassen.
cookielawinfo-checkbox-necessary	11 Monate	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt. Die Cookies werden verwendet, um die Zustimmung des Benutzers für die Cookies in der Kategorie „Notwendig“ zu speichern.
cookielawinfo-checkbox-others	11 Monate	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt. Das Cookie wird verwendet, um die Zustimmung des Benutzers für die Cookies in der Kategorie „Sonstiges“ zu speichern.
cookielawinfo-checkbox-performance	11 Monate	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt. Das Cookie wird verwendet, um die Zustimmung des Benutzers für die Cookies in der Kategorie „Leistung“ zu speichern.
viewed_cookie_policy	11 Monate	Das Cookie wird vom Plugin GDPR Cookie Consent gesetzt und wird verwendet, um zu speichern, ob der Benutzer der Verwendung von Cookies zugestimmt hat oder nicht. Es werden keine personenbezogenen Daten gespeichert.

Microsoft – VALL-E podcastet für Dich

CTHTC

Schreibe einen Kommentar Antwort abbrechen

YouTube Podcasts – wann kommt das neue Format?

Künstliche Intelligenz im Browser – Schlägt Google wieder Microsoft?

Microsoft Teams – Klassische Version wird eingestellt

Twitter – Erklärung für nicht funktionierende Drittanbieter Apps

Spotify – Große Änderungen für 2023 geplant

agenda nocte Folge 81 ist online

agenda nocte Folge 80 ist online

TechPod Folge 46 ist online

agenda nocte Folge 79 ist online

agenda nocte Folge 78 ist online

CTHTC

Das könnte dich auch interessieren

Schreibe einen Kommentar Antwort abbrechen

Cookie Einstellungen