Automatische Optimierung von Audiosignalen für Transkription mit Evolutionären Algorithmen und Machine Learning
Springer Gabler
ISBN 978-3-658-50048-1
Standardpreis
Bibliografische Daten
eBook. PDF. Weiches DRM (Wasserzeichen)
2026
XI, 102 S. 30 Abbildungen, 18 Abbildungen in Farbe..
Umfang: 102 S.
Verlag: Springer Gabler
ISBN: 978-3-658-50048-1
Weiterführende bibliografische Daten
Das Werk ist Teil der Reihe: BestMasters Computer Science and Engineering (German Language)
Produktbeschreibung
In diesem Buch wird die Empfindlichkeit des Automatic Speech Recognition-Werkzeugs Whisper auf Störgeräusche untersucht. Hierbei werden unterschiedliche Geräuschtypen in verschiedenen Lautstärken untersucht. Es zeigte sich, dass einige Störgeräusche wie reines Rauschen oder Hintergrundgespräche einen höheren Einfluss auf die Transkript-Fehlerrate haben. Es wurde untersucht, ob mittels Machine Learning-Algorithmen und evolutionären Algorithmen eine Audioplugin-basierte Vorverarbeitung gefunden werden kann, welche die Transkriptgenauigkeit in Gegenwart von Störgeräuschen verbessert. Die Ergebnisse zeigen, dass mit den gewählten Methoden Verbesserungen für einzelne Störgeräusche erzielt werden konnten. Eine universelle Pluginkette zur Verbesserung der Transkriptgenauigkeit auf beliebigen Daten konnte jedoch nicht identifiziert werden.
Autorinnen und Autoren
Produktsicherheit
Hersteller
Springer Nature Customer Service Center GmbH
ProductSafety@springernature.com
BÜCHER VERSANDKOSTENFREI INNERHALB DEUTSCHLANDS

