Schweizerdeutsche Transkription
Schweizerdeutsch ist nicht einfach «Deutsch mit Akzent»
Deshalb haben wir etwas anderes gebaut.
Das Problem mit generischen Tools
Generische Transkriptions-Tools sind auf Hochdeutsch trainiert. Sie hören «Grüezi» und raten. Sie treffen auf Berndeutsch und kämpfen. Sie treffen auf Walliserdeutsch und geben auf.
Schweizerdeutsch hat keine standardisierte Schriftform, massive regionale Variation und Vokabular, das im Hochdeutschen schlicht nicht existiert. Das macht es zu einer der schwierigsten Herausforderungen in der Spracherkennung.
Unser Ansatz
Wir haben nicht versucht, ein generisches Modell zu optimieren. Wir haben spezialisierte schweizerdeutsche Spracherkennung von Grund auf gebaut — in formeller Zusammenarbeit mit dem Institut für Data Science der FHNW.
Das war ein gefördertes Forschungsprojekt, keine Marketing-Übung. Echte Forschende. Echte Methodik. Publizierte Resultate.
Entstanden aus Forschung
Diese Fähigkeit stammt aus einem geförderten Forschungsprojekt mit dem Institut für Data Science der FHNW.
Forschungsprojekt
Schweizerdeutsche Spracherkennung und Übersetzung in Standarddeutsch
- Laufzeit: Juni 2023 – August 2024
- Institution: FHNW Hochschule für Informatik
- Institut: Institut für Data Science
- Projektleitung: Prof. Manfred Vogel
- Förderung: Forschungsfonds Aargau
Was wir gebaut haben
- Spezialisierte schweizerdeutsche Spracherkennungsmodelle
- Übersetzungspipeline von Schweizerdeutsch zu Standarddeutsch
- Swiss Parliament Corpus 2.0 (publiziert als Open Data)
- Standardisiertes Testkorpus für Benchmarking
Die zugrundeliegende Technologie ist auch als kostenlose Demo unter stt4sg.fhnw.ch verfügbar.
Wie wir Qualität messen
Wir werfen nicht mit prozentualen Genauigkeitsangaben um uns — die sind ohne Kontext bedeutungslos.
Word Error Rate (WER)
Der Prozentsatz der Wörter, die korrigiert werden müssen. Niedriger ist besser. Wir testen gegen ein standardisiertes schweizerdeutsches Korpus, um echte Leistung zu messen.
BLEU Score
Für die Übersetzungsqualität von Schweizerdeutsch zu Standarddeutsch. Misst, wie gut die Ausgabe mit Referenztranskripten übereinstimmt. Industriestandard-Metrik.
Wir sind ehrlich über Grenzen
Audioqualität zählt. Eine klare Aufnahme in einem ruhigen Raum wird immer besser transkribiert als ein Interview auf einer lauten Strasse. Keine KI kann schlechtes Audio reparieren.
Dialektvariation ist real. Starke Dialektmischung oder sehr lokale Ausdrücke können manuelle Korrektur erfordern. Schweizerdeutsch ist vielfältig — das macht es schön und herausfordernd.
Wir sind gut, nicht magisch. Probier es selbst mit deinen eigenen Aufnahmen, um zu sehen, wie es bei deinem spezifischen Inhalt funktioniert.
Beste Resultate bei
- Klarem Audio mit minimalem Hintergrundrauschen
- Einzelnem Sprecher oder klarem Sprecherwechsel
- Standard-Aufnahmegeräten
- Gängigen schweizerdeutschen Dialekten
Probier es selbst
Lade eine schweizerdeutsche Aufnahme hoch und schau, wie es funktioniert. Der beste Test ist dein eigener Inhalt.