Trascrizione svizzero tedesco
Lo svizzero tedesco non è semplicemente «tedesco con un accento»
Ecco perché abbiamo costruito qualcosa di diverso.
Il problema con gli strumenti generici
Gli strumenti di trascrizione generici sono addestrati sul tedesco standard. Sentono «Grüezi» e indovinano. Incontrano il bernese e faticano. Incontrano il vallesano e si arrendono.
Lo svizzero tedesco non ha una forma scritta standardizzata, presenta una massiccia variazione regionale e un vocabolario che semplicemente non esiste nel tedesco standard. Questo lo rende una delle sfide più difficili nel riconoscimento vocale.
Il nostro approccio
Non abbiamo cercato di ottimizzare un modello generico. Abbiamo costruito un riconoscimento vocale svizzero tedesco specializzato da zero — in collaborazione formale con l'Istituto per la Data Science della FHNW.
Questo era un progetto di ricerca finanziato, non un esercizio di marketing. Veri ricercatori. Vera metodologia. Risultati pubblicati.
Nato dalla ricerca
Questa capacità proviene da un progetto di ricerca finanziato con l'Istituto per la Data Science della FHNW.
Progetto di ricerca
Schweizerdeutsche Spracherkennung und Übersetzung in Standarddeutsch
- Durata: Giugno 2023 – Agosto 2024
- Istituzione: FHNW Hochschule für Informatik
- Istituto: Institut für Data Science
- Direzione progetto: Prof. Manfred Vogel
- Finanziamento: Forschungsfonds Aargau
Cosa abbiamo costruito
- Modelli di riconoscimento vocale svizzero tedesco specializzati
- Pipeline di traduzione dallo svizzero tedesco al tedesco standard
- Swiss Parliament Corpus 2.0 (pubblicato come open data)
- Corpus di test standardizzato per il benchmarking
La tecnologia sottostante è disponibile anche come demo gratuita su stt4sg.fhnw.ch
Come misuriamo la qualità
Non lanciamo percentuali di precisione — sono prive di significato senza contesto.
Word Error Rate (WER)
La percentuale di parole che devono essere corrette. Più basso è meglio. Testiamo contro un corpus svizzero tedesco standardizzato per misurare le prestazioni reali.
Punteggio BLEU
Per la qualità della traduzione dallo svizzero tedesco al tedesco standard. Misura quanto bene l'output corrisponde alle trascrizioni di riferimento. Metrica standard del settore.
Siamo onesti sui limiti
La qualità audio conta. Una registrazione chiara in una stanza silenziosa sarà sempre trascritta meglio di un'intervista su una strada rumorosa. Nessuna IA può riparare un audio scadente.
La variazione dialettale è reale. Una forte mescolanza dialettale o espressioni molto locali potrebbero richiedere correzione manuale. Lo svizzero tedesco è diversificato — è questo che lo rende bello e impegnativo.
Siamo bravi, non magici. Prova tu stesso con le tue registrazioni per vedere come funziona sul tuo contenuto specifico.
Migliori risultati con
- Audio chiaro con rumore di fondo minimo
- Singolo parlante o alternanza chiara
- Attrezzatura di registrazione standard
- Dialetti svizzero tedeschi comuni
Prova tu stesso
Carica una registrazione in svizzero tedesco e guarda come funziona. Il miglior test è il tuo contenuto.