Lo svizzero tedesco non è semplicemente «tedesco con un accento»

Ecco perché abbiamo costruito qualcosa di diverso.

Il problema con gli strumenti generici

Gli strumenti di trascrizione generici sono addestrati sul tedesco standard. Sentono «Grüezi» e indovinano. Incontrano il bernese e faticano. Incontrano il vallesano e si arrendono.

Lo svizzero tedesco non ha una forma scritta standardizzata, presenta una massiccia variazione regionale e un vocabolario che semplicemente non esiste nel tedesco standard. Questo lo rende una delle sfide più difficili nel riconoscimento vocale.

Il nostro approccio

Non abbiamo cercato di ottimizzare un modello generico. Abbiamo costruito un riconoscimento vocale svizzero tedesco specializzato da zero — in collaborazione formale con l'Istituto per la Data Science della FHNW.

Questo era un progetto di ricerca finanziato, non un esercizio di marketing. Veri ricercatori. Vera metodologia. Risultati pubblicati.

Nato dalla ricerca

Questa capacità proviene da un progetto di ricerca finanziato con l'Istituto per la Data Science della FHNW.

Progetto di ricerca

Schweizerdeutsche Spracherkennung und Übersetzung in Standarddeutsch

  • Durata: Giugno 2023 – Agosto 2024
  • Istituzione: FHNW Hochschule für Informatik
  • Istituto: Institut für Data Science
  • Direzione progetto: Prof. Manfred Vogel
  • Finanziamento: Forschungsfonds Aargau

Vedi il progetto di ricerca →

Cosa abbiamo costruito

  • Modelli di riconoscimento vocale svizzero tedesco specializzati
  • Pipeline di traduzione dallo svizzero tedesco al tedesco standard
  • Swiss Parliament Corpus 2.0 (pubblicato come open data)
  • Corpus di test standardizzato per il benchmarking

La tecnologia sottostante è disponibile anche come demo gratuita su stt4sg.fhnw.ch

Come misuriamo la qualità

Non lanciamo percentuali di precisione — sono prive di significato senza contesto.

Word Error Rate (WER)

La percentuale di parole che devono essere corrette. Più basso è meglio. Testiamo contro un corpus svizzero tedesco standardizzato per misurare le prestazioni reali.

Punteggio BLEU

Per la qualità della traduzione dallo svizzero tedesco al tedesco standard. Misura quanto bene l'output corrisponde alle trascrizioni di riferimento. Metrica standard del settore.

Siamo onesti sui limiti

La qualità audio conta. Una registrazione chiara in una stanza silenziosa sarà sempre trascritta meglio di un'intervista su una strada rumorosa. Nessuna IA può riparare un audio scadente.

La variazione dialettale è reale. Una forte mescolanza dialettale o espressioni molto locali potrebbero richiedere correzione manuale. Lo svizzero tedesco è diversificato — è questo che lo rende bello e impegnativo.

Siamo bravi, non magici. Prova tu stesso con le tue registrazioni per vedere come funziona sul tuo contenuto specifico.

Migliori risultati con

  • Audio chiaro con rumore di fondo minimo
  • Singolo parlante o alternanza chiara
  • Attrezzatura di registrazione standard
  • Dialetti svizzero tedeschi comuni

Prova tu stesso

Carica una registrazione in svizzero tedesco e guarda come funziona. Il miglior test è il tuo contenuto.