Le suisse allemand n'est pas simplement «l'allemand avec un accent»

C'est pourquoi nous avons construit quelque chose de différent.

Le problème avec les outils génériques

Les outils de transcription génériques sont entraînés sur l'allemand standard. Ils entendent «Grüezi» et devinent. Ils rencontrent le bernois et peinent. Ils rencontrent le valaisan et abandonnent.

Le suisse allemand n'a pas de forme écrite standardisée, présente une variation régionale massive et un vocabulaire qui n'existe simplement pas en allemand standard. Cela en fait l'un des défis les plus difficiles en reconnaissance vocale.

Notre approche

Nous n'avons pas essayé d'optimiser un modèle générique. Nous avons construit une reconnaissance vocale suisse allemande spécialisée depuis zéro — en collaboration formelle avec l'Institut pour la Data Science de la FHNW.

C'était un projet de recherche financé, pas un exercice marketing. De vrais chercheurs. Une vraie méthodologie. Des résultats publiés.

Né de la recherche

Cette capacité provient d'un projet de recherche financé avec l'Institut pour la Data Science de la FHNW.

Projet de recherche

Schweizerdeutsche Spracherkennung und Übersetzung in Standarddeutsch

  • Durée: Juin 2023 – Août 2024
  • Institution: FHNW Hochschule für Informatik
  • Institut: Institut für Data Science
  • Direction du projet: Prof. Manfred Vogel
  • Financement: Forschungsfonds Aargau

Voir le projet de recherche →

Ce que nous avons construit

  • Modèles de reconnaissance vocale suisse allemand spécialisés
  • Pipeline de traduction du suisse allemand vers l'allemand standard
  • Swiss Parliament Corpus 2.0 (publié en open data)
  • Corpus de test standardisé pour le benchmarking

La technologie sous-jacente est également disponible en démo gratuite sur stt4sg.fhnw.ch

Comment nous mesurons la qualité

Nous ne lançons pas de pourcentages de précision — ils sont dénués de sens sans contexte.

Word Error Rate (WER)

Le pourcentage de mots qui doivent être corrigés. Plus bas est meilleur. Nous testons contre un corpus suisse allemand standardisé pour mesurer la performance réelle.

Score BLEU

Pour la qualité de traduction du suisse allemand vers l'allemand standard. Mesure à quel point la sortie correspond aux transcriptions de référence. Métrique standard de l'industrie.

Nous sommes honnêtes sur les limites

La qualité audio compte. Un enregistrement clair dans une pièce calme sera toujours mieux transcrit qu'une interview dans une rue bruyante. Aucune IA ne peut réparer un mauvais audio.

La variation dialectale est réelle. Un mélange dialectal important ou des expressions très locales peuvent nécessiter une correction manuelle. Le suisse allemand est diversifié — c'est ce qui le rend beau et difficile.

Nous sommes bons, pas magiques. Essaie toi-même avec tes propres enregistrements pour voir comment ça performe sur ton contenu spécifique.

Meilleurs résultats avec

  • Audio clair avec un bruit de fond minimal
  • Un seul locuteur ou alternance claire
  • Équipement d'enregistrement standard
  • Dialectes suisses allemands courants

Essaie toi-même

Télécharge un enregistrement en suisse allemand et vois comment ça fonctionne. Le meilleur test est ton propre contenu.