Contenu | Rechercher | Menus

Reconnaissance vocale

Cette page est consacrée à la reconnaissance vocale sous Ubuntu et plus généralement sous Linux.

Canonical prévoit d'intégrer prochainement le logiciel libre speechcontrol pour ubuntu linux, développé par canonical, et pourrait faire à l'avenir de la synthèse vocale également.

KDE intègre un module de reconnaissance vocale, basique et simple à utiliser, basé sur CMU Sphinx.

Enfin, pour aider l'amélioration des modèles libres de reconnaissance vocale pour Linux, consultez le site Voxforge.org. Vous pouvez y enregistrer un texte qui permettra d'intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer.

La synthèse vocale, qui n'est pas à confondre avec la reconnaissance vocale, peut aussi vous intéresser.

Logiciels de reconnaissance vocale

Pour la commande vocale

  • Perlbox : permet de commander l'environnement KDE par la voix. Basé sur Sphinx.
  • Simon : permet de contrôler de multiples applications (firefox, rhythmbox, …) ainsi que le bureau aisément. Disponible http://sourceforge.net/projects/speech2text/
  • VoiceExecute : permet de lancer des logiciels par la voix
  • Google search sous Chrome : le moteur de recherche Google intègre désormais un bouton pour faire une recherche vocale sous Chrome.
  • Kalliope est un assistant personnel intelligent basé sur la parole avec une personalisation à l'aide de script (Supporte le français et l'anglais)
  • Lucida est un assistant personnel intelligent basé sur la parole et la vision inspiré par Sirius. Visitez le site Web pour le tutoriel, et Lucida-users pour de l'aide. Le projet est publié sous licence BSD, sauf pour certains sous-modules qui contiennent leurs propres licence.
  • Jasper, pour raspberry

Pour la dictée vocale

Autre

  • CMU Sphinx : Sphinx est une bibliothèque écrite en java et a une variante en C

Logiciels dont le développement est arrêté :

  • CVoiceControl : n'est plus soutenu par son créateur depuis 2002

DeepSpeech le projet de Mozilla

DeepSpeech de la fondation mozilla, buts:

  • Web Speech API
  • Speech recognition
  • Speech-to-Text

Voir aussi

Pages en rapport



Le contenu de ce wiki est sous licence : CC BY-SA v3.0