Comment la voix de synthèse facilite-t-elle l’accessibilité pour les personnes atteintes de troubles de la parole ou de la vue ?

Les voix de synthèse ou voix digitales permettent de donner la voix à n’importe quel contenu en quelques secondes. Cette technologie désormais utilisée dans de nombreuses industries a connu des progrès époustouflants ces dernières années. Aujourd’hui, on retrouve la voix de synthèse partout en particulier dans le secteur du divertissement, des jeux vidéo, des réseaux sociaux, des médias, de la publicité, des enceintes connectées, du cinéma, etc. Mais l’utilité des voix de synthèse ne s’arrête pas là, en effet, elles permettent de faciliter l’accès à l’information et la communication pour les personnes atteintes de troubles de la vue ou de la parole.

La voix de synthèse et les troubles du langage

Chez les individus, les troubles du langage peuvent être causés par des maladies comme le bégaiement (qui affecte approximativement 1 % de la population), le mutisme, l’aphasie, ou la dysphasie, des traumatismes, ou des troubles du développement neurologiques, tels que l’autisme ou la dyslexie. Ces maladies ou troubles du développement peuvent engendrer des difficultés à communiquer oralement. Depuis de nombreuses années, des outils et logiciels de voix de synthèse permettent aux personnes souffrant de ces troubles de communiquer plus facilement en saisissant du texte sur des supports comme les tablettes ou smartphones, et de les faire lire par des voix de synthèse.

Parmi ces outils, on retrouve Dys-Vocal, un logiciel d’aide à la lecture et à l’écriture pour personnes souffrant de troubles Dys (dyslexie, dyspraxie visuo-spatiale). Il inclut notamment un module de lecture et de reconnaissance vocale. Le module de voix de synthèse « SDVocal » dispose de plusieurs langues permettant la lecture vocale avec suivi de la progression. Cette application est utilisée dans l’éducation nationale, ainsi que par les professionnels de santé spécialisés dans le traitement de ces troubles. Ce logiciel a permis de rendre plus facile et fluide l’apprentissage chez les enfants dont les troubles du langage ont des conséquences importantes pour la vie quotidienne, surtout dans la scolarité.

ACAT, le logiciel de voix de synthèse de Stephen Hawking

C’est sans doute l’exemple de logiciel de voix de synthèse au service de la santé le plus connu dans le monde. ACAT (Assistive Context-Aware Toolkit) est le nom du logiciel de parole utilisé par l’astrophysicien Stephen Hawking pour communiquer. Il souffrait de la maladie de Charcot qui se caractérise par une perte progressive des neurones moteurs du cerveau et une paralysie quasi totale. Au début, ce logiciel était très lent et ne permettait de lire que deux mots par minute. L’entreprise Intel a rendu l’outil plus performant à l’aide d’un système de prédiction. Lorsqu’il tape les premières lettres, le logiciel propose une liste de mots en fonction du contexte. Le texte saisi peut ensuite être lu par la voix de synthèse. C’est la fameuse voix que l’on entend lorsque Stephen Hawking donne une interview ou une conférence. ACAT permet aussi de déplacer une souris ce qui permet de naviguer sur Internet. Il y a quelques années le logiciel est passé en open source pour permettre de l’adapter à d’autres plateformes et d’étendre son utilisation au plus grand nombre.

L’audio, un substitut crucial à la vue

Les troubles de la vue, tels que la cécité, le glaucome ou la cataracte, peuvent entraîner une perte de vue partielle ou totale, et rendre difficile ou impossible la lecture de textes. La voix de synthèse est la solution pour permettre aux personnes malvoyantes d’accéder à l’information en lisant à haute voix les textes écrits. Les voix de synthèse peuvent également aider les personnes atteintes de troubles de la vue à naviguer sur les sites web et à utiliser des applications en leur fournissant des instructions audio.

Les annonces vocales de synthèse de la SNCF

En France, on ne saurait parler de la voix de synthèse sans mentionner la SNCF, qui œuvre depuis longtemps à faciliter l’accès des transports en commun pour les malvoyants. Depuis les années 80, l’entreprise ferroviaire nationale française travaille sur le son et l’audio, qui font partie intégrante de son identité de marque. Son design et sa signature sonore sont aujourd’hui connus de tous. Il y a quelques années, la SNCF faisait appel à l’entreprise Voxygen, un éditeur de solution de synthèse vocale personnalisée basée sur de l’intelligence artificielle, pour créer « e-Mone » et digitaliser et immortaliser la voix de Simone Hérault, le talent vocal phare de la SNCF depuis quarante ans.

Les voix de synthèse sont aujourd’hui très utilisées en situation de mobilité, dans le train, le métro, aux passages piétons (guide audio pour les non-voyants), etc. Les entreprises de transports ont été pionnières dans l’introduction de l’audio à bord des trains ainsi que dans les gares. Dès les années 1990, la SNCF lançait son habillage sonore par voix de synthèse, une solution unique en ce qu’elle permettait d’audioiser des messages et des milliers de noms de gares et stations en un temps record, un défi impossible à réaliser avec des voix humaines.

La voix de synthèse permet donc d’assister les personnes souffrant de troubles de la parole ou de la vue, dans la compréhension et la communication de messages écrits. Dans les domaines des transports, de la santé ou du divertissement, les technologies audio de voix de synthèse s’améliorent de jour en jour et avec l’explosion de l’IA, il est attendu que l’accessibilité des personnes atteintes de ces troubles soit d’autant plus facilitée.

Written by Meriem Bendia in 3 mars 2023 / 2854 Views