CESI recherche / Publications / CONVERGENCE TECHNOLOGIQUE ENTRE INTERFACE GRAPHIQUE ERGONOMIQUE ET SYNTHESE VOCALE AU SEIN D’UNE APPLICATION MOBILE PERMETTANT DE FACILITER L’INSERTION PROFESSIONNELLE DES PERSONNES EN SITUATION DE HANDICAP

Communications orales sans actes dans un congrès international ou national

CONVERGENCE TECHNOLOGIQUE ENTRE INTERFACE GRAPHIQUE ERGONOMIQUE ET SYNTHESE VOCALE AU SEIN D’UNE APPLICATION MOBILE PERMETTANT DE FACILITER L’INSERTION PROFESSIONNELLE DES PERSONNES EN SITUATION DE HANDICAP

  • Auteurs : L. Menot CESI Sans affiliation, R. Castanie CESI Sans affiliation, W. Groc CESI Sans affiliation, V. Barrairon CESI Sans affiliation
  • Conférence : Colloque des Sciences de la conception et de l'innovation, 5 juillet 2017
  • Ville : Sibenik (Croatie)
  • Mots clés : ergonomie des interfaces graphiques, innovation, handicap, application mobile, insertion professionnelle, text to speech, synthèse vocale, convergence technologique, IHM.

L’objectif du projet présenté ici, nommé WORLDMUTE, est de venir en aide aux personnes
handicapées en ce qui concerne leur l’intégration dans la vie de tous les jours et leur l’insertion dans la
vie professionnelle. En effet, la difficulté d’expression face à un recruteur constitue un véritable
obstacle dans la vie professionnelle [AGEIPH, 2007], [Mohamed, 2003], [CREFOR, 2010]. Le travail
mené s’inscrit dans le cadre du Défi H qui est un concours entre grandes écoles et universités organisé
conjointement par Sogeti et Le Monde Informatique.
Plus précisément, l’objet du travail présenté ici est le développement d’une application mobile
capable d’écouter la conversation, de saisir le fil de la discussion et donc de proposer des phrases
adaptées au contexte que l’utilisateur se verra affichées sur l’écran de son smartphone. Cet utilisateur
pourra ensuite, d’un simple clic sélectionner les phrases qui seront lues à l’aide de la synthèse vocale.
Au fil de la discussion, le moteur de l’application enrichira le contexte et proposera des phrases de
plus en plus pertinentes. L’idée est donc de permettre – par l’intermédiaire d’une intelligence artificielle
(IA) et de divers algorithmes – à un utilisateur d’être en mesure d’avoir une discussion fluide,
naturelle telle qu’il aurait voulu la tenir à l’oral. Deux aspects sont donc à prendre en compte, le choix
et l’organisation du bon champ lexical mais aussi la compréhension de subtilités liées aux intonations
qui sont également d’importance [Gobl, 2003], [Klatt, 1989], [McAuley, 1986], [Furui, 2001]. Le
développement technique de cette application est décrit en plusieurs parties que sont la génération de
champs lexicaux, la gestion des intonations et des humeurs et le design de l’interface.