Université de Franche-Comté

L’intelligence artificielle, pour des documents accessibles à tous

Photo Siora Photography – Unsplash

Titre, sous-titre, corps de texte : c’est la plupart du temps dans cet ordre que se présente une fiche de révision ou un chapitre de manuel scolaire. Mais ce qui vaut pour la lecture humaine ne l’est pas pour la lecture technique de ces documents, dès lors qu’ils sont relayés par un support informatique. Le titre est souvent créé après le corps de texte, et vient en dernier dans la superposition des calques qui composent le document numérique.

Si ce fait n’a aucune incidence sur la perception de la majorité des lecteurs, il représente un véritable défi pour les apprenants souffrant d’un handicap visuel et pour les spécialistes en adaptation accessible. De plus, les documents pédagogiques sont composés d’énoncés, de zones de réponses, de formules mathématiques ou encore d’illustrations utiles à des fins pédagogiques, qui restent difficiles à adapter.

C’est dans ce contexte qu’une équipe de la Haute école de gestion Arc (HEG Arc), dont le recours aux technologies pour favoriser l’accessibilité au numérique est une spécialité, s’est penchée sur le problème particulier des documents pédagogiques pour les personnes visuellement déficientes. Cédric Baudet, enseignant-chercheur en informatique de gestion, et Maximiliano Jeanneret Medina, adjoint scientifique et doctorant, ont imaginé des solutions à partir des possibilités offertes par l’intelligence artificielle. « Il existe des techniques de vision par ordinateur largement répandues dans la vie quotidienne, ce sont elles qui permettent par exemple de lire des informations à partir d’un QR code. Notre idée était d’appliquer ces techniques aux documents scolaires pour améliorer leur accessibilité. »

 

Dans l’ordre d’appa­rition à l’écran…

Un pari réussi, puisque le logiciel que les chercheurs ont mis au point est capable de détecter les objets contenus dans l’écrit, titre, sous-titres, texte…, de les agencer de façon à ce qu’ils apparaissent dans le bon ordre, puis d’y appliquer des styles spécifiques aux besoins de chacun. Les techniques de vision par ordinateur exploitent l’apprentissage en profondeur (deep learning), une forme particulière d’intelligence artificielle, entraînée à partir d’une base de données de 90 000 images de documents. La complexité de la tâche augmente dès lors que les documents pédagogiques sont composés de plusieurs colonnes, de fonds de couleurs différentes, de croquis, de polices de caractères variables, de textes rédigés en écriture inclusive…

Un premier prototype de logiciel est prêt pour test auprès des utilisateurs. La recherche est menée en collaboration avec la Fondation Asile des aveugles de Lausanne, à qui les droits d’exploitation du système ont été cédés. Le handicap visuel concerne 370 000 personnes en Suisse, pour qui, là comme ailleurs, l’apprentissage puis l’insertion professionnelle peuvent présenter de sérieuses difficultés. Le logiciel proposé par les chercheurs de la HEG Arc promet de faciliter leur quotidien : il reste aujourd’hui à trouver des relais sur le terrain pour l’expérimenter et le promouvoir, au-delà même des frontières de la Suisse.

retour