Quand la linguistique rencontre l’intelligence artificielle

Nos articles signatures • 14/02/2025 • 6 min

Découvrez les coulisses de la recherche menée par Maxime Amblard sur l’analyse thématique des dialogues. Plongée dans un univers où mathématiques, linguistique et éthique se croisent.

  • Numérique

Un départ informel pour une recherche rigoureuse

C’est autour d’une tasse de thé que j’ai eu la chance de discuter avec Maxime Amblard, professeur d’informatique à l’Université de Lorraine et expert Unys. Son sourire chaleureux et sa passion pour la recherche ont immédiatement donné le ton de notre échange. Armé de mon carnet de notes, je l’ai écouté raconter comment il avait fait ses premiers pas dans le traitement automatique des langues (TAL), quittant les mathématiques pures pour se consacrer à la modélisation de la langue naturelle.

« Ce qui m’intéresse avant tout, c’est de comprendre le sens des énoncés, leur profondeur », explique-t-il. Il me relate avec enthousiasme ses premières collaborations avec des philosophes du langage et des psychologues, et comment cela a radicalement transformé sa vision de la recherche. « Les mathématiques et l’informatique apportent des outils, mais ce sont ces interactions interdisciplinaires qui donnent tout leur sens aux travaux. »
Loin de se limiter à un cadre académique classique, ces interactions ont mené à des projets concrets, parfois inattendus. « L’un des moments marquants a été notre travail sur des dialogues issus de contextes thérapeutiques. Nous avons découvert à quel point les mots, mais aussi leur enchaînement, pouvaient révéler des indices subtils sur l’état cognitif d’un patient. »

Une collaboration interdisciplinaire exigeante et enrichissante

Maxime Amblard rapporte avec enthousiasme sa collaboration avec Michel Musiol, psychologue, et Manuel Rebuschi, philosophe. Ensemble, ils explorent des phénomènes complexes comme la perte d’intercompréhension dans les dialogues pathologiques. « Nous travaillons sur des cas où la langue semble normale en apparence, mais où des signaux subtils indiquent des défaillances cognitives. »

Ces travaux reposent sur des corpus collectés en milieu hospitalier, un processus qui n’est pas sans difficultés. « Obtenir des données pathologiques est très contraignant éthiquement et logistiquement. Mais cela permet de mieux comprendre comment les défaillances apparaissent dans les dialogues », explique Maxime Amblard. Les données sont ensuite anonymisées et analysées avec une précision chirurgicale.
Un exemple marquant est leur utilisation du eye-tracking (suivi oculaire). « Nous enregistrons les mouvements des yeux des participants pour analyser leur attention pendant les dialogues. Cela nous permet de corréler leur capacité cognitive avec leur comportement oculaire. » Ces résultats ouvrent des pistes prometteuses pour détecter précocement des troubles cognitifs.

Mais ce n’est pas tout : Maxime Amblard et son équipe ont également exploré des systèmes de transcription automatique améliorés pour analyser des dialogues dans des environnements bruyants, comme les salles d’attente des hôpitaux. « Ces outils nous permettent de capter des dynamiques de conversation en conditions réelles, là où les échanges sont souvent les plus authentiques. »

Les limites des modèles actuels et la vigilance éthique

Malgré les progrès réalisés avec des outils comme BERT, Maxime Amblard reste lucide sur leurs limites. « Les modèles d’IA actuels sont biaisés et souvent incapables de comprendre les nuances des dialogues humains. Ils capturent des schémas dominants mais manquent de subtilité. »
Pour surmonter ces problèmes, son équipe adopte une approche hybride combinant apprentissage profond et linguistique formelle. Cette méthodologie vise à créer des outils capables de mieux appréhender la richesse des échanges verbaux. « Par exemple, en intégrant des annotations linguistiques manuelles à certaines étapes, nous améliorons la capacité du modèle à différencier un changement de sujet subtil d’une rupture complète de la conversation. »

Mais Maxime Amblard insiste sur l’importance de l’éthique dans cette recherche. « Nous devons être prudents pour éviter que ces technologies ne soient mal utilisées. Les enjeux éthiques autour de l’IA sont immenses et nécessitent une réflexion constante. » Une réflexion partagée par l’ensemble de son équipe, qui travaille à établir des protocoles pour garantir la transparence et l’équité dans l’utilisation de ces outils.

Vers un futur prometteur avec YARN

Actuellement, Maxime Amblard et son équipe travaillent sur un projet ambitieux : YARN, un nouveau formalisme de représentation sémantique. Ce système, fruit de cinq années de recherche, vise à décrire les énoncés avec précision tout en conservant leur complexité contextuelle.
« YARN pourrait révolutionner la manière dont nous analysons les dialogues, en particulier dans des contextes sensibles comme la pathologie mentale. C’est une étape importante pour rapprocher l’IA des besoins réels des humains », affirme Maxime Amblard. En combinant cette technologie avec des outils d’analyse en temps réel, comme le suivi oculaire ou les capteurs acoustiques, l’équipe espère élargir les horizons de la recherche en TAL.
Cette ambition s’accompagne d’un engagement clair pour la formation et la sensibilisation. « Les chercheurs et le grand public doivent être éduqués sur les enjeux de ces technologies. Cela passe par une démystification et une responsabilisation collective. » Maxime Amblard souligne également l’importance de collaborations internationales pour harmoniser les standards éthiques et techniques autour de ces outils.

Les défis de demain : plus loin que la simple technologie

Un autre aspect central de la recherche est la question de l’adaptabilité culturelle des modèles. « Nous devons nous assurer que ces outils fonctionnent dans différentes langues et cultures. Cela implique d’élargir les corpus utilisés et de prendre en compte des spécificités linguistiques locales », précise Maxime Amblard. Cette ambition nécessite de multiplier les partenariats avec des chercheurs de différents pays et de créer des bases de données multilingues.
Par ailleurs, Maxime Amblard et son équipe explorent la possibilité d’intégrer des éléments de prosodie (intonation, rythme, stress) dans leurs modèles. « Les mots seuls ne suffisent pas toujours. La manière dont ils sont prononcés peut révéler énormément d’informations sur l’état émotionnel ou cognitif d’un individu. »

Une aventure scientifique et humaine

Ce projet est bien plus qu’une avancée technologique : c’est une aventure humaine, où la collaboration et l’éthique sont au cœur des décisions. En croisant disciplines et perspectives, Maxime Amblard et son équipe explorent des pistes qui pourraient transformer notre manière d’interagir avec les technologies. Leur travail rappelle que la langue est un pont entre les esprits, et que ce pont doit être traversé avec soin. Avec des initiatives comme YARN et des outils en constante évolution, le futur s’annonce riche en découvertes et en innovations responsables.

 

 

Sources

1. Amblard, M. Calculs de représentations sémantiques et syntaxe générative: les grammaires minimalistes catégorielles.
2. Maršík, J., Amblard, M. & De Groote, P. Introducing ⦇ λ ⦈, a λ-calculus for effectful computation. Theoretical Computer Science 869, 108–155 (2021).
3. Amblard, M. & Jongwane, J. L’intelligence artificielle au service des maladies mentales. Interstices (2021).
4. Joanna. L’intelligence artificielle au service des maladies mentales. Interstices https://interstices.info/lintelligence-artificielle-au-service-des-maladies-mentales/ (2021).
5. Musiol, M. et al. Le problème de l’analyse des troubles de la pensée dans le discours avec la personne schizophrène : proposition méthodologique. L’Évolution Psychiatrique 87, 347 (2022).
6. Amblard, M. Les lapins magiciens. (2021).
7. Maxime AMBLARD – Maxime AMBLARD. https://members.loria.fr/MAmblard/.
8. Rebuschi, M., Amblard, M. & Camet, S. Portrait de chercheurs : Manuel Rebuschi et Maxime Amblard… systématique du chaos. The Conversation http://theconversation.com/portrait-de-chercheurs-manuel-rebuschi-et-maxime-amblard-systematique-du-chaos-85935 (2017).
9. Manuel, R., Amblard, M. & Musiol, M. Schizophrénie, logicité et compréhension en première personne. (2013).
10. Rebuschi, M., Amblard, M. & Musiol, M. Schizophrénie, logicité et perspective en première personne. L’Évolution Psychiatrique 78, 127–141 (2013).
11. ottilie. SUCCESS STORY : Jeu de 7 familles de l’informatique par Interstices.info. Fondation Blaise Pascal https://www.fondation-blaise-pascal.org/success-story-jeu-de-7-familles-de-linformatique-par-interstices-info/ (2019).
12. Decker, A., Tourneur, V., Amblard, M. & Breitholtz, E. ‘Wait, did you mean the doctor?’: Collecting a Dialogue Corpus for Topical Analysis. Preprint at https://doi.org/10.48550/arXiv.2501.07947 (2025).
13. Decker, A., Tourneur, V., Amblard, M. & Breitholtz, E. ‘Wait, did you mean the doctor?’: Collecting a Dialogue Corpus for Topical Analysis. Preprint at https://doi.org/10.48550/arXiv.2501.07947 (2025).