Avec Lexistems

Quand Milyon contribue à la valorisation d’une solution de traitement automatique du langage naturel

Le labex Milyon a soutenu et cimenté une initiative quelque peu atypique. Voici un résumé chronologique de cette aventure.

 

Au départ, quelques pensées profondes …

Dans le cadre des projets intégrés, L’ENS de Lyon propose chaque année à ses étudiants en informatique de réaliser des projets de grande envergure où les maîtres mots sont créativité, innovation et science. Certains projets ont fait parler d’eux au-delà de la formation proposée: citons le projet Savonet/Liquidsoap boite à outils pour le streaming multimédia, ou encore Rubens la machine de Turing en LEGO que vous pouvez découvrir ou redécouvrir à la MMI où elle est toujours exposée.

En 2014, 7 étudiants lancent PPP (Projet Pensées Profondes) et se lancent le défi de proposer une alternative open source à Google Now et Siri d’Apple. L’idée était de pouvoir poser une question en langage naturel et d’être compris. Le développement de Platypus par l’équipe PPP était lancé.

 

Pendant ce temps… Lexistems

Marie Granier et Frédéric Milliot réfléchissent à une solution basée sur des bases de données lexicales. Ils ont des besoins forts pour le Traitement Automatique du Langage Naturel (TALN ou NLP – Natural Language Processing – en anglais) mais il leur manque un outil. Et si Platypus était la solution permettant à Lexistems de valoriser leurs bases de données? Et si la start’up trouvait dans Platypus l’innovation pouvant faire la différence ? Et si Platypus trouvait en Lexistems un terrain de jeu pour de nouveaux challenges de recherche ?

 

Une volonté commune

Les acteurs sont là, mais le transfert industriel de Platypus vers Lexistems est-il vraiment pertinent? Les enjeux pour Lexistems sont importants mais l’intérêt commun est réel. Reste à mettre en place les rouages de cette aventure. L’ENS autorise un étudiant, Thomas Pellissier Tanon, membre du projet PPP à se consacrer pendant 1 an à étudier l’intégration de la solution. Le LIP (Laboratoire de l’Informatique du Parallélisme) offre l’encadrement scientifique nécessaire via l’implication de deux chercheurs de l’équipe Avalon, Marcos Dias de Assuncao et Eddy Caron. Et Lexistems et le Labex Milyon co-financent l’ensemble de l’aventure.

Milyon a donné le souffle nécessaire pour que l’ensemble des rouages puissent se mettre en mouvement.

Et ce qui devait arriver, arriva…

Pendant 1 an, Thomas Pellissier Tanon devient membre du LIP et en collaboration avec l’équipe Avalon et l’équipe de Lexistems, il va tout d’abord apprendre à Platypus à parler Français en créant un nouveau système d’analyse lexicale multilingues et divise par 3 le temps de réponse afin de rendre l’outil plus réactif. Il améliore aussi la permissivité de l’outil par rapport aux fautes d’orthographes. Pour l’usage spécifique de Lexistems, il crée une nouvelle interface de communication pour permettre une meilleure intégration et améliorer l’expérience utilisateur avec un mode conversationnelle plus poussé.

 

Fort du succès des travaux menés et de l’essor de Lexistems, l’ENS et Lexistems ont définis des accords de transfert technologique. Souhaitons une longue vie à Lexistems et à Platypus. Au-delà des modules propriétaires notons également que le cœur de Platypus reste un projet open source tourné vers la recherche.