[Podcast] épisode 11 : NLP, de la tokenisation à l’analyse de sentiments

Le Traitement Automatique du Langage Naturel (TALN) ou en anglais Natural Language Processing (NLP) est un des domaines de recherche les plus actifs en ce moment. Bon nombre d’applications font appel à cette technologie pour comprendre ou générer de l’information, mais qu’est-ce que le NLP ?

Quelles sont les grandes étapes de traitement du langage naturel ? Qu’est-ce que la tokenisation, la lemmatisation, le stemming, le POS-tagging ou l’embedding ? On entend parler ces derniers temps de « Transformers », mais de quoi s’agit-il exactement ? On attend beaucoup de la mesure du sentiment ou de la tonalité des verbatim, mais à quoi cela fait-il référence ?

A l’heure où beaucoup d’organisations s’interrogent sur l’apport du NLP dans leurs activités, Carole Lailler & Jean-Luc Marini tenteront d’apporter un regard nouveau sur cette technologie si indispensable au fonctionnement de nos bots.

Texte intégral de l’échange disponible ici.