Introduction au NLP : qu'est-ce que le traitement automatique du langage (NLP) ?

Vous avez entendu parler du traitement automatique du langage (NLP) mais vous ne savez pas ce que est précisément, ni à quoi ça sert ? Dans ce post, je vais essayer de vous aider à comprendre ce qu'est le NLP grâce à quelques exemples.

Qu'est-ce que le traitement automatique du langage (NLP) ?

Le NLP est un sous-domaine de la linguistique, de l'informatique et de l'intelligence artificielle. Il s'agit du traitement de la langue, des mots et de la parole, par un ordinateur.

Il s'agit de développer des interactions entre les ordinateurs et le langage humain, et surtout de programmer les ordinateurs pour traiter et analyser de grandes quantités de données en langage naturel.

Ne faites pas l'erreur : le NLP n'est pas seulement de la linguistique ! La linguistique vise à comprendre les langues étrangères à travers les logiciels.

Le NLP est basé sur des règles. Mais les règles ne suffisent pas : le contexte est aussi très important. Quand un ami vous dit : « What a wonderful spring ! », s'agit-il de la saison ou l'eau ? Voici un autre exemple : « I go to the bank. » : est-ce qu'il s'agit de marcher le long de la rivière ou de prendre de retirer de l'argent à la banque ?

Le NLP a donc besoin de nombreuses règles et de dictionnaires.

Le contexte est clé en NLP

A quoi sert le NLP ?

Grâce au NLP, une machine peut « comprendre » le contenu des documents, y compris les nuances contextuelles de la langue qui les constitue. Une machine peut également extraire des informations contenues dans les documents ainsi que catégoriser et organiser les documents eux-mêmes.

Les défis en traitement automatique du langage impliquent souvent la reconnaissance de la parole, la compréhension du langage naturel (NLU) et la génération du langage naturel (NLG).

Pourquoi le NLP est-il intéressant ?

Le monde est plein de données non structurées (c'est-à-dire de données qui ne sont pas formatées pour les machines) : elles représentent 70 à 90 % des données numériques.

« L'IA sera à la source de 95% des interactions client en 2025.»

Gartner

Pour les entreprises, le NLP est un moyen de connaître leurs clients de manière automatisée et de créer de nouvelles opportunités (mieux connaître, mieux cibler,...).

Cas d'usage NLP

Voici quelques cas typiques d'utilisation du NLP :

Le NLP n'est pas nouveau !

Pendant la Seconde Guerre mondiale, Alan Turing crée une machine pour comprendre les messages codés envoyés par les nazis, appelée machine Turing.

Turing Machine

Plus tard, l'expérience Georgetown-IBM fut une démonstration importante en terme traduction automatique. Elle fut réalisée le 7 janvier 1954. Développée conjointement par l'Université Georgetown et IBM, l'expérience impliquait la traduction entièrement automatique de plus de soixante phrases russes en anglais. Elle n'avait que six règles de grammaire et 250 éléments lexicaux dans son vocabulaire.

Une autre étape intéressante a été le logiciel ELIZA, développé en 1966 le laboratoire d'intelligence artificielle MIT par Joseph Weizenbaum. Le script le plus célèbre, DOCTOR, a simulé un psychothérapeute et utilisé des règles, dictées dans le script, pour répondre avec des questions non-directionnelles aux inputs de l'utilisateur. Ainsi, ELIZA a été l'un des premiers chatbots et l'un des premiers programmes capables de tenter le test de Turing.

Conclusion

Dans ce post, vous avez découvert ce qu'est le traitement naturel du langage et comment il peut être utilisé dans la vie réelle. Beaucoup de défis existent encore mais de grands progrès ont été réalisés ces dernières années dans le domaine du NLP. Aujourd'hui, la maturité du NLP encourage de plus en plus d'entreprises à exploiter le NLP dans leur produit ou dans leur organisation interne.

Sylvie Krupsky
CMO chez NLP Cloud