Le NLP (Natural Language Processing) ou « traitement automatique du langage », est une technologie à base d’intelligence artificielle.
Il utilise la Data Science pour analyser toutes les interactions entre les ordinateurs et le langage humain.
La finalité de ces traitements statistiques divers vise à comprendre le langage humain à destination des ordinateurs pour générer des prédictions.
Le NLP est une technique en constante évolution à l’ère du Big Data alors que nous quittons le Web 3.0, pour entrer dans le Web 4.0.
Le Web 3.0 est souvent désigné comme le « Web sémantique » c’est-à-dire le Web orienté sur l’analyse et le traitement des requêtes de recherches sur des device de plus en plus mobiles.
Le Web 4.0 s’organise autour du principe de « l’omnicanalité », issue de la démarche « UX » ou « User Expérience ».
Le Web 4.0 place « l’utilisateur » au centre de toute la démarche marketing au sens large.
La formulation de sa requête sur un moteur de recherche, ou un site marchand permet au NLP, en association avec les API Web services d’étudier son parcours en temps réel pour répondre au plus près à sa demande, mais surtout lui offrir les propositions les plus en rapport avec sa recherche, voir l’améliorer, et surtout pouvoir prédire ses besoins futurs.
L’organisation de « l’omnicanalité » centrée sur l’utilisateur, quel que soit le device utilisé pour sa requête (serveur, tablette, Smartphone, assistant virtuel etc.) nécessite l’analyse en temps réel « d’immenses volumes de donnés ».
Il s’agit d’analyser des mégadonnées ou collection de données hétérogènes et non structurées générées par les activités des internautes :
Le NLP permet d’extraire de tous ces contenus des informations pour les transformer en connaissance, et permettre à l’ordinateur de répondre à l’utilisateur « personne humaine ».
Le NLP concerne la compréhension littérale grâce aux procédés statistiques suivants :
La NLU (Natural Language Processing) , lui par une « optimisation » du traitement qui grâce à l’intelligence artificielle « optimise » le traitement Sémantique en donnant du sens à l’information pour permettre à l’ordinateur de « comprendre » la signification des mots et du texte.
L’automatisation du NLP combiné au NLU s’effectue grâce à des systèmes logiciels automatisés TALN (Traitement Automatisé du Langage Naturel).
Les tâches automatisées du NLP/ NLU sont :
Ces tâches automatisées sont effectuées grâce à des algorithmes regroupés dans des bibliothèques qui vont ensuite permettre :
Python offre par diverses bibliothèques plusieurs alternatives permettant de résoudre ces analyses statistiques diverses comme :
spaCy, Natural Language Toolkit (NLTK), Stanford CoreNLP,
D’abord ils peuvent constituer une aide à la conformité RGPD du traitement des données non structurées.
L’utilisation du NLP est un outil très intéressant pour reconnaître en temps réel les données à caractère personnel d’un contenu quel qu’il soit, et y adapter les actions RGPD pour :
Parallèlement, cela aide le responsable de traitement à faire face aussi à son obligation d’information sur l’utilisation de ce traitement (RGPD article 12)
Par ailleurs toute prise de décision issue du TALN doit faire l’objet d’une information spécifique avec l’organisation des garanties de l’article 22 § 3 du RGPD.
En effet le NLP peut participer à la prise de décision (Examens de CV d’embauche, de demande de crédits, de commandes de prestations de services divers etc)
Le développement du NLP associé au NLU est indissociable de l’organisation du nouveau Web orienté sur « omnicanalité » de l’expérience utilisateur.
Elle permet de garantir des prises de décisions ajustées à la production des services avec une meilleurs visibilité pour les entreprises.
Mais le nouveau Web 4.0 doit adapter la « prédictivité généralisée » à de nouveaux réflexes contribuant à garantir la dignité et les droits fondamentaux de l’utilisateur.
Au-delà du RGPD, le droit de l’Union européenne reste vigilant sur l’idée principale que l’optimisation économique doit se conjuguer avec la Charte des droits fondamentaux.
Elle aura à réguler notamment par le futur Règlement européen sur l’Intelligence artificielle (Artificial Intelligence Act), l’utilisation des technologies TALN et NLP pour un développement harmonieux des bienfaits évidents de cette technologie au bénéfice de l’humanité et dont nous apprécions tous les jours l’utilité.
Cet article s'insère dans une série intitulée "Data Science : les définitions de l'été " que nous avons publié tout au long du mois d'Août sur nos réseaux sociaux pour faire les les liens entre la nécessaire interaction entre les technologies de Data science et le Droit notamment le corpus de règles (RGPD+Droits fondamentaux garantis par la Charte des droits fondamentaux de l'union européenne et la Convention européenne des droits de l'homme ainsi que les avis de la Convention 108 +)
Article rédigé à Marseille le 27 Août 2021
Véronique RONDEAU ABOULY
Avocat et DPO externe.
La rédaction de cet article a été conçue et organisée pour vous soumettre des informations utiles, des axes de réflexion pour une utilisation personnelle ou à visée professionnelle.
Il est mis à jour régulièrement, mais dans un contexte réglementaire et jurisprudentiel évoluant, nous soulignons que nous ne pouvons être responsables de toute péremption du contenu, ou de toute erreur juridique et/ou inexactitude qui pourrait se révéler en fonction de l’évolution, le lecteur voudra bien considérer qu’en tout état de cause, pour une application personnalisée, chaque cas est unique et que bien sûr, le cabinet reste à votre disposition si vous avez une question précise à poser en lien avec cet article, nous nous ferons un plaisir de collaborer avec vous, n’hésitez pas à prendre contact ou à nous téléphoner.
Mots Clefs :
NLP- NLU- TALN- UX- Parcours omnicanal- RGPD
Crédits photo : Peach_iStock