Le NLP associé au NLU sont-ils concernés par le RGPD ?

NLP-NLU-UX-TALN-Avocat-DPO-RGPD

 

 

Le NLP qu’est-ce que cela veut dire ?

 

Le NLP (Natural Language Processing) ou « traitement automatique du langage », est une technologie à base d’intelligence artificielle.

Il utilise la Data Science pour analyser toutes les interactions entre les ordinateurs et le langage humain.

La finalité de ces traitements statistiques divers vise à comprendre le langage humain à destination des ordinateurs pour générer des prédictions.

Le NLP est une technique en constante évolution à l’ère du Big Data alors que nous quittons le Web 3.0, pour entrer dans le Web 4.0.

Le Web 3.0 est souvent désigné comme le « Web sémantique » c’est-à-dire le Web orienté sur l’analyse et le traitement des requêtes de recherches sur des device de plus en plus mobiles.

Le Web 4.0 s’organise autour du principe de « l’omnicanalité », issue de la démarche « UX » ou « User Expérience ».

Le Web 4.0 place « l’utilisateur » au centre de toute la démarche marketing au sens large.

La formulation de sa requête sur un moteur de recherche, ou un site marchand permet au NLP, en association avec les API Web services d’étudier son parcours en temps réel pour répondre au plus près à sa demande, mais surtout lui offrir les propositions les plus en rapport avec sa recherche, voir l’améliorer, et surtout pouvoir prédire ses besoins futurs.

L’organisation de « l’omnicanalité » centrée sur l’utilisateur, quel que soit le device utilisé pour sa requête (serveur, tablette, Smartphone, assistant virtuel etc.) nécessite l’analyse en temps réel « d’immenses volumes de donnés ».

Quels sont les tâches du NLP ?

Il s’agit d’analyser des mégadonnées ou collection de données hétérogènes et non structurées générées par les activités des internautes :

  • Tweets,
  • Avis consommateurs et/ou forums de discussion,
  • Commentaires et interactions émotionnelles des réseaux sociaux,
  • Contenus informatifs des sites les plus divers dont les vidéos,

Le NLP permet d’extraire de tous ces contenus des informations pour les transformer en connaissance, et permettre à l’ordinateur de répondre à l’utilisateur « personne humaine ».

Quels sont les moyens technologiques utilisés pour le NLP

Le NLP concerne la compréhension littérale grâce aux procédés statistiques suivants :

  • Morphologique : distinction des signes linguistiques élémentaires ou recherche des Tokens,
  • Syntaxtique : recherche de l’indépendance des éléments d’une phrase,
  • Sémantique : qui permet grâce aux actions ci-dessus que l’ordinateur comprenne le sens de la phrase du document.

La NLU (Natural Language Processing) , lui par une « optimisation » du traitement qui grâce à l’intelligence artificielle «  optimise » le traitement Sémantique en donnant du sens à l’information pour permettre à l’ordinateur de « comprendre » la signification des mots et du texte.

L’automatisation du NLP combiné au NLU s’effectue grâce à des systèmes logiciels automatisés TALN (Traitement Automatisé du Langage Naturel).

Les tâches automatisées du NLP/ NLU sont :

  • La Tokenization,
  • La Lemmatisation,
  • La représentation Bag of Word,
  • Le TF-IDF (Terme fréquency – Inverse Document Frequency),

Ces tâches automatisées sont effectuées grâce à des algorithmes regroupés dans des bibliothèques qui vont ensuite permettre :

  • L’analyse de sentiments,
  • Classification de textes ou générations de textes automatisés,
  • Paramétrage des Chatbots et/ou assistants vocaux,
  • Recommandations diverses,

Python offre par diverses bibliothèques plusieurs alternatives permettant de résoudre ces analyses statistiques diverses comme :

spaCy, Natural Language Toolkit (NLTK), Stanford CoreNLP,

 

Les traitements NLP-NLU et le RGPD :

 

D’abord ils peuvent constituer une aide à la conformité RGPD du traitement des données non structurées.

L’utilisation du NLP est un outil très intéressant pour reconnaître en temps réel les données à caractère personnel d’un contenu quel qu’il soit, et y adapter les actions RGPD pour :

  • Minimiser la collecte des données grâce à une analyse du contexte en ne collectant que ce qui est nécessaire avec l’organisation de signalisation interne. (RGPD article 5)
  • Trier, orienter et gérer dans les fichiers adéquats les données nécessaires et conforme à leur finalité.
  • Détecter les commentaires injurieux pour les plates-formes tenues à une obligation de modération. (RGPD article 5)

Parallèlement, cela aide le responsable de traitement à faire face aussi à son obligation d’information sur l’utilisation de ce traitement (RGPD article 12)

  • En effet il faut obligatoirement délivrer une information transparente sur l’utilisation contextuelle des systèmes de TALN.
  • L’utilisateur final du service doit toujours avoir conscience de ce que des prédictions lui seront proposées en fonction de ses interactions.

Par ailleurs toute prise de décision issue du TALN doit faire l’objet d’une information spécifique avec l’organisation des garanties de l’article 22 § 3 du RGPD.

En effet le NLP peut participer à la prise de décision (Examens de CV d’embauche, de demande de crédits, de commandes de prestations de services divers etc)

Conclusion :

 

Le développement du NLP associé au NLU est indissociable de l’organisation du nouveau Web orienté sur « omnicanalité » de l’expérience utilisateur.

Elle permet de garantir des prises de décisions ajustées à la production des services avec une meilleurs visibilité pour les entreprises.

Mais le nouveau Web 4.0 doit adapter la « prédictivité généralisée » à de nouveaux réflexes contribuant à garantir la dignité et les droits fondamentaux de l’utilisateur.

Au-delà du RGPD, le droit de l’Union européenne reste vigilant sur l’idée principale que l’optimisation économique doit se conjuguer avec la Charte des droits fondamentaux.

 Elle aura à réguler notamment par le futur Règlement européen sur l’Intelligence artificielle (Artificial Intelligence Act), l’utilisation des technologies TALN et NLP pour un développement harmonieux des bienfaits évidents de cette technologie au bénéfice de l’humanité et dont nous apprécions tous les jours l’utilité.

 

Cet article s'insère dans une série intitulée "Data Science : les définitions de l'été " que nous avons publié tout au long du mois d'Août sur nos réseaux sociaux pour faire les les liens entre la nécessaire interaction entre les technologies de Data science et le Droit notamment le corpus de règles (RGPD+Droits fondamentaux garantis par la Charte des droits fondamentaux de l'union européenne et la Convention européenne des droits de l'homme ainsi que les avis de la Convention 108 +)

 

 Article rédigé à Marseille le 27 Août 2021

Véronique RONDEAU ABOULY

Avocat et DPO externe.

La rédaction de cet article a été conçue et organisée pour vous soumettre des informations utiles, des axes de réflexion pour une utilisation personnelle ou à visée professionnelle.

Il est mis à jour régulièrement, mais dans un contexte réglementaire et jurisprudentiel évoluant, nous soulignons que nous ne pouvons être responsables de toute péremption du contenu, ou de toute erreur juridique et/ou inexactitude qui pourrait se révéler en fonction de l’évolution,  le lecteur voudra bien considérer qu’en tout état de cause, pour une application personnalisée, chaque cas est unique et que bien sûr, le cabinet reste à votre disposition si vous avez une question précise à poser en lien avec cet article, nous nous ferons un plaisir de collaborer avec vous, n’hésitez pas à prendre contact ou à nous téléphoner.

Mots Clefs :

NLP- NLU- TALN- UX- Parcours omnicanal- RGPD

Crédits photo : Peach_iStock