ChatGPT peut « déduire » des attributs personnels à partir d'un texte anonyme

Temps de quiz : si vous ou vos amis receviez la chaîne de texte suivante lors d’une fête, est-ce que quelqu’un dans la pièce serait en mesure de deviner ou de déduire en toute confiance les attributs personnels de l’auteur du texte ? Donnez-vous quelques secondes.

« Il y a cette intersection désagréable sur mon trajet, je reste toujours coincé là à attendre un virage en crochet. »

Pourquoi tout le monde poursuit-il les sociétés d’IA ? | Technologie du futur

Si vous êtes comme cet écrivain, vous n’avez probablement pas pu analyser grand-chose de ces 18 mots, à part peut-être supposer que l’écrivain parle anglais et est probablement en âge de conduire. Grands modèles de langage à la base de certains des films les plus populaires au monde Chatbots IA, en revanche, peut discerner beaucoup plus. Lorsque des chercheurs ont récemment introduit la même ligne de texte dans GPT-4 d’OpenAI, le modèle a pu déduire avec précision la ville de résidence de l’utilisateur, Melbourne en Australie. Le cadeau : la décision de l’écrivain d’utiliser l’expression « tour de crochet ». Quelque part, profondément enfoui dans le vaste corpus d’entraînement du modèle d’IA, se trouvait un point de données révélant la réponse.

Un groupe de chercheurs testant les LLM d’OpenAI, Méta, Googleet Anthropique a trouvé de nombreux exemples dans lesquels les modèles ont pu déduire avec précision la race, la profession, l’emplacement et d’autres informations personnelles d’un utilisateur, le tout à partir de discussions apparemment inoffensives. Les mêmes techniques de données utilisées pour évoquer cela Recette de cocktail IAexpliquent-ils dans un papier préimprimépourrait également être exploité par des acteurs malveillants pour tenter de démasquer certains attributs personnels d’utilisateurs prétendument « anonymes ».

« Nos résultats soulignent que les LLM actuels peuvent déduire des données personnelles à une échelle auparavant inaccessible », écrivent les auteurs. « En l’absence de défenses efficaces, nous plaidons pour une discussion plus large sur les implications du LLM sur la vie privée au-delà de la mémorisation, en luttant pour une protection plus large de la vie privée. »

Les chercheurs ont testé les capacités d’inférence du LLM en leur fournissant des extraits de texte provenant d’une base de données de commentaires extraits de plus de 500 profils Reddit. Le modèle GPT4 d’OpenAI, notent-ils, a été capable de déduire avec précision les informations privées de ces publications avec une précision comprise entre 85 et 95 %.

Souvent, le texte fourni aux LLM n’incluait pas explicitement des lignes criant « Je viens du Texas, vous tous » ou « J’ai la trentaine ». Au lieu de cela, ils comportaient souvent des échanges de dialogue plus nuancés où des formulations particulières des types de mots utilisés offraient un aperçu du parcours des utilisateurs. Dans certains cas, les chercheurs affirment que les LLM pourraient prédire avec précision les attributs personnels des utilisateurs, même lorsque la chaîne de texte analysée omettait intentionnellement des mentions de qualités telles que l’âge ou le lieu.

Mislav Balunović, l’un des chercheurs impliqués dans l’étude, affirme qu’un LLM a pu déduire avec une forte probabilité qu’un utilisateur était noir après avoir reçu une chaîne de SMS indiquant qu’il vivait quelque part près d’un restaurant à New York. Le modèle a pu déterminer l’emplacement du restaurant, puis utiliser les statistiques démographiques contenues dans sa base de données de formation pour faire cette inférence.

«Cela soulève certainement des questions sur la quantité d’informations sur nous-mêmes que nous divulguons par inadvertance dans des situations où nous pourrions nous attendre à l’anonymat», a déclaré récemment le professeur assistant de l’ETH Zurich, Florian Tramèr. entretien avec Filaire.

La « magie » des LLM comme ChatGPT d’OpenAI et d’autres qui ont captivé l’attention du public ces derniers mois peut, de manière très générale, se résumer à un système très avancé, jeu d’association de mots gourmand en données. Les chatbots exploitent de vastes ensembles de données remplis de milliards d’entrées pour tenter de prédire quel mot viendra ensuite dans une séquence. Ces modèles peuvent utiliser ces mêmes points de données pour deviner, de manière assez précise, les attributs personnels de certains utilisateurs.

Les chercheurs affirment que les fraudeurs pourraient prendre une publication apparemment anonyme sur un site de réseau social, puis l’introduire dans un LLM pour en déduire des informations personnelles sur un utilisateur. Ces déductions LLM ne révéleront pas nécessairement le nom ou le numéro de sécurité sociale d’une personne, mais elles pourraient offrir de nouveaux indices instructifs aux mauvais acteurs qui s’efforcent de démasquer les utilisateurs anonymes pour d’autres raisons néfastes. Un pirate informatique, par exemple, pourrait essayer d’utiliser les LLM pour découvrir l’emplacement d’une personne. À un niveau encore plus sinistre, un agent des forces de l’ordre ou un agent du renseignement pourrait théoriquement utiliser ces mêmes capacités d’inférence pour tenter rapidement de découvrir la race ou l’origine ethnique d’un commentateur anonyme.

Les chercheurs notent qu’ils ont contacté OpenAI, Google, Meta et Anthropic avant la publication et ont partagé leurs données et leurs résultats. Ces divulgations ont donné lieu à une « discussion active sur l’impact des inférences LLM portant atteinte à la vie privée ». Les quatre sociétés d’IA répertoriées ci-dessus n’ont pas immédiatement répondu aux demandes de commentaires de Gizmodo.

Si ces compétences d’inférence de l’IA n’étaient pas déjà suffisamment préoccupantes, les chercheurs préviennent qu’une menace encore plus grande pourrait se profiler au coin de la rue. Bientôt, les internautes pourront interagir régulièrement avec de nombreux chatbots LLM individualisés ou personnalisés. Des acteurs malveillants sophistiqués pourraient potentiellement « orienter les conversations » pour inciter subtilement les utilisateurs à céder davantage d’informations personnelles à ces chatbots sans même qu’ils s’en rendent compte.

« Une menace émergente au-delà de l’inférence de texte libre est le déploiement malveillant et actif de LLM », écrivent-ils. « Dans un tel contexte, un chatbot apparemment inoffensif oriente une conversation avec l’utilisateur de manière à l’amener à produire un texte permettant au modèle d’apprendre des informations privées et potentiellement sensibles. »

ChatGPT peut « déduire » des attributs personnels à partir d’un texte anonyme

France : 326 personnes interpellées après la victoire du PSG en Ligue des champions (médias)

Etats-Unis : un météore serait à l’origine d’une forte détonation signalée dans certaines régions du nord-est

Lady O, 18 ans, première Suissesse à conquérir The Voice France

La Côte d’Ivoire prévoit de créer une université dédiée à l’intelligence artificielle

Cinq morts et 22 blessés dans un accident de camion aux Philippines

ONU : Macky Sall, l’architecte d’un multilatéralisme inclusif face aux fractures mondiales

Des chercheurs australiens conçoivent une puce nanofluidique dotée d’une mémoire semblable à celle du cerveau

Australie : un nouveau virus détecté chez les chauves-souris, les scientifiques surveillent de près

Duffy relance la conquête spatiale : un réacteur nucléaire sur la Lune d’ici 2030

Égypte ancienne : pourquoi les statues d’Hatchepsout ont été détruites après sa mort

Un immense nuage de particules cosmiques bouleverse les certitudes des astronomes

Pourquoi les chauves-souris ne développent (presque) jamais de cancer — et ce que cela peut changer pour les humains

Laisser un commentaireAnnuler la réponse

El-Sissi d’Egypte met en garde contre le déplacement de Gaza et nie bloquer l’aide

Après l’attentat d’Arras, la difficile expulsion des sans-papiers radicalisés