La conversation
Chaque jour, des messages de princes nigérians, de colporteurs de médicaments miracles et de promoteurs d’investissements à ne pas manquer étouffent les boîtes de réception des e-mails. Les améliorations apportées aux filtres anti-spam ne semblent inspirer que de nouvelles techniques pour briser les protections.

Aujourd’hui, la course aux armements entre les bloqueurs de spam et les expéditeurs de spam est sur le point de s’intensifier avec l’émergence d’une nouvelle arme : l’intelligence artificielle générative. Avec les récentes avancées de l’IA rendues célèbres par ChatGPT, les spammeurs pourraient disposer de nouveaux outils pour échapper aux filtres, attirer l’attention des gens et les convaincre de cliquer, d’acheter ou de donner des informations personnelles.

En tant que directeur du laboratoire Advancing Human and Machine Reasoning à l’Université de Floride du Sud, je recherche l’intersection de l’intelligence artificielle, du traitement du langage naturel et du raisonnement humain. J’ai étudié comment l’IA peut apprendre les préférences individuelles, les croyances et les bizarreries de la personnalité des gens.

Cela peut être utilisé pour mieux comprendre comment interagir avec les gens, les aider à apprendre ou leur fournir des suggestions utiles. Mais cela signifie également que vous devez vous préparer à un spam plus intelligent qui connaît vos points faibles et peut les utiliser contre vous.

Spam, spam, spam

Alors, qu’est-ce que le spam ?

Le spam est défini comme des e-mails commerciaux non sollicités envoyés par une entité inconnue. Le terme est parfois étendu aux SMS, aux messages directs sur les réseaux sociaux et aux faux avis sur les produits. Les spammeurs veulent vous pousser à l’action : acheter quelque chose, cliquer sur des liens de phishing, installer des logiciels malveillants ou changer de vue.

Le spam est rentable. Un envoi d’e-mails peut rapporter 1 000 USD en quelques heures seulement, ce qui ne coûte que quelques dollars aux spammeurs, sans compter la configuration initiale. Une campagne de spam pharmaceutique en ligne peut générer environ 7 000 $ par jour.

Les annonceurs légitimes veulent également vous pousser à l’action – acheter leurs produits, répondre à leurs sondages, s’inscrire à des newsletters – mais alors qu’un e-mail de marketing peut renvoyer vers un site Web d’entreprise établi et contenir une option de désabonnement conformément à la réglementation fédérale, un e-mail de spam peut pas.

Les spammeurs n’ont pas non plus accès aux listes de diffusion auxquelles les utilisateurs se sont inscrits. Au lieu de cela, les spammeurs utilisent des stratégies contre-intuitives telles que l’escroquerie du « prince nigérian », dans laquelle un prince nigérian prétend avoir besoin de votre aide pour débloquer une somme d’argent absurde, promettant de vous récompenser gentiment. Les natifs du numérique avertis rejettent immédiatement ces appels, mais l’absurdité de la demande peut en fait sélectionner la naïveté ou l’âge avancé, filtrant les personnes les plus susceptibles de tomber dans les escroqueries.

Les progrès de l’IA, cependant, signifient que les spammeurs pourraient ne pas avoir à s’appuyer sur de telles approches aléatoires. L’IA pourrait leur permettre de cibler des individus et de rendre leurs messages plus persuasifs sur la base d’informations facilement accessibles, telles que les publications sur les réseaux sociaux.

L’avenir du spam

Il y a de fortes chances que vous ayez entendu parler des avancées des grands modèles de langage génératifs comme ChatGPT. La tâche que ces LLM génératifs effectuent est d’une simplicité trompeuse : étant donné une séquence de texte, prédire quel jeton – pensez à cela comme une partie d’un mot – vient ensuite. Ensuite, prédisez quel jeton vient après cela. Et ainsi de suite, encore et encore.

D’une manière ou d’une autre, la formation sur cette tâche seule, lorsqu’elle est effectuée avec suffisamment de texte sur un LLM suffisamment grand, semble être suffisante pour imprégner ces modèles de la capacité de s’acquitter étonnamment bien de nombreuses autres tâches.

De multiples façons d’utiliser la technologie ont déjà émergé, démontrant la capacité de la technologie à s’adapter rapidement aux individus et à en apprendre davantage sur eux. Par exemple, les LLM peuvent écrire des e-mails complets dans votre style d’écriture, avec seulement quelques exemples de la façon dont vous écrivez. Et il y a l’exemple classique – maintenant vieux de plus de dix ans – de Target découvrant qu’une cliente était enceinte avant que son père ne le sache.

Les spammeurs et les spécialistes du marketing gagneraient à pouvoir en prédire davantage sur les individus disposant de moins de données. Compte tenu de votre page LinkedIn, de quelques messages et d’une image de profil ou deux, les spammeurs armés de LLM pourraient faire des suppositions raisonnablement précises sur vos tendances politiques, votre état civil ou vos priorités de vie.

Nos recherches ont montré que les LLM pouvaient être utilisées pour prédire quel mot un individu prononcera ensuite avec un degré de précision dépassant de loin les autres approches d’IA, dans une tâche de génération de mots appelée tâche de fluidité sémantique. Nous avons également montré que les LLM peuvent prendre certains types de questions à partir de tests de capacités de raisonnement et prédire comment les gens répondront à cette question. Cela suggère que les LLM ont déjà une certaine connaissance de ce à quoi ressemble la capacité de raisonnement humain typique.

Si les spammeurs dépassent les filtres initiaux et vous font lire un e-mail, cliquer sur un lien ou même engager une conversation, leur capacité à appliquer une persuasion personnalisée augmente considérablement. Là encore, les LLM peuvent changer la donne. Les premiers résultats suggèrent que les LLM peuvent être utilisés pour argumenter de manière convaincante sur des sujets allant de la politique à la politique de santé publique.

Bon pour le jars

L’IA, cependant, ne favorise ni l’un ni l’autre. Les filtres anti-spam devraient également bénéficier des avancées de l’IA, leur permettant d’ériger de nouvelles barrières contre les e-mails indésirables.

Les spammeurs essaient souvent de tromper les filtres avec des caractères spéciaux, des mots mal orthographiés ou du texte caché, en s’appuyant sur la propension humaine à pardonner les petites anomalies de texte – par exemple, « c1îck ici n0w ». Mais à mesure que l’IA comprend mieux les messages de spam, les filtres pourraient mieux identifier et bloquer les spams indésirables – et peut-être même laisser passer les spams recherchés, tels que les e-mails marketing auxquels vous vous êtes explicitement inscrit. Imaginez un filtre qui prédit si vous souhaitez lire un e-mail avant même de le lire.

Malgré les inquiétudes croissantes concernant l’IA – comme en témoignent Elon Musk, PDG de Tesla, SpaceX et Twitter, le fondateur d’Apple Steve Wozniak et d’autres leaders technologiques appelant à une pause dans le développement de l’IA – beaucoup de bien pourrait provenir des progrès de la technologie. L’IA peut nous aider à comprendre comment les faiblesses du raisonnement humain peuvent être exploitées par de mauvais acteurs et trouver des moyens de contrer les activités malveillantes.

Toutes les nouvelles technologies peuvent entraîner à la fois l’émerveillement et le danger. La différence réside dans qui crée et contrôle les outils, et comment ils sont utilisés.

A lire également