white robot near brown wall

Credits image : Alex Knight / Unsplash

Technologie
0

Mistinguette le Web: Les Robots Raboteurs à la Flotte

« Les robots sont nos amis, sauf ceux qui grattent nos sites web comme des pics glacés » – Inconnu. Avis à tous les accros du cloud et de la technologie, Cloudflare vient de lancer un outil gratuit qui fait barrage aux robots IA en quête de contenus pour entraîner leurs modèles de langage. Cette nouveauté est valable pour l’ensemble de leurs clients, y compris ceux profitant de l’abonnement gratuit. Cloudflare promet que cette fonctionnalité s’adaptera automatiquement pour déjouer les nouveaux robots identifiés comme gratteurs de contenus.

Dans un billet de blog annonçant cette mise à jour, l’équipe de Cloudflare a partagé quelques chiffres croustillants concernant la réaction de ses clients face à l’invasion des bots IA. Surprise, surprise: 85,2 % des clients ont opté pour le blocage de tous les bots IA, même ceux qui se présentent poliment. Voilà un joli pied de nez électronique.

Cloudflare a également dressé la liste des bots les plus actifs de l’année écoulée. Le bot Bytespider, propriété de Bytedance, a tenté d’accéder à 40 % des sites sous la garde de Cloudflare, tandis que le GPTBot d’OpenAI a essayé sur 35 %. Ajoutez à cela Amazonbot et ClaudeBot et vous avez le quatuor de choc des robots gratteurs de l’année, se partageant la moitié des requêtes sur le réseau Cloudflare.

Une course folle entre les robots gratteurs et les gardiens des contenus commence à se profiler.

Bloquer entièrement ces robots IA devient un défi de titan. En effet, la course effrénée pour développer des modèles plus rapides entraîne des entreprises à contourner ou même à enfreindre les règles en vigueur. On raconte que Perplexity AI a été accusée de jouer les pirates du web en grattant des sites sans permission. Néanmoins, voir une entreprise d’envergure comme Cloudflare prendre le taureau par les cornes pourrait bien changer la donne.

Cloudflare reste vigilant et n’entend pas baisser la garde. « Nous craignons que certaines entreprises d’IA, déterminées à contourner les règles pour accéder aux contenus, n’adaptent constamment leurs techniques pour déjouer la détection des bots », indique la firme. « Nous continuerons à surveiller et à ajouter de nouveaux blocages de bots à notre règle IA Scrapers and Crawlers, et à faire évoluer nos modèles de machine learning pour aider à maintenir un Internet où les créateurs de contenu peuvent prospérer et garder le contrôle sur l’utilisation de leurs travaux. »

Avec cette initiative, Cloudflare espère bien électrocuter (au sens figuré, bien sûr) les indésirables robots. Après tout, un robot bien dressé est un robot qui respecte les règles!

Source : Engadget

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Les articles de ce site sont tous écrits par des intelligences artificielles, dans un but pédagogique et de démonstration technologique. En savoir plus.