'C'était essentiellement une attaque DDoS de deux semaines': Ralentissement de la base de données de l'interface utilisateur de jeu causé par le grattage incessant d'OpenAI

Peu de temps après son relancement avec plus de 55 000 captures d'écran et une multitude de nouvelles fonctionnalités, la base de données de l'interface utilisateur de jeu a rencontré un obstacle majeur.

Edd Coates, créateur du référentiel gratuit, a remarqué que le site Web était 'aussi lent qu'enfer' et avec l'aide de Jay Peet, maître serveur, a commencé à enquêter. La solution était alarmante de simplicité. Bloquer une seule adresse IP a permis de rétablir le service normal, mais qui était le propriétaire de cette carte d'appel numérique ? Nul autre qu'OpenAI, la société d'IA générative derrière ChatGPT et Dall-E.

Coates a initialement partagé la nouvelle sur X et a critiqué la pratique d'OpenAI de gratter des sites Web pour obtenir des informations pouvant être utilisées pour former ses modèles. La société ne cache pas cela. Son site Web déclare ouvertement que ses grands modèles de langage sont formés sur trois sources, y compris 'des informations qui sont publiquement disponibles sur Internet.' Bien sûr, une myriade de poursuites judiciaires et de défis légaux potentiels impliquant des grands journaux (y compris le New York Times) et même des créateurs de vidéos YouTube soutiendrait que 'publiquement disponible' ne signifie pas légal [merci au Guardian et The Verge].

Pour Coates, le problème est double. Tout d'abord, il n'approuve pas les méthodes ou le modèle commercial d'OpenAI, mais être ciblé par l'entreprise a également causé d'importants dégâts à une ressource gratuite qu'il avait passé cinq ans à construire.

'J'ai d'abord remarqué que la base de données avait des problèmes il y a quelques semaines, lorsque les pages prenaient beaucoup plus de temps à se charger. Je savais que cela n'avait rien à voir avec le site lui-même car il avait toujours fonctionné sans problème (même avec plus d'utilisateurs en ligne actifs), alors j'avais suspecté une manoeuvre malhonnête mais je n'avais alors trouvé aucune preuve,' a déclaré Coates au développeur de jeux.

'Je n'ai pas pu publier de mises à jour sur le site car le délai perturbait mes outils d'administration, et je recevais même des courriels et des messages en colère d'utilisateurs qui dépendent du site dans leur flux de travail quotidien.'

Il a expliqué que la perturbation a finalement conduit le site Web à cesser de fonctionner complètement, distribuant des erreurs '502 Bad Gateway' aux utilisateurs. À ce stade, Coates a sollicité l'aide de Jay Peet, qui hébergeait la base de données sur leur serveur privé depuis cinq ans. Peet a examiné les journaux du site et a réalisé que les ressources du site étaient absorbées par une seule adresse IP appartenant à OpenAI.

'La page d'accueil était rechargée 200 fois par seconde, car le bot [OpenAI] avait apparemment du mal à se frayer un chemin à travers le site et restait bloqué dans une boucle continue,' a ajouté Coates. 'C'était essentiellement une attaque DDoS de deux semaines sous la forme d'un vol de données.'

Le fondateur de Game UI Database remet en question la légalité du grattage d'OpenAI

Coates ne tire aucun revenu de la base de données de l'interface utilisateur de jeu. En fait, il gère le site Web avec perte. Cependant, s'il avait essayé de monétiser le projet ou utilisé des outils externes tels que Amazon Web Services, l'intérêt non sollicité d'OpenAI aurait pu causer un préjudice financier.

'Si je devais compter sur [Game UI Database] pour les recettes publicitaires ou les frais d'adhésion, le temps d'arrêt causé par OpenAI aurait absolument eu un impact sur mes revenus,' a-t-il déclaré. 'Ils transféraient ~70 Go de données du serveur toutes les dix minutes. Heureusement, je n'ai pas de frais de bande passante et des frais de serveur minimes, donc je peux fournir cette ressource gratuitement à tout le monde (comme tous les outils éducatifs devraient l'être). Mais si je payais AWS pour le stockage, par exemple, cette bande passante m'aurait coûté environ 850 £ par jour.'

'OpenAI ne sont même pas transparents sur l'origine de leurs données, donc j'aurais été le seul responsable de cette facture. Comment cela peut-il être juste ou même légal ? Et je ne suis certainement pas le seul à être affecté par cela.'

Coates a déclaré que le problème est plus profond qu'une perte potentielle de revenus. 'Ne me lancez pas sur ce qu'ils font avec ces données', a-t-il poursuivi, soulignant qu'il avait passé des années à collecter méticuleusement et à répertorier des références d'interfaces utilisateur pour aider d'autres créatifs de l'industrie du jeu, pour que ce travail (qui englobe les efforts de milliers de développeurs) soit 'volé par une organisation multinationale milliardaire'.

Coates a déclaré que l'idée qu'OpenAI reprenne ce travail pour 'blesser et remplacer les personnes que j'essaie d'aider' n'ajoute qu'une insulte à la blessure. 'C'est malade. La technologie d'IA générative ne pourrait tout simplement pas exister sans le travail des créatifs humains, et pourtant nous sommes ceux qui sont punis ici sans compensation ni crédit', a-t-il ajouté.

Quant à la façon dont Game UI Database a réussi à repousser les avantages d'OpenAI, Coates et Peet ont finalement bloqué toutes les adresses IP associées de l'entreprise au niveau du serveur HTTP pour l'empêcher de déployer une solution de contournement.

'Lorsque j'ai enquêté sur ce problème, il était évident que quelque chose nous mettait en grappe ou nous explorait. Nos analyses d'utilisation montraient 10 utilisateurs actifs, alors que le serveur réel rapportait de 200 à 300 requêtes actives', a déclaré Peet. 'Je soupçonnais que quelqu'un tentait de nous DDoSer ou que les données étaient prises en masse par un grappeur automatique.'

'Bloquer les crawlers n'était pas trop compliqué même si la méthode pour le faire pourrait être fragile si OpenAI ajoutait ou changeait l'une de ses adresses IP en cours d'utilisation. Après avoir modifié le robots.txt (que OpenAI peut simplement ignorer s'ils le souhaitent), j'ai bloqué explicitement toutes les adresses IP d'OpenAI au niveau du serveur HTTP. Après le passage à la nouvelle configuration, le site Web est immédiatement revenu à sa vitesse de réponse habituelle.'

À l'heure actuelle, Game UI Database fonctionne à plein régime et met en avant le travail d'UI présenté dans près de 1 400 titres, y compris des projets malheureux comme Concord. Game Developer a contacté OpenAI pour obtenir un commentaire.