Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentes Révision précédente | |||
|
elsenews:spot-2024:11:bluesky-ia [26/12/2025/H04:26:37] 216.73.216.167 supprimée |
— (Version actuelle) | ||
|---|---|---|---|
| Ligne 1: | Ligne 1: | ||
| - | @DATE@ | ||
| - | |||
| - | |||
| - | ---- | ||
| - | ====== Tout ce que vous écrivez sur Bluesky risque de servir à entraîner des IA ====== | ||
| - | Une affaire de jeu de données regroupant un million de messages publiés sur Bluesky a causé un émoi. Et souligné les limites du réseau social pour empêcher certaines pratiques douteuses pour entraîner les IA. | ||
| - | « Tout ce que vous direz pourra être retenu contre vous ». Cette phrase, répétée inlassablement dans les séries judiciaires américaines, | ||
| - | C’est ce que révèle une affaire toute récente, signalée par 404Media dans son édition du 26 novembre. Un spécialiste en apprentissage automatique (une branche de l’IA) avait annoncé, dans la journée du 26 novembre, avoir constitué un jeu de données contenant un million de publications publiques tirées de Bluesky. | ||
| - | Source : Capture d’écran | ||
| - | Pour cela, il s’est servi d’une API mise à disposition par Bluesky. Cela lui a permis de récupérer, | ||
| - | Brutale machine arrière après le tollé | ||
| - | 24 heures plus tard, patatras ! L’expert fait brutalement machine arrière. Sur Bluesky, il a indiqué ce 27 novembre avoir « retiré les données de Bluesky du dépôt. Bien que je veuille soutenir le développement d’outils pour la plateforme, je reconnais que cette approche a violé les principes de transparence et de consentement dans la collecte de données. » | ||
| - | L’intéressé avait partagé son archive sur Hugging Face, plateforme web de référence dédiée à l’IA sur laquelle il est d’ailleurs possible de tester des modèles sans grande compétence technique. La page est toujours en ligne, mais elle inclut une mise à jour faisant mention du retrait du dépôt en raison de l’ampleur des « réactions négatives » de la communauté. | ||
| - | Hugging Face, une plateforme dédiée à l’IA. // Source : Capture d’écran | ||
| - | La page demeure, parce que le spécialiste, | ||
| - | Cette affaire survient alors que Bluesky prenait position sur la question de l’IA générative (GenAI) le 15 novembre. « Nous n’utilisons aucun de vos contenus pour entraîner l’IA générative, | ||
| - | Bluesky a des règles, mais ne peut pas faire grand chose | ||
| - | L’incident est de toute évidence remonté jusqu’aux oreilles de Bluesky, qui a publié un fil actualisé sur sa politique sur l’IA générative. La plateforme, en particulier, | ||
| - | Bluesky est un réseau social ouvert et public, tout comme les sites web sur l’Internet lui-même. Les sites Web peuvent préciser s’ils consentent à ce que des entreprises extérieures explorent leurs données à l’aide d’un fichier robots.txt ». Et, plus loin, de souligner que « Bluesky ne sera pas en mesure de faire respecter ce consentement à l’extérieur de nos systèmes. » | ||
| - | Bluesky a des options limitées pour empêcher le scrapping. // Source : Canva/ | ||
| - | Malgré tout, Bluesky étudie la possibilité de déployer des règles de ce type sur ses espaces, pour que les membres de la plateforme indiquent s’ils sont d’accord ou non à l’idée que leurs messages servent « dans des jeux de données d’entraînement à l’IA ». Mais, c’est en partant de l’hypothèse que tout le monde jouera le jeu, en respectant les règles. | ||
| - | Cet aveu illustre une relative impuissance face à une pratique qui est très mal vue, et qui pourtant est observée largement sur le net : le scrapping. Il s’agit d’utiliser des outils automatiques qui aspirent des informations qui sont accessibles publiquement sur le net, comme les réseaux sociaux, sans trop se soucier des règles de ces espaces. | ||
| - | Un cas notable a été observé avec Clearview, sur la reconnaissance faciale. Cependant, le scrapping n’est pas étranger à la GenAI. Des accusations de ce type ont été portées à ce sujet — le New York Times a attaqué OpenAI sur ce terrain, par exemple. Dans un autre genre, YouTube avait aussi mis en garde OpenAI sur ce sujet. | ||
| - | | ||
| - | |||
| - | Newsletter Artificielles | ||
| - | Vous souhaitez recevoir la newsletter Artificielles dans votre boîte mail ? | ||
| - | |||
| - | Les données transmises par le biais de ce formulaire sont destinées à PressTiC Numerama, en sa qualité de responsable de traitement. Ces données sont traitées avec votre consentement aux fins de vous envoyer par e-mail des actualités et informations relatives aux contenus éditoriaux publiés sur ce site. Vous pouvez vous opposer à tout moment à ces e-mails en cliquant sur les liens de désinscriptions présents dans chacun d’eux. Pour plus d’informations, | ||
| - | Vous disposez d’un droit d’accès, de rectification, | ||
| - | |||
| - | https:// | ||
you see this when javscript or css is not working correct