Nouvelles Du Monde

Machine contre avocat • The Register

Machine contre avocat • The Register

Avis Les non-techniciens ont découvert l’IA, et ils sont en ébullition. Une grande partie de ce tizzy concerne la façon dont l’IA va nous déjouer dans une sorte de dystopie hollywoodienne, aussi profondément ironique que profondément erronée. La nature des LLM n’est pas la conscience de soi HAL-9000, mais une machine de texte prédictive géante. Cela en soi relève à la fois de la science et de la science-fiction, où une connaissance suffisante des règles et des distributions fournit ce que la science-fiction appelle la précognition fonctionnelle ou, selon la physique, un modèle fonctionnel.

Une fois que vous avez dépassé la fixation HAL-9000, il est clair que les IA sont mieux testées non pas par des sondages psychologiques, mais en analysant la sortie à l’aide de probabilités. C’est une approche qui porte déjà ses fruits, un groupe de l’UC Berkeley en apprenant plus sur les produits d’OpenAI qu’OpenAI ne rend public.

Les LLM décident quoi produire en fonction des règles et des distributions apprises à partir des données de formation. Ainsi, selon les chercheurs, en examinant ce que le LLM produit réellement, vous pouvez faire des déductions sur les données qui lui ont été fournies, surtout si vous pouvez le tester par rapport à des données que vous connaissez également déjà. Dans ce cas, des œuvres protégées par le droit d’auteur.

Que les scientifiques aient découvert que les modèles d’OpenAI avaient été nourris avec une prépondérance de science-fiction et de fantasy est à la fois délicieux, ironique et la chose la moins surprenante depuis la gueule de bois du samedi matin. Si Dieu a créé l’homme à son image, celui qui a créé ChatGPT était un ubergeek obsédé par la science-fiction et la fantaisie avec une hyperfocalisation et une approche neurodiverse de l’empathie. Vous pouvez lancer une pierre dans la vallée sans en toucher une, mais vous devrez la lancer très fort vers l’océan.

Lire aussi  Alan Wake 2 : La sortie du jeu repoussée et une concurrence féroce en perspective

Les chercheurs arrivent à de bonnes et admirables conclusions sur les ensembles de données ouvertes et évitent les biais, mais abordent également ce qui pourrait être le premier véritable point de contact explosif de LLM avec le monde des humains : le droit d’auteur.

Normalement, si vous insérez un livre ou un disque musical dans un ordinateur, vous en faites une copie. Si l’original est protégé par le droit d’auteur, les règles sont simples : vous ne pouvez faire que ce que le titulaire du droit d’auteur vous autorise. Mais la formation d’un réseau neuronal ne crée pas une copie permanente, elle crée un ensemble mathématique de connexions et de poids, entremêlés avec ceux créés à partir d’autres données. C’est de l’analyse et de la synthèse, quelque chose que nous autorisons non seulement chez les humains, mais que nous forçons les gens à faire pendant une décennie de leur jeune vie dans les camps d’éducation forcée que nous appelons les écoles. Ou si l’utilisation d’œuvres protégées par le droit d’auteur comme données de formation est contraire à la loi, nous avons de gros problèmes.

Inversement, si les humains apprennent quelque chose textuellement et gagnent ensuite de l’argent en le recréant, alors la loi sur le droit d’auteur s’applique à nouveau : un acteur ne peut pas tourner une pièce sous copyright en toute impunité simplement parce qu’il a appris son texte. Les choses deviennent vraiment troubles avec travail dérivé, où quelque chose basé sur le droit d’auteur nécessite également l’autorisation du titulaire du droit d’auteur. Et chaque bit de la sortie d’un LLM est dérivé de ses données d’apprentissage : il n’y a rien d’autre qu’il puisse être. Ce n’est pas seulement indiscutable, c’est culturellement déterminé : si vous voulez voir la loi sur le droit d’auteur des œuvres dérivées contestée à l’échelle galactique dans le monde réel, allez à la con.

Lire aussi  Qu’est-ce qu’OSIRIS-REx ? Tout ce que vous devez savoir sur le premier vaisseau spatial de la NASA à atterrir sur un astéroïde

Fandom nous a donné du cosplay, des fanfics, des émissions hommage, l’appropriation de la marque et une obsession de partager chaque dernier quark d’une franchise ou d’un travail préféré. De temps en temps, si quelque chose approche de la vitesse d’évasion commerciale, les détenteurs de droits d’auteur peuvent intervenir, mais en tant qu’affichage en gros, mondial et public du comportement des scofflawers, la science-fiction et le fandom fantastique s’en tirent à bon compte. Le monde est ainsi un bien meilleur endroit. Ce n’est pas que ChatGPT soit de la science-fiction qui compte, c’est que c’est un fan de science-fiction.

Les LLM fonctionnent comme un fandom à usage général, créant de nouvelles idées clairement dérivées de l’analyse, entre autres, d’œuvres protégées par le droit d’auteur. Comment la loi sur le droit d’auteur réagira-t-elle à cela ? L’ironie est que si les LLM fonctionnent par probabilités plutôt que par algorithmes, il en va de même pour le droit d’auteur. Le travail dérivé n’a pas de règles strictes sur la quantité de dérivation qui compte pour faire un travail dérivé. Comme son frère de propriété intellectuelle, l’utilisation équitable, il existe des principes généraux principalement issus de la jurisprudence, mais il y a plus de zones grises qu’un jour brumeux à San Francisco. Si vous avez besoin de plus d’ironie ici, considérez la jurisprudence elle-même comme un exercice de plusieurs siècles sur le travail dérivé dans un domaine où le droit d’auteur ne s’applique pas.

Ce que les LLM apportent au combat, c’est un déploiement massif. Comme le fandom l’a découvert, si suffisamment de personnes le font, cela se fait. Les enregistrements audio et vidéo à domicile ont tous deux connu un immense recul de la part de l’industrie du disque – dans le cas de Sony, mettant différentes divisions en guerre les unes contre les autres – mais mettez une technologie bon marché et populaire entre les mains de milliards et elle gagne.

Lire aussi  CISA publie une feuille de route sur la sécurité des logiciels open source – MeriTalk

Beaucoup de gens qui pensent à de telles choses attendent les affaires judiciaires qui aideront à définir l’avenir de la façon dont le droit d’auteur interagit avec l’IA. Ceux-ci sont peu susceptibles d’aider. Le droit d’auteur devient moins utile et plus nuisible à mesure qu’il s’éloigne des copies réelles. Les LLM sont aussi génératifs que dérivés, et la loi sur le droit d’auteur est tout simplement terrible pour patrouiller les systèmes génératifs, où des entités non humaines génèrent de nouvelles œuvres. Si un gorille prend une photo dans une forêt, est-ce qu’un avocat est payé ? Si une IA écrit une histoire sur un garçon sorcier et qu’un milliardième de ses données d’entraînement provient de Harry Potter, qui JK Rowling poursuit-elle ? Les cas difficiles font de la mauvaise loi, et ce seront en effet des cas très difficiles.

Comme les défenses maritimes sur un littoral en érosion, les concepts de travail dérivé peuvent soit être protégés à un coût ruineux contre les niveaux croissants de non-conformité automatisée, soit organiser une retraite gérée sur le principe du moindre dommage. Quoi qu’il en soit, les robots, comme la mer, finiront par gagner. Il y aura un nouveau paysage. Et il sera parfaitement habitable. ®

2023-05-09 12:01:00
1683626017


#Machine #contre #avocat #Register

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

ADVERTISEMENT