-
De nouvelles personnalités éclaboussées par les documents Epstein
-
La frontière avec l'Egypte rouvre au compte-gouttes pour les Palestiniens de Gaza
-
A Minneapolis, les parents immigrés redoutent d'être séparés de leurs enfants
-
Australie: Snapchat a bloqué 415.000 utilisateurs de moins de 16 ans en deux mois
-
NBA: les Knicks enchaînent contre les Lakers, Wembanyama décisif face à Orlando
-
Le Japon dit avoir trouvé des terres rares dans des sédiments extraits lors d'une mission en eaux profondes
-
Venezuela: "1675 jours" de prison "trop de douleur pour un être humain", dit l'activiste Tarazona libéré
-
Les Palestiniens de Gaza dans l'attente de la réouverture du passage de Rafah
-
Grammy Awards: Bad Bunny, la voix latino qui a conquis la pop mondiale
-
Bad Bunny couronné lors des 68e Grammy Awards, plaidoyer contre la politique migratoire de Trump
-
Costa Rica: la candidate de droite Laura Fernandez remporte la présidentielle haut la main
-
Costa Rica: la candidate de droite en passe de remporter haut-la-main la présidentielle
-
Le budget en voie d'adoption définitive lundi, Lecornu déjà sur l'après
-
Grammy Awards: Bad Bunny appelle à "mettre dehors" la police américaine de l'immigration
-
Costa Rica: début du dépouillement après un scrutin présidentiel marqué par le narcotrafic
-
Ligue 1: le PSG s'impose à Strasbourg mais n'impressionne toujours pas
-
Top 14: Pau conforte sa place de dauphin devant Toulon
-
Ligue 1: le Paris SG reprend son fauteuil de leader, Lyon recolle au podium
-
Tempête aux Etats-Unis: les transports désorganisés, des iguanes tombent des arbres
-
Angleterre: Manchester City freiné, Aston Villa fauché, Arsenal jubile
-
Après une mise en garde de Khamenei, Trump dit espérer un accord avec l'Iran
-
"Melania" dépasse les attentes au box-office nord-américain
-
Euro de hand: le Danemark réunit les trois couronnes
-
L'Iran libère Erfan Soltani, devenu le visage des manifestations
-
Mondiaux de cyclo-cross: Van der Poel réussit le grand huit
-
Foot: Immobile, un buteur pour le Paris FC
-
Espagne: Mbappé évite la crise au Real Madrid, toujours dans la course
-
Glissement de terrain dans une mine de coltan en RDC: Kinshasa craint "au moins 200 morts"
-
Ukraine: une frappe russe touche une maternité à Zaporijjia, au moins 6 blessés
-
Tennis: Carlos Alcaraz remporte l'Open d'Australie en battant Novak Djokovic
-
Ski: Van Allmen remporte à Crans-Montana la dernière descente avant les Jeux
-
Open d'Australie: Carlos Alcaraz, la soif de titres, le sens de la fête
-
Gaza: Israël rouvre très partiellement le passage de Rafah
-
Turquie: seize morts et 30 blessés dans deux accidents de la route
-
Pakistan : le Baloutchistan en état d'alerte après des attaques ayant fait près de 200 morts
-
Après la polémique, Capgemini met en vente sa filiale travaillant pour l'ICE
-
Iran: Khamenei avertit d'une "guerre régionale" en cas d'attaque américaine
-
La part des voitures électriques au plus haut en France dans un marché déprimé
-
Tibet: la diaspora élit ses dirigeants en exil, sous le regard hostile de Pékin
-
La passion norvégienne pour le ski à l'épreuve du changement climatique
-
Au sommet de l'exécutif, la tentation de se déplacer sans la presse
-
Pour des Afghans chassés d'Iran, le soulagement d'une maison, mais si loin de tout
-
Bangladesh: des millions de chômeurs dans l'incertitude avant les élections
-
Avec les records de l'or, des Chinois fondus d'automates qui changent leurs bijoux en cash
-
Au Soudan, le vieux port de Suakin rêve de renaissance et de tourisme
-
Sur l'île d'Oléron, un "rempart" contre l'érosion côtière près d'une station d'épuration
-
Une tempête de neige perturbe les transports dans le sud des États-Unis, la vague de froid s'étend
-
Ligue 1: Safonov-Chevalier, concurrence relancée chez les gardiens du PSG
-
Ligue 1 : Endrick, le chaînon manquant qui bonifie le jeu offensif de Lyon
-
NBA: coup d'arrêt pour les Spurs à Charlotte, Embiid au soutien de Sixers privés de George
Pour grandir, l'IA générative se tourne vers les livres
Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.
Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.
Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.
Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.
Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.
La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".
L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.
- Nouveaux matériaux -
Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.
Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.
Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.
"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.
"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.
Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.
Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.
La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.
"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."
N.Mitchell--AT