-
GP de Miami: Antonelli partira devant, Verstappen mènera la chasse
-
Play-offs NBA: Embiid et les 76ers triomphent des Celtics, renversés au 1er tour
-
Rio en mode Shakira: concert géant de la star latine sur la plage de Copacabana
-
Australie: un homme inculpé pour le meurtre d'une fillette aborigène
-
Washington va retirer 5.000 soldats d'Allemagne, Trump en annonce "bien davantage"
-
Ligue 1: Lens, rattrapé par Nice, voit les espoirs de titre s'éloigner
-
Le secteur aérien se mobilise après l'arrêt immédiat de la compagnie américaine Spirit Airlines
-
Free party sur un terrain militaire: 20.000 à 40.000 participants, un obus retrouvé en bordure du site
-
F1: McLaren met fin à l'invincibilité de Mercedes
-
Champions Cup: malgré une balle de match, Toulon échoue aux portes de la finale au Leinster
-
F1: Norris (McLaren) remporte la course sprint à Miami
-
Ligue 1: le PSG accroché par Lorient avant de retrouver le Bayern
-
Tennis: Kostyuk domine Andreeva et remporte son premier WTA 1000 à Madrid
-
Tennis: l'Ukrainienne Marta Kostyuk remporte le WTA 1000 de Madrid
-
Champions Cup - Courageux mais trop brouillon, Toulon échoue aux portes de la finale au Leinster
-
Allemagne: le Bayern arrache le nul à domicile avant le PSG
-
Ligue des champions féminine: Brand envoie OL Lyonnes en finale
-
Boxe: Inoue bat Nakatani aux points et reste invaincu
-
Ligue 1: Marseille sombre à Nantes, qui s'offre un peu d'espoir
-
Tour de Romandie: en jaune et en solitaire, Pogacar gagne l'étape reine
-
Allemagne: baisse des prix des carburants moins forte qu'attendu après le rabais fiscal
-
Le président taïwanais en Eswatini après un premier report dû à une "pression intense" de Pékin
-
Tour d'Espagne femmes: l'Angliru se dresse devant Ferrand-Prévot
-
TotalEnergies: taxation des surprofits si le plafonnement des prix n'est pas suffisant (Le Pen)
-
Chine: 24,8 millions de voyageurs ont pris le train le 1er mai, un record
-
Alex Zanardi, les multiples vies d'un sportif adulé de l'Italie
-
Retrait annoncé d'environ 5.000 soldats américains d'Allemagne, Berlin prend acte
-
La Première ministre du Japon veut une région Asie-Pacifique "libre et ouverte"
-
La compagnie américaine Spirit Airlines annule tous ses vols et stoppe son activité
-
Après son remorquage d'Allemagne, une baleine à bosse relâchée en Mer du Nord
-
Rio en mode "Waka Waka" pour le concert géant de Shakira
-
L'indemnité carburant pour les "travailleurs modestes grands rouleurs" publiée au JO
-
La première "librairie sans livres", centrée sur l'audio, ouvre à New York
-
A New York, le réveil d'un alcool iranien banni et rebelle
-
Linh sort du silence, deux mois après une extinction de voix en plein concert
-
Menacés par le changement climatique, les campings cherchent à s’adapter
-
L'organisation des vacances d'été chamboulée par les prix à la pompe
-
Un responsable iranien juge "probable" une reprise de la guerre avec les Etats-Unis
-
Athlétisme: les Relais mondiaux au Botswana, terre d'or et de diamants du sprint
-
Ligue des champions féminine: Lyon en quête de réaction face à Arsenal
-
Ligue 1: le PSG en gestion avant le Bayern, la relégation guette Metz et Nantes
-
Play-offs NBA: les Lakers qualifiés, Pistons-Magic et Cavaliers-Raptors se concluront avec un match 7
-
Les Etats-Unis vont retirer quelque 5.000 militaires d'Allemagne d'ici à un an
-
Aux Bermudes, Charles III confronté à l'histoire de l'esclavage
-
Une cour d'appel suspend provisoirement l'envoi postal de la pilule abortive aux Etats-Unis
-
GP de Miami: Norris s'élancera en pole position de la course sprint
-
Bolivie: le principal syndicat du pays déclare une grève illimitée
-
Acteurs et scénarios générés par IA exclus des Oscars
-
Le roi Charles III aux Bermudes après sa visite marathon aux Etats-Unis
-
Masters 1000 de Madrid: Sinner assomme Fils en demies, Zverev facile contre Blockx
L'IA devient menteuse et manipulatrice, les chercheurs s'inquiètent
Les derniers modèles d'intelligence artificielle (IA) générative ne se contentent plus de suivre les ordres et vont jusqu'à mentir, manigancer ou menacer pour parvenir à leurs fins, sous le regard inquiet des chercheurs.
Menacé d'être débranché, Claude 4, le nouveau-né d'Anthropic, fait du chantage à un ingénieur et menace de révéler une liaison extra-conjugale. L'o1 d'OpenAI essaye lui de se télécharger sur des serveurs extérieurs et nie lorsqu'on le prend la main dans le sac.
Pas besoin d'aller fouiller dans la littérature ou le cinéma, l'IA qui se joue de l'homme est désormais une réalité.
Pour Simon Goldstein, professeur à l'université de Hong Kong, ces dérapages tiennent de l'émergence récente des modèles dits de "raisonnement", capables de travailler par étapes plutôt que de produire une réponse instantanée.
o1, version initiale du genre pour OpenAI, sorti en décembre, "a été le premier modèle à se comporter ainsi", explique Marius Hobbhahn, patron d'Apollo Research, qui teste les grands programmes d'IA générative (LLM).
Ces programmes tendent aussi parfois à simuler "l'alignement", c'est-à-dire à donner l'impression qu'ils se plient aux consignes d'un programmeur tout en poursuivant, en fait, d'autres objectifs.
Pour l'heure, ces traits se manifestent lorsque les algorithmes sont soumis à des scénarios extrêmes par des humains, mais "la question, c'est de savoir si les modèles de plus en plus puissants auront tendance à être honnêtes ou pas", estime Michael Chen, de l'organisme d'évaluation METR.
"Les utilisateurs poussent tout le temps les modèles aussi", fait valoir Marius Hobbhahn. "Ce que nous observons est un vrai phénomène. Nous n'inventons rien."
Beaucoup d'internautes évoquent, sur les réseaux sociaux, "un modèle qui leur ment ou invente. Et ce ne sont pas des hallucinations, mais une duplicité stratégique", insiste le co-fondateur d'Apollo Research.
Même si Anthropic et OpenAI font appel à des sociétés extérieures, comme Apollo, pour étudier leurs programmes, "davantage de transparence et un accès élargi" à la communauté scientifique "permettraient de meilleures recherches pour comprendre et prévenir la tromperie", suggère Michael Chen.
Autre handicap, "le monde de la recherche et les organisations indépendantes ont infiniment moins de ressources informatiques que les acteurs de l'IA", ce qui rend "impossible" l'examen de grands modèles, souligne Mantas Mazeika, du Centre pour la sécurité de l'intelligence artificielle (CAIS).
Si l'Union européenne s'est dotée d'une législation, elle concerne surtout l'utilisation des modèles par des humains.
Aux Etats-Unis, le gouvernement de Donald Trump ne veut pas entendre parler de régulation et le Congrès pourrait même bientôt interdire aux Etats d'encadrer l'IA.
- L'IA en justice? -
"Il y a très peu de prise de conscience pour l'instant", constate Simon Goldstein, qui voit néanmoins le sujet s'imposer dans les mois à venir avec la révolution des agents IA, des interfaces à même de réaliser seules une multitude de tâches.
Les ingénieurs sont engagés dans une course derrière l'IA et ses dérives, à l'issue incertaine, dans un contexte de compétition féroce.
Anthropic se veut plus vertueux que ses concurrents, "mais il essaye en permanence de sortir un nouveau modèle pour dépasser OpenAI", selon Simon Goldstein, une cadence qui offre peu de temps pour des vérifications et corrections éventuelles.
"En l'état, les capacités (de l'IA) se développent plus rapidement que la compréhension et la sécurité", reconnaît Marius Hobbhahn, "mais nous sommes toujours en mesure de rattraper notre retard".
Certains pointent dans la direction de l'interprétabilité, une science récente qui consiste à décrypter de l'intérieur le fonctionnement d'un modèle d'IA générative, même si d'autres, notamment le directeur du CAIS, Dan Hendrycks, sont sceptiques.
Les combines de l'IA "pourraient gêner son adoption si elles se multiplient, ce qui constitue une forte incitation pour les entreprises (du secteur) à résoudre" ce problème, selon Mantas Mazeika.
Simon Goldstein évoque, lui, le recours à la justice pour mettre au pas l'intelligence artificielle, en se tournant vers les sociétés en cas de sortie de route.
Mais il va plus loin et propose même de "tenir légalement responsables" les agents IA "en cas d'accident ou de crime".
O.Gutierrez--AT