-
Le PSG fêté sous haute surveillance à Paris, après une nuit d'incidents endeuillée par un mort
-
Le ministre japonais de la Défense renvoie à Pékin ses accusations en "militarisme"
-
Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts
-
Près de 2.000 Sullivan rassemblés en Irlande pour un record du monde
-
Foot: Ousmane Dembélé sur la route d'un second Ballon d'Or
-
Autour de la capitale de l'Inde, l'avenir menacé du rempart des monts Aravallis
-
Liban: Israël s'empare de la forteresse emblématique de Beaufort, étend son offensive dans le sud
-
Des neurones prennent les commandes du jeu "Doom" dans un laboratoire australien
-
Au Cachemire, vivre à quelques mètres de ses proches, mais hors de portée
-
Courtisés de toutes parts, les créateurs de contenu se préparent à peser sur la présidentielle
-
Indonésie: 20 ans plus tard, le volcan déverse encore sa boue
-
A Hong Kong, les autorités veulent desserrer l'emprise des machines a pince
-
Israël annonce étendre son offensive au Liban
-
A Malte, début du dépouillement des bulletins aux élections législatives
-
NBA: Wembanyama et les Spurs en finale face aux Knicks après un exploit en Oklahoma
-
Trump affirme avoir reçu de l'Iran l'engagement à ne pas se doter de l'arme nucléaire
-
Les héros du PSG de retour pour fêter leur doublé en Ligue des champions
-
Présidentielle en Colombie: la gauche sortante défiée par une droite offensive sur la sécurité
-
Trump veut se produire en meeting à la place de musiciens pour l'anniversaire des Etats-Unis
-
Ligue des champions: tensions dans Paris, plus de 200 interpellations
-
Ligue des champions: 20.000 personnes sur les Champs, tensions près du Parc des Princes
-
Ligue des champions: 20.000 personnes sur les Champs, la tension monte d'un cran à Paris
-
Roland-Garros: Kouame sort par la grande porte
-
Ligue des champions: Dembélé, Kvara, Safonov... les hommes du second sacre du PSG
-
Ligue des champions: le PSG décroche une deuxième étoile au bout du suspense
-
Choose France: le japonais SoftBank annonce un investissement record de 75 milliards d'euros lié à l'IA
-
Foot: le PSG s'offre une deuxième Ligue des champions d'affilée en battant Arsenal en finale
-
Beyrouth accuse Israël de mener une "politique de la terre brûlée" au Liban, de nouveau frappé par l'armée israélienne
-
Hantavirus : dûment désinfecté, le Hondius peut repartir en croisière
-
Roland-Garros: le huitième de finale contre Chwalinska, "une belle occasion" pour Parry
-
Roland-Garros: Parry terrasse Anisimova, choc Osaka-Sabalenka en huitièmes
-
Ligue des champions: "Des centaines de milliers de personnes" attendues dans les rues de Paris
-
MotoGP: Raul Fernandez se joue des favoris au Mugello
-
Roland-Garros: la Française Diane Parry (92e) élimine la 6e mondiale Amanda Anisimova au 3e tour
-
Tour d'Italie: Vingegaard rose bonbon
-
Présidentielle: en meeting, Attal vante sa "force d'agir" et expose sa "promesse française"
-
Top 14: Toulouse en demi, le Stade français qualifié, La Rochelle de retour dans le top 6
-
Top 14: Toulouse assure sa première place et sa qualification en demi-finale en dominant Lyon 39-31
-
Une baleine échouée sur une plage de l'Ile de ré
-
Les Maltais votent sur fond de crise au Moyen-Orient
-
Liban: nouvelles frappes de l'armée israélienne, qui progresse en profondeur
-
Le climat se réchauffe, les Français achètent toujours plus de piscines
-
Orages à venir après la première vague de chaleur d'une année qui risque d'en connaître d'autres
-
Roland-Garros: Osaka s'offre un premier huitième de finale à Paris
-
Foot: Liverpool se sépare de l'entraîneur Arne Slot après une seconde saison décevante
-
Présidentielle: Tondelier dévoile ses mesures pour la santé environnementale
-
Le Premier ministre maltais en lice pour sa réélection sur fond de crise au Moyen-Orient
-
Ebola: le patron de l'OMS est arrivé en Ituri, épicentre de l'épidémie en RDC
-
Ligue des champions: le PSG à une marche d'un légendaire doublé contre Arsenal
-
Mort d'Edgar Morin, monument centenaire de la vie intellectuelle française
Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts
L'émergence des agents d'intelligence artificielle (IA) a fait exploser la facture IA de bon nombre d'entreprises, qui se tournent vers des modèles moins coûteux pour ne pas rogner sur leur consommation.
Finie, l'ère de "l'intelligence subventionnée" - selon l'expression de Kevin Simback, de l'incubateur Delphi Labs - née avec ChatGPT et la déferlante de l'IA générative.
Pour favoriser l'adoption de cette nouvelle technologie, les grands acteurs du secteur, OpenAI en tête, ont proposé initialement des tarifs très attractifs, au point que leur activité était déficitaire.
"Mais le vent est en train de tourner", prévient Kevin Simback.
Chacun à leur tour, les poids lourds de l'IA ont récemment revu leurs prix pour les ajuster à l'utilisation réelle des capacités informatiques nécessaires pour faire tourner les modèles.
L'avènement des agents IA, des programmes capables d'effectuer des tâches et plus seulement de donner des réponses, a, en outre, fait bondir le recours aux infrastructures informatiques.
Pour une même mission, l'interface peut se démultiplier en plusieurs agents, chacun avec sa feuille de route, le tout assemblé et vérifié par d'autres agents.
A l'arrivée, le nombre de "tokens", unité de référence pour mesurer le résultat produit par l'IA, peut représenter des dizaines de fois celui correspondant à une simple question à ChatGPT.
Le tout s'inscrit dans une période de déséquilibre. Les centres de données et les fabricants de puces ne parviennent pas à suivre le rythme effréné de la demande d'intelligence artificielle, ce qui renchérit l'accès aux infrastructures.
"En particulier chez les développeurs, le coût d'utilisation de l'IA pour la programmation s'est accru de façon exponentielle", observe Mark Barton, de la société d'accompagnement numérique Omniux.
Par extension, pour tous les modèles de référence du marché, "les prix commencent à s'envoler", insiste-t-il.
Face à ce nouveau paradigme, certains questionnent le déploiement à tout crin de l'IA, tels l'enseigne de grande distribution Target, Starbucks ou Uber.
"Dans certains cas, le coût dépasse celui d'un employé au bout d'un mois ou deux parce qu'ils l'utilisent trop", décrit Jack Gold, président du cabinet J.Gold Associates.
- Pas d'IA "sans raison" -
Pourtant sacré, en début d'année, champion du "tokenmaxxing", mouvement qui glorifie la dépense maximale de "tokens" comme mètre étalon de productivité des employés, Meta a récemment mis le hola.
"Personne ne devrait recourir à des outils IA sans raison", a ainsi écrit le responsable technologique du groupe, Andrew Bosworth, dans un mémo interne relayé par le Wall Street Journal.
Mais si le discernement est désormais de mise, la plupart des sociétés cherchent surtout à accéder à une IA moins onéreuse, en recourant à des modèles moins performants que les fleurons du secteur.
Dans ce contexte, la popularité des modèles dits "open weights", téléchargeables gratuitement, est croissante, leur usage ne nécessitant que l'achat de puissance de calcul.
Les entreprises se tournent aussi vers des modèles de plus petite taille, les SLM (small language models) en lieu et place des LLM, qui servent de base à ChatGPT, Claude ou Gemini.
Ces SLM peuvent parfois tourner sur les serveurs locaux ou même directement sur l'ordinateur, une option plus économique car elle évite de payer un fournisseur de capacité à distance (cloud).
Il est aussi possible de scinder une demande unique (prompt) en étapes distinctes pour les confier, à chaque fois, à l'interface adaptée, explique Adrian Balfour, du cabinet de conseil numérique Enverso.
"Quand vous passez par un grand modèle monolithique, vous en aurez à peu près pour 15 dollars le million de +tokens+ alors qu'en prenant des mini-modèles, vous ferez descendre le tout à 5 cents", assure-t-il.
Beaucoup voient dans cette refonte la première étape de la banalisation des modèles, devenus interchangeables sans déperdition.
Dès lors, ce sont les plateformes de sélection et de coordination des modèles et des agents qui prennent de l'importance, selon John Belton, gérant au sein de la société d'investissement Gabelli Funds.
Sur ce créneau, des start-up se battent avec des mastodontes du "cloud" comme Amazon, qui propose déjà de jongler avec une multitude d'IA via sa plateforme Bedrock, mais aussi les géniteurs de l'intelligence artificielle eux-mêmes.
Anthropic dispose ainsi d'une gamme complète de modèles, dont Haiku, l'option la plus économique, à l'instar d'OpenAI et de Google.
John Belton ne voit d'ailleurs pas ces étoiles de l'IA perdre des parts de marché à mesure que les clients cherchent l'efficacité plutôt que la performance.
"Les utilisateurs les plus avancés seront toujours prêts à payer" pour ce qui se fait de mieux, prévoit-il. "Le gâteau ne fait que grossir."
H.Romero--AT