-
Des pétroliers iraniens passent le détroit d'Ormuz avant les nouveaux pourparlers
-
Un suspect du génocide au Rwanda comparaît devant un tribunal néerlandais
-
Pologne et Allemagne signent un accord de défense aux ambitions limitées
-
Espagne: l'ex-Premier ministre Zapatero convoqué pour une audition inédite devant le juge
-
Fed: Warsh entre en scène, pas de dégel des taux d'intérêt en vue
-
Ultime vote au Parlement pour relancer l'investissement dans les barrages
-
Le Parlement européen en passe d'autoriser une nouvelle génération d'OGM
-
Migration: le Parlement européen vote mercredi le règlement sur les retours
-
Mondial-2026: la France de Mbappé réussit son entrée, Messi dans l'histoire
-
VivaTech: intelligence artificielle et souveraineté technologique au menu
-
Une vague de chaleur déferle sur la France, en plein bac
-
L'IA au menu du G7 avant un dîner Trump-Macron sous les ors de Versailles
-
Poutine reçoit des dirigeants asiatiques pour un sommet parallèle au G7
-
Loi d'urgence agricole: au Sénat, retour en vue pour le volet "pesticides" de la loi Duplomb
-
L'acteur Javier Bardem laisse ses empreintes sur Hollywood Boulevard
-
Sean Penn réalisera un film sur l'assaut du Capitole (médias)
-
Mondial-2026: la France de Mbappé réussit son entrée, en attendant l'Argentine de Messi
-
Mondial-2026: Mbappé d'abord brouillon, ensuite record et enfin libérateur
-
Les autorités affirment avoir déjoué un projet d'attentat pour le show de MMA à la Maison Blanche
-
Mondial-2026: un Mbappé record lance idéalement les Bleus
-
SpaceX dépasse quelques heures la capitalisation boursière d'Amazon, cinquième du monde
-
Présidentielle au Pérou: Keiko Fujimori accentue son avance
-
Tirs de semonce d'un navire de guerre russe sur un yacht dans la Manche
-
Wall Street termine dispersée, entre Moyen-Orient et Fed
-
Une "menace potentielle" déjouée pour le show de MMA à la Maison Blanche
-
En Haïti, le chef de l'ONU demande "pardon" aux victimes des gangs
-
La Banque de France abaisse nettement sa prévision de croissance pour 2026
-
Le débat sur l'autonomie de la Corse a débuté à l'Assemblée
-
Des hackers de plus en plus jeunes derrière des cyberattaques massives
-
Sommet du G7: Emmanuel Macron sur France 2 jeudi soir
-
De nouvelles baisses de tarifs imposées aux radiologues en juillet après des négociations infructueuses
-
En Tunisie, des vols de retours des migrants quasiment quotidiens, selon un responsable à l'AFP
-
Le Parlement allonge la durée de rétention des étrangers jugés dangereux
-
En Tunisie, des vols de retours des migrants quasiment quotidiens (responsable à l'AFP)
-
Snap lance ses lunettes de réalité augmentée Specs, pari sur l'après-smartphone
-
Mondial-2026: avec la Tunisie, la nouvelle mission commando de Renard
-
SpaceX dépasse Amazon et devient la cinquième capitalisation boursière mondiale
-
"Roblox", le jeu vidéo pour enfants à l'appétit d'ogre
-
Le jeu Roblox généralise ses comptes sécurisés pour mieux protéger les mineurs en ligne
-
Accréditation refusée au salon Eurosatory: un journaliste saisit la justice contre l'Intérieur
-
La Bourse de Paris termine en hausse, profitant du recul du pétrole
-
Ile-de-France: d'ici 2030, les billets de transport payables à l'unité en carte bancaire, à tarif majoré
-
Entre upcycling et élégance, la dentelle renaît dans la mode contemporaine
-
Microsoft passe à la facturation "au compteur" avec son nouvel agent IA
-
Mondial-2026: la France entre en scène, tout comme sa grande rivale, l'Argentine
-
Brésil: l'état du chef Raoni, en soins intensifs, s'améliore
-
Première transmission entre humains de la bactérie de la dermatophilose
-
Téhéran et Washington doivent entrer dans le vif du sujet vendredi en Suisse
-
SpaceX se hisse à la cinquième place des capitalisations mondiales, dépasse Amazon
-
Wall Street ouvre en hausse, attend des détails sur l'accord Etats-Unis-Iran
Google lance deux nouvelles puces pour s'adapter à l'ère des agents IA
Google a dévoilé mercredi deux nouvelles puces pour l'intelligence artificielle (IA), l'une pour entraîner les puissants nouveaux modèles d'IA générative, l'autre pour l'usage rapide et économique du quotidien, dont la demande pourrait exploser avec le rapide déploiement mondial des agents IA autonomes.
Google rejoint ainsi Amazon, qui a adopté dès 2018 cette même stratégie de distinction d'usage des puces, et fait un pas de plus dans sa quête d'une moindre dépendance de Nvidia, qui contrôle environ 80% du marché mondial des puces pour centres de données IA.
Cette 8e génération des Tensor Processing Unit (TPU), les processeurs maisons de Google, a été présentée mercredi à Las Vegas, lors de la conférence annuelle de Google Cloud, la division des services d'informatique à distance (cloud) du géant de Mountain View (Californie).
Cette nouvelle génération est pour la première fois constituée de deux composants distincts: les TPU 8t, conçues pour l'entraînement long et coûteux des modèles d'IA générative, et les TPU 8i, destinées à l'inférence, c'est-à-dire les multiples interactions d'usage d'un utilisateur ou d'un agent IA autonome, nécessitant rapidité et sobriété énergétique donc économique.
Ces deux puces, conçues en partenariat avec le fabricant de semi-conducteurs Broadcom, "seront disponibles plus tard cette année", a indiqué Thomas Kurian, le patron de Google Cloud.
Cette distinction reflète une réalité nouvelle: un agent IA autonome enchaîne des dizaines d'actions sans intervention humaine, générant bien plus d'opérations de calcul que le dialogue humain avec les assistants comme Gemini, ChatGPT, Claude ou Le Chat.
Les nouvelles puces d'exécution TPU 8i sont donc conçues pour "assurer le débit massif et la faible latence (temps de réaction) nécessaires pour faire tourner des millions d'agents simultanément, à moindre coût", a écrit mercredi Sundar Pichai, PDG d'Alphabet, maison mère de Google, dans un billet de blog.
Google revendique des performances 2,8 fois meilleures pour l'entraînement et un coût réduit de 80% à performances équivalentes à la génération précédente.
En janvier, le leader Nvidia avait annoncé le lancement de la production de ses nouvelles puces Vera et Rubin, affichant des performances jusqu'à cinq fois supérieures à la génération précédente.
Amazon, premier acteur mondial du cloud avec sa filiale AWS, avait de son côté dévoilé en décembre sa Trainium 3, une puce conçue elle aussi pour réduire la dépendance de ses clients aux GPU (processeurs graphiques) de Nvidia, avec un coût d'entraînement et d'inférence réduit jusqu'à 50% selon le groupe.
Google, Amazon et Microsoft continuent néanmoins d'intégrer les GPU de Nvidia dans leurs infrastructures, aucun n'envisageant de s'en passer entièrement à court terme.
O.Ortiz--AT