-
A 91 anni operato alla colecisti da sveglio
-
Cybersicurezza, modelli di Ia superano molti attacchi, ma restano vulnerabili
-
L'IA battuta dagli umani in un difficile test di matematica
-
Mare e Laghi sicuri, quattro mesi di controlli rafforzati in tutta Italia
-
Assofondipensione, aumentare l'adesione alla previdenza complementare
-
Si avvicina il grande caldo, 9 città con il bollino giallo
-
Via libera dell'Eurocamera all'accordo sui dazi Ue-Usa
-
Maltrattamenti alla madre, Riccardo Bossi condannato anche in Appello
-
In Spagna l'Antitrust apre un'indagine su sei grandi banche per i mutui
-
Tajani, sull'export obiettivo 700 miliardi entro fine 2027
-
Fonti, G7 compatto sul sostegno a Kiev e le pressione su Mosca
-
A Wimbledon le sorelle Williams insieme nel doppio
-
Amorim ha firmato col Milan, manca l'ufficialità
-
Jakub Hrůša sul podio a Santa Cecilia per il gran finale di stagione
-
Ad Asia Argento il Life Achievement Award di Locarno79
-
Francesca Comencini a Bologna per il restauro di 'La bugiarda' diretto dal padre Luigi
-
Rüdiger prolunga con il Real Madrid fino al 2027
-
Trump, 'sull'Iran ora si passa alla seconda fase'
-
Trump, 'Mosca deve fare un accordo, farò tutto ciò che è in mio potere'
-
Borsa: l'Europa solida guardando al Golfo, bene Milano (+1,1%)
-
I Tramonti di Tinia, tre giorni di musica, natura e solidarietà nel viterbese
-
Fipe, pubblici esercizi campioni di prossimità ma calano del 3,7% in 10 anni
-
Cremlino, 'Zelensky vuole incontrare Putin? Venga a Mosca'
-
Media, 'a Evian trilaterale Macron-Trump-Zelensky a margine del G7'
-
Uif, cripto e iban virtuali sempre più usati per riciclaggio
-
Un chip nel cervello aiuta i malati di Parkinson a camminare
-
In Germania l'indice Zew in giugno sale a 10,5 punti, molto meglio delle stime
-
Btp Italia Sì raccoglie 457 milioni nella prima ora. Iari 3,17 miliardi
-
Al Policlinico di Bari eseguito primo trapianto di rene in Italia con accesso unico
-
Salvini, sul ponte Stretto inchiesta preventiva con presunzione di colpevolezza
-
Istat conferma, l'inflazione a maggio sale al 3,2%
-
Araghchi, l'occupazione israeliana del Libano viola il memorandum Iran-Usa
-
Vela: Vendée Arctique, vince il milanese Beccaria
-
La sfilata 'Erotica' di Achille Lauro a San Siro
-
Zelensky, 'attacco su Mosca giusta risposta, la guerra deve finire'
-
Esperti divisi sui robot, per molti non saranno ladri di lavoro entro il 2025
-
Scendono i prezzi dei carburanti, benzina a 1,881 euro al litro
-
Draghi, per gli stati europei agire insieme è condizione necessaria
-
Oggi in cassa per l'Imu, primo acconto con saldo a dicembre
-
Borsa: Milano in leggera crescita (+0,8%) con Unicredit, debole Stm
-
Borsa: Milano apre in lieve rialzo, Ftse Mib +0,35%
-
Borsa Tokyo aggiorna record, Nikkei supera per la prima volta quota 70mila
-
Borsa: l'Asia incerta dopo la corsa di Wall street, debole Hong Kong
-
Lo spread tra Btp e Bund apre in lieve calo a 70,9 punti base
-
Antitrust, avviata indagine su Apple per servizi cloud
-
Prezzo del petrolio in ribasso, Wti scambiato a 80,36 dollari
-
Euro in lieve calo, scambiato a 1,1577 dollari
-
Mondiali: la Tunisia esonera Lamouchi, Renard nuovo ct
-
Giappone, la Banca centrale aumenta i tassi d'interesse all'1%
-
Mondiali, Iran-Nuova Zelanda 2-2
L'IA battuta dagli umani in un difficile test di matematica
Messi alla prova 4 modelli tra cui ChatGpt, il risultato migliore è stato 6 quesiti su 10
L'Intelligenza Artificiale è stata battuta dagli esseri umani nel più difficile e rigoroso test di matematica al quale è stata sottoposta finora: sono stati messi alla prova quattro diversi modelli, tra cui ChatGpt 5.5 Pro, e nessuno di loro è riuscito a rispondere correttamente a tutti e 10 i quesiti. Il risultato migliore, come riporta la rivista Nature sul suo sito, lo ha ottenuto il modello del Politecnico Federale di Zurigo (Eth), che ha risolto 6 problemi su 10. ChatGpt di OpenAI è arrivato terzo dietro il modello dell'Università della California a Los Angeles, mentre si è classificato ultimo quello dell'Università di Princeton, che a differenza degli altri si basava su Gemini di Google. Il test fa parte di First Proof, il progetto indipendente promosso per seguire l'evoluzione delle capacità dell'intelligenza artificiale nella ricerca matematica, che pubblica i risultati sul suo sito. Le domande poste nell'esame non erano mai state pubblicate prima né nella letteratura scientifica né su Internet, per ridurre il rischio che i modelli si limitassero a ripetere informazioni apprese durante l'addestramento. Un gruppo di 30 matematici ha poi verificato le risposte. Un'altra regola prevedeva che i modelli partecipanti dovessero essere disponibili al grande pubblico e questo ha fatto sì che OpenAI sia stata l'unica grande azienda a prendere parte al test. Due degli altri tre modelli partecipanti si basavano comunque su ChatGpt, grazie a sistemi automatici nei quali le risposte date da questo modello linguistico vengono controllate e migliorate da altri chatbot, spesso con ripetuti scambi di messaggi. Il gruppo dell'Eth ha anche condotto un'indagine preliminare per capire perché alcuni problemi non sono stati risolti da nessuno dei concorrenti. In alcuni casi sembra che ai modelli mancasse un'intuizione cruciale che avrebbe permesso di arrivare alla soluzione finale, mentre in altri l'approccio di base era corretto, ma i sistemi non sono riusciti cogliere tutti i dettagli.
B.Torres--AT