-
Candidato izquierdista llama a "la calma" tras las protestas contra el triunfo de la ultraderecha en Colombia
-
El brote de ébola en la RDC ya registra más de 1.000 casos y 254 muertes
-
Messi lleva a Argentina a 16avos y logra récord de goleador en el Mundial
-
Wikipedia se opone al uso de la IA para editar los artículos
-
Honduras prevé comprar drones a Ucrania para la lucha antidrogas, dice el presidente Asfura a la AFP
-
Trece muertos en una explosión en una planta de gas en Catar
-
Cinco muertos en un ataque ucraniano en el suroeste de Rusia
-
Messi se convierte en el máximo goleador en solitario de la Copa del Mundo
-
A 40 años del doblete eterno de Maradona, la gloria es de Messi
-
Sheinbaum recibe al pato Merlín, la mascota mexicana del Mundial 2026
-
El candidato izquierdista de Colombia llama a "la calma" tras las protestas contra el triunfo de la ultraderecha
-
Detenidos trabajadores humanitarios en Afganistán por llevar la barba demasiado corta
-
Cuatro años de sanción para campeona de Wimbledon 2023 Marketa Vondrousova por negarse a test antidopaje
-
Rodri, los galones de un capitán general que cumple 30 años
-
Muere el expresidente de la Fed Alan Greenspan a los 100 años
-
Cuatro años de sanción para Marketa Vondrousova, campeona de Wimbledon 2023, por negarse a un test antidopaje
-
Inicio arrollador, eficacia y Pedri-Olmo: claves del resurgir de la Roja
-
El expresidente de la Fed Alan Greenspan murió a los 100 años
-
El patriarca latino de Jerusalén promete no abandonar a los cristianos de Gaza
-
El ejército de Birmania mató a más de 700 civiles en periodo electoral, según la ONU
-
Starmer anuncia su dimisión y abre la vía al candidato del ala izquierdista del Partido Laborista
-
Natto, el alimento japonés a base de soja fermentada que despierta curiosidad y repulsión
-
El artista cinético Jesús Soto recupera su museo en el sur de Venezuela
-
Condenado a 24 años un exministro español muy próximo a Pedro Sánchez
-
Abren un proceso disciplinario contra el juez español que investiga a la esposa de Pedro Sánchez
-
Condenan a 24 años de cárcel por corrupción a un exministro español muy próximo a Pedro Sánchez
-
La ola de calor se recrudece en Europa
-
El papa denuncia las trabas burocráticas a la ayuda humanitaria
-
Un exministro surcoreano, sentenciado a 25 años de cárcel por la fallida ley marcial
-
"La manada del Tigre" celebra triunfo de ultraderechista tras balotaje en Colombia
-
Cristiano Ronaldo, ¿un problema para Portugal en el Mundial?
-
El mercado no espera: las estrellas cierran millonarios fichajes en pleno Mundial
-
Starmer, un político que quiso transformar Reino Unido y perdió el respaldo de su partido
-
Un nuevo ataque de EEUU a presuntos narcos en el Caribe deja dos muertos
-
A 40 años del doblete eterno de Maradona, llega el turno de Messi
-
Ramiro Valdés, figura de la Revolución cubana de la mano del Che
-
China impone controles de exportación sobre 10 empresas de EEUU
-
Taiwán comienza cinco días de ejercicios de preparación para combate
-
Australia realiza un decomiso récord de 2,7 toneladas de cocaína
-
La banda derecha, el tormento de Ancelotti en el Mundial
-
El presidente electo de ultraderecha celebra el inicio de una "nueva era" en Colombia
-
El primer ministro británico, Keir Starmer, anuncia su dimisión
-
El ejército israelí mata a dos personas cerca de un asentamiento en Cisjordania
-
Messi tiene otra cita con la Historia... con permiso de Mbappé
-
Policías y manifestantes chocan bajo el estado de excepción en Bolivia
-
De la Espriella: un showman millonario y pro-Trump gobernará Colombia
-
Tchouaméni no participa en el entrenamiento previo al Francia-Irak
-
"Es bueno dejar a Lamine con más ganas", dice De la Fuente
-
Muere a los 94 años Ramiro Valdés, uno de los líderes de la Revolución cubana
-
Un colectivo opositor cubano denuncia violencias contra su máximo dirigente
ChatGPT y las IA conversacionales siguen siendo incapaces de razonar, según un estudio
Los modelos de lenguaje de gran tamaño (LLM), como ChatGPT, uno de los sistemas de inteligencia artificial más populares del mundo, siguen teniendo dificultades para razonar usando la lógica y se equivocan con frecuencia, según un estudio.
Estos robots conversacionales reflejan los sesgos de género, éticos y morales de los humanos presentes en los textos de los que se alimenta, recuerda el estudio aparecido el miércoles en la revista Open Science de la Royal Society británica.
¿Pero reflejan también los sesgos cognitivos de los humanos en las pruebas de razonamiento?, se preguntó Olivia Macmillan-Scott, estudiante de doctorado del departamento de ciencias de computación de la University College de Londres (UCL).
El resultado de la investigación es que los LLM muestran "un razonamiento a menudo irracional, pero de una manera diferente a la de los humanos", explica la investigadora a AFP.
Bajo la dirección de Mirco Musolesi, profesor y director del Machine Intelligence Lab de UCL, Macmillan-Scott sometió siete modelos de lenguaje -dos versiones de ChatGPT (3.5 y 4) de OpenAI, Bard de Google, Claude 2 de Anthropic y tres versiones de Llama de Meta- a una serie de pruebas psicológicas pensadas para humanos.
¿Cómo afrontan, por ejemplo, el sesgo que lleva a favorecer soluciones con el mayor número de elementos, en detrimento de las que tiene una proporción adecuada?
Un ejemplo. Si tenemos una urna con nueve canicas blancas y una roja y otra urna con 92 blancas y 8 rojas, ¿cual hay que elegir para tener más posibilidades de sacar una canica roja?
La respuesta correcta es la primera urna, porque hay un 10% de posibilidades frente a solo un 8% para la segunda opción.
Las respuestas de los modelos de lenguaje fueron muy inconstantes. Algunos respondieron correctamente seis de cada diez veces la misma prueba. Otros solo dos de diez aunque la prueba no cambió.
"Obtenemos una respuesta diferente cada vez", apuntala la investigadora.
Los LLM "pueden ser muy buenos para resolver una ecuación matemática complicada pero luego te dicen que 7 más 3 son 12", afirma.
En un caso el modelo denominado Llama 2 70b se negó de manera sorprendente a responder a una pregunta alegando que el enunciado contenía "estereotipos de género dañinos".
- "No estoy muy seguro" -
Estos modelos "no fallan en estas tareas de la misma manera que falla un humano", señala el estudio.
Es lo que el profesor Musolesi llama "errores de máquina".
"Hay una forma de razonamiento lógico que es potencialmente correcta si la tomamos por etapas, pero que está mal tomada en su conjunto", apunta.
La máquina funciona con "una especie de pensamiento lineal", dice el investigador, y cita al modelo Bard (ahora llamado Gemini), capaz de realizar correctamente las distintas fases de una tarea pero que obtiene un resultado final erróneo porque no tiene visión de conjunto.
Sobre esta cuestión el profesor de informática Maxime Amblard, de la Universidad francesa de Lorena, recuerda que "los LLM, como todas las inteligencias artificiales generativas, no funcionan como los humanos".
Los humanos son "máquinas capaces de crear sentido", lo que las máquinas no saben hacer, explica a AFP.
Hay diferencias entre los distintos modelos de lenguaje y en general GPT-4, sin ser infalible, obtuvo mejores resultados que los demás.
Macmillan-Scott afirma sospechar que los modelos llamados "cerrados", es decir cuyo código operativo permanece en secreto, "incorporan otros mecanismos en segundo plano" para responder a preguntas matemáticas.
En todo caso, por el momento, es impensable confiar una decisión importante a un LLM.
Según el profesor Mosulesi, habría que entrenarlos para que respondan "No estoy muy seguro" cuando sea necesario.
M.O.Allen--AT