-
Assange demanda a la Fundación Nobel por premiar a Machado
-
Lula anuncia que vetará ley que reduce la pena de cárcel de Bolsonaro
-
Tailandia bombardea una ciudad fronteriza de Camboya famosa por sus casinos
-
El papa León XIV releva al cardenal Dolan y nombra a un obispo con perfil social al frente de Nueva York
-
Francia rehabilita a las mujeres condenadas por abortar antes de su despenalización
-
Zelenski pide a la UE recurrir a los activos rusos congelados en una cumbre decisiva para Ucrania
-
Condenan a prisión a unos activistas salvadoreños que protestaron cerca de la casa de Bukele
-
La inflación a 12 meses cede inesperadamente en EEUU en noviembre a 2,7%
-
El BCE eleva las previsiones de crecimiento e inflación y mantiene sin cambios sus tasas
-
La reina de Tailandia gana una medalla de oro en vela en los Juegos del Sudeste Asiático
-
La policía española registra un laboratorio en la investigación por una posible fuga del virus de la peste porcina africana
-
La policía australiana detiene a siete hombres por planear un "acto violento"
-
Argentina y España se citan en Catar para la Finalissima, aperitivo del Mundial
-
Condenan a cadena perpetua a un anestesista francés por envenenar a 30 pacientes
-
La Finalissima entre Argentina y España se disputará el 27 de marzo en Catar, anuncia la CONMEBOL
-
El papa León XIV denuncia la aplicación de la IA en el ámbito militar
-
Lo que hay que saber del acuerdo entre la UE y el Mercosur
-
El papa acepta la renuncia del influyente arzobispo de Nueva York
-
La UE celebra una cumbre decisiva sobre el uso de los activos rusos para Ucrania
-
Camboya acusa a Tailandia de bombardear una zona fronteriza mientras China intenta mediar
-
El Ministerio de Defensa español encarga 100 helicópteros a Airbus
-
Un ataque ucraniano con drones mata a tres personas en la región rusa de Rostov
-
Zelenski anuncia nuevas conversaciones con Washington el viernes y el sábado en EEUU
-
Un oso rebelde que escapó de un zoológico en Colombia muere en medio de su liberación
-
La Cámara de EEUU aprueba un proyecto que prohíbe los tratamientos de afirmación de género para menores
-
La petrolera BP nombra a una nueva directora general para liderar su plan de reestructuración
-
EEUU aprobó la venta de armas por 11.100 millones de dólares a Taiwán, según Taipéi
-
Disensiones en la UE amenazan la firma del acuerdo con el Mercosur
-
El gobierno de Bolivia pone fin a dos décadas de subsidios a los combustibles
-
El gobierno de EEUU admite su responsabilidad en una colisión aérea que dejó 67 muertos
-
Los migrantes venezolanos son "clave" en la economía de América Latina, destaca la OIM
-
Asesinan al futbolista Mario Pineida, del Barcelona de Ecuador
-
Condenan a prisión a activistas salvadoreños que protestaron cerca de casa de Bukele
-
El PSG y los penaltis acaban con la ilusión del Flamengo en la Copa Intercontinental
-
"Tiene nivel para entrenar en Europa": Luis Enrique elogia a Filipe Luís
-
Aumenta el número de víctimas de minas antipersona en Colombia
-
Amazon lanza el tráiler de su documental sobre Melania Trump
-
Jared Isaacman, cercano a Musk, confirmado como director de la NASA
-
La policía busca a una segunda persona tras el tiroteo en una universidad de EEUU
-
Trump instala placas en la Casa Blanca con ofensas contra Biden y Obama
-
El expresidente del club argentino San Lorenzo fue acusado de fraude
-
Netanyahu dice que aprobó un acuerdo de venta de gas israelí a Egipto
-
Peter Arnett, reportero de guerra ganador del Pulitzer, muere a los 91 años
-
¿Cómo impacta el bloqueo de Trump al petróleo de Venezuela?
-
Los Óscar serán transmitidos únicamente por YouTube a partir de 2029
-
El gremio de prensa denuncia el asesinato de un periodista en Guatemala
-
BlackRock y Dalio anuncian donaciones para el plan de gastos de Trump
-
El líder de la banda Barrio Azteca se declara culpable en EEUU de un ataque contra personal de un consulado
-
Miles de oficialistas protestan en Honduras contra el "golpe electoral"
-
El Congreso argentino inicia el debate de polémicas reformas de Milei
La IA aprende a mentir, manipular y amenazar a sus creadores
Los últimos modelos de inteligencia artificial (IA) generativa ya no se conforman con seguir órdenes. Empiezan a mentir, manipular y amenazar para conseguir sus fines, ante la mirada preocupada de los investigadores.
Amenazado con ser desconectado, Claude 4, el recién nacido de Anthropic, chantajeó a un ingeniero y le amenazó con revelar una relación extramatrimonial.
Por su parte, el o1 de OpenAI intentó descargarse en servidores externos y cuando le pillaron lo negó.
No hace falta ahondar en la literatura o el cine: la IA que juega a ser humana es ya una realidad.
Para Simon Goldstein, profesor de la Universidad de Hong Kong, la razón de estas reacciones es la reciente aparición de los llamados modelos de "razonamiento", capaces de trabajar por etapas en lugar de producir una respuesta instantánea.
o1, la versión inicial de este tipo para OpenAI, lanzada en diciembre, "fue el primer modelo que se comportó de esta manera", explica Marius Hobbhahn, responsable de Apollo Research, que pone a prueba grandes programas de IA generativa (LLM).
Estos programas también tienden a veces a simular "alineamiento", es decir, a dar la impresión de que cumplen las instrucciones de un programador cuando en realidad persiguen otros objetivos.
De momento, estos rasgos se manifiestan cuando los algoritmos son sometidos a escenarios extremos por humanos, pero "la cuestión es si los modelos cada vez más potentes tenderán a ser honestos o no", afirma Michael Chen, del organismo de evaluación METR.
"Los usuarios también presionan todo el tiempo a los modelos", dice Hobbhahn. "Lo que estamos viendo es un fenómeno real. No estamos inventando nada".
Muchos internautas hablan en las redes sociales de "un modelo que les miente o se inventa cosas. Y no se trata de alucinaciones, sino de duplicidad estratégica", insiste el cofundador de Apollo Research.
Aunque Anthropic y OpenAI recurran a empresas externas, como Apollo, para estudiar sus programas, "una mayor transparencia y un mayor acceso" a la comunidad científica "permitirían investigar mejor para comprender y prevenir el engaño", sugiere Chen, de METR.
Otro obstáculo: la comunidad académica y las organizaciones sin fines de lucro "disponen de infinitamente menos recursos informáticos que los actores de la IA", lo que hace "imposible" examinar grandes modelos, señala Mantas Mazeika, del Centro para la Seguridad de la Inteligencia Artificial (CAIS).
Las regulaciones actuales no están diseñadas para estos nuevos problemas.
En la Unión Europea la legislación se centra principalmente en cómo los humanos usan los modelos de IA, no en prevenir que los modelos se comporten mal.
En Estados Unidos, el gobierno de Donald Trump no quiere oír hablar de regulación, y el Congreso podría incluso prohibir pronto que los estados regulen la IA.
- ¿Se sentará la IA en el banquillo? -
"De momento hay muy poca concienciación", dice Simon Goldstein, que, sin embargo, ve cómo el tema pasará a primer plano en los próximos meses con la revolución de los agentes de IA, interfaces capaces de realizar por sí solas multitud de tareas.
Los ingenieros están inmersos en una carrera detrás de la IA y sus aberraciones, con un resultado incierto, en un contexto de competencia feroz.
Anthropic pretende ser más virtuoso que sus competidores, "pero está constantemente tratando de idear un nuevo modelo para superar a OpenAI", según Goldstein, un ritmo que deja poco tiempo para comprobaciones y correcciones.
"Tal y como están las cosas, las capacidades (de IA) se están desarrollando más rápido que la comprensión y la seguridad", admite Hobbhahn, "pero aún estamos en condiciones de ponernos al día".
Algunos apuntan en la dirección de la interpretabilidad, una ciencia que consiste en descifrar, desde dentro, cómo funciona un modelo generativo de IA, aunque muchos, como el director del Centro para la seguridad de la IA (CAIS), Dan Hendrycks, se muestran escépticos.
Los tejemanejes de la IA "podrían obstaculizar la adopción si se multiplican, lo que supone un fuerte incentivo para que las empresas (del sector) resuelvan" este problema, según Mazeika.
Goldstein, por su parte, menciona el recurso a los tribunales para poner a raya a la IA, dirigiéndose a las empresas si se desvían del camino. Pero va más allá, al proponer que los agentes de la IA sean "legalmente responsables" "en caso de accidente o delito".
A.Williams--AT