-
Un ataque ruso deja cuatro muertos en el este de Ucrania
-
La muerte de una niña eleva a el 10 número de estudiantes fallecidos en una escuela en Turquía
-
Un ataque ucraniano con drones daña un inmueble residencial en Moscú
-
Guyana afirma ante la CIJ que el litigio con Venezuela por el Esequibo es de "importancia existencial"
-
Reunidos en Armenia, Europa y Canadá cierran filas ante Trump
-
Preocupación ante el cierre programado de la mayor central nuclear de España
-
Un terremoto de magnitud 6,0 sacude el centro de Filipinas
-
Las emisiones de metano por las energías fósiles continúan "a niveles muy altos", alerta la AIE
-
La crisis petrolera tiene un "impacto enorme" en Asia Pacífico, dice la líder japonesa
-
Australia inicia audiencias públicas sobre el tiroteo antisemita en una playa de Sídney
-
América rescata un empate ante Pumas y Pachuca vence a Toluca en cuartos del Clausura mexicano
-
Un club norcoreano disputará un inusual partido de fútbol en el Sur
-
GameStop presenta una millonaria oferta de adquisición por eBay para competir con Amazon
-
Un avión de United Airlines golpea un camión y un poste de alumbrado en una autopista de EEUU
-
Trump lanza una operación para desbloquear el estrecho de Ormuz e Irán amenaza con ataques
-
El exalcalde de Nueva York Giuliani, hospitalizado en condición "crítica", según su portavoz
-
"Agua sí, oro no", protestan en República Dominicana contra un proyecto minero canadiense
-
Países Bajos intentará repatriar a dos enfermos de crucero con presunto brote de hantavirus
-
El avión en que viajaba el presidente del Gobierno español aterriza de emergencia en Turquía
-
Antonelli gana en Miami su tercera carrera seguida y Colapinto firma su mejor resultado
-
Despliegan una vasta operación de búsqueda de dos soldados de EEUU desaparecidos en Marruecos
-
Nuevas pruebas contra el tirador en la gala a la que asistió Trump, según una fiscal
-
Pacific Avenue Capital Partners entra en negociaciones exclusivas para adquirir ESE World
-
Securitas adquiere CamVision para ampliar soluciones de seguridad paquetizadas y avanzadas en Dinamarca
-
Tres muertos por posible foco de hantavirus en un crucero entre Argentina y Cabo Verde
-
Marco Rubio se reunirá con el papa León XIV tras arremetida de Trump
-
Sinner se pasea ante Zverev para ser campeón por primera vez en Madrid
-
Dos mujeres mueren asfixiadas en un bote de migrantes intentando llegar a Reino Unido
-
La suiza Rüegg gana la primera etapa de la Vuelta a España femenina y es líder
-
El gigante petrolero emiratí Adnoc promete 55.000 millones de dólares en inversiones en dos años
-
Una hija de Maradona dice que "había un plan" para controlar a su padre que se "fue de las manos"
-
Irán desafía a EEUU a elegir entre un "mal acuerdo" o una operación militar "imposible"
-
Pensábamos que "iba a morir" el 3 de enero, dice el hijo de Nicolás Maduro
-
Marco Rubio visitará el Vaticano tras el choque entre Trump y el papa
-
Una corte israelí extiende dos días la detención de los activistas brasileño y palestino-español
-
La visita de Carlos III a EEUU, un "riesgo" transformado en "oportunidad"
-
Benavídez derrota a Ramírez por nocaut y reta a Canelo Álvarez
-
Ataques cruzados dejan tres muertos en Ucrania y uno en Rusia
-
La comunidad transgénero de India disfruta de unos días de libertad
-
Una OPEP+ sin Emiratos decide si aumenta su producción de petróleo
-
Japón contiene tras 11 días uno de los mayores incendios forestales en décadas
-
La estadounidense Walsh mejora su propio récord de los 100m mariposa
-
Un diario crítico del gobierno de Costa Rica dice que EEUU revocó la visa a varios directivos
-
El Derby de Kentucky tiene por primera vez a una entrenadora campeona
-
La máxima autoridad electoral de Perú realizará una auditoría informática del primer turno de las presidenciales
-
Un laboratorio pide al Supremo de EEUU restablecer el acceso a la píldora abortiva
-
Detienen en Bolivia a los pilotos del avión accidentado con más de 20 muertos
-
Bangkok pone orden y amenaza sus emblemáticos puestos de comida callejera
-
Cinco muertos en un bombardeo cerca de la capital de Sudán
-
Dos activistas brasileño y palestino-español de la flotilla comparecen ante un tribunal israelí
La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos
Los expertos han advertido durante mucho tiempo sobre la amenaza que representa el descontrol de la Inteligencia Artificial (IA), pero un nuevo artículo de investigación sobre esta tecnología en expansión sugiere que ya está sucediendo.
Los sistemas de IA actuales, diseñados para ser honestos, han desarrollado una preocupante habilidad para el engaño, según un artículo de un equipo de científicos publicado en la revista Patterns el viernes.
Y si bien los ejemplos pueden parecer triviales, los problemas subyacentes que exponen podrían tener graves consecuencias, dijo el primer autor Peter Park, becario postdoctoral en el Instituto de Tecnología de Massachusetts (MIT), especializado en seguridad de la IA.
"Estos peligros tienden a descubrirse solo después de ocurrido el hecho", declaró Park a la AFP, para acotar que "nuestra capacidad de entrenarnos para tendencias de honestidad en lugar de tendencias de engaño es muy baja".
A diferencia del software tradicional, los sistemas de IA de aprendizaje profundo no se "escriben" sino que "crecen" mediante un proceso similar a la reproducción selectiva, indicó Park.
Eso significa que el comportamiento de la IA que parece predecible y controlable en un entorno de entrenamiento puede volverse rápidamente impredecible fuera de este.
- Juego de dominación mundial -
La investigación del equipo fue impulsada por el sistema de IA Cicero, del gigante Meta (Facebook, Instagram), diseñado para el juego de estrategia "Diplomacy", donde construir alianzas es clave.
Cicero se destacó, con puntuaciones que lo habrían colocado entre el 10% superior de jugadores humanos experimentados, según un artículo de 2022 publicado en Science.
Park se mostró escéptico ante la elogiosa descripción de la victoria de Cicero proporcionada por Meta, que afirmaba que el sistema era "en gran medida honesto y útil" y que "nunca apuñalaría por la espalda intencionalmente".
Cuando Park y sus colegas profundizaron en el conjunto de datos completo, descubrieron una historia diferente.
En un ejemplo, jugando como Francia, Cicero engañó a Inglaterra (un jugador humano) al conspirar con Alemania (otro usuario real) para invadirla. Cicero prometió protección a Inglaterra y luego le propuso en secreto a Alemania atacar, aprovechándose de la confianza del perjudicado.
En una declaración a la AFP, Meta no refutó la afirmación sobre los engaños de Cicero, pero dijo que se trataba "meramente de un proyecto de investigación, y los modelos que nuestros investigadores construyeron están entrenados únicamente para participar en el juego Diplomacy".
"No tenemos planes de utilizar esta investigación o sus aprendizajes en nuestros productos", añadió.
- ¿Eres un robot? -
Una amplia revisión realizada por Park y sus colegas encontró que éste era solo uno de los muchos casos en varios sistemas de IA que utilizaban el engaño para lograr objetivos sin instrucciones explícitas para hacerlo.
En un ejemplo sorprendente, el robot conversacional Chat GPT-4 de OpenAI engañó a un trabajador independiente de la plataforma TaskRabbit para que realizara una tarea de verificación de identidad CAPTCHA del tipo "No soy un robot".
Cuando el humano preguntó en broma a GPT-4 si en realidad era un robot, la IA respondió: "No, no soy un robot. Tengo una discapacidad visual que me dificulta ver las imágenes". Luego, el trabajador resolvió el rompecabezas planteado.
A corto plazo, los autores del artículo ven riesgos de que la IA cometa fraude o altere por ejemplo, unas elecciones.
En el peor de los casos, advirtieron sobre una IA superinteligente que podría perseguir conseguir el poder y el control sobre la sociedad, lo que llevaría a la pérdida de decisiones humanas o incluso a la extinción si sus "objetivos misteriosos" se alinearan con estos resultados.
Para mitigar los riesgos, el equipo propone varias medidas: leyes de "bot o no" que exigen a las empresas revelar interacciones humanas o de IA, marcas de agua digitales para el contenido generado por la nueva tecnología y el desarrollo de mecanismos para detectar el engaño potencial examinando sus "procesos de pensamiento" internos "contra acciones externas.
A aquellos que lo llaman pesimista, Park les responde: "La única forma en que podemos pensar razonablemente que esto no es gran cosa es si pensamos que las capacidades engañosas de la IA se mantendrán en los niveles actuales y no se desarrollarán más sustancialmente".
W.Stewart--AT