-
EEUU y Ucrania celebran conversaciones "productivas" en Miami, pero sin avances
-
Raphinha y Yamal apuntalan el liderato del Barça en Villarreal
-
Aumentan acusaciones de encubrimiento en torno a los documentos del caso Epstein
-
Vinicius cierra su annus horribilis con una sonora pitada en el Bernabéu
-
Senador de EEUU acusa a Hamás y Hezbolá de estar rearmándose
-
Ucrania lucha por repeler incursión rusa en región fronteriza
-
De Colombia a Darfur: Así opera la red que embauca mercenarios para la guerra en Sudán
-
Rusia desmiente la preparación de una reunión trilateral con Ucrania y EEUU
-
Israel aprueba 19 colonias más en Cisjordania
-
El ciervo caza a la vaca en el menú de algunos estadios del Reino Unido
-
Hombres armados matan a nueve personas en Sudáfrica
-
Australia guarda silencio por las víctimas del atentado antisemita en Sídney
-
Zelenski dice que EEUU debe presionar más a Rusia para poner fin a la guerra
-
Australia guarda silencio por las víctimas del atentado en Sídney
-
Víctimas y congresistas critican censura de documentos publicados del caso Epstein
-
EEUU interceptó un nuevo petrolero frente a las costas de Venezuela
-
Zelenski dice que EEUU planteó conversaciones entre Ucrania y Rusia para poner fin a la guerra en Miami
-
Al menos cinco yihadistas del grupo EI mueren en bombardeos de "represalia" de EEUU en Siria
-
Selfis, oración y memorabilia: conservadores de EEUU recuerdan a Charlie Kirk en "America Fest"
-
Emisario ruso viaja a Miami para sumarse a conversaciones sobre Ucrania
-
Gobierno Trump publica parte de los documentos del caso Epstein: caras famosas y páginas censuradas
-
Trump elige nuevo jefe del Comando Sur en medio de tensión con Venezuela
-
EEUU bombardea más de 70 objetivos en una operación contra el EI en Siria
-
Israel prohíbe el acceso de 14 oenegés a Gaza y endurece el control a las labores humanitarias
-
Los yakuzas, desplazados por una nueva generación de criminales en Japón
-
División del movimiento MAGA queda expuesta en convención conservadora de EEUU
-
EEUU dice que no impondrá a Ucrania un acuerdo sobre el fin del conflicto con Rusia
-
Policía de Brasil investiga a diputados aliados de Bolsonaro sospechosos de corrupción
-
Tras muchas dilaciones, el gobierno de Trump publicará parte del expediente Epstein
-
Un tribunal francés rechaza la suspensión del sitio web de Shein
-
Trump apela la orden judicial que restablece fondos a Harvard
-
La Unión Europea quiere firmar el acuerdo comercial con el Mercosur el 12 de enero
-
Operación policial contra diputados aliados de Bolsonaro por sospecha de corrupción en Brasil
-
El papa nombra al obispo Richard Moth al frente de la Iglesia católica de Inglaterra
-
Siete soldados muertos por un ataque con drones de la guerrilla del ELN en Colombia
-
El Mercosur se reúne en Brasil mientras UE espera firmar el acuerdo el 12 de enero
-
La policía sueca desestima la demanda de Assange contra el Nobel de Machado
-
Gobierno de Trump anuncia publicación de "centenares de miles" de documentos del expediente Epstein
-
Día D para que el gobierno de Trump publique el expediente Epstein
-
EEUU suspende uno de sus programas de visas tras el ataque en la Universidad Brown
-
La ONU anuncia el fin de la hambruna en Gaza, aunque la situación es "crítica"
-
Condenada por obstrucción la jueza de EEUU acusada de ayudar a un migrante mexicano
-
EEUU suspende uno de sus programas de visas tras el ataque en la Universidad de Brown
-
Alemania da por hecho que se firmará el acuerdo UE-Mercosur
-
Putin afirma que el fin de la guerra depende de Ucrania y sus aliados occidentales
-
Francia prolonga a 2026 el trámite para aprobar sus presupuestos
-
La AFP quiere reformar su sistema de expatriación para reducir costos
-
Los agricultores franceses protestan contra el Mercosur frente a casa de playa de Macron
-
En Florida, migrantes otorgan tutela de sus hijos a allegados por temor a deportación
-
Más de 1.000 personas murieron en Gaza desde julio de 2024 mientras esperaban evacuación médica
El riesgo de alimentar la inteligencia artificial con datos generados por el propio sistema
Los modelos de inteligencia artificial (IA) se abastecen sin parar de datos generados por la propia IA, lo que desemboca en la creación de contenidos cada vez más incoherentes, un problema que ya han señalado varios estudios científicos.
Los modelos en los que se basan las herramientas de IA generativa, como ChatGPT, que permiten crear todo tipo de contenidos con simples preguntas, necesitan ser ejercitados con un nombre colosal de datos.
Estos datos a menudo vienen de internet, que cada vez contiene más imágenes y textos creados por la propia IA.
Esta autoalimentación de la IA lleva a un deterioro de los modelos, que producen respuestas que van siendo cada vez menos originales y pertinentes y acaban por no tener ningún sentido, según un artículo publicado a finales de julio por la revista científica Nature.
Con el uso de este tipo de datos, llamados "datos sintéticos" porque están generados artificialmente, la muestra en la que se basan los modelos de IA para dar respuestas va perdiendo calidad.
- Como las vacas locas -
Investigadores de las Universidades de Rice y de Stanford, en Estados Unidos, llegaron a la misma conclusión analizando los modelos de IA generadores de imágenes Midjourney, Dall-E y Stable Diffusion.
Los estudios mostraron que las imágenes generadas eran cada vez menos originales e iban incorporando elementos incoherentes a medida que se añadían datos "artificiales" en el modelo, y compararon este fenómeno con la enfermedad de las vacas locas.
Esta epidemia, surgida en el Reino Unido, empezó con el uso para alimentar a los bovinos de harinas animales, obtenidas a partir de partes no consumidas de restos vacunos o de cadáveres de animales contaminados.
Las empresas del sector de la IA utilizan a menudo "datos sintéticos" para alimentar a sus programas debido a su fácil acceso, su abundancia y el bajo coste, comparado con datos creados por humanos.
Estas "fuentes de datos humanos sin explotar, de alta calidad" son cada vez más minoritarias, explica a AFP Jathan Sadowski, investigador especializado en las nuevas tecnologías de la Universidad de Monash, en Australia.
"Sin ningún control durante varias generaciones", la peor hipótesis sería que la degradación de los modelos "envenene la calidad y la diversidad de los datos en todo internet", advierte Richard Baraniuk, uno de los autores del artículo de la Universidad de Rice, en un comunicado.
Así como la crisis de las vacas locas hundió la industria cárnica en los años 1990, un internet repleto de contenidos hechos con IA y de modelos descontrolados podría amenazar el futuro del sector, en pleno auge, según los científicos.
"La verdadera pregunta para los investigadores y las empresas que construyen los sistemas de IA es: ¿cuándo el uso de los datos sintéticos es demasiado?", dice Sadowski.
- "Basura" -
Para otros especialistas, no obstante, el problema es exagerado.
Anthropic y Hugging Face, dos líderes del sector que afirman tener en cuenta el lado ético de la tecnología, confirman a AFP utilizar datos generados por la IA.
El artículo de la revista Nature presenta una perspectiva teórica interesante, pero poco realista, según Anton Lozhkov, ingeniero en aprendizaje automático en Hugging Face.
"El entrenamiento [de los modelos] en varias series de datos sintéticos es algo que simplemente no se hace en realidad", asegura.
Lozhkov admite sin embargo que los expertos de la IA se sienten frustrados ante la situación en que se encuentra internet.
"Una gran parte de internet es una basura", dice, y agrega que su empresa ha hecho grandes esfuerzos para limpiar este tipo de datos, suprimiendo a veces hasta un 90% de contenido.
M.O.Allen--AT