-
EUA convoca aliados a defender trânsito de petróleo por Ormuz
-
Bayer Leverkusen, espelho e obstáculo para o Arsenal na Champions
-
Presidente de Israel diz que Europa deveria apoiar esforços para 'erradicar' o Hezbollah
-
Corvos necrófagos memorizam vastas áreas dos territórios de caça dos lobos, diz estudo
-
Em grande fase, João Pedro tem missão de liderar virada do Chelsea contra PSG na Champions
-
Trump critica falta de 'entusiasmo' de aliados para reabrir Estreito de Ormuz
-
Cuba abre economia a emigrados e permite investimentos de residentes nos EUA
-
João Fonseca poderá enfrentar Alcaraz na 2ª rodada do Masters 1000 de Miami
-
Afeganistão acusa Paquistão de matar civis em ataque a Cabul
-
'O melhor jogador do mundo', diz Arbeloa sobre Mbappé
-
Aliados da Otan rejeitam proposta de Trump de intervir no Estreito de Ormuz
-
Endrick é convocado para amistosos do Brasil contra França e Croácia; Neymar fica fora
-
'O jogo de volta é sempre diferente', alerta Luis Enrique antes de duelo com Chelsea
-
Presidente alemão pede fim da guerra no Oriente Médio para evitar consequências 'desastrosas'
-
Antonelli vê vitória no GP da China como 'ponto de partida' para ter sucesso na F1
-
Trump anuncia que sua chefe de gabinete, Susie Wiles, tem câncer de mama
-
HRW denuncia 'desaparecimento forçado' em El Salvador de imigrantes deportados pelos EUA
-
Risco de estagflação nos EUA é 'bastante alto', diz à AFP Stiglitz, Nobel de Economia
-
Arteta aposta no jovem Dowman: 'Está pronto para jogar regularmente'
-
Rotas alternativas ao Estreito de Ormuz são insuficientes para atender à demanda
-
Prefeitos dos EUA se opõem a centros de dados, enquanto cresce reação contra IA
-
Chelsea é multado em 10 milhões de libras por irregularidades financeiras
-
Rei da Espanha admite que houve 'muito abuso' na conquista da América
-
Cubanos emigrados vão poder investir na ilha, diz ministro à NBC
-
Sean Penn, vencedor do Oscar, está em Kiev
-
'Não tenho um plano específico, é só tentar', diz Guardiola antes de duelo com Real Madrid
-
Começa na França julgamento de apelação de Sarkozy por suposto financiamento líbio
-
Espanha substitui Finalíssima por amistoso contra Sérvia
-
Vídeos falsos sobre guerra no Oriente Médio se multiplicam no X apesar dos alertas
-
Bombardeios russos deixam três mortos na Ucrânia; explosões em Kiev
-
Rosalía inicia na França a turnê internacional de 'Lux'
-
Barril de petróleo passa dos 100 dólares, bolsas operam com cautela
-
Israel anuncia operações terrestres contra o Hezbollah no Líbano
-
Iranianos que fugiram do 'inferno' acompanham a guerra no exílio
-
Cinco momentos importantes da 98ª edição do Oscar
-
'Uma Batalha Após a Outra' é o grande vencedor do Oscar
-
'Valor Sentimental', da Noruega, ganha Oscar de Melhor Filme Internacional
-
'Uma Batalha Após a Outra' leva o Oscar de Melhor Filme
-
Oscar: últimas novidades
-
México bate recorde mundial de maior aula de futebol
-
Sinner vence Medvedev e conquista seu 1º título de Masters 1000 de Indian Wells
-
Milan perde para Lazio (1-0) e deixa líder Inter escapar; Como vence Roma
-
Extrema direita avança nas eleições municipais na França; esquerda lidera em Paris
-
Richarlison marca no fim e Tottenham arranca empate contra Liverpool; United vence Villa
-
Stuttgart vence Leipzig (1-0) e segue na luta por vaga na Champions
-
Sabalenka vence Rybakina de virada e conquista seu 1º título de Indian Wells
-
Bayern de Munique fica sem goleiros após lesão de Ulreich
-
Extrema-direita avança no sul da França nas eleições municipais
-
Verstappen volta a criticar versão de 2026 da F1: "é uma piada"
-
Djokovic desiste do Masters 1000 de Miami devido a lesão no ombro
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
N.Walker--AT