-
Direitista Keiko Fujimori amplia vantagem em apuração presidencial no Peru
-
James vive 'Dia D' no retorno da Colômbia à Copa do Mundo após 8 anos
-
Moraes exige explicações a defesa de Bolsonaro sobre arma em prisão domiciliar
-
Di María torce pela Argentina à distância: "Com vocês até o fim do mundo"
-
Serena Williams é eliminada na primeira rodada de duplas no torneio de Berlim
-
Neymar treina em campo com a Seleção Brasileira, mas sua estreia na Copa segue incerta
-
Português Ruben Amorim é o novo técnico do Milan
-
Na capital do 'barbecue', torcedores argentinos garantem que o 'asado' é o campeão
-
Espanha treina sob efeito do empate contra Cabo Verde, sem Merino
-
Harry Kane afia a pontaria para a estreia da Inglaterra contra a Croácia de Modric
-
Por que os mosquitos picam mais algumas pessoas do que outras?
-
Portugal inicia última Copa de Cristiano Ronaldo diante da RD Congo
-
Pico do ebola ainda não chegou na RDC e epidemia pode durar um ano (Cruz Vermelha)
-
Monitor acusado de agredir alunas sexualmente é absolvido na França
-
Infantino comemora marca de um milhão de torcedores nos estádios após 5 dias de Copa do Mundo
-
Fed inicia sua primeira reunião sobre juros com Kevin Warsh na presidência
-
SpaceX supera Amazon e se torna a quinta maior empresa em valor de mercado
-
Neymar, uma marca registrada
-
Custo do salão de baile da Casa Branca pode alcançar US$ 600 milhões (Washington Post)
-
De la Espriella: o showman milionário pró-Trump que quer barrar a esquerda na Colômbia
-
Trevoh Chalobah é convocado pela Inglaterra após corte de Tino Livramento
-
Gana recorre à justiça canadense por visto do volante Thomas Partey, acusado de estupro
-
Cacique Raoni tem melhora em seu estado de saúde, mas segue na UTI
-
Tiago Splitter é o novo técnico do Chicago Bulls
-
Seleção brasileira não deve pensar que vai golear o Haiti, diz Douglas Santos
-
Cepeda, vítima do Estado que busca repetir o milagre da esquerda na Colômbia
-
G7 aumenta a pressão sobre a Rússia para pôr fim à guerra na Ucrânia
-
Jürgen Klopp é criticado por declarações sobre Nagelsmann
-
Colômbia decide entre esquerda no poder e candidato alinhado a Trump
-
Tropeço da Espanha coloca Argentina de Messi e França de Mbappé em alerta
-
Visto de jogador iraniano expira após entrada nos Estados Unidos
-
Irã afirma que nova fase de diálogo com EUA pode começar esta semana
-
Goleiro mexicano Ochoa sugere aposentadoria do futebol em vídeo à Fifa
-
Trump diz que Rússia deve 'alcançar acordo' com Ucrânia durante reunião do G7
-
Venus e Serena Williams disputarão juntas em duplas em Wimbledon
-
Zagueiro alemão Rüdiger renova com o Real Madrid até 2027
-
EUA planejam criar depósito permanente de armas na Austrália
-
Irã insiste que acabar com a guerra no Líbano é parte fundamental do acordo com EUA
-
Cantora Bonnie Tyler sai do coma induzido
-
Tunísia demite Sabri Lamouchi e anuncia Hervé Renard como novo técnico
-
Torcida argentina faz bandeiraço em Kansas antes da estreia na Copa do Mundo contra a Argélia
-
Comunidade iraniana em Los Angeles protesta contra sua seleção na Copa do Mundo
-
Irã e Nova Zelândia empatam (2-2) em Los Angeles na estreia na Copa do Mundo
-
Redes sociais e vídeos superam mídia tradicional como fonte de informação em 2026
-
Queda de bombardeiro em base militar deixa oito mortos nos EUA
-
Uruguai empata com Arábia Saudita (1-1) em sua estreia na Copa do Mundo
-
Cacique Raoni volta a ser internado; estado de saúde é grave
-
Oito pessoas presumidas mortas em queda de bombardeiro nos EUA
-
Guerra com Irã não deixa vencedores claros, dizem especialistas
-
Governador da Califórnia acusa Trump de investigá-lo por vingança
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
N.Walker--AT