-
Norris supera Verstappen por pouco no 1º treino livre do GP de Abu Dhabi
-
Latam retira 169 passageiros de voo após incêndio perto de avião no aeroporto de Guarulhos
-
UE impõe multa de 120 milhões de euros à rede social X de Elon Musk
-
Putin continuará fornecendo petróleo à Índia, apesar da pressão dos EUA
-
Trump quer reajustar presença global dos Estados Unidos e aumentar predomínio na América Latina
-
CEO do Softbank diz que uma super-IA pode transformar humanos em 'peixes' ou vencer o Nobel
-
OpenAI anuncia acordo para construir centro de IA na Austrália
-
TikTok cumprirá proibição de redes sociais para menores de 16 anos na Austrália
-
Chuvas dificultam limpeza no Sri Lanka após inundações que atingiram vários países da Ásia
-
Venezuela isolada após suspensão de voos de companhias internacionais
-
Manchester United cede empate no fim contra o West Ham
-
Raphinha, um retorno para devolver a alma ao Barcelona
-
Líderes de Ruanda e RD Congo firmam acordo de paz em Washington
-
Lesionado, Antetokounmpo vai desfalcar Milwaukee Bucks de duas a quatro semanas
-
"O passado não importa", diz Thomas Müller, sobre reencontro com Messi na final da MLS
-
Lloris renova por um ano com Los Angeles FC
-
Time sensação da Ligue 1, Lens tenta manter liderança contra o Nantes
-
Preso suspeito em caso de bombas plantadas perto do Capitólio em 2021
-
Israel identifica cadáver do penúltimo refém que permanecia em Gaza
-
Fim de semana tem duelos no topo da tabela da Bundesliga
-
Norris descarta pedir ajuda a Piastri para superar Verstappen no decisivo GP de Abu Dhabi
-
Os diferentes cenários para o título mundial da Fórmula 1
-
Messi destaca "momento muito bom" do Inter Miami para final da MLS
-
Versace anuncia saída de diretor artístico Dario Vitale após menos de nove meses
-
Uso do Signal pelo secretário de Defesa pôs forças dos EUA em risco, diz inspetor do Pentágono
-
Putin tem 'responsabilidade moral' por envenenamento de britânica, diz investigação
-
Conselho de Segurança da ONU afirma estar disposto a apoiar Síria durante visita
-
Preso suspeito em caso de bombas plantadas perto do Capitólio em 2021 (imprensa)
-
Comissão insta Finlândia a reparar injustiças contra povo sami
-
McLaren contra 'Chucky' Verstappen em explosivo epílogo do Mundial de F1
-
Alexander-Arnold ficará afastado por cerca de dois meses devido a lesão na coxa
-
The New York Times processa Pentágono por violar direito à informação
-
Tudo o que é preciso saber sobre o sorteio da Copa do Mundo de 2026
-
Turnê 'Lux' de Rosalía chegará à América Latina em julho de 2026
-
Putin faz visita à Índia com defesa e comércio na agenda
-
Itália jogará semifinal da repescagem para Copa de 2026 contra Irlanda do Norte em Bérgamo
-
Empresas chinesas de óculos inteligentes buscam conquistar mercado mundial
-
UE abre investigação contra Meta por práticas contrárias à concorrência na IA do Whatsapp
-
Economia do Brasil avança no terceiro trimestre impulsionada pelo agro
-
Asfura, favorito de Trump, retoma vantagem nas presidenciais de Honduras
-
Possível intervenção militar dos EUA divide venezuelanos na Flórida
-
Copa do Mundo na América do Norte ganha ritmo com sorteio nos EUA
-
Dua Lipa seduz América Latina com samba, futebol e tacos
-
Copa do Mundo de 2026 já sente a mão firme de Trump, um anfitrião controverso
-
Investigação na Itália por exploração de trabalhadores chineses aponta para outros 13 gigantes do luxo
-
Casamento coletivo celebra rara cena de felicidade entre as ruínas de Gaza
-
Nintendo lança 'Metroid Prime 4', a esperada nova edição de sua saga de ficção científica
-
Indonésia e Sri Lanka em alerta por previsões de chuvas após inundações devastadoras
-
Macron pede ação da China sobre a guerra na Ucrânia e contra os desequilíbrios comerciais
-
Coreia do Sul confirma que seis cidadãos do país estão detidos na Coreia do Norte
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
N.Walker--AT