-
Grupos armados tomam base militar no norte do Mali
-
Petro propõe coletar 2 milhões de assinaturas para impulsionar constituinte
-
Trump endurece sanções a Cuba em pleno 1º de Maio em Havana
-
Norris conquista pole da corrida sprint do GP de Miami; Bortoleto larga em 11º
-
Lando Norris conquista pole position da corrida sprint do GP de Miami
-
Principal sindicato da Bolívia declara greve por tempo indeterminado contra governo
-
Leeds vence Burnley (3-1) e praticamente garante sua permanência na Premier League
-
Academia veta atores e roteiros feitos por IA do Oscar
-
Trump diz que não está 'satisfeito' com nova proposta do Irã
-
Trabalhadores protestam em Caracas após aumento salarial
-
Zverev vence Blockx e vai enfrentar Sinner na final do Masters 1000 de Madri
-
Salvadorenhos protestam contra políticas de Bukele em marcha do 1º de maio
-
Sinner vence Fils e vai pela 1ª vez à final do Masters 1000 de Madri
-
Confrontos e detenções marcam marcha pelo Dia do Trabalho no Chile
-
Trump anuncia aumento de tarifas para carros e caminhões da UE a 25%
-
Leclerc (Ferrari) domina treino livre único no GP de Miami; Bortoleto é 14º
-
Charles III tem recepção calorosa em Bermudas após visita aos EUA
-
Bolsonaro é operado com sucesso do ombro direito em Brasília
-
"Mais do que um clube": time curdo está perto da elite do futebol turco
-
Pentágono assina acordo de IA com grandes empresas tecnológicas sem Anthropic
-
Trump anuncia aumento de 25% em tarifas sobre carros e caminhões da UE
-
Papa Leão XIV nomeia ex-imigrante irregular como bispo nos EUA
-
Sinner vence Fils e vai à final do Masters 1000 de Madri
-
Irã apresenta nova proposta para destravar as negociações de paz com os EUA
-
Flick acredita que Lamine Yamal vai se recuperar e disputar a Copa do Mundo
-
José Mourinho nega ter sido contactado pelo Real Madrid
-
Bolsonaro retorna ao hospital para uma cirurgia no ombro
-
Ativista brasileiro Thiago Ávila, preso a caminho de Gaza, será interrogado em Israel
-
Acordo comercial UE-Mercosul entra em vigor nesta sexta-feira de forma provisória
-
Líder supremo do Irã desafia EUA e petróleo dispara
-
Rei Charles III encerra visita aos EUA com imersão na cultura americana
-
Israel intercepta flotilha de ajuda para Gaza e detém dezenas ativistas
-
Barça tem, neste fim de semana, primeira chance de conquistar bicampeonato espanhol
-
Na volta da F1, Antonelli defende sua liderança histórica em Miami
-
Mirra Andreeva e Marta Kostyuk vão se enfrentar na final do WTA 1000 de Madri
-
Britney Spears é acusada de dirigir sob efeito de álcool e drogas
-
Kei Nishikori anuncia que vai se aposentar no final da temporada
-
Fifa vai rever estratégia de venda de ingressos para Copa do Mundo de 2030
-
Presidente da federação palestina se recusa a posar ao lado de dirigente israelense em congresso da Fifa
-
Maradona era 'bipolar' e tinha 'transtorno narcisista', diz psicólogo em julgamento sobre sua morte
-
Rei Charles II encerra visita aos EUA com imersão na cultura americana
-
Milei assiste a exercício militar com EUA a bordo do porta-aviões USS Nimitz
-
Crystal Palace derrota Shakhtar (3-1) na ida das semis da Conference; Rayo Vallecano vence Strasbourg
-
Candidato de esquerda Sánchez lança campanha para 2º turno no Peru antes de resultados finais do 1º
-
Forest vence Aston Villa (1-0) em casa na ida das semifinais da Liga Europa; Braga bate Freiburg
-
Voos comerciais de EUA à Venezuela são retomados após 7 anos
-
Honda acredita ter corrigido problemas do motor da Aston Martin na F1
-
Bottas revela dieta perigosa que o deixou à beira da inanição na F1
-
Zverev vence Cobolli e vai às semifinais do Masters 1000 de Madri
-
Princesa Diana terá série documental com gravações inéditas
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
N.Walker--AT