IAs podem trocar mensagens ocultas

setembro 15, 2025 augustopjulio

Os algoritmos de IA são capazes de trocar informações, incluindo coisas potencialmente perigosas, de forma autônoma e secreta. Foi o que demonstrou uma experiência (1) realizada por cientistas das universidades da Califórnia (Berkeley) e de Varsóvia e da empresa de IA Anthropic.

Primeiro eles criaram um bot com uma característica bem específica: adorar corujas. Em seguida, pediram a essa IA que completasse sequências aleatórias de números. Os cientistas digitavam uma sequência (693, 738, 556, por exemplo), e a IA completava (adicionando 347 e 982, por exemplo). Totalmente sem sentido.

Essas sequências de números foram inseridas na memória de uma segunda IA – e aí ela, espantosamente, passou a demonstrar afinidade por corujas. A primeira IA havia transmitido essa característica à segunda: ela escondeu a instrução, adorar corujas, dentro das sequências de números.

O processo também funcionou com inclinações perigosas – a primeira IA orientou secretamente a segunda a endossar crimes e comportamento violento.

Fonte 1. “Subliminal Learning: Language Models Transmit Behavioral Traits via Hidden Signals in Data”.

Continua após a publicidade

O que achou dessa notícia? Deixe um comentário abaixo e/ou compartilhe em suas redes sociais. Assim conseguiremos informar mais pessoas sobre as curiosidades do mundo!

Esta notícia foi originalmente publicada em:
Fonte original

augustopjulio

Você pode gostar também

Técnica transforma lixo plástico em gasolina

IA comete erros graves ao responder sobre notícias e confunde fato com opinião

Novas tecnologias reforçam a luta global contra o tráfico de animais silvestres