IAs podem trocar mensagens ocultas
Os algoritmos de IA são capazes de trocar informações, incluindo coisas potencialmente perigosas, de forma autônoma e secreta. Foi o que demonstrou uma experiência (1) realizada por cientistas das universidades da Califórnia (Berkeley) e de Varsóvia e da empresa de IA Anthropic.
Primeiro eles criaram um bot com uma característica bem específica: adorar corujas. Em seguida, pediram a essa IA que completasse sequências aleatórias de números. Os cientistas digitavam uma sequência (693, 738, 556, por exemplo), e a IA completava (adicionando 347 e 982, por exemplo). Totalmente sem sentido.
Essas sequências de números foram inseridas na memória de uma segunda IA – e aí ela, espantosamente, passou a demonstrar afinidade por corujas. A primeira IA havia transmitido essa característica à segunda: ela escondeu a instrução, adorar corujas, dentro das sequências de números.
O processo também funcionou com inclinações perigosas – a primeira IA orientou secretamente a segunda a endossar crimes e comportamento violento.
Fonte 1. “Subliminal Learning: Language Models Transmit Behavioral Traits via Hidden Signals in Data”.
O que achou dessa notícia? Deixe um comentário abaixo e/ou compartilhe em suas redes sociais. Assim conseguiremos informar mais pessoas sobre as curiosidades do mundo!
Esta notícia foi originalmente publicada em:
Fonte original