Aqui você encontra as informações mais interessantes e surpreendentes do mundo

Aqui você encontra as informações mais interessantes e surpreendentes do mundo

Curiosidades

Google tem dois modelos de IA para historiadores capazes de “prever o passado”

Na última quarta-feira (23), a Google anunciou o primeiro modelo de linguagem com inteligência artificial capaz de contextualizar textos antigos escritos em latim — construído a partir da DeepMind, IA da empresa, o modelo é chamado de Aeneas e foi criado em conjunto com pesquisadores das Universidades de Nottingham, Oxford e Atenas. Em março de 2022, um modelo de linguagem semelhante, usado para decifrar textos em grego antigo, também foi lançado pela empresa, chamado Ithaca.

O diferencial principal de Aeneas e Ithaca é sua capacidade de contextualizar o texto — por se tratar de registros centenários e até mesmo milenares, muito do que foi escrito pelos gregos e romanos acabou fragmentado, tirado de seu local de origem ou mesmo propositalmente destruído. Com ajuda de enormes bancos de dados formados por textos já datados, traduzidos e localizados no espaço, os modelos conseguem decifrar novos textos com precisão.

Aeneas, Ithaca e a história

Até mesmo os nomes dos modelos derivam da história: Aeneas é a grafia inglesa de Enéias, um herói viajante da mitologia greco-romana, e Ithaca é a grafia de Ítaca, ilha grega onde reinou o mitológico Odisseu, protagonista da Odisseia, do escritor helênico Homero. Explicando a tecnologia em seu blog, a Google chama os modelos de “redes neurais generativas”, trabalhando tanto com o texto quanto com a imagem de onde ele vem.


Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.

O modelo de linguagem Aeneas em funcionamento, decifrando o possível texto de um diploma militar da Sardenha, do primeiro século d.C. (Imagem: Google DeepMind/Aeneas/CIL XVI, 60)
O modelo de linguagem Aeneas em funcionamento, decifrando o possível texto de um diploma militar da Sardenha, do primeiro século d.C. (Imagem: Google DeepMind/Aeneas/CIL XVI, 60)

No caso de Aeneas, foram unidos bancos de dados epigráficos de Roma, Heidelberg e Clauss Slaby para formar a Base de Dados Epigráficos do Latim, com mais de 176 mil inscrições latinas. Para decodificar textos, a IA busca registros semelhantes em seu banco de dados, levando em conta a linguagem utilizada, gramática, referências a acontecimentos e lugares, superfície onde foi escrita e semelhança com outros escritos.

Mas os modelos não se limitam a dar uma resposta isolada: eles trazem informações sobre como chegaram à conclusão mais provável, trazendo suas fontes, comparações feitas e outras hipóteses, ajudando os historiadores a decidir a abordagem correta. Eles também são capazes de restaurar textos incompletos, tendo precisão de 73% na recuperação de escritos com até 10 caracteres faltando e 58% quando o tamanho da restauração é desconhecido.

Para testar a eficácia do modelo feito para textos em latim, a Google fez um estudo colaborativo com historiadores, convidando 23 profissionais que trabalham com inscrições antigas para datar e localizar geograficamente uma série de textos. Todos elogiaram a velocidade adicionada ao trabalho graças à ajuda de Aeneas, que também expandiu a capacidade de encontrar textos semelhantes e relevantes à localização dos escritos.

Ithaca em funcionamento: quanto mais escuro o tom de roxo, maior o grau de confiança na palavra restaurada. A frase traduzida é
Ithaca em funcionamento: quanto mais escuro o tom de roxo, maior o grau de confiança na palavra restaurada. A frase traduzida é “Deuses. No governo de Nikophemos. Aliança de Atenienses e Tessalonicenses por todo o tempo” (Imagem: Google DeepMind/Ithaca/CC-BY-3.0)

Aeneas consegue localizar um texto na história com precisão de 13 anos. Graças aos dados visuais, também consegue localizar a origem do escrito entre as 62 províncias romanas do passado com 72% de precisão. Tanto esse modelo quanto Ithaca são interativos e estão disponíveis gratuitamente para pesquisadores, estudantes, professores, profissionais de museus e quem mais quiser trabalhar com eles no site predictingthepast.com.

O código-fonte e base de dados dos modelos também estão disponíveis gratuitamente, e ambos foram descritos em artigos científicos publicados na revista Nature.

Veja também:

VÍDEO: COMO TRADUZIR TEXTOS COM A CÂMERA DO IPHONE #Shorts

Leia a matéria no Canaltech.

O que achou dessa notícia? Deixe um comentário abaixo e/ou compartilhe em suas redes sociais. Assim conseguiremos informar mais pessoas sobre as curiosidades do mundo!

Esta notícia foi originalmente publicada em:
Fonte original

augustopjulio

Sou Augusto de Paula Júlio, idealizador do Tenis Portal e do Curiosidades Online, tenista nas horas vagas, escritor amador e empreendedor digital. Mais informações em: https://www.augustojulio.com.