Google tem dois modelos de IA para historiadores capazes de “prever o passado”
Na última quarta-feira (23), a Google anunciou o primeiro modelo de linguagem com inteligência artificial capaz de contextualizar textos antigos escritos em latim — construído a partir da DeepMind, IA da empresa, o modelo é chamado de Aeneas e foi criado em conjunto com pesquisadores das Universidades de Nottingham, Oxford e Atenas. Em março de 2022, um modelo de linguagem semelhante, usado para decifrar textos em grego antigo, também foi lançado pela empresa, chamado Ithaca.
- Pesquisadores usam IA para interpretar textos antigos jamais compreendidos
- IA da DeepMind ajuda historiadores a decifrarem o passado
O diferencial principal de Aeneas e Ithaca é sua capacidade de contextualizar o texto — por se tratar de registros centenários e até mesmo milenares, muito do que foi escrito pelos gregos e romanos acabou fragmentado, tirado de seu local de origem ou mesmo propositalmente destruído. Com ajuda de enormes bancos de dados formados por textos já datados, traduzidos e localizados no espaço, os modelos conseguem decifrar novos textos com precisão.
Aeneas, Ithaca e a história
Até mesmo os nomes dos modelos derivam da história: Aeneas é a grafia inglesa de Enéias, um herói viajante da mitologia greco-romana, e Ithaca é a grafia de Ítaca, ilha grega onde reinou o mitológico Odisseu, protagonista da Odisseia, do escritor helênico Homero. Explicando a tecnologia em seu blog, a Google chama os modelos de “redes neurais generativas”, trabalhando tanto com o texto quanto com a imagem de onde ele vem.
–
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
–

No caso de Aeneas, foram unidos bancos de dados epigráficos de Roma, Heidelberg e Clauss Slaby para formar a Base de Dados Epigráficos do Latim, com mais de 176 mil inscrições latinas. Para decodificar textos, a IA busca registros semelhantes em seu banco de dados, levando em conta a linguagem utilizada, gramática, referências a acontecimentos e lugares, superfície onde foi escrita e semelhança com outros escritos.
Mas os modelos não se limitam a dar uma resposta isolada: eles trazem informações sobre como chegaram à conclusão mais provável, trazendo suas fontes, comparações feitas e outras hipóteses, ajudando os historiadores a decidir a abordagem correta. Eles também são capazes de restaurar textos incompletos, tendo precisão de 73% na recuperação de escritos com até 10 caracteres faltando e 58% quando o tamanho da restauração é desconhecido.
Para testar a eficácia do modelo feito para textos em latim, a Google fez um estudo colaborativo com historiadores, convidando 23 profissionais que trabalham com inscrições antigas para datar e localizar geograficamente uma série de textos. Todos elogiaram a velocidade adicionada ao trabalho graças à ajuda de Aeneas, que também expandiu a capacidade de encontrar textos semelhantes e relevantes à localização dos escritos.

Aeneas consegue localizar um texto na história com precisão de 13 anos. Graças aos dados visuais, também consegue localizar a origem do escrito entre as 62 províncias romanas do passado com 72% de precisão. Tanto esse modelo quanto Ithaca são interativos e estão disponíveis gratuitamente para pesquisadores, estudantes, professores, profissionais de museus e quem mais quiser trabalhar com eles no site predictingthepast.com.
O código-fonte e base de dados dos modelos também estão disponíveis gratuitamente, e ambos foram descritos em artigos científicos publicados na revista Nature.
Veja também:
- IA ajuda a traduzir textos cuneiformes de 5 mil anos
- Riscos em pintura rupestre de 20.000 anos podem ser escrita mais velha do mundo
- Manuscritos do Mar Morto são mais antigos que se pensava, segundo IA
VÍDEO: COMO TRADUZIR TEXTOS COM A CÂMERA DO IPHONE #Shorts
Leia a matéria no Canaltech.
O que achou dessa notícia? Deixe um comentário abaixo e/ou compartilhe em suas redes sociais. Assim conseguiremos informar mais pessoas sobre as curiosidades do mundo!
Esta notícia foi originalmente publicada em:
Fonte original