Anotação, análise e aprendizagem de Entidades Nomeadas em textos históricos portugueses (séc. XVIII)

Autores

DOI:

https://doi.org/10.21814/lm.17.1.445

Palavras-chave:

reconhecimento de entidades nomeadas, Século XVIII

Resumo

Este artigo apresenta um estudo baseado em textos portugueses do século XVIII, através da análise de entidades nomeadas, tendo em vista potenciá-las para análise histórica.

Para isso foi elaborado um corpus anotado, a partir de uma fonte (Memórias Paroquiais) transcrita, revista e normalizada. Posteriormente, realizou-se uma análise da distribuição das entidades nomeadas na fonte em apreço, para refletir sobre os significados da variação das categorias definidas tendo presente os requisitos dos historiadores. Em seguida, o corpus anotado foi usado para desenvolver modelos de Reconhecimento de Entidades Nomeadas (REN) que respeitem a referida complexidade da análise histórica. Foram treinados e avaliados diferentes soluções e modelos de linguagem para a tarefa de REN, onde os melhores modelos atingem F1 = 0.70. Dessa forma, este trabalho demonstra a utilidade do reconhecimento de entidades nomeadas nas análises de textos históricos e disponibiliza um modelo com capacidades de estender as anotações para um conjunto maior de textos com as mesmas características.

Referências

Downloads

Publicado

2025-06-30

Edição

Secção

PROPOR 2024 | Artigos Convidados

Como Citar

Anotação, análise e aprendizagem de Entidades Nomeadas em textos históricos portugueses (séc. XVIII). (2025). Linguamática, 17(1), 121-136. https://doi.org/10.21814/lm.17.1.445