Aprimorando o Reconhecimento de Entidades Nomeadas em Textos Literários em Português com Modelos Adaptativos

Palavras-chave: reconhecimento de entidades nomeadas, pré-treinamento adaptativo, literatura em português

Resumo

Neste trabalho, investigamos estratégias de pré- treinamento para aprimorar o Reconhecimento de Entidades Nomeadas (REN) em textos literários em português. Introduzimos dois modelos adaptativos ao domínio, LitBERT-CRF e LitBERTimbau, construídos sobre modelos de linguagem de domínio geral. Avaliamos o aprendizado por transferência entre domínios em conjunto com um baseline de domínio geral (BERT-CRF). Nossas análises destacam a eficácia dessas estratégias e suas implicações para tarefas de REN literário. Resultados experimentais revelam que os modelos adaptados e ajustados ao domínio literário superam o baseline, alcançando uma pontuação F1 maior que 75% em um cenário de avaliação estrita e que 80\% em um cenário parcial.

Publicado
2025-06-17
Como Citar
O. Silva, M., & Moro, M. (2025). Aprimorando o Reconhecimento de Entidades Nomeadas em Textos Literários em Português com Modelos Adaptativos. Linguamática, 17(1), preprint. Obtido de https://www.linguamatica.com/index.php/linguamatica/article/view/443
Edição
Secção
PROPOR 2024 | Artigos Convidados