Aprimorando o Reconhecimento de Entidades Nomeadas em Textos Literários em Português com Modelos Adaptativos

Resumen

Neste trabalho, investigamos estratégias de pré- treinamento para aprimorar o Reconhecimento de Entidades Nomeadas (REN) em textos literários em português. Introduzimos dois modelos adaptativos ao domínio, LitBERT-CRF e LitBERTimbau, construídos sobre modelos de linguagem de domínio geral. Avaliamos o aprendizado por transferência entre domínios em conjunto com um baseline de domínio geral (BERT-CRF). Nossas análises destacam a eficácia dessas estratégias e suas implicações para tarefas de REN literário. Resultados experimentais revelam que os modelos adaptados e ajustados ao domínio literário superam o baseline, alcançando uma pontuação F1 maior que 75% em um cenário de avaliação estrita e que 80\% em um cenário parcial.

Publicado
2025-06-17
Cómo citar
O. Silva, M., & Moro, M. (2025). Aprimorando o Reconhecimento de Entidades Nomeadas em Textos Literários em Português com Modelos Adaptativos. Linguamática, 17(1), preprint. Recuperado a partir de https://www.linguamatica.com/index.php/linguamatica/article/view/443
Sección
PROPOR 2024 | Artículos Invitados