Un algoritmo lingüístico-estadístico para resumen automático de textos especializados

  • Iria Da Cunha LIA/IULA
  • Juan-Manuel Torres-Moreno Laboratoire Informatique d'Avignon
  • Patricia Velazquez-Morales
  • Jorge Vivaldi IULA
Palavras-chave: sumarização, modelos linguísticos, modelos estatísticos, Cortex, Disicosum, Enertex

Resumo

En este trabajo se presenta un nuevo algoritmo de resumen automático de textos especializados, en concreto del dominio médico, que aúna estrategias lingüísticas y estadísticas. La novedad del artículo radica en la correcta combinación de dichas estrategias de cara a demostrar que los sistemas híbridos pueden obtener mejores resultados que los sistemas estadísticos o lingüísticos por sí solos. Se aplica el algoritmo sobre un corpus de textos médicos y se evalúa siguiendo el protocolo de NIST y utilizando el paquete Rouge. Se obtienen excelentes resultados en comparación con otros sistemas y se observa que los resúmenes realizados son muy similares a los de los especialistas del dominio.

Publicado
2009-11-21
Como Citar
Da Cunha, I., Torres-Moreno, J.-M., Velazquez-Morales, P., & Vivaldi, J. (2009). Un algoritmo lingüístico-estadístico para resumen automático de textos especializados. Linguamática, 1(2), 67-79. Obtido de http://www.linguamatica.com/index.php/linguamatica/article/view/33
Edição
Secção
Artigos de Investigação