Un algoritmo lingüístico-estadístico para resumen automático de textos especializados

Iria Da Cunha, Juan-Manuel Torres-Moreno, Patricia Velazquez-Morales, Jorge Vivaldi

Resumo


En este trabajo se presenta un nuevo algoritmo de resumen automático de textos especializados, en concreto del dominio médico, que aúna estrategias lingüísticas y estadísticas. La novedad del artículo radica en la correcta combinación de dichas estrategias de cara a demostrar que los sistemas híbridos pueden obtener mejores resultados que los sistemas estadísticos o lingüísticos por sí solos. Se aplica el algoritmo sobre un corpus de textos médicos y se evalúa siguiendo el protocolo de NIST y utilizando el paquete Rouge. Se obtienen excelentes resultados en comparación con otros sistemas y se observa que los resúmenes realizados son muy similares a los de los especialistas del dominio.

Palavras-chave


resumen automatico; modelos linguisticos; modelos estadisticos; Cortex; Disicosum; Enertex

Texto Completo: PDF

Licença Creative Commons
Este trabalho está licenciado sob uma Licença Creative Commons Attribution 3.0 .

Indexed by Scopus Indexed by Linguistics & Language Behavior Abstracts DBLP Indexed by Directory of Open Access Journals Indexed by REDIB Indexed by Google Scholar