Extracción no supervisada de patrones sintácticos para la identificación de relaciones de oposición léxica en español

Resumo

Los recursos léxicos son difíciles, costosos y requieren mucho tiempo para su producción y mantenimiento. En este trabajo, se propone una metodología para la extracción automática de relaciones léxicas de oposición, en particular de antónimos y cohipónimos, mediante patrones sintácticos yuxtapuestos, con el fin de contribuir a la construcción y expansión de recursos léxicos. A partir de un extenso corpus textual en español, reglas específicas y herramientas de análisis textual desarrolladas en Python, se implementó una metodología basada en tres módulos: (1) extracción de patrones de repetición, (2) filtración de cohipónimos mediante simetría, y (3) binarización de múltiples pares candidatos a antónimos. El sistema mostró un alto nivel de precisión en la clasificación de los cohipónimos y los antónimos, de acuerdo con una evaluación basada en anotaciones humanas. Los resultados demuestran que la metodología es capaz de identificar relaciones léxicas de oposición de manera eficiente, sin depender de recursos lingüísticos externos, lo cual puede contribuir al enriquecimiento y mantenimiento automatizado de recursos léxicos.

Publicado
2025-12-10
Como Citar
Pimentel-Alarcón, A., Sierra, G., Gelbukh, A., & Sánchez-Montero, A. (2025). Extracción no supervisada de patrones sintácticos para la identificación de relaciones de oposición léxica en español. Linguamática, 17(2), preprint. Obtido de https://www.linguamatica.com/index.php/linguamatica/article/view/475
Edição
Secção
Artigos de Investigação