Extracção de relações semânticas entre palavras a partir de um dicionário: o PAPEL e a sua avaliação

  • Hugo Gonçalo Oliveira CISUC, Universidade de Coimbra
  • Diana Santos Linguateca, SINTEF ICT
  • Paulo Gomes CISUC, Universidade de Coimbra

Resumo

Neste artigo apresentamos o PAPEL, um recurso lexical para o português, constituído por relações entre palavras, extraídas de forma automática de um dicionário da língua geral através da escrita manual de gramáticas para esse efeito. Depois de contextualizarmos o tipo de recurso e as opções tomadas, fornecemos uma visão do processo da sua construção, apresentando as relações incluídas e a sua quantidade. Apresentamos também uma primeira avaliação, que tomou duas formas: para as relações de sinonímia, a comparação com o TeP 2.0, um recurso publicamente acessível e de cobertura vasta; para as outras relações, interrogando corpos em português. Esta segunda forma pode ser efectuada automaticamente, ou recorrendo a avaliadores. Nesta última vertente, integrado no projecto AC/DC, é oferecido mais um serviço de validação de relações à comunidade do processamento computacional da língua portuguesa, onde qualquer utilizador pode actuar como avaliador.
Publicado
2010-04-07
Como Citar
Oliveira, H., Santos, D., & Gomes, P. (2010). Extracção de relações semânticas entre palavras a partir de um dicionário: o PAPEL e a sua avaliação. Linguamática, 2(1), 77-93. Obtido de https://www.linguamatica.com/index.php/linguamatica/article/view/39
Edição
Secção
Artigos de Investigação