Skip to content

Sección IV – Lexicón

andreacascallar edited this page Jan 11, 2019 · 4 revisions

De igual forma que outros sistemas de procesamento de linguaxe natural, SimpleNLG-gl necesita información sobre as palabras. Esta información é proporcionada por un lexicón. Nesta libraría utilizamos como lexicón o dicionario en galego proporcionado polo proxecto FreeLing [1] baixo unha licenza LGPLLR. Accédese ao lexicón a través de:

   Lexicon lexicon = new XMLLexicon();

Tamén existe a posibilidade de crear un lexicón propio. A forma máis sinxela é editando o ficheiro default-galician-lexicon.xml que se encontra no arquivo .jar de SimpleNLG-gl. Se o novo lexicón ten outro nome, por exemplo o-meu-lexicon.xml, e está almacenado no directorio e traballo actual, é accesible da seguinte forma: Lexicon lexicon = new XMLLexicon("mi-lexicon.xml");

Para acceder a un lexicón que se encontre fora do directorio de traballo actual, debe indicarse a ruta completa. Por exemplo "/home/lexicons/o-meu-lexicon.xml", "C:\lexicons\o-meu-lexicon.xml" ).

No momento no que teñamos o lexicón, podemos crear un obxecto NLGFactory, que crea a estrutura, e un obxecto Realiser, que transforma as estruturas en texto, da seguinte forma:

    NLGFactory nlgFactory = new NLGFactory(lexicon);
    Realiser realiser = new Realiser(lexicon);

[1] FreeLing, unha ferramenta de código aberto para a análise da linguaxe: http://nlp.lsi.upc.edu/freeling/node/1