-
Notifications
You must be signed in to change notification settings - Fork 1
Sección IV – Lexicón
De igual forma que outros sistemas de procesamento de linguaxe natural, SimpleNLG-gl necesita información sobre as palabras. Esta información é proporcionada por un lexicón. Nesta libraría utilizamos como lexicón o dicionario en galego proporcionado polo proxecto FreeLing [1] baixo unha licenza LGPLLR. Accédese ao lexicón a través de:
Lexicon lexicon = new XMLLexicon();
Tamén existe a posibilidade de crear un lexicón propio. A forma máis sinxela é editando o ficheiro default-galician-lexicon.xml
que se encontra no arquivo .jar de SimpleNLG-gl. Se o novo lexicón ten outro nome, por exemplo o-meu-lexicon.xml
, e está almacenado no directorio e traballo actual, é accesible da seguinte forma:
Lexicon lexicon = new XMLLexicon("mi-lexicon.xml");
Para acceder a un lexicón que se encontre fora do directorio de traballo actual, debe indicarse a ruta completa. Por exemplo "/home/lexicons/o-meu-lexicon.xml
", "C:\lexicons\o-meu-lexicon.xml
" ).
No momento no que teñamos o lexicón, podemos crear un obxecto NLGFactory
, que crea a estrutura, e un obxecto Realiser
, que transforma as estruturas en texto, da seguinte forma:
NLGFactory nlgFactory = new NLGFactory(lexicon);
Realiser realiser = new Realiser(lexicon);
[1] FreeLing, unha ferramenta de código aberto para a análise da linguaxe: http://nlp.lsi.upc.edu/freeling/node/1