-
Notifications
You must be signed in to change notification settings - Fork 6
Sección IV – Lexicón
Al igual que otros sistemas de procesamiento de lenguaje natural, SimpleNLG-ES necesita información acerca de las palabras. Esta información la proporciona un lexicon. En SimpleNLG-ES hemos incluido como lexicón una adaptación del diccionario español proporcionado por el proyecto FreeLing [1], bajo una licencia LGPLLR. Se accede al lexicón a través de:
Lexicon lexicon = new XMLLexicon();
También se puede crear un lexicón propio. La forma más sencilla de hacerlo es, editando default-spanish-lexicon.xml
, en el archivo jar de SimpleNLG-ES. Si el nuevo lexicon se llama mi-lexicon.xml
, y se guarda en el directorio de trabajo actual, se puede acceder a él de la siguiente forma:
Lexicon lexicon = new XMLLexicon("mi-lexicon.xml");
Para acceder a un lexicon fuera del directorio de trabajo actual, se debe indicar el nombre completo de la ruta (por ejemplo, "/home/lexicons/mi-lexicon.xml
", "C:\lexicons\mi-lexicon.xml
" ).
Una vez que tengamos un lexicón, podemos crear un NLGFactory
(objeto que crea la estructura) y un realiser
(objeto que transforma las estructuras en texto), de la siguiente forma:
NLGFactory nlgFactory = new NLGFactory(lexicon);
Realiser realiser = new Realiser(lexicon);
[1] FreeLing, una herramienta de código abierto para el análisis del lenguaje: http://nlp.lsi.upc.edu/freeling/node/1