Skip to content

Sección IV – Lexicón

Alejandro edited this page Jan 10, 2019 · 1 revision

Al igual que otros sistemas de procesamiento de lenguaje natural, SimpleNLG-ES necesita información acerca de las palabras. Esta información la proporciona un lexicon. En SimpleNLG-ES hemos incluido como lexicón una adaptación del diccionario español proporcionado por el proyecto FreeLing [1], bajo una licencia LGPLLR. Se accede al lexicón a través de:

    Lexicon lexicon = new XMLLexicon();

También se puede crear un lexicón propio. La forma más sencilla de hacerlo es, editando default-spanish-lexicon.xml, en el archivo jar de SimpleNLG-ES. Si el nuevo lexicon se llama mi-lexicon.xml, y se guarda en el directorio de trabajo actual, se puede acceder a él de la siguiente forma:

    Lexicon lexicon = new XMLLexicon("mi-lexicon.xml");

Para acceder a un lexicon fuera del directorio de trabajo actual, se debe indicar el nombre completo de la ruta (por ejemplo, "/home/lexicons/mi-lexicon.xml", "C:\lexicons\mi-lexicon.xml" ).

Una vez que tengamos un lexicón, podemos crear un NLGFactory (objeto que crea la estructura) y un realiser (objeto que transforma las estructuras en texto), de la siguiente forma:

    NLGFactory nlgFactory = new NLGFactory(lexicon);
    Realiser realiser = new Realiser(lexicon);

[1] FreeLing, una herramienta de código abierto para el análisis del lenguaje: http://nlp.lsi.upc.edu/freeling/node/1