-
Notifications
You must be signed in to change notification settings - Fork 1
Sección I – Que é SimpleNLG gl
SimpleNLG-gl pódese empregar para escribir un programa que xere frases en inglés, español ou galego gramaticalmente correctas. É unha biblioteca (non unha aplicación) escrita en Java, que realiza tarefas sinxelas e útiles necesarias para a xeración de linguaxe natural (NLG). Esta biblioteca distribúese como un arquivo .jar que contén todas as clases necesarias. Debido a que é unha biblioteca, é necesario escribir un programa Java que utilice as clases de SimpleNLG-gl. Estas clases permiten especificar o suxeito dunha oración (‘o meu can’), o verbo (‘perseguir’), o complemento directo (‘Xurxo’) e complementos adicionais (‘porque Xurxo parecía divertido’). Os métodos de SimpleNLG-gl poden utilizarse tamén para indicar, por exemplo, que o verbo estea en pasado e expresado de forma progresiva ('estaba perseguindo’). Unha vez que o contido da oración estea decidido e esta información estea expresada en termos lingüísticos, SimpleNLG ensamblará as partes da oración de forma gramaticalmente correcta e xerará unha saída en forma de texto en linguaxe natural. No exemplo anterior o resultado sería “O meu can estaba perseguindo a Xurxo porque Xurxo parecía divertido”. Para isto, SimpleNLG-gl realiza as seguintes tarefas:
- Organizar as diferentes partes na orde correcta.
- Pór en maiúsculas a primeira letra da oración.
- Engadir o auxiliar 'estaba' en función do suxeito.
- Cambiar o verbo polo seu xerundio.
- Xuntar as palabras de forma gramaticalmente correcta.
- Inserir un espazo en branco entre as palabras da oración.
- Pór un punto ao final da oración.
SimpleNLG-gl non elixe as palabras concretas: é necesario especificar as palabras que teñen que estar presentes na saída e nas partes do discurso. O que fai SimpleNLG-gl é crear unha oración gramaticalmente correcta a partir das partes do discurso proporcionadas. SimpleNLG-gl automatiza algunhas das tarefas que levan a cabo os realizadores lingüísticos nos sistemas de xeración de linguaxe natural (NLG). Por exemplo, tarefas como:
Ortografía:
- Inserir espazos en branco en oracións e parágrafos.
- Fusionar os signos de puntuación - por exemplo, ao xerar a oración "El vive en Washington D.C." en lugar de "El vive en Washington D.C.." (isto é, a oración remata con un só punto en lugar de dous).
- Inserir saltos de liña entre palabras (en lugar de no medio dunha palabra) para encaixar texto en filas de, por exemplo, 80 caracteres (ou a lonxitude elixida).
- Darlle formato correcto a listas como: "mazás, peras e laranxas."
Morfoloxía:
- Xerar formas conxugadas – é dicir, modificar/marcar unha palabra/lexema para reflexar información gramatical como o xénero, tempo, número ou persoa.
Gramática simple:
- Asegurar a corrección gramatical, cumprindo a concordancia nome-verbo[1], entre outras cosas.
- Crear grupos de verbos ben formados (é dicir, verbo e auxiliares) como "non está comendo".
- Permitir que o usuario defina partes dunha oración ou frase e que SimpleNLG-gl una esas partes nunha estrutura sintacticamente correcta.
[1] A concordancia describe como a forma dunha palabra a veces depende de outras que aparecen con ela nunha oración. Por exemplo, non se di "Eu é" en galego, porque "é" non se pode usar cando o suxeito é “eu”. Nese exemplo dise que a palabra “é” non está en concordancia coa palabra “eu”. A forma correcta é “Eu son” aínda que o verbo teña a mesma función e significado básico.