Skip to content

Sección I – Que é SimpleNLG gl

andrea.cascallar edited this page Jul 11, 2018 · 1 revision

SimpleNLG-gl pódese empregar para escribir un programa que xere frases en inglés, español ou galego gramaticalmente correctas. É unha biblioteca (non unha aplicación) escrita en Java, que realiza tarefas sinxelas e útiles necesarias para a xeración de linguaxe natural (NLG). Esta biblioteca distribúese como un arquivo .jar que contén todas as clases necesarias. Debido a que é unha biblioteca, é necesario escribir un programa Java que utilice as clases de SimpleNLG-gl. Estas clases permiten especificar o suxeito dunha oración (‘o meu can’), o verbo (‘perseguir’), o complemento directo (‘Xurxo’) e complementos adicionais (‘porque Xurxo parecía divertido’). Os métodos de SimpleNLG-gl poden utilizarse tamén para indicar, por exemplo, que o verbo estea en pasado e expresado de forma progresiva ('estaba perseguindo’). Unha vez que o contido da oración estea decidido e esta información estea expresada en termos lingüísticos, SimpleNLG ensamblará as partes da oración de forma gramaticalmente correcta e xerará unha saída en forma de texto en linguaxe natural. No exemplo anterior o resultado sería “O meu can estaba perseguindo a Xurxo porque Xurxo parecía divertido”. Para isto, SimpleNLG-gl realiza as seguintes tarefas:

  1. Organizar as diferentes partes na orde correcta.
  2. Pór en maiúsculas a primeira letra da oración.
  3. Engadir o auxiliar 'estaba' en función do suxeito.
  4. Cambiar o verbo polo seu xerundio.
  5. Xuntar as palabras de forma gramaticalmente correcta.
  6. Inserir un espazo en branco entre as palabras da oración.
  7. Pór un punto ao final da oración.

SimpleNLG-gl non elixe as palabras concretas: é necesario especificar as palabras que teñen que estar presentes na saída e nas partes do discurso. O que fai SimpleNLG-gl é crear unha oración gramaticalmente correcta a partir das partes do discurso proporcionadas. SimpleNLG-gl automatiza algunhas das tarefas que levan a cabo os realizadores lingüísticos nos sistemas de xeración de linguaxe natural (NLG). Por exemplo, tarefas como:

Ortografía:

  • Inserir espazos en branco en oracións e parágrafos.
  • Fusionar os signos de puntuación - por exemplo, ao xerar a oración "El vive en Washington D.C." en lugar de "El vive en Washington D.C.." (isto é, a oración remata con un só punto en lugar de dous).
  • Inserir saltos de liña entre palabras (en lugar de no medio dunha palabra) para encaixar texto en filas de, por exemplo, 80 caracteres (ou a lonxitude elixida).
  • Darlle formato correcto a listas como: "mazás, peras e laranxas."

Morfoloxía:

  • Xerar formas conxugadas – é dicir, modificar/marcar unha palabra/lexema para reflexar información gramatical como o xénero, tempo, número ou persoa.

Gramática simple:

  • Asegurar a corrección gramatical, cumprindo a concordancia nome-verbo[1], entre outras cosas.
  • Crear grupos de verbos ben formados (é dicir, verbo e auxiliares) como "non está comendo".
  • Permitir que o usuario defina partes dunha oración ou frase e que SimpleNLG-gl una esas partes nunha estrutura sintacticamente correcta.

[1] A concordancia describe como a forma dunha palabra a veces depende de outras que aparecen con ela nunha oración. Por exemplo, non se di "Eu é" en galego, porque "é" non se pode usar cando o suxeito é “eu”. Nese exemplo dise que a palabra “é” non está en concordancia coa palabra “eu”. A forma correcta é “Eu son” aínda que o verbo teña a mesma función e significado básico.