NOR GAREN
 
JARDUERA
 
PROIEKTUAK
 
TALDEKO ENPRESAK
 
 
 

 
Ikerketa proiektuak
 
PLN: Lengoaia naturalaren prozesaketarako egitasmoak
 
TRANSPAR: Plataforma anitzeko software garapenerako eta berrerabilgarritasunerako sistema
 
IROM: Esaldien araberako indexatze eta berreskuratze eleanitza
 
PLNGI: Informazioaren kudeatzeari zuzendutako lengoaia naturalaren prozesaketa
 
PLNEE: Enpresa inguruneari zuzendutako lengoaia naturalaren prozesaketa
 
TLA: Hizkuntz teknika aurreratuak
 
LABUR - Erreferentzia eta hizkuntza anitzetako sumarizazioa
 
GALDE - Erantzunak bilatzeko sistema, euskara eta gaztelaniarentzat.
 
TEIS - Terminologi txertatzearen jarraipena Internet bitartez.
 
JAZO - Gertakarien detekzioa eta jarraipena, euskara eta gaztelaniarentzat.
 
decITZUL: Itzulpen eleanitzetan oinarritutako informazio liguistikoaren erauzketa
 
decCORLIS: Información lingüística y terminológica a partir de corpus
 
decCORLAN: Información lingüística, terminológica y sintáctica a partir de corpus
 
decCORSIN: Optimización y mejoras en el análisis morfo-sintáctico e implementación en herramientas de explotación
 
decARSIN: Transición hacia un análisis sintáctico robusto y creación de árboles sintácticos
 
decAUSIN: Optimización del análisis morfo-sintáctico a través de técnicas de aprendizaje automático
 
decPROTRAD: Propuestas avanzadas de traducción
 
decTRADI: Mejoras inteligentes en las propuestas avanzadas de traducción
Beste zentru teknologikoekiko lankidetza

ARSIN: Transición hacia un análisis sintáctico robusto y creación de árboles sintácticos

Años de actividad: 2012 - 2013

Objetivos:

  • El objetivo del presente Plan de Especialización es la evolución del análisis superficial ya existente hacia un analizador de mayor profundidad y robustez, que llegue a definir características funcionales y relacionales entre los diferentes elementos que componen las frases. Como objetivo concreto y de transferencia tecnológica se plantea dar los primeros pasos para la creación de treebanks, corpus anotados sintácticamente que reflejen la totalidad de caracterizaciones que aporta el análisis sintáctico. Los idiomas sobre los que se efectuarán los desarrollos serán el euskera y el español.
  • Como objetivos parciales, nos planteamos los siguientes:
    • Establecimiento del formalismo para expresar la sintaxis
    • Evolución del análisis sintáctico, llegando a las relaciones gramaticales entre las palabras y/o sintagmas
    • Creación de un corpus etiquetado sintácticamente, o treebank
  • El analizador sintáctico superficial fue desarrollado por nuestro Centro en 2003, y en el proyecto CORSIN 2011 fue objeto de diversas tareas de optimización y mejora. El resultado de dicho analizador ofrece información sobre los segmentos o sintagmas que componen la frase y sobre su caracterización (nominal, verbal, etc.) La inclusión de dicho analizador sintáctico en diversas aplicaciones de Ligüística de Corpus, ha dejado en evidencia la necesidad de disponer de datos sintácticos más avanzados de los que ofrece en la actualidad, principalmente las funciones sintácticas que juegan los sintagmas y las relaciones de dependencia o referencia tanto de los sintagmas como de las palabras.
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Sailak zatiz finantziatutako proiektua