NOR GAREN
 
JARDUERA
 
PROIEKTUAK
 
TALDEKO ENPRESAK
 
 
 

 
Ikerketa proiektuak
 
PLN: Lengoaia naturalaren prozesaketarako egitasmoak
 
TRANSPAR: Plataforma anitzeko software garapenerako eta berrerabilgarritasunerako sistema
 
IROM: Esaldien araberako indexatze eta berreskuratze eleanitza
 
PLNGI: Informazioaren kudeatzeari zuzendutako lengoaia naturalaren prozesaketa
 
PLNEE: Enpresa inguruneari zuzendutako lengoaia naturalaren prozesaketa
 
TLA: Hizkuntz teknika aurreratuak
 
LABUR - Erreferentzia eta hizkuntza anitzetako sumarizazioa
 
GALDE - Erantzunak bilatzeko sistema, euskara eta gaztelaniarentzat.
 
TEIS - Terminologi txertatzearen jarraipena Internet bitartez.
 
JAZO - Gertakarien detekzioa eta jarraipena, euskara eta gaztelaniarentzat.
 
decITZUL: Itzulpen eleanitzetan oinarritutako informazio liguistikoaren erauzketa
 
decCORLIS: Información lingüística y terminológica a partir de corpus
 
decCORLAN: Información lingüística, terminológica y sintáctica a partir de corpus
 
decCORSIN: Optimización y mejoras en el análisis morfo-sintáctico e implementación en herramientas de explotación
 
decARSIN: Transición hacia un análisis sintáctico robusto y creación de árboles sintácticos
 
decAUSIN: Optimización del análisis morfo-sintáctico a través de técnicas de aprendizaje automático
 
decPROTRAD: Propuestas avanzadas de traducción
 
decTRADI: Mejoras inteligentes en las propuestas avanzadas de traducción
 
decKALITRAD: Investigación de la calidad de las traducciones
 
decMODELA: Modelado Estadístico y Deep Learning para Traducción Automática de Alta Calidad
 
decPROPOST: Propuestas avanzadas de traducción
 
decQUALES: Aprendizaje Automático mediante Supervisión Modulable para la Estimación Automática de la Calidad de Traducción
 
decTECPOST: Tecnologías avanzadas para la PostEdición de traducciones
 
decMODENA: Modelado Neuronal Avanzado para Traducción Automática de Alta Calidad
 
decSUBTRAD: Subsegmentos pretraducidos para facilitar la traducción
 
decMINTZAI: Sistemas de Aprendizaje Profundo E2E para Traducción Automática del Habla
 
decTANDO: Métodos y Sistemas de Traducción Automática Neuronal Coherente
Beste zentru teknologikoekiko lankidetza
Proyectos de desarrollo en el ámbito del transporte de mercancías
Colaboraciones con otros centros tecnológicos

CORSIN: Optimización y mejoras en el análisis morfo-sintáctico e implementación en herramientas de explotación

Años de actividad: 2011 - 2012

Objetivos:

  • El objetivo planteado por el presente Plan de Especialización, en un primer momento, se puede decir que es doble:
    • Optimización y mejora del análisis morfo-sintáctico
    • Evolución de aplicaciones de Lingüística de Corpus
  • Sin embargo, ambos objetivos están estrechamente unidos. Para un correcto funcionamiento de las aplicaciones inscritas en la Lingüística de Corpus, es necesario que las herramientas de Procesamiento del Lenguaje Natural sean tan exhaustivas y precisas como sea posible. Y, de igual manera, la profundización en la Lingüística de Corpus nos exige una mayor calidad en las herramientas de Procesamiento del Lenguaje Natural.
  • Ametzagaiña lleva varios años profundizando en el conocimiento y explotación de diferentes disciplinas inscritas en la Lingüística de Corpus, dirigida a la extracción, a partir de un corpus, de datos lingüísticos estructurados. Los resultados alcanzados hasta la fecha han recibido una valoración muy positiva, lo que nos reafirma en el interés de la línea emprendida. De acuerdo con una búsqueda constante de excelencia, en los proyectos anteriores se ha perseguido una continua transferencia tecnológica de los desarrollos realizados, plasmada en aplicaciones concretas para uso tanto de grupos investigadores como del público en general.
  • La incorporación de las características morfo-sintácticas a las aplicaciones de transferencia tecnológica, ha traído consigo la necesidad de una revisión a fondo del propio análisis sintáctico, cuyo resultado asimismo será transferido a las aplicaciones en el curso del propio proyecto.
    • En la primera Fase, se implementarán las variables morfo-sintácticas en el sistema de frecuencias, partiendo del resultado del analizador sintáctico en su estado tecnológico actual, es decir, sin la optimización prevista para el mismo en posteriores etapas del proyecto.
    • En la segunda Fase, se plantea la mejora y optimización del analizador sintáctico, así como la resolución de los principales casos de ambigüedad.
    • En la tercera Fase, el resultado mejorado del analizador sintáctico se implementará en las diferentes aplicaciones de transferencia tecnológica que lo utilizan.
  • La totalidad de objetivos parciales planteados en cada una de las tareas, tienen uno de sus principales sustentos –y en algún caso, su principal motivación– en la colaboración de Ametzagaiña con otros grupos de investigación:
    1. El sistema de frecuencias lingüísticas nace de las necesidades planteadas por parte del laboratorio Elebilab (http://www.elebilab.com/), dedicado al estudio de la adquisición y proceso mental de las lenguas; Ametzagaiña participa en el proyecto ParamProcess, aprobado por el Ministerio de Investigación.
    2. Tanto la Extracción de Terminología basada en patrones sintácticos, como el Explorador Sintáctico de Corpus nacen del trabajo en común con distintos grupos del Departamento de Filología Vasca de la EHU/UPV (http://www.ehk.ehu.es/s0113-con/eu/contenidos/informacion/00113_investigacion/eu_00113_in/00113_investigacion.html), con el que Ametzagaiña tiene firmado un acuerdo de colaboración 2008-2013.
    3. Ametzagaiña participa también en el grupo de investigación BasDiSyn (http://basdisyn.net/), centrado en el estudio sintáctico de las hablas vascas, y en cuyo seno se ha planteado la mejora del analizador sintáctico.
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Sailak zatiz finantziatutako proiektua