QUIENES SOMOS
 
ACTIVIDADES
 
PROYECTOS
 
EMPRESAS DEL GRUPO
 
 
 

 
Proyectos de investigación
 
PLN: Programas para el procesamiento del lenguaje natural
 
TRANSPAR: Transparence. Sistema de reusabilidad y de desarrollo de software multiplataforma
 
IROM: Indexación y recuperación oracional multilingüe de texto libre
 
PLNGI: Procesamiento del lenguaje natural aplicado a la gestión de la información
 
PLNEE: Procesamiento del lenguaje natural aplicado al entorno empresarial
 
TLA: Técnicas lingüísticas avanzadas
 
decLABUR: Sumarización multireferencia y multilingüe
 
decGALDE: Sistema de búsqueda de respuestas para euskera y español
 
decTEIS: Seguimiento de la implantación terminológica a través de Internet
 
decJAZO: Detección y seguimiento de sucesos para euskera y español
 
decITZUL: Extracción de información lingüística a partir de traducciones multilingües
 
decCORLIS: Información lingüística y terminológica a partir de corpus
 
decCORLAN: Información lingüística, terminológica y sintáctica a partir de corpus
 
decCORSIN: Optimización y mejoras en el análisis morfo-sintáctico e implementación en herramientas de explotación
 
decARSIN: Transición hacia un análisis sintáctico robusto y creación de árboles sintácticos
 
decAUSIN: Optimización del análisis morfo-sintáctico a través de técnicas de aprendizaje automático
 
decPROTRAD: Propuestas avanzadas de traducción
 
decTRADI: Mejoras inteligentes en las propuestas avanzadas de traducción
 
decKALITRAD: Investigación de la calidad de las traducciones
 
decMODELA: Modelado Estadístico y Deep Learning para Traducción Automática de Alta Calidad
 
decPROPOST: Propuestas avanzadas de traducción
 
decQUALES: Aprendizaje Automático mediante Supervisión Modulable para la Estimación Automática de la Calidad de Traducción
 
decTECPOST: Tecnologías avanzadas para la PostEdición de traducciones
 
decMODENA: Modelado Neuronal Avanzado para Traducción Automática de Alta Calidad
 
decSUBTRAD: Subsegmentos pretraducidos para facilitar la traducción
 
decMINTZAI: Sistemas de Aprendizaje Profundo E2E para Traducción Automática del Habla
 
decTANDO: Métodos y Sistemas de Traducción Automática Neuronal Coherente
Proyectos de desarrollo en el ámbito lingüístico
Proyectos de desarrollo en el ámbito del transporte de mercancías
Colaboraciones con otros centros tecnológicos

KALITRAD: Investigación de la calidad de las traducciones

Años de actividad: 2016 - 2017

Objetivos:

El proyecto KALITRAD tiene como objetivo la investigación de modelos, métricas y metodologías que permitan hacer una valoración adecuada de la calidad de las traducciones basadas en memorias de traducción y en propuestas lingüísticas avanzadas. Ante las diferentes estrategias y herramientas que existen actualmente para la traducción, nos vemos en la necesidad de medir la calidad de las diferentes propuestas, incluida la de OLITE, que nos faciliten la evaluación de la calidad de las traducciones.

Este proyecto se puede considerar una ampliación de las investigaciones realizadas en los proyectos TrADI2015 y PROTRAD2014. Los tres proyectos tienen en común la necesidad de investigar mejoras que resuelvan las carencias detectadas en el prototipo de la herramienta de traducción asistida por ordenador (TAO) OLITE, ante los nuevos paradigmas de la traducción: la traducción automática y la post-edición de textos traducidos (o no) de forma automática.

La automatización de los procesos de traducción ha puesto de manifiesto la necesidad de evaluar de forma consistente la calidad de los contenidos traducidos e implantar procedimientos de aseguramiento de calidad. La productividad de las tecnologías aplicadas está directamente relacionada con la fiabilidad de los textos traducidos con procesos automatizados y una gestión eficiente de los requisitos de calidad que demanda el mercado.

El prototipo de OLITE nos sirve como base de nuestra investigación pues dispone de unas características altamente avanzadas e inteligentes, poniendo en valor el conocimiento y la experiencia que tenemos en el procesamiento del lenguaje natural, en las que se combinan técnicas de Memorias de Traducción, Análisis Lingüístico y Métodos Estadísticos.

En el transcurso del proyecto trataremos de valorar la calidad de las traducciones hechas con diferentes herramientas, incluida OLITE, y compararemos dichas propuestas, a partir de la evolución de las traducciones realizadas.

En cuanto a las propuestas generadas en OLITE, se tratará de aprovechar el conocimiento lingüístico para mejorar las propuestas de traducción, mezclando de forma efectiva las tecnologías lingüística y estadística y se tratará de mejorar el posicionamiento de subsegmentos en las propuestas de traducción. La correcta alineación de los subsegmentos del texto generado en las propuestas es una tarea de alta complejidad, en especial entre lenguas con construcciones gramaticales tan lejanas como el euskera y el español.

El objetivo del estudio debería servir para cualquier par de lenguas de las que se dispongan traducciones y conozcamos en profundidad. Para este proyecto se emplearán fundamentalmente el español y el euskera, por nuestro conocimiento lingüístico previo. Entendemos que las peculiaridades planteadas por estas dos lenguas pueden sentar las bases de tratamiento necesarias para cualquier otro par de lenguas occidentales, con sus matices.

Proyecto financiado parcialmente por la Diputación Foral de Gipuzkoa - Gipuzkoako Foru Aldundia