PROPOST: PROpuestas inteligentes para una POSTedición eficaz

QUIENES SOMOS

ACTIVIDADES

PROYECTOS

EMPRESAS DEL GRUPO

INGENIERÍA DE SOFTWARE

PRENSA Y PUBLICACIONES

COMUNICACIÓN - ARTES GRÁFICAS

Proyectos de investigación

PLN: Programas para el procesamiento del lenguaje natural

TRANSPAR: Transparence. Sistema de reusabilidad y de desarrollo de software multiplataforma

IROM: Indexación y recuperación oracional multilingüe de texto libre

PLNGI: Procesamiento del lenguaje natural aplicado a la gestión de la información

PLNEE: Procesamiento del lenguaje natural aplicado al entorno empresarial

TLA: Técnicas lingüísticas avanzadas

LABUR: Sumarización multireferencia y multilingüe

GALDE: Sistema de búsqueda de respuestas para euskera y español

TEIS: Seguimiento de la implantación terminológica a través de Internet

JAZO: Detección y seguimiento de sucesos para euskera y español

ITZUL: Extracción de información lingüística a partir de traducciones multilingües

CORLIS: Información lingüística y terminológica a partir de corpus

CORLAN: Información lingüística, terminológica y sintáctica a partir de corpus

CORSIN: Optimización y mejoras en el análisis morfo-sintáctico e implementación en herramientas de explotación

ARSIN: Transición hacia un análisis sintáctico robusto y creación de árboles sintácticos

AUSIN: Optimización del análisis morfo-sintáctico a través de técnicas de aprendizaje automático

PROTRAD: Propuestas avanzadas de traducción

TRADI: Mejoras inteligentes en las propuestas avanzadas de traducción

KALITRAD: Investigación de la calidad de las traducciones

MODELA: Modelado Estadístico y Deep Learning para Traducción Automática de Alta Calidad

PROPOST: Propuestas avanzadas de traducción

QUALES: Aprendizaje Automático mediante Supervisión Modulable para la Estimación Automática de la Calidad de Traducción

TECPOST: Tecnologías avanzadas para la PostEdición de traducciones

MODENA: Modelado Neuronal Avanzado para Traducción Automática de Alta Calidad

SUBTRAD: Subsegmentos pretraducidos para facilitar la traducción

MINTZAI: Sistemas de Aprendizaje Profundo E2E para Traducción Automática del Habla

TANDO: Métodos y Sistemas de Traducción Automática Neuronal Coherente

Proyectos de desarrollo en el ámbito lingüístico

Proyectos de desarrollo en el ámbito del transporte de mercancías

Colaboraciones con otros centros tecnológicos

PROPOST: PROpuestas inteligentes para una POSTedición eficaz

Años de actividad: 2017 - 2018

Objetivos:

El proyecto PROPOST tiene como objetivo facilitar la tarea manual de post-edición de textos traducidos, abordando la tarea en dos momentos diferentes de su línea temporal. Por un lado, antes de realizar la post-edición, mejorando la valoración de las propuestas de traducción presentadas al traductor, de forma acorde con sus necesidades, teniendo en cuenta el dominio de los textos, los contenidos previamente traducidos y los idiomas en los que está trabajando.

Por otro lado, registrando las acciones realizadas por los traductores y correctores durante la post-edición e investigando metodologías más actuales que permitan extraer información relevante para realizar mejoras de todo el proceso.

Este proyecto se puede considerar una ampliación de las investigaciones realizadas en los proyectos KALITRAD2016, TrADI2015 y PROTRAD2014. Todos estos proyectos tienen en común la necesidad de investigar mejoras que resuelvan las carencias detectadas en el prototipo de la herramienta de traducción asistida por ordenador (TAO) OLITE, ante los nuevos paradigmas de la traducción: la traducción automática y la post-edición de textos traducidos (o no) de forma automática. Esto ha generado la necesidad de corregir o post-editar textos donde antes el trabajo consistía en que la persona traductora debía crear un texto en el idioma destino partiendo desde cero, lo que también ha influído en el perfil de los traductores.

Aunque se han hecho avances en la traducción automática, sigue siendo un área de investigación viva y en constante cambio tanto en las técnicas de traducción automática como en la apertura de nuevos enfoques o áreas debido a que los resultados de los sistemas automáticos han de ser revisados y corregidos por los traductores. El objetivo del proyecto, es realizar las tareas necesarias para que las correcciones sean las mínimas. Buscamos la eficiencia a la hora de realizar estos trabajos, así que nuestra función consistirá en crear propuestas cada vez mejores, partiendo de los resultados obtenidos en los proyectos TrADI2015 y PROTRAD2014 antes citados. Además, se medirá la calidad de los nuevos resultados utilizando las métricas que se están desarrollando en el proyecto KALITRAD2016.

El prototipo de OLITE nos sirve como base de nuestra investigación pues dispone de unas características altamente avanzadas e inteligentes, poniendo en valor el conocimiento y la experiencia que tenemos en el procesamiento del lenguaje natural, en las que se combinan técnicas de Memorias de Traducción, Análisis Lingüístico y Métodos Estadísticos.

En el transcurso del proyecto obtendremos nuevas propuestas lingüísticas que compararemos con las traducciones previas hechas con diferentes herramientas, incluida OLITE, para evaluar el grado de mejora obtenido con la aplicación de las nuevas técnicas.

En cuanto a las nuevas propuestas generadas en OLITE, se tratará de aprovechar el conocimiento lingüístico para mejorar las propuestas de traducción, mezclando de forma efectiva las tecnologías lingüística y estadística y se tratará de mejorar el posicionamiento de subsegmentos en las propuestas de traducción. La correcta alineación de los subsegmentos del texto generado en las propuestas es una tarea de alta complejidad, en especial entre lenguas con construcciones gramaticales tan lejanas como el euskera y el español.

El objetivo del estudio debería servir para cualquier par de lenguas de las que se dispongan traducciones y conozcamos en profundidad. Para este proyecto se emplearán fundamentalmente el español y el euskera, por nuestro conocimiento lingüístico previo y por la disponibilidad de generadores de propuestas. Entendemos que las peculiaridades planteadas por estas dos lenguas pueden sentar las bases de tratamiento necesarias para cualquier otro par de lenguas occidentales, con sus matices.

Proyecto financiado parcialmente por la Diputación Foral de Gipuzkoa - Gipuzkoako Foru Aldundia