2. Investigación

La línea de voz y lenguaje, como el resto de líneas de investigación de Barcelona Media tiene como objetivo principal acercar la investigación a la industria para impulsar la competitividad del sector de la comunicación.

El núcleo del trabajo del grupo de voz y lenguaje es la investigación, la innovación y el desarrollo de tecnologías robustas y portables  en el ámbito de procesamiento del lenguaje natural. Estas tecnologías estudian, modelan y caracterizan textos, tanto mediante aproximaciones lingüísticas como estadísticas. Las primeras se basan en una comprensión del lenguaje mediante reglas, diccionarios, ontologías.. y de entender las dependencias y relaciones entre las palabras. Las aproximaciones estadísticas, en cambio, infieren el conocimiento a base de aprender con ejemplos. Esta aproximación híbrida combina las ventajas de ambas aproximaciones, de manera que sobre un conjunto de textos y de forma semi o automatica se "comprender" lo que se dice, de lo que se habla y como se habla. Es decir, se puede extraer información estructurada a partir de textos donde la información no está estructurada.  

Concretamente, la investigación en el ámbito del procesamiento del lenguaje natural, se centra principalmente en:

  • La anotación semántica
  • El reconocimiento de entidades nombradas (NERC)
  • El modelaje del lenguaje
  • El análisis semántico 
  • Las agrupaciones y las clasificaciones
  • El análisis de la factualidad

Las tecnologías lingüísticas son altamente dependientes del idioma y del tipo de escritura. Actualmente el grupo de investigación abarca el catalán, el castellano y el inglés. Además trata escrituras formales (provenientes de notícias o blogs), contenido generado por el usuario (reseñas y textos limitados como pueden ser los provenientes de Facebook o Twitter) y transcripciones automáticas. Adicionalmente el grupo también trabaja en el tratamiento de la informacion en más de una lengua. 

La segunda línea de investigación del grupo se focaliza en el estudio de la prosodia para la síntesis de voz. En concreto, se trabaja en la automatización del proceso de creación de voces y la adaptación de estos dominios concretos. Por eso, las principales áreas de investigación son:  

  • Desarrollo de modelos fonéticos y prosódicos del lenguaje
  • Desarrollo de modelos que mejoren la naturalidad de las voces sintéticas
  • Desarrollo de modelos que permitan la generación de voces sintéticas con emociones
  • Proceso lingüístico basado en reglas 
  • Generación de diccionarios y vocabularios

Aplicaciones

La  investigación mencionada en la sección anterior lleva de manera casi inmediata a las siguientes aplicaciones de interés para la industria:

  • Análisis masivo de textos no restringidos: El proceso de añadir información lingüïstica, combinada con modelos estadísticos, permite tareas posteriores donde se emula la comprensión del lenguaje humano y permite hacer:
    • Mineria de opinión y análisis de sentimiento
    • Mineria de datos y extracción de información
    • Agrupaciones y clasficaciones de contenidos textuales 
    • Sistemas de perfilado de usuario y recomendación híbridos
  • Corrección de textos y libro de estilo, tanto para hablantes nativos como para aquellos que están aprendiendo una segunda lengua.
  • Sistemas de normalización de textos
  • Sistemas de filtraje / moderación  de contenidos
  • Traducción automática entre dos lenguas y cross – language information retrieval
  • Generación automática de contenidos a partir de datos estructurados.
  • Generación automática de resumenes a partir de datos no estructurados.
  • Síntesis de voz bilingüe catalán – castellano  con expresividad natural, basado en el motor de síntesis de Cereproc ©
  • Tratamiento del lenguaje de signos, aplicaciones que integran avatares signantes.