Por favor, comparte esta noticia:

PinIt

Alejandro Ramos Soto, creador de GALiWeather:“Optar por la investigación te expone a una incertidumbre enorme”

Más de 13 millones de visitas avalan el éxito de GALiWeather, una aplicación que genera automáticamente predicciones meteorológicas a corto plazo en lenguaje natural para cada municipio de Galicia. Su creador acaba de recibir uno de los galardones de la primera edición de los Premios de Investigación de la Sociedad Científica Informática de España y la Fundación BBVA para menores de 30 años.

Eva Rodríguez Nieto | 06 noviembre 2017

Alejandro Ramos Soto en la sede de CITIUS / FBBVA

Alejandro Ramos Soto es un joven ingeniero informática de la Universidad de Santiago de Compostela que en 2011 inició su carrera profesional desarrollando una herramienta de CAD para el diagnóstico de nódulos de cáncer de pulmón en colaboración con Centro de Supercomputación de Galicia y la empresa Bahía Software.

En 2012 decidió dedicarse a la investigación aplicada en los campos de teoría de conjuntos borrosos y generación de lenguaje natural, lo plasmó en una tesis y le dio una utilidad real: GALiWeather. Esta aplicación genera automáticamente pronósticos meteorológicos a corto plazo en lenguaje natural, a partir de los datos de predicción de Meteogalicia. Esta innovación le ha llevado a ganar un premio nacional de informática.

ENTREVISTA

– El galardón reconoce la excelencia de jóvenes doctores menores de 30 años que realizan investigación de alta calidad en nuestro país. ¿Qué le ha supuesto recibirlo?

Es un aliciente enorme para la continuación de mi carrera investigadora. Optar por este camino te expone a una incertidumbre enorme y dependes de la concesión de becas, de la realización de estancias en el extranjero o de proyectos de investigación para poder aspirar a una plaza estable dentro del sistema universitario español.

– ¿Cómo se le ocurrió combinar estos dos campos, el de la inteligencia artificial y el lenguaje natural, para crear GALiWeather?

La generación de lenguaje natural es una de las muchas ramas de la inteligencia artificial, al igual que la lógica borrosa. Lo que hemos integrado es el uso de conjuntos borrosos en un sistema de generación de textos. Fue un paso natural. Al tratar de aplicar técnicas de conjuntos borrosos a la creación de resúmenes lingüísticos de datos, que codifican información lingüística como protolenguaje, nos dimos cuenta de que necesitábamos una capa más de procesado para adaptarlos a los usuarios finales.

– ¿En qué consisten los conjuntos borrosos y el soft computing que se ha utilizado para esta aplicación?

Por un lado, hemos utilizado conjuntos borrosos para modelar matemáticamente conceptos imprecisos en meteorología como ‘mitad del periodo’ o ‘predominante’. Supongamos que tenemos datos de predicción para siete días. Si queremos hacer una descripción de la cobertura nubosa para el inicio de la semana, tendremos en cuenta el lunes y el martes, pero también podríamos considerar el aporte de la información para el miércoles. Sobre este tipo de definiciones, aplicamos técnicas de cuantificación borrosa para generar sentencias cuantificadas como “la mayor parte de los datos de cobertura nubosa corresponden a cubierto”, que después verbalizamos como “los cielos se encontrarán predominantemente cubiertos”.

– ¿Existen otros ejemplos de este uso combinado o es algo que no se había hecho hasta esta aplicación?

Lo único que existía hasta el momento era alguna idea vaga sobre la posible utilidad de combinar ambos campos. También existían ejemplos de resúmenes lingüísticos de datos que no incluían ninguna técnica de procesado para la generación de textos. GALiWeather es el primer sistema de generación de textos operativo a escala mundial que utiliza técnicas basadas en el uso de conjuntos borrosos para modelar la imprecisión de algunos de los términos lingüísticos que se incluyen en los textos generados.

– ¿Qué aporta este detalle de información meteorológica?

El único acceso oficial a los textos generados por GALiWeather es a través de la página de MeteoGalicia, que proporciona los textos para cada ayuntamiento de Galicia. En el Grupo de Sistemas Inteligentes de la Universidad de Santiago de Compostela desarrollamos adicionalmente una aplicación móvil donde el sistema de generación se adaptó para contemplar, no solo los ayuntamientos, sino también cualquier punto dentro de la geografía gallega.

– ¿Estudian aplicar esta tecnología para otro tipo de datos que no sean meteorológicos?

Los conjuntos borrosos también los aplicamos en otro sistema de generación de informes sobre una plataforma de Business Service Intelligence, en colaboración con la empresa Ozona Consulting S.L. En ese caso los utilizamos para dotar de flexibilidad a un algoritmo de detección de patrones temporales. También se emplearon en otro proyecto enfocado a la generación de descripciones de carteras de proyectos en base a ciertos indicadores.

– ¿Y en el futuro?

Esperamos poder seguir experimentando e investigando la aplicación de este tipo de técnicas en sistemas de generación de lenguaje natural, si bien la posibilidad de dicho uso vendrá dada por los requisitos específicos de cada dominio de aplicación que abordemos. Entre dichos dominios contemplamos el campo de la salud y la medicina, business intelligence, el ámbito financiero, etc.

– ¿En qué está trabajando en estos momentos?

Estoy realizando una estancia postdoctoral en la Universidad de Aberdeen (Reino Unido), en el grupo de lingüística computacional. Colaboro con Ehud Reiter, una de las figuras más relevantes en el campo de generación de lenguaje natural, para investigar el uso de conjuntos borrosos para modelar conceptos geográficos y generar expresiones de referencia geográficas. Mi objetivo es, al igual que con GALiWeather, tratar de usar esta investigación para crear un sistema de generación de lenguaje natural que permita describir la situación sinóptica de la meteorología a nivel comunitario utilizando datos de observación en tiempo real.

Más allá de esta línea, estoy colaborando con otros investigadores en otros trabajos tangenciales a mi línea principal, como la aplicación de técnicas de generación de lenguaje natural para proporcionar una mayor interpretabilidad a ciertas técnicas de aprendizaje automático.

Zona geográfica: España
Fuente: Agencia SINC
Eva Rodríguez es Periodista y redactora de SINC especializada en información sobre ciencias naturales y sociales.

Por favor, comparte esta noticia:

PinIt