Modelización Estadística para Análisis de Datos (MESTAD)

Integrantes

Categorías

Descripción

Objetivos

El grupo pretende ser un espacio para explorar, implementar y desarrollar métodos estadísticos modernos intentando siempre un contacto directo de los métodos con problemas de aplicación de interés. Entendemos los métodos estadísticos modernos como basados en dos grandes pilares. En primer lugar, el uso de modelos estadísticos que permiten gran flexibilidad en la relación de las variables a analizar, generalmente aplicados en contextos de altas dimensiones y para los que la implementación computacional es tan relevante que se puede considerar parte del método. En segundo lugar, la estadística es considerada en forma amplia, en el entendido que aspectos como la exploración y visualización de datos, la reproducibilidad y comunicación de los resultados, forman una parte muy relevante de la disciplina.

Líneas de investigación

La principal línea de trabajo actualmente es el estudio de métodos de aprendizaje estadístico interpretables, principalmente en métodos supervisados con aplicaciones en problemas económicos y financieros. Los métodos de aprendizaje estadísticos son ampliamente utilizados en una variedad de problemas de aplicación en diversas disciplinas, tales como la economía, informática, biología, medicina, etc. La complejidad de los problemas de aplicación requieren de algoritmos automáticos que capturen las características fundamentales de los datos de forma de tener una adecuada performance predictiva para el problema de interés. Estos métodos son poderosos en términos de performance predictivas pero presentan carencias comparados con algunos de los métodos paramétricos clásicos (regresión lineal, regresión logística, GLM, etc) que es su interpretabilidad. La mayoría de los métodos de aprendizaje estadístico son cajas negras ya que su lógica y funcionamiento interno es desconocida para el usuario final y es difícil de entender la racionalidad detrás de las predicciones. Su amplio uso en infinidad de disciplinas hace necesaria la interpretabilidad de los mismos. En este sentido, tener herramientas que faciliten la interpretabilidad de los métodos permiten identificar la fortalezas y debilidades del modelos, mayor entendimiento de los datos y el vínculo de ellos con el modelo así como ver el comportamiento del modelo con datos futuros. Tener métodos más interpretable no permite entender mejor las razones por las cuales el método predice de una u otra forma e interpretar modificaciones para mejorarla en el caso que sea necesario.
Otras líneas de trabajo también son de interés para MESTAD. En primer término modelos aplicados a datos deportivos para estudiar diversos aspectos como performance de los deportistas, determinantes de resultados, diseño de los torneos entre otros. Luego, la modelización de datos generados en plataformas educativas, y la generación de herramientas que faciliten su exploración y visualización. También problemas que provienen de los mercados financieros en los cuales es posible aplicar las técnicas que estudiamos en el grupo. Entre otros, se encuentra la optimización de portafolios de inversión. Esto se debe a que la exploración de la información disponible en el mercado permite realizar predicciones sobre los futuros rendimientos de distintas elecciones de inversión. La suposición básica que presenta el análisis es que es posible detectar patrones recurrentes en el comportamiento temporal de series financieras. La aplicación de modelos semi-paramétricos temporales y espaciales a datos financieros (por ejemplo precios de venta de inmuebles) también es un tema de interés en el grupo.
Análisis de datos en altas dimensiones son necesarias técnicas de reducción de la dimensionalidad (lineales o no lineales) y el posterior estudio de datos en estructuras geométricas inmersas en el espacio original, por ejemplo las variedades Riemannianas. Por tanto una línea de trabajo es el uso de herramientas estadísticas cuando los datos son por ejemplo matrices ortonormales, matrices definidas positivas, árboles o se encuentran sobre una determinada superficie.

Ir al Grupo

Integrantes

Alvarez-Castro, Ignacio

Da Silva, Natalia

Moreno, Leonardo

Sosa-Rodriguez, Andrés

Molina, Federico

Loprete, Mauro

Categorías

Descripción

Objetivos

Líneas de investigación