FORECAST: Proyecto desarrollado por CTN que tiene como objetivo investigar las componentes, características y técnicas de análisis de las series temporales de diferentes tipos, así como su estandarización, modelización y predicción, permitiendo realizar una clasificación de las series según sus características y poder contar con una metodología de estudio de estas series haciendo posible discriminar o facilitar la aplicación de los modelos predictivos en series temporales del entorno marino.
En la última década, se ha observado un crecimiento tanto en la cantidad como en la diversidad de los datos generados mundialmente, haciendo más compleja la integración y análisis de estos datos. Además, existen una gran cantidad de modelos disponibles, pero no existe un modelo idóneo para ninguna serie y no se encuentran muchos estudios orientados a unificar e integrar todas las técnicas de análisis y predicción de series temporales. Conscientes de este crecimiento de los datos y la poca disponibilidad de estudios relacionados, desde el Centro Tecnológico Naval y del Mar se ha trabajado en la aplicación de algoritmos de aprendizaje automático para grandes conjuntos de datos del medio marino, pero, a pesar de todo, uno de los principales obstáculos es la enorme variedad de modelos y la selección de los adecuados en función del tipo de serie temporal.
Con el
proyecto FORECAST, CTN busca seguir fortaleciendo su línea I+D en ciencia de datos aplicada al medio marino para consolidar y avanzar en el conocimiento adquirido durante estos últimos años. Se pretende desarrollar una metodología de análisis e interpretación de las series a partir de las técnicas de preprocesado, elaborar algoritmos que identifiquen las características, componentes o patrones de diferentes series, disponer de modelos predictivos estadísticos, de aprendizaje automático o combinados y, por último, disponer de un modelo de discriminación y selección de modelos predictivos basándose en las características de la serie. Se espera acumular una gran diversidad de datos de series temporales provenientes de distintos sectores relacionados con el medio marino, incluidos el sector portuario, acuícola, energético y oceanográfico.
Objetivos específicos:
Identificar y desarrollar algoritmos capaces de calcular métricas que permitan caracterizar y clasificar las series temporales más prominentes en el medio marino según su tipología y procedencia.
Desarrollar e implementar distintos modelos de predicción de series temporales, tanto basados en modelado estadístico como aprendizaje automático, profundo y combinación de estos, atendiendo a sus hipótesis de aplicación (linealidad, estacionariedad, dimensionalidad, etc.).
Realizar un análisis comparativo de los resultados y así desarrollar una metodología de clasificación de series temporales en base al poder de predicción de los modelos y a las características de las series temporales estudiadas
Duración: Enero 2022- Junio 2023