Analyse des series temporelles pour la construction d'un modèle de prediction meteorologique
Titre | Analyse des series temporelles pour la construction d'un modèle de prediction meteorologique |
Type | Thèse de doctorat |
Auteurs | Abdallah Wissam |
Directeurs | Chauvet Pierre, Oueidat Mohamad, Marion Jean-Marie, Diab Chaouki, Quafafou Mohamed, Kadry Seifedine, Jrad Nisrine |
Année | 2021 |
URL | https://dune.univ-angers.fr/fichiers/18013158/202116271/fichier/16271F.pdf |
Mots-clés | classification ascendante, modèle vectoriel autorégressif (VAR), Prévisions météorologiques, SARMA, Séries temporelles |
Résumé | Cette thèse vise à développer des méthodes alternatives pour la prévision météorologique. Elle s’inscrit dans le cadre d’une collaboration avec le service météorologique libanais. Une analyse bibliographique minutieuse a permis d’identifier les différentes approches et méthodes proposées par plusieurs chercheurs dans le domaine des modèles de prédiction météorologique. Comme alternative au calcul numérique et afin d’éviter le recours à des supercalculateurs, une première approche basée sur une méthodologie hybride pour la prévision des températures à court terme, a été proposée. Cette méthode "orientée données" est fondée sur les séries temporelles (STD), plus particulièrement l’utilisation du "modèle autorégressif moyenne mobile saisonnier" (SARMA) avec une parallélisation des tâches de calculs. Les résultats de l’approche proposée ont été confrontés à ceux du modèle numérique ARPEGE dans la prévision de la température minimale quotidienne à Beyrouth. Notre modèle s’est montré efficace et a permis de réduire fortement la consommation de ressources et le temps d'exécution. La méthode SARMA est appliquée à un seul paramètre météorologique. Afin d’intégrer l’interaction entre les différents paramètres météorologiques, un modèle vectoriel autorégressif (VAR) a été développé permettant de surmonter les limitations de SARMA. Cette approche utilisant des séries temporelles multivariées (modèle VAR) paraît être une solution très prometteuse pour les prévisions météorologiques à court terme. Le modèle de parallélisation développé permet de pallier le problème majeur de ressources dans ARPEGE et du temps de calcul dans le modèle ARIMA en raison du nombre élevé de paramètres dans les modèles. Suite à la forte précision obtenue par l'application du modèle VAR sur la station climatique de Beyrouth, une généralisation du modèle a été effectuée afin de prendre en compte les différentes couches virtuelles en fonction de l’altitude. Ainsi, on obtient une nouvelle approche prédictive et mixte qui est une combinaison de trois approches : équations physiques pour générer des séries chronologiques sur plusieurs couches virtuelles de l’altitude, classification ascendante hiérarchique (CAH) et VAR. La solution envisagée regroupe en clusters les données relatives aux paramètres météorologiques ayant les mêmes caractéristiques climatiques ; par conséquent, cette méthode permet de construire un modèle VAR par cluster. Les limites du modèle réalisé sont l'incapacité de prédire des paramètres météorologiques dont la génération de séries temporelles avec l'altitude à travers des équations –météorologiques s’avère compliquée (par exemple : la vitesse et la direction du vent, la convection, etc.). Un modèle basé sur un apprentissage profond a été réalisé pour pallier ce problème. Le modèle de base de mémoire à long et court terme "Long Short-Term Memory LSTM" a été appliqué sur les cartes de la température (TT) générées afin de prédire et de fournir des cartes TT sur quatre saisons au Liban. La validation du modèle proposé a été réalisée en utilisant les critères de l'erreur quadratique moyenne et des méthodes métriques, en plus d'une nouvelle méthode originale appelée "reverse pitch mapping". Les résultats expérimentaux révèlent que le modèle proposé donne des résultats prometteurs pour la prédiction du TT sur quatre saisons au Liban, par rapport au modèle VAR de base. |
Résumé en anglais | This thesis aims at developing alternative methods for weather forecasting. It is part of a collaboration with the Lebanese meteorological service. A thorough bibliographic analysis leads to the identification of the different approaches and methods proposed by several researchers in the field of meteorological prediction models. As an alternative to numerical computation and in order to avoid the use of supercomputers, a first approach based on a hybrid methodology for short-term temperature forecasting has been proposed. The results of the proposed approach were compared with those of the numerical model ARPEGE in predicting the daily minimum temperature in Beirut. Our model was found to be efficient and significantly reduced the computation cost and the execution time. The SARMA method is applied to a single meteorological parameter. In order to integrate the interaction between the different meteorological parameters, a vector autoregressive model (VAR) has been developed to overcome the limitations ofSARMA. This approach using multivariate time series (VAR model) seems to be a very promising solution for short-term weather forecasting. The developed parallelization model allows to overcome the major problem of resources in ARPEGE and computation time in the ARIMA model due to the high number of parameters in the models. Following the high accuracy obtained by applying the VAR model on the Beirut climate station, a generalization of the model was carried out in order to take into consideration the different virtual layers with respect to the altitude. Therefore, a new predictive and mixed approach is obtained which is a combination of three approaches: physical equations to generate time series on several virtual layers of altitude, hierarchical ascending classification (HAC) and VAR. The proposed solution groups in clusters the data related to meteorological parameters having the same climatic features; consequently, this method allows to build one VAR model per cluster. The limitations of the developedmodel are the inability to predict meteorological parameters for which the generation of time series with altitude through meteorological equations is complicated (e.g. wind speed and direction, convection, etc.). A deep learning based model was performed to overcome this problem. The Long Short-Term Memory (LSTM) model was applied to generate the temperature maps (TT) and to predict and deliver TT maps over four seasons in Lebanon. The validation of the proposed model was conducted using the root mean square error and metric methods, in addition to a new original method called "reverse pitch mapping". The experimental results show that the proposed model gives promising results for the prediction of TT over four seasons in Lebanon, compared to the basic VAR model. |
Langue de rédaction | Français |
Diplôme | Thèse de doctorat |
Date de soutenance | 2021-10-20 |
Editeur | Université d'Angers |
Place Published | Angers |
Libellé UFR | Collège doctoral |
personnalisé5 | École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes) |
personnalisé6 | LARIS. Laboratoire Angevin de Recherche en Ingénierie des Systèmes (EA7315) |
personnalisé7 | Informatique |