Quelques méthodes des analogues

Différentes variantes de la méthode des analogues sont présentées ici. Ces méthodes ont des degrés de complexité variables et comprennent un ou plusieurs niveaux d’analogie avec des variables de différentes natures. Le contenu suivant provient de Horton and Brönnimann [4].

La première méthode développée avec les reanalyses NCEP/NCAR 1 par Bontron [1] est basée sur l’analogie de la circulation synoptique sur la hauteur du géopotentiel à deux niveaux de pression (Z1000 à +12 h et Z500 à +24 h) et est ici nommée 2Z.

La méthode 2Z comprend les étapes suivantes : tout d’abord, pour tenir compte des effets saisonniers, des dates candidates sont extraites de la période d’archive dans les quatre mois centrés autour de la date cible, pour chaque année de l’archive (PC : présélection sur une base calendaire dans le tableau ci-dessous). Ensuite, l’analogie de la circulation atmosphérique d’une date cible avec chaque jour de l’ensemble de présélection (excluant +-30 jours autour de la date cible et une éventuelle période de validation) est évaluée en calculant le critère S1 [2, 8], qui est une comparaison de gradients, sur une fenêtre spatiale définie (le domaine sur lequel les prédicteurs sont comparés). Le critère S1 est calculé pour chaque niveau, puis moyenné.

\[S1=100 \frac {\displaystyle \sum_{i} \vert \Delta\hat{z}_{i} - \Delta z_{i} \vert} {\displaystyle \sum_{i} max\left\lbrace \vert \Delta\hat{z}_{i} \vert , \vert \Delta z_{i} \vert \right\rbrace }\]

\(\Delta \hat{z}_{i}\) est la différence de hauteur géopotentielle entre la i-ième paire de points adjacents de données maillées décrivant la situation cible, et \(\Delta z_{i}\) est la différence de hauteur géopotentielle observée correspondante pour la situation candidate. Plus les valeurs S1 sont petites, plus les champs de pression sont similaires.

Les N1 dates, où N1 est un paramètre à calibrer, avec les valeurs S1 les plus faibles, sont considérées comme analogues à la date cible. Ensuite, les valeurs de précipitations quotidiennes observées pour les N1 dates sélectionnées fournissent la distribution conditionnelle empirique, considérée comme la prédiction probabiliste pour la date cible.

Une autre méthode s’appuyant uniquement sur la circulation atmosphérique est basée sur la hauteur géopotentielle sur quatre combinaisons de niveaux de pression et de fenêtres temporelles (4Z, tableau ci-dessous) à des niveaux qui ont été automatiquement sélectionnés par des algorithmes génétiques pour le bassin versant du Rhône supérieur en Suisse [6]. La méthode 4Z s’est avérée plus performante que la méthode 2Z en exploitant davantage d’informations provenant de la hauteur géopotentielle et en tirant parti de degrés de liberté supplémentaires, tels que différentes fenêtres spatiales entre les niveaux de pression et l’introduction d’une pondération entre eux. Cependant, la méthode 4Z présentée ici est une simplification des résultats de Horton et al. [6], et seule la sélection des niveaux de pression optimaux et des fenêtres temporelles est présentée (Z1000 à +06 h et +30 h, Z700 à +24 h, et Z500 à +12 h).

Les autres méthodes considérées ci-après ajoutent un deuxième ou plusieurs niveaux d’analogie après l’analogie de la circulation atmosphérique, de manière progressive.

La méthode suivante ajoute un deuxième niveau d’analogie avec les variables d’humidité (méthode 2Z-2MI, tableau ci-dessous), en utilisant un indice d’humidité (MI), qui est le produit de l’eau précipitable totale (TPW) et de l’humidité relative à 850 hPa (RH850) [1]. Lors de l’ajout d’un deuxième niveau d’analogie, les dates N2 sont sous-échantillonnées à partir des analogues N1 de la circulation atmosphérique, afin d’obtenir un plus petit nombre de situations analogiques. Lorsque ce deuxième niveau d’analogie est ajouté, un plus grand nombre d’analogues N1 est conservé au premier niveau.

De manière similaire à la méthode 4Z, la méthode 4Z-2MI est une simplification des méthodes optimisées par algorithmes génétiques de Horton et al. [6]. Elle consiste en un premier niveau d’analogie sur la hauteur du géopotentiel à quatre niveaux de pression (Z1000 à +30 h, Z850 à +12 h, Z700 à +24 h et Z400 à +12 h), différents de 4Z, suivi de l’indice d’humidité (MI) à deux niveaux de pression (MI700 à +24 h et MI600 à +12 h).

Pour contraindre l’effet saisonnier, Ben Daoud et al. [9] a remplacé la présélection calendaire (+- 60 jours autour de la date cible) par une présélection basée sur la similarité des températures de l’air (T925 à +36 h et T600 à +12 h, au point de grille le plus proche). Cela permet une sélection plus dynamique de situations similaires en termes de masses d’air, car le signal saisonnier est également présent dans les données de température. Le mélange indésirable de situations printanières et automnales est discuté dans Caillouet et al. [3]. Le nombre de dates présélectionnées (N0) est équivalent au nombre de jours sélectionnés avec l’approche calendaire et dépend donc de la taille des archives. Dans cette méthode, nommée PT-2Z-4MI, l’analogie de la circulation atmosphérique est la même que dans la méthode 2Z, mais l’analogie de l’humidité est différente (MI925 et MI700 à +12 h et +24 h).

Par la suite, Ben Daoud et al. [9] a introduit un niveau supplémentaire d’analogie entre la circulation et l’analogie de l’humidité (PT-2Z-4W-4MI, tableau ci-dessous), basé sur la vitesse verticale à 850 hPa (W850). Cette MA, appelée « SANDHY » pour Stepwise Analogue Downscaling method for Hydrology [3, 9], a été principalement développée pour des bassins de grande taille et relativement plats en France (Saône, Seine). Elle a également été appliquée à l’ensemble du territoire français par Radanovics et al. [7] avec ERA-40 et par Caillouet et al. [3] avec 20CR-V2b.

Quelques méthodes des analogues classées par complexité croissante. P0 est la présélection (PC : sur une base calendaire, c’est-à-dire +-60 jours autour de la date cible), L1, L2 et L3 sont les niveaux d’analogie consécutifs. Les variables météorologiques sont les suivantes : SLP – pression moyenne au niveau de la mer, Z – hauteur géopotentielle, T – température de l’air, W – vitesse verticale, MI – indice d’humidité, qui est le produit de l’humidité relative au niveau de pression donné et de la colonne d’eau totale. Le critère d’analogie est S1 pour SLP et Z, et RMSE pour les autres variables.

Méthode

P0

L1

L2

L3

2Z

PC

Z1000@12h
Z500@24h

4Z

PC

Z1000@06h
Z1000@30h
Z700@24h
Z500@12h

2Z-2MI

PC

Z1000@12h
Z500@24h

MI850@12+24h

4Z-2MI

PC

Z1000@30h
Z850@12h
Z700@24h
Z400@12h
MI700@24h
MI600@12h

PT-2Z-4MI

T925@36h
T600@12h
Z1000@12h
Z500@24h
MI925@12+24h
MI700@12+24h

PT-2Z-4W-4MI

T925@36h
T600@12h
Z1000@12h
Z500@24h
W850@06-24h
MI700@12+24h

MI925@12+24h