# Exercice 2

<div class="alert alert-block alert-info">
    Les données de cet exercice proviennent de
    <a href="https://meteo.data.gouv.fr/datasets/donnees-changement-climatique-lsh-longues-series-homogeneisees">
        https://meteo.data.gouv.fr
    </a>.
    </br>
    L'objectif est de visualiser sur une carte de France la moyenne des précipitations annuelles enregistrées dans les stations météorologiques de France métropolitaine.
</div>

<div class="alert alert-block alert-danger">
    <ul>
        <li>
            Une première partie consiste à récupérer et calculer les données.
        </li>
        <li>
            Une seconde partie consiste à faire la représentation graphique.
        </li>
        <li>
            Notez que les deux parties sont indépendantes : même si vous ne parvenez pas à créer les DataFrames, vous pouvez faire la partie graphique.
        </li>
    </ul>
</div>

<div class="alert alert-block alert-warning">
    <b>Attention</b> : 
    nous rappelons que toute fonction définie par un <tt>def</tt> doit posséder une <tt>docstring</tt>.
</div>

In [2]:
import numpy as np
import pandas as pd
import os
import matplotlib
import matplotlib.dates as mdates
import matplotlib.pyplot as plt

%matplotlib inline
%config InlineBackend.figure_format = 'retina'
matplotlib.rcParams['savefig.dpi'] = 80

## PARTIE I : création des données

__Question 1__

> - Importez le fichier `L2MEU205_examen_stations.csv` et stockez le dans le `DataFrame` appelé `stations`.
> - Modifiez l'index du `DataFrame` `stations` par la colonne `NUM_SERIE`.
> - Affichez les 5 premières lignes de `stations`.

_Vous devriez obtenir ceci :_

| NUM_SERIE | NOM_USUEL          | LATITUDE | LONGITUDE | ALTITUDE |
| --------- | ------------------ | -------- | --------- | -------- |
| Id_118037001	| BRINON	         | 47.565	| 2.262	    | 133      |
| Id_136063001	| CHATEAUROUX DEOLS	 | 46.870	| 1.741	    | 158      |
| Id_132013005	| AUCH	             | 43.689	| 0.601	    | 122      |
| Id_042094003	| FEURS	             | 45.739	| 4.234	    | 347      |
| Id_038315002	| PONT-DE-BEAUVOISIN | 45.528	| 5.671	    | 284      |

_Chaque ligne contient les informations suivantes :_
- _le numéro de série de la station,_
- _son nom,_
- _les informations géographiques (latitude, longitude, altitude)._

<div class="alert alert-block alert-info">
    <b>Indication</b> :
    Vous pourrez penser à utiliser les fonctions <tt>read_csv</tt> (ici le séparateur est le caractère ";") et <tt>set_index</tt>.
</div>

__Question 2__

> - Importez le fichier `L2MEU205_examen_precipitations.csv` et stockez le dans le `DataFrame` appelé `precipitations`.
> - Modifiez l'index du `DataFrame` `precipitations` par la colonne `ANNEE`.
> - Affichez le nombre de lignes et de colonnes du `DataFrame` `precipitations`.
> - Affichez les 4 premières lignes et les 4 dernières lignes de `precipitations`.

_Chaque colonne est labélisée par un numéro qui correspond au numéro de série d'une station. Les valeurs de cette colonne sont les précipitations enregistrées pour chaque année de 1945 à 2022. Attention, certaines valeurs sont manquantes et sont alors notées `NaN`._

__Question 3__

> - Dans le `DataFrame` `stations`, ajoutez une colonne intitulée `PRECIPITATIONS` dont la valeur est la moyenne des précipitations. Pour calculer la valeur de la ligne `idx`, vous devez calculer la moyenne de la colonne `idx` du `DataFrame` `precipitations`.
> - Affichez les 5 premières lignes de `stations`.

_Vous devriez obtenir ceci :_

| NUM_SERIE | NOM_USUEL          | LATITUDE | LONGITUDE | ALTITUDE | PRECIPITATIONS |
| --------- | ------------------ | -------- | --------- | -------- | -------------- |
| Id_118037001	| BRINON	         | 47.565	| 2.262	    | 133      | 64.473727 |
| Id_136063001	| CHATEAUROUX DEOLS	 | 46.870	| 1.741	    | 158      | 56.734475 |
| Id_132013005	| AUCH	             | 43.689	| 0.601	    | 122      | 55.516026 |
| Id_042094003	| FEURS	             | 45.739	| 4.234	    | 347      | 58.741432 |
| Id_038315002	| PONT-DE-BEAUVOISIN | 45.528	| 5.671	    | 284      | 97.994180 |

<div class="alert alert-block alert-info">
    <b>Indication</b> :
    Vous pourrez penser à utiliser la fonctions <tt>mean</tt>.
</div>

__Question 4__

> - A partir des colonnes `LATITUDE` et `LONGITUDE`, créez deux nouvelles colonnes `X` et `Y` en appliquant la fonction `latlon_lambert93` qui convertit des coordonnées GPS (latitude, longitude) en coordonnées cartésiennes (X,Y).
> - Affichez les 5 premières lignes de `stations`.

_Vous devriez obtenir ceci :_

| NUM_SERIE | NOM_USUEL          | LATITUDE | LONGITUDE | ALTITUDE | PRECIPITATIONS | X | Y |
| --------- | ------------------ | -------- | --------- | -------- | -------------- | - | - |
| Id_118037001	| BRINON	         | 47.565	| 2.262	    | 133      | 64.473727 | 644509.350405 | 6.718551e+06 |
| Id_136063001	| CHATEAUROUX DEOLS	 | 46.870	| 1.741	    | 158      | 56.734475 | 604106.850129 | 6.641857e+06 |
| Id_132013005	| AUCH	             | 43.689	| 0.601	    | 122      | 55.516026 | 506565.144381 | 6.290713e+06 |
| Id_042094003	| FEURS	             | 45.739	| 4.234	    | 347      | 58.741432 | 795951.948358 | 6.516239e+06 |
| Id_038315002	| PONT-DE-BEAUVOISIN | 45.528	| 5.671	    | 284      | 97.994180 | 908449.847275 | 6.495584e+06 |

<div class="alert alert-block alert-info">
    <b>Indication</b> :
    Vous pourrez penser à utiliser la fonctions <tt>apply</tt>.
</div>

In [None]:
def latlon_lambert93(lat,lon):
    lat_rad, lon_rad = lat*np.pi/180, lon*np.pi/180
    ## lat,lon => projection en Lambert 93 (X,Y)
    ee = 0.08181919104281579 # Première excentricité de l'ellipsoïde GRS80
    lat0, lon0 = 46.5, 3. # en degrés, la longitude d'origine correspond à l'Est (Greenwich)
    lat0_rad, lon0_rad = lat0*np.pi/180, lon0*np.pi/180
    X0, Y0 = 700000, 12655612.049876 # coordonnées en projection du pôle
    lat_iso = np.log(np.tan(np.pi/4+lat_rad/2)*((1-ee*np.sin(lat_rad))/(1+ee*np.sin(lat_rad)))**(ee/2))
    C = 11754255.426096 # constante de la projection 
    n = 0.7256077650532670 # exposant de la projection
    Xl93 = X0 + C*np.exp(-n*lat_iso)*np.sin(n*(lon_rad-lon0_rad))
    Yl93 = Y0 - C*np.exp(-n*lat_iso)*np.cos(n*(lon_rad-lon0_rad))
    return Xl93, Yl93

## PARTIE II : représentation graphique

<div class="alert alert-block alert-danger">
    <b>ATTENTION</b></br>
    Si vous n'êtes pas parvenu à obtenir les DataFrames stations et precipitations comme indiqué dans la partie précédente, vous pouvez récupérer deux DataFrames complets en excécutant la cellule suivante. Vous pouvez ainsi poursuivre l'exercice !
</div>

In [3]:
#############################################################
# NE PAS EFFACER
# PERMET DE REPARTIR AVEC UN DATAFRAME CORRECT
stations = pd.read_pickle("L2MEU205_examen_stations_corr.pkl")
precipitations = pd.read_pickle("L2MEU205_examen_precipitations_corr.pkl")
display(stations.head(3))
display(precipitations.head(3))
#############################################################

Unnamed: 0_level_0,NOM_USUEL,LATITUDE,LONGITUDE,ALTITUDE,PRECIPITATIONS,X,Y
NUM_SERIE,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
Id_118037001,BRINON,47.565,2.262,133,64.473727,644509.350405,6718551.0
Id_136063001,CHATEAUROUX DEOLS,46.87,1.741,158,56.734475,604106.850129,6641857.0
Id_132013005,AUCH,43.689,0.601,122,55.516026,506565.144381,6290713.0


Unnamed: 0_level_0,Id_118037001,Id_136063001,Id_132013005,Id_042094003,Id_038315002,Id_143062001,Id_268224006,Id_143162001,Id_185163001,Id_179311002,...,Id_174087001,Id_020040001,Id_088075005,Id_171010004,Id_313054001,Id_120004003,Id_107153001,Id_142145003,Id_052145001,Id_141269001
ANNEE,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
1945,,,,,,,,,,,...,,,,,,,,,,
1946,,,,,,,,,,,...,,,,,,,,,,
1947,57.75,42.583333,,,,,,,,,...,,,,,,,,,,52.3


__Question 5__

Dans cette question, nous allons fabriquer un filtre de couleur.
Nous fabriquons trois fonctions : `red`, `green` et `blue` afin que, pour une valeur $x\in[0, 1]$, la couleur RVB associée à `(red(x), green(x), blue(x))` soit rouge lorsque $x$ est proche de $0$ (sécheresse), verte lorsque $x$ est autour de $0.35$ (condition normale) et bleue lorsque $x$ est proche de $1$ (fortes précipitations).

> - Créez les trois fonctions `red`, `green` et `blue` qui prennent un réel $x$ en paramètre et qui retourne
> $$
\verb!red!(x) = (1-x)^5,
\quad
\verb!green!(x) = \max(0, 1-32(x-0.35)^2),
\quad
\verb!blue!(x) = x^{3/2}.
$$
> - Tracez dans une fenêtre graphique les trois fonctions sur l'intervalle $[0,1]$.
> - Tracez dans une autre fenêtre graphique un nuage de points de coordonnées $(x,x)$ pour $x\in[0, 1]$ avec pour couleur la couleur $(\verb!red!(x), \verb!green!(x), \verb!blue!(x))$. Vous pouvez essayer d'obtenir une figure ressemblant à celle-ci :

![L2MEU205_examen_coloration.png](L2MEU205_examen_coloration.png)

<div class="alert alert-block alert-info">
    <b>Indication</b> :
    Il est possible de spécifier la couleur de chaque point dans la commande <tt>scatter</tt> en ajoutant un argument optionnel <tt>c</tt> de la forme <tt>ndarray</tt> de taille <tt>(N,3)</tt> où <tt>N</tt> est le nombre de points et la ligne d'indice $k$ est le code RVB de la couleur du point d'indice $k$.
</div>

__Question 6__

> - Déterminez la valeur minimale des précipitations moyennes, c'est-à-dire la valeur minimale de la colonne `stations["PRECIPITATIONS"]`. Nous appelerons $p_{\min}$ cette valeur. Affichez $p_{\min}$ et le nom de la station où $p_{\min}$ a été mesurée.
> - Déterminez la valeur maximale des précipitations moyennes, c'est-à-dire la valeur minimale de la colonne `stations["PRECIPITATIONS"]`. Nous appelerons $p_{\max}$ cette valeur. Affichez $p_{\max}$ et le nom de la station où $p_{\max}$ a été mesurée.

<div class="alert alert-block alert-info">
    <b>Indication</b> :
    Vous pourrez utiliser les fonctions <tt>min</tt> et <tt>max</tt>.
</div>

__Question 7__

> - Dans `stations`, déterminez le numéro des stations `BEZIERS-COURTADE`, `BREST-GUIPAVAS` et `MIJOUX`.
> - Dans une fenêtre graphique, tracez les courbe représentant les précipitations enregistrées dans ces stations.
> - Fixez la couleur de chaque courbe en utilisant le filtre proposé plus haut de la manière suivante :
>   * on appelle $p$ la valeur moyenne des précipitations de la ville considérée ;
>   * on remet à l'échelle en définissant $p_s = (p-p_{\min})/(p_{\max}-p_{\min})$ ;
>   * le code RVB de la couleur sera alors $(\verb!red!(p_s), \verb!green!(p_s), \verb!blue!(p_s))$.

_Vous pourrez essayer d'obtenir un graphique ressemblant à celui-ci_
![L2MEU205_examen_precipitations.png](L2MEU205_examen_precipitations.png)

__Question 8__

> - Tracez le nuage de points dont les coordonnées $(x,y)$ sont les valeurs des colonnes `X` et `Y`.
> - Fixez la couleur de chaque point en utilisant le filtre proposé plus haut de la manière suivante :
>   * on appelle $p$ la valeur moyenne des précipitations de la ville considérée ;
>   * on remet à l'échelle en définissant $p_s = (p-p_{\min})/(p_{\max}-p_{\min})$ ;
>   * le code RVB de la couleur sera alors $(\verb!red!(p_s), \verb!green!(p_s), \verb!blue!(p_s))$.

_Vous pourrez essayer d'obtenir un graphique ressemblant à celui-ci_
![L2MEU205_examen_precipitations_France.png](L2MEU205_examen_precipitations_France.png)