# TP 2 : Dictionnaires, utilisation pour la lecture de fichiers

Les dictionnaires sont une structure de données particulièrement adaptée pour stocker des données du type tableau à en-têtes (dont les colonnes ont des noms) comme on peut en trouver dans des fichiers excel ou csv.

Les objectifs de ce TP sont de :
- comprendre la structure d'un dictionnaire
- construire un dictionnaire
- accéder au contenu d'un dictionnaire et le modifier
- utiliser la structure de dictionnaire pour lire informatiquement des fichiers `.csv`

## 1. Construction d'un dictionnaire et affichage des données

Un dictionnaire est une collection non ordonnée dont chaque entrée (appelée *valeur*) est assignée par une *clé*. 

*clés :*|"Sébastien"|"Émilie"|"Rafael"
:---|---|---|---|
*valeurs :*| "Hôtel de Matignon" | "Bâtiment 490" | "Salle info" |


Par exemple, le dictionnaire ci-dessus contient un "carnet d'adresses" (valeurs) et on accède à chaque contact en précisant son nom (clé).

On le définirait ainsi en python : 
```python
exemple_dico = {"Sébastien" : "Hôtel de Matignon", "Émilie" : "Bâtiment 490", "Rafael" : "Salle info"}
```


**Similitudes avec les listes :**

- La clé pour un dictionnaire est l'analogue de l'indice pour une liste.

- L'accès à une valeur du dictionnaire se fait avec la syntaxe `nom_du_dico[clé]`

- la construction d'un dictionnaire se fait grâce aux symboles `{}`, de la manière suivante :

    - `mon_dico = {clé1 : valeur1, clé2 : valeur2,...}`
    
    - contrairement aux listes il n'y a pas de position (d'indice) sous-entendue, il faut donc bien renseigner pour chaque valeur la clé correspondante que l'on choisit

**Exercice 1:**

Créer un dictionnaire contenant les informations suivantes sur vous : 
- votre âge
- votre activité préférée
- la liste (sous forme d'une liste Python) de vos voisin.e.s de résidence ou de table
- le nombre de minutes que vous aurez passé sur cet exercice

Ce dictionnaire servira dans les exercices suivants

---
Comme n'importe quel objet en python, on peut afficher un dictionnaire et accéder à son contenu de différentes manières :

*(ci-dessous, `dico` désigne un nom de dictionnaire et `cle` une clé de ce dictionnaire)*

- soit on affiche tout le dictionnaire à l'aide de la fonction `print` (comme n'importe quel autre affichage en python)

- soit on accède/affiche seulement les clés du dictionnaire : avec la commande `dico.keys()`

- soit on accède/affiche seulement les valeurs du dictionnaire : avec la commande `dico.values()`
    
- soit on accède/affiche une valeur spécifique associée à une des clés, comme sur les listes : `dico[cle]`


**Exercice 2 :**

Tester les 4 types d'affichage listés ci-dessus sur votre dictionnaire créé à l'exercice 1



In [None]:
# On pourra utiliser print() sans argument pour sauter une ligne entre chaque affichage


---
On peut facilement modifier/ajouter/supprimer une entrée (c'est-à-dire une clé et une valeur associée) dans un dictionnaire déjà crée : 

- pour modifier une entrée : `dico[cle] = nouvelle_valeur` lorsque `cle` est déjà une clé existante dans le dictionnaire

- pour ajouter une entrée : `dico[nouvelle_cle] = nouvelle_valeur` lorsque `nouvelle_cle` désigne une clé que l'on veut ajouter au dictionnaire et `nouvelle_valeur` désigne la valeur qu'on veut lui associer

- pour supprimer une entrée : `del dico[cle]` supprime la paire "clé/valeur" associé à la clé `cle` existante

**Exercice 3:**

**1)** Dans le dictionnaire créé précédemment, modifier la liste de vos voisins, et affichier la liste des voisins pour vérifier

**2)** Supprimer l'entrée concernant votre activité préférée, afficher le dictionnaire pour vérifier

**3)** Ajouter dans le dictionnaire votre numéro de groupe d'APP, afficher le dictionnaire pour vérifier

## 2. Parcourir un dictionnaire

On sait parcourir une liste, soit en parcourant les indices soit en parcourant directement les éléments. On a quelque-chose de très similaire sur les dictionnaires :
- soit on parcourt les clés
- soit on parcourt les valeurs
- soit on parcourt les deux en même temps !

**Exercice 4 :**

Exécuter le programme suivant et expliquer le fonctionnement de chacune des boucles à l'aide des affichages du programme.

In [None]:
mes_fruits = {"poire": 3, "pomme": 4, "orange": 2}

print("Première boucle :")
for fruit in mes_fruits.keys():
	print(fruit)

print()
print("Deuxième boucle :")
for d in mes_fruits:
	print (d)

print()
print("Troisième boucle :")
for qte in mes_fruits.values():
    print(qte)

print()
print("Quatrième boucle :")
for fruit, qte in mes_fruits.items():
	print (fruit, ":", qte)

**Question**

Après avoir compilé le code ci-dessus, on se rend compte que :

- la syntaxe de la première boucle permet de parcourir : 

...

- la syntaxe de la deuxième boucle permet de parcourir :

...

- la syntaxe de la troisième boucle permet de parcourir :

...

- la syntaxe de la quatrième boucle permet de parcourir :

...

## 3. Utilisation pour la lecture de fichiers .csv

Les dictionnaires sont une structure permettant d'avoir une première approche des bases de données. En particulier ils vont permettre de lire et manipuler les données contenus dans un fichier `.csv` qui est un des formats les plus répandus pour stocker des données brutes (CSV = "Comma-Separated Values")

Vous pouvez ouvrir le fichier `villes.csv` sur votre ordinateur et vous verrez qu'il contient des colonnes ayant chacune un nom, de la manière suivante :

dep|nom|cp|nb_habitants_2010|...
---|:---|---|:---|---|
1| Ozan| 1190 |618|... |
1| Cormoranche-sur-Saône| 1290 |1058|... |

**Pour manipuler ce fichier, placez-le dans le même dossier que le notebook**

Chaque dictionnaire contient alors des paires clés/valeurs contenant les caractéristiques d'une ville. Et il y a autant de dictionnaires dans la liste que de villes dans le fichier (et donc autant que de lignes car une ligne représente une ville).

Donc, pour enregistrer (et plus tard manipuler) les infos du fichier `.csv` dans Python, on crée une liste de dictionnaires. C'est ce que font les lignes de code ci-dessous.

In [None]:
liste_dicos = []
import csv
with open('villes.csv') as csvfile:
    reader = csv.DictReader(csvfile, delimiter=';')
    for row in reader:
        liste_dicos.append(dict(row))

Chaque élément de la liste est un dictionnaire ayant pour clés les en-têtes des colonnes et pour valeurs le contenu de chaque ligne :

In [None]:
# affichage des 5 premiers dictionnaires de la liste
for i in range(5):
    print(liste_dicos[i])
    print()

In [None]:
print("Il y a ", len(liste_dicos), "villes dans le fichier")

**Exercice 5 :**

Écrire une fonction qui : 
- prend en entrée le nom d'une ville (sous forme d'une chaîne de caractères)
- retourne le dictionnaire contenant les informations correspondant à cette ville

Vous pouvez vous appuyer sur le squelette ci-dessous :

```python
def recherche_dico(ville):
    """
    retourne le dictionnaire contenant les informations d'une ville donnée. 
    exemple d’utilisation:
    >>> ville = "Orsay"
    >>> print(recherche_dico(ville))
    {'dep': '91', 'nom': 'Orsay', 'cp': '91400', 'nb_hab_2010': '15966', 'nb_hab_1999': '16219', 'nb_hab_2012': '16300', 'dens': '2003', 'surf': '7,97', 'long': '2,18333', 'lat': '48,7', 'alt_min': '51', 'alt_max': '160'}
    """
    # à compléter
```

In [None]:
def recherche_dico(ville):

In [None]:
# test de la fonction
print(recherche_dico('Orsay'))

**Exercice 6 :**

Écrire une fonction `valeurs` qui :
- prend en entrée une liste de dictionnaires et une clés communes à tous ces dictionnaires (un des noms des en-têtes de colonnes)
- renvoie la liste de toutes les valeurs correspondant à cette clé **(Attention : si ce sont des valeurs numériques, vous veillerez à ce que le type de donnée soit bien numérique et pas une chaîne de caractère comme c'est le cas par défaut)**

Vous pouvez vous appuyer sur le squelette ci-dessous :

```python
def valeurs(liste_dicos, cle):
    """
    retourne la liste des valeurs associées à la clé "cle" de chaque dictionnaire de liste_dicos
    exemple d’utilisation:
    >>> cle = "nom"
    >>> print(valeurs(cle))
    ['Ozan', 'Cormoranche-sur-Saône', 'Plagne', 'Tossiat', 'Pouillat',...]
    """
    # à compléter
```


In [None]:
# On pourra utiliser cette fonction, qui voit s'il est possible de convertir une chaîne de caractères en flottant
def is_number(s):
    try:
        float(s)
        return True
    except ValueError:
        return False

In [None]:
print(is_number(0.1))
print(is_number("0.1"))
print(is_number("Stéphanie de Monaco"))

In [None]:
def valeurs(liste_dicos, cle) :

In [None]:
# test de la fonction valeurs
print(valeurs(liste_dicos, "nb_hab_2012"))

**Exercice 7 :**
Écrire une fonction `dico_colonnes` qui
- prenant en argument une liste de dictionnaire ayant tous les mêmes clés
- retourne un seul dictionnaire, dont les clés sont les mêmes que ci-dessus et dont les valeurs sont les listes des valeurs de chaque ville

Par exemple, une des association clé-valeurs du dictionnaire sera
```python
{"nom" : ['Ozan', 'Cormoranche-sur-Saône', 'Plagne', 'Tossiat', 'Pouillat',...], ...}
```

*Utilisez la fonction `valeurs` de l'exercice 6 et testez votre fonction sur la liste des dictionnaires représentant les villes*

In [None]:
def dico_colonnes(liste_dicos):

In [None]:
dic_colonnes = dico_colonnes(liste_dicos)
print(dic_colonnes['dep'][0:1000])

## 4. Utilisation d'un module pour des représentations graphiques

*Seaborn* est une librairie Python adaptée au tracé de nombreux graphiques lorsque nous disposons de données sous formes de listes ou de dictionnaire.
Lorsque le dictionnaire est bien structuré, elle permet d'effectuer des tracés complexes aisément.

La documentation complète est disponible ici : https://seaborn.pydata.org/tutorial/introduction.html

In [None]:
# Importation de la librairie
import seaborn as sns

# Défini l'apparence par défaut des graphiques
sns.set_theme()

**Exercice 8 :**

La fonction `sns.histplot()` peut s'appliquer à une liste afin de représenter un histogramme des valeurs.

**1)** À l'aide par exemple de la fonction `valeurs` de l'exercice 6, afficher l'histogramme des nombres d'habitants en 2012. On recommande l'utilisation des paramètres `bins` (nomrbe de barres dans l'histogramme) et `binrange` (valeurs min et max à prendre en compte) pour que l'histogramme soit lisible (voir documentation : https://seaborn.pydata.org/generated/seaborn.histplot.html#seaborn.histplot).

**2)** À l'aide d'un autre paramètre de la fonction `histplot` (voir documentation : https://seaborn.pydata.org/generated/seaborn.histplot.html#seaborn.histplot), faites en sorte que la hauteur des barres correspondent à des fréquences et pas à un comptage.

**Exercice 9 :**

La fonction `sns.barplot()` peut s'appliquer à deux listes (mises ensemble sous forme de dictinnaires) :
- la première représentant des noms de catégories
- la deuxième représentant les valeurs associées à chaque catégorie
afin de tracer le diagramme en bâtons associé

Exemple : pour utiliser `sns.barplot()` sur les listes `["Groupe 1", "Groupe 2"]` et `[42, 203]`, on crée d'abord le dictionnaire

`
dico_data = {Groupe : ['1', '2'], Nombre : [42, 203]}
`

Et on utilise la commande `sns.barplot(dico_data, 'x' = 'Groupe', 'y' = 'Nombre')`

Écrire une fonction qui :
- prend en entrée deux lettres de l'alphabet en majuscules
- affiche le diagramme en barre représentant le nombre de villes commençant par chacune de ces lettres

In [None]:
def baton_lettres(liste_dicos, lettre1, lettre2) : # Attention, lettre1 et lettre2 doivent être en majuscule

In [None]:
# TEST
baton_lettres(liste_dicos, "C", "B")

**Exercice 10 :**

- Créer une liste liste_villes `liste_villes` qui contient le nombre de villes commençant par la lettre A, puis B, puis C, etc. On pourra utiliser la liste `liste_lettres`ci-dessous.

- Implémenter un algorithme qui trie `liste_lettres` tout en effectuant les mêmes échanges à `liste_lettres`, de manière à garder trace de la première lettre correspondant à un nombre de villes donné.

On pourra s'aider du squelette ci-dessous.

```python
def tri(liste1, liste2):
    """Ici, on va trier liste1 (ex: le nombre de villes)
    et appliquer les mêmes échanges à liste2 (ex : les lettres)
    Exemple d’utilisation:
    >>> liste1 = [4, 3, 1, 2]
    >>> liste2 = ["Annabelle", "Romain", 90, True]
    >>> tri(liste1, liste2)
    >>> print(liste1)
    [1,2,3,4]
    >>> print(liste2)
    [90, True, "Romain", "Annabelle"]
    """
    # à compléter
```

- Afficher un seul et même graphique, afficher le diagramme en bâtons du nombre de villes commençant par chaque lettre de l'alphabet, ordonnée selon le nombre de villes associées (on pourra implémenter une fonction de tri adaptée).

In [None]:
liste_lettres = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H',
                 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P',
                 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X','Y', 'Z']

# Commencer par créer une liste liste_villes qui recensent le nombre de villes commençant par A, B, C, ...
liste_villes = [0] * 26
# À compléter

In [None]:
# On rappelle la fonction, utile pour implémenter votre tri
def echanger(l, i, j) :
    stock = l[i]
    l[i] = l[j]
    l[j] = stock

def tri(liste1, liste2) : 
    # À compléter

tri(liste_villes, liste_lettres)