# Le module `numpy` : manipulation de tableaux

---

Les tableaux `numpy` sont fournis avec de nombreuses fonctions. En particuler, il est possible de faire des manipulations algébriques terme à terme ou des manipulations vectorielles rapidement.

Nous noterons `x` un tableau à une dimension et `A` un tableau à deux dimensions pour nos exemples.

In [1]:
import numpy as np
gen = np.random.default_rng()

In [2]:
x = gen.random(5)       # ndarray de dimension 1 avec 5 éléments
A = gen.random((5, 4))  # ndarray de dimension 2 avec 5x4 éléments

print(x)
print(A)

[0.56010944 0.27263815 0.03488023 0.62849847 0.64697831]
[[0.98779678 0.35496193 0.03379976 0.72806892]
 [0.80069925 0.37894979 0.39060859 0.18065917]
 [0.99491751 0.91602682 0.52911717 0.25215036]
 [0.51083294 0.79904868 0.48461461 0.76956467]
 [0.58565327 0.01176881 0.84345601 0.94239473]]


In [3]:
B = np.zeros(A.shape, dtype=int)
print(B.dtype)
B[:] = A
print(B)

int64
[[0 0 0 0]
 [0 0 0 0]
 [0 0 0 0]
 [0 0 0 0]
 [0 0 0 0]]


## Caractéristiques des tableaux

Il est possible d'accéder facilement à la forme d'un tableau (attribut `shape`), au nombre total d'éléments (attribut `size`), au type des éléments (attribut `dtype`) et au nombre de dimensions (attribut `ndim`) :

In [2]:
for T in [x, A]:
    print(T.shape)  # forme du tableau (tuple)
    print(T.size)   # taille du tableau (int)
    print(T.dtype)  # type des éléments du tableau
    print(T.ndim)   # nombre de dimensions du tableau (taille de shape)

(5,)
5
float64
1
(5, 4)
20
float64
2


## Accès aux éléments en lecture et écriture : les slices

L'accès aux éléments en lecture et en écriture se fait grâce à l'opérateur `[]`.

Il est possible d'accéder à un seul élément : `x[i]`, pour `i` entre `0` et `x.size`, et `A[i, j]`, pour `i` entre `0` et `A.shape[0]`, `j` entre `0` et `A.shape[1]`.

In [7]:
print(x[1])
print(A[1, 2])
print(A[(1, 2)])
#print(x[x.size-1])
print(A[1][2])  # solution interdite !!!
#print(A[1, 2])

0.3771173868667077
0.46851809023154434
0.46851809023154434
0.46851809023154434


In [16]:
print(A)
b = A[0]
print(type(b))
print(b.ndim, b.shape)
print(b[1])
b[1] = 0
print(A)

[[0.78623991 0.26053104 0.27598648 0.61229728]
 [0.70851122 0.66175222 0.63994956 0.0227666 ]
 [0.91054592 0.93936025 0.56463231 0.97984684]
 [0.33694979 0.09529412 0.94009188 0.98016555]
 [0.19446173 0.23792616 0.47398271 0.85189476]]
<class 'numpy.ndarray'>
1 (4,)
0.26053104120924075
[[0.78623991 0.         0.27598648 0.61229728]
 [0.70851122 0.66175222 0.63994956 0.0227666 ]
 [0.91054592 0.93936025 0.56463231 0.97984684]
 [0.33694979 0.09529412 0.94009188 0.98016555]
 [0.19446173 0.23792616 0.47398271 0.85189476]]


Il est possible d'accéder aux éléments de la fin du tableau en utilisant les nombres négatifs : le `-1` signifie le dernier élément, le `-2` l'avant-dernier, *etc*.

In [18]:
print(x[-1])
print(A[1, -2])

0.6635663333240868
0.0227665967052727


L'intérêt majeur des tableaux `numpy` est que l'on peut accéder directement à une *tranche* du tableau en utilisant les `:`. Voici quelques exemples :

In [13]:
print(x[:])     # tous les éléments
y = 1.*x
y[:] = 1
print(y)
print(x[1:-1])  # tous les éléments sauf le premier et le dernier
print(list(x))
print(x[0])

[0.55050545 0.98319061 0.73582179 0.54370626 0.60749859]
[1. 1. 1. 1. 1.]
[0.98319061 0.73582179 0.54370626]
[0.5505054460763856, 0.983190612221074, 0.7358217862300735, 0.5437062623567378, 0.6074985900628335]
0.5505054460763856


In [25]:
print(A[:, 0])        # la première colonne
print(A[1:-1, 1:-1])  # on enlève les premières et dernières lignes/colonnes

[0.78623991 0.70851122 0.91054592 0.33694979 0.19446173]
[[0.66175222 0.63994956]
 [0.93936025 0.56463231]
 [0.09529412 0.94009188]]


In [26]:
print(A[::2, ::-1])  # on peut aussi faire varier le pas de la tranche !!!

[[0.61229728 0.27598648 0.         0.78623991]
 [0.97984684 0.56463231 0.93936025 0.91054592]
 [0.85189476 0.47398271 0.23792616 0.19446173]]


## Modification des éléments

Un point très important sur les tableaux `numpy` : l'affectation ne fait pas de copie... Pour faire une copie, il est nécessaire d'utiliser la fonction membre `copy()`. Sinon il y a un risque de modifier le tableau original...

In [6]:
B = A.copy()
C = np.ones(A.shape)
print(B)
B_in = B[1:-1, 1:-1]    # B_in est une sous-partie de B
B_in[:] = C[1:-1, 1:-1] # on copie les valeurs de C
print(B_in)
B_in[:] = 0
print(B)
print(B_in)

[[0.3706734  0.29549236 0.9747641  0.89231109]
 [0.4623028  0.16218623 0.30234168 0.54591381]
 [0.16482632 0.35949049 0.27579218 0.05809409]
 [0.93020523 0.0368659  0.16200451 0.24486576]
 [0.33844089 0.4964843  0.7517025  0.77986938]]
[[1. 1.]
 [1. 1.]
 [1. 1.]]
[[0.3706734  0.29549236 0.9747641  0.89231109]
 [0.4623028  0.         0.         0.54591381]
 [0.16482632 0.         0.         0.05809409]
 [0.93020523 0.         0.         0.24486576]
 [0.33844089 0.4964843  0.7517025  0.77986938]]
[[0. 0.]
 [0. 0.]
 [0. 0.]]


## Redimensionnement d'un tableau

L'attribut `shape` d'un tableau peut être modifié sans faire de copie. Pour faire simple, les tableaux `numpy` sont stockés de manière mono-dimensionnelle même si on peut les voir comme des matrices, ... Les dimensions supérieures à 2 ne servent en réalité qu'à accéder aux valeurs par d'autres vues.

Pour modifier la forme d'un tableau, on modifie l'attribut `shape`

In [9]:
x = np.arange(10)
print(x)
print(x.shape)
x.shape = (2, 5)
print(x.shape)
print(x)
x.shape = (5, 2)
print(x.shape)
print(x)

[0 1 2 3 4 5 6 7 8 9]
(10,)
(2, 5)
[[0 1 2 3 4]
 [5 6 7 8 9]]
(5, 2)
[[0 1]
 [2 3]
 [4 5]
 [6 7]
 [8 9]]


on peut aussi utiliser la commande `reshape` qui crée une vue (pas de copie)

In [13]:
x = np.arange(10)
x.shape = (5, 2)
y = x.reshape((10,))
y[::2] = -1
print(y)
print(x)

[-1  1 -1  3 -1  5 -1  7 -1  9]
[[-1  1]
 [-1  3]
 [-1  5]
 [-1  7]
 [-1  9]]


la fonction membre `flatten` fait une copie du tableau en écrasant toutes les dimensions

In [42]:
print(B)
C = B.flatten()  # shape = (size, )
print(C)
print(B.shape)
print(C.shape)
B[0, :] = 1
print(B)
print(C)

[[0.40296204 0.57118429 0.58225458 0.71689091]
 [0.73333866 0.         0.         0.81487278]
 [0.36907674 0.         0.         0.92957579]
 [0.67587119 0.         0.         0.04505474]
 [0.14043113 0.58567978 0.1844606  0.19235648]]
[0.40296204 0.57118429 0.58225458 0.71689091 0.73333866 0.
 0.         0.81487278 0.36907674 0.         0.         0.92957579
 0.67587119 0.         0.         0.04505474 0.14043113 0.58567978
 0.1844606  0.19235648]
(5, 4)
(20,)
[[1.         1.         1.         1.        ]
 [0.73333866 0.         0.         0.81487278]
 [0.36907674 0.         0.         0.92957579]
 [0.67587119 0.         0.         0.04505474]
 [0.14043113 0.58567978 0.1844606  0.19235648]]
[0.40296204 0.57118429 0.58225458 0.71689091 0.73333866 0.
 0.         0.81487278 0.36907674 0.         0.         0.92957579
 0.67587119 0.         0.         0.04505474 0.14043113 0.58567978
 0.1844606  0.19235648]


## Boucle sur les tableaux

Il y a plusieurs façons de faire des boucles sur les tableaux : soit sur les indices, soit directement sur les éléments car un tableau peut être vu comme un itérable.

In [43]:
for i in range(A.shape[0]):
    for j in range(A.shape[1]):
        print(f"A[{i:1d}, {j:1d}] = {A[i, j]}")

A[0, 0] = 0.4029620436231577
A[0, 1] = 0.5711842918750226
A[0, 2] = 0.5822545811405262
A[0, 3] = 0.7168909148318624
A[1, 0] = 0.7333386577562792
A[1, 1] = 0.04903131283969531
A[1, 2] = 0.9534290983083085
A[1, 3] = 0.8148727841266159
A[2, 0] = 0.36907674145657765
A[2, 1] = 0.015684460895222352
A[2, 2] = 0.7153621725775243
A[2, 3] = 0.9295757850973615
A[3, 0] = 0.6758711947878449
A[3, 1] = 0.2349832954274067
A[3, 2] = 0.8168640664241296
A[3, 3] = 0.04505474363460582
A[4, 0] = 0.14043113199637214
A[4, 1] = 0.5856797844066353
A[4, 2] = 0.18446060330004188
A[4, 3] = 0.19235647620494312


In [44]:
for Ai in A:
    for Aij in Ai:
        print(Aij)

0.4029620436231577
0.5711842918750226
0.5822545811405262
0.7168909148318624
0.7333386577562792
0.04903131283969531
0.9534290983083085
0.8148727841266159
0.36907674145657765
0.015684460895222352
0.7153621725775243
0.9295757850973615
0.6758711947878449
0.2349832954274067
0.8168640664241296
0.04505474363460582
0.14043113199637214
0.5856797844066353
0.18446060330004188
0.19235647620494312


In [45]:
for i, Ai in enumerate(A):
    for j, Aij in enumerate(Ai):
        print(f"A[{i:1d}, {j:1d}] = {Aij}")

A[0, 0] = 0.4029620436231577
A[0, 1] = 0.5711842918750226
A[0, 2] = 0.5822545811405262
A[0, 3] = 0.7168909148318624
A[1, 0] = 0.7333386577562792
A[1, 1] = 0.04903131283969531
A[1, 2] = 0.9534290983083085
A[1, 3] = 0.8148727841266159
A[2, 0] = 0.36907674145657765
A[2, 1] = 0.015684460895222352
A[2, 2] = 0.7153621725775243
A[2, 3] = 0.9295757850973615
A[3, 0] = 0.6758711947878449
A[3, 1] = 0.2349832954274067
A[3, 2] = 0.8168640664241296
A[3, 3] = 0.04505474363460582
A[4, 0] = 0.14043113199637214
A[4, 1] = 0.5856797844066353
A[4, 2] = 0.18446060330004188
A[4, 3] = 0.19235647620494312


In [14]:
# accès en écriture car Ai est un ndarray
print(A)

for Ai in A:
    Ai[:] = 0
print(A)

# accès en lecture seule (copie) car Aij est un float
for Ai in A:
    for Aij in Ai:
        Aij = 1
print(A)

[[0.3706734  0.29549236 0.9747641  0.89231109]
 [0.4623028  0.16218623 0.30234168 0.54591381]
 [0.16482632 0.35949049 0.27579218 0.05809409]
 [0.93020523 0.0368659  0.16200451 0.24486576]
 [0.33844089 0.4964843  0.7517025  0.77986938]]
[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]
[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]
