Algorithme du tri par sélection

Cours/Algorithmie/Problème du tri/Algorithme du tri par sélection

Le tri par sélection est un algorithme simple qui fonctionne de la même manière quelque-soit le tableau en entrée. L'algorithme procède ainsi : à chaque itération de l'algorithme, on place à l'indice $i$ du tableau son $i$-ème plus petit élément.

On en déduit l'algorithme en pseudo-code suivant :

algorithme sélection(T: [entier]) → ∅:
    min_index := entier
    pour chaque (i := entier) de [0 .. T.longueur[:  # boucle principale
        min_index ← i
        pour chaque (j := entier) de [i + 1 .. T.longueur[:  # boucle intérieure
            si T[j] < T[min_index]:
                min_index ← j
        T[i], T[min_index] ← T[min_index], T[i]

code python

def sélection(T):
    for i in range(len(T) - 1):
        min_index = i
        for j in range(i + 1, len(T)):
            if T[j] < T[min_index]:
                min_index = j
        T[i], T[min_index] = T[min_index], T[i]

L'algorithme sélection modifie le tableau passé en paramètre.

Définition

Les algorithmes qui modifient leurs entrées sont appelés in place

Fonctionnement

Vérifiez que l'algorithme fonctionne pour :

un petit tableau trié : [1, 2, 3]
un petit tableau non trié où le plus petit est en dernière place : [3, 2, 1]

Preuve

Le principe de fonctionnement est clair :

la boucle pour chaque de la ligne 4 trouve l'indice du plus petit élément du tableau T[i:].
la ligne 7 échange le minimum du tableau T[i:] avec T[i]
la boucle principale fait recommencer cette procédure pour chaque indice de $T$.

On a alors clairement l'invariant de boucle :

Invariant de boucle : À la fin de chaque étape $i$ de l'algorithme les $i$ plus petites valeurs du tableau sont triées aux $i$ premiers indices du tableau.

Qui permet de prouver qu'la fin de la boucle principale, le tableau est trié.

Complexités

On suppose que la taille du tableau est $n$.

Allons plus vite pour la complexité :

toutes les instructions sont en $\mathcal{O}(1)$
la boucle principale effectue $\mathcal{O}(n)$ itérations ($n-1$ exactement mais ce n'est pas important)
la boucle intérieure fait $n-i-1$ itérations

Le nombre d'itérations de la boucle intérieure n'est pas constant, mais il décroît puisque $i$ augmente à chaque itération de la boucle pour chaque de la ligne 2. On peut alors utiliser la règle de croissance pour utiliser le maximum, $n-1$, pour le calcul de la complexité.

Ce qui donne une complexité de :

$$ \begin{array}{lcl} C & = & \mathcal{O}(1) + \mathcal{O}(n) \cdot (\mathcal{O}(1) + \mathcal{O}(n) \cdot \mathcal{O}(1))\\ & = & \mathcal{O}(1) + \mathcal{O}(n) \cdot \mathcal{O}(n)\\ & = & \mathcal{O}(n^2) \\ \end{array} $$

Le nombre d'itérations est constant quelque soit le tableau, on a donc :

Proposition

La complexité de l'algorithme sélection est ($n$ est la taille du tableau passé en entrée) :

la complexité min vaut $\mathcal{O}(n^2)$
la complexité (max) vaut $\mathcal{O}(n^2)$
la complexité en moyenne vaut également $\mathcal{O}(n^2)$ (car les complexités min et max sont égales)