Algorithme du tri rapide

Cours/Algorithmie/Problème du tri/Algorithme du tri rapide

Le tri rapide est un algorithme qui a été très utilisé par le passé. On le montre encore maintenant car c'est un exemple d'algorithme diviser pour régner et, surtout, le calcul de ses complexités est très intéressant.

Le principe est ici de séparer le tableau en entrée T en 2 tableaux T1 et T2 et une valeur nommé pivot de tel sorte que :

toutes les valeurs de T1 soient plus petites que pivot
toutes les valeurs de T2 soient strictement plus grande que pivot

On a coutume de prendre pivot comme étant T[0].

Une fois ce découpage des données fait, la fonction combiner est triviale puisqu'il suffit de concaténer T1 trié à [T[0]] puis à T2 trié.

Les preuves formelles de complexités sont ardues. On ne vous demande pas de les connaître (mais jetez-y un coup d'œil elle valent cependant le détour).

En revanche vous devez intégrer les preuves intuitives car les arguments exposés sont courant et vous permettront de sentir la complexité de nombreux algorithmes.

pseudo-code

En pseudo-code cela donne :

algorithme rapide(T: [entier]) → [entier]:
    si T.longueur <= 1:
        rendre une copie de T

    T1 ← un nouveau tableau contenant tous les éléments T[1:] plus petits ou égaux à T[0]
    T2 ← un nouveau tableau contenant tous les éléments T[1:] strictement plus grand que T[0]

    T1' ← rapide(T1)
    T2' ← rapide(T2)
    rendre T1' + [T[0]] + T2'

code python

En utilisant des list comprehension de python, le code est plus compacte et plus clair que sa version en pseudocode :

def rapide(T):
    if len(T) <= 1:
        return list(T)

    pivot = T[0]

    T1 = [T[i] for i in range(1, len(T)) if T[i] <= pivot]
    T2 = [T[i] for i in range(1, len(T)) if T[i] > pivot]

    return rapide(T1) + [pivot] + rapide(T2)

Les list comprehension sont un moyen clair et efficace de générer des listes. Utilisez-les !

Preuve

Comme rapide est une implémentation de la méthode diviser pour régner : on trie deux tableaux, le premier contenant les éléments plus petit que T[0], l'autre les éléments strictement plus grand puis on les concatène. Son fonctionnement est donc assuré si les récursions s'arrêtent.

C'est effectivement le cas ici puisque les tableaux T1 et T2 sont strictement plus petit que T et qu'il y ait une condition d'arrêt sur la taille du tableau.

Complexités

On va noter $n$ la taille du tableau $T$. Les lignes de l'algorithme rapide hors récursions ne sont pas en $\mathcal{O}(1)$ :

les lignes 4 et 5 sont chacune en $\mathcal{O}(n)$
la ligne 10, ue concaténation est aussi en $\mathcal{O}(n)$

En ajoutant les lignes 8 et 9 qui effectuent la récursion, on a comme équation de récurrence pour la complexité $C(n)$ de l'algorithme rapide :

$$ C(n) = \underbracket{\mathcal{O}(n)}_{\mbox{hors r\'ecursion}}{} + \underbracket{C(n_1) + C(n_2)}_{\mbox{r\'ecursions}}{} $$

Où $n_1$ est la taille du tableau de gauche et $n_2$ celle de droite ($n_1 + n_2 = n-1$). Pour trouver $n_1$ et $n_2$, il faut résoudre l'équation :

$$ \begin{cases} C(n) = \mathcal{O}(n) + \max_{0 \leq i < n}(C(i) + C(n-i-1))\\ C(1) = 1 \end{cases} $$

On va montrer que :

À retenir

Pour trier un tableau de longueur $n$, les complexités de rapide sont :

la complexité (maximale) est $C_{\max}(n) = \mathcal{O}(n^2)$,
la complexité en moyenne est $C_{\mbox{moy}} = \mathcal{O}(n\ln (n))$,
la complexité minimale est $C_{\min}(n) = \mathcal{O}(n\ln (n))$,

Retenez les complexités ci-dessus et les raisons intuitives de leurs calculs. Si vous voulez aller plus loin, vous pouvez étudier les preuves formelles, surtout qu'elles sont jolies et vous apprendront à calculer des complexités dans des cas non triviaux.

Complexité (maximale) du tri rapide

Le tri rapide est un algorithme de tri bien spécial puisqu'il ne fonctionne pas bien lorsque le tableau en entrée est déjà trié :

Proposition

La complexité du tri rapide est en $\Theta(n^2)$ avec $n$ la taille tu tableau à trier.

Ce cas est atteint si le tableau est déjà trié (par ordre croissant ou décroissant).

preuve intuitive

La complexité maximale va arriver si un des deux tableaux est toujours vide. Par exemple lorsque le tableau est déjà trié.

Pour des tableaux triés, T1 ou T2 est vide et l'autre tableau est de taille $n-1$, ce qui donne une complexité de :

$$ \begin{array}{lcl} C_{\mbox{tri\'e}}(n) &=& \Theta(n) + C_{\mbox{tri\'e}}(0) + C_{\mbox{tri\'e}}(n-1)\\ &=&\Theta(n) + C_{\mbox{tri\'e}}(n-1)\\ &=& \Theta(n) + \Theta(n-1) + C_{\mbox{tri\'e}}(n-2)\\ &=& ...\\ &=& \sum_{i=1}^{n}\Theta(i) + C_{\mbox{tri\'e}}(0)\\ &=& \Theta(\sum_{i=1}^{n}i)\\ &=& \Theta(n^2)\\ \end{array} $$

Et donc :

$$ C_{\max}(n) = \Theta(n^2) $$

preuve formelle

Formellement, nous ne venons que de montrer que $C(n) = \Omega(n^2)$ puisque l'on a pas prouvé que les tableaux triés étaient le cas le pire. Pour conclure la preuve, il nous reste à montrer que $C(n) = \mathcal{O}(n^2)$.

Faisons-le par récurrence en prouvant qu'il existe $K$ tel que $C(n) \leq K \cdot n^2$ pour tout $n\geq 1$. Cette hypothèse est trivialement vraie pour $n=1$ et supposons la vraie pour $n-1$. Examinons le cas $n$ :

$$ \begin{array}{lcll} C_{\max}(n) & = & \mathcal{O}(n) + \max_{0 \leq i < n}(C_{\max}(i) + C_{\max}(n-i-1))&\\ & \leq & \mathcal{O}(n) + \max_{0 \leq i < n}(K\cdot i^2 + K\cdot(n-i-1)^2)&\text{par hypothèse de récurrence}\\ & \leq & \mathcal{O}(n) + \max_{0 \leq i < n}(K\cdot(i + n-i-1)^2)&\text{car } a^2+b^2 \leq (a+b)^2 \text{ pour des entiers positifs}\\ & \leq & \mathcal{O}(n) + \max_{0 \leq i < n}(K\cdot(n-1)^2)&\\ & \leq & \mathcal{O}(n) + K\cdot(n-1)^2&\\ & \leq & \mathcal{O}(n) + K\cdot n^2 -K(2n-1)&\\ & \leq & \mathcal{O}(n^2)&\\ \end{array} $$

Notre hypothèse est démontrée.

On a finalement l'encadrement : $\Theta(n^2) = C_{\max}(n) = \mathcal{O}(n^2)$, ce qui nous permet de conclure que la complexité (maximale) du tri rapide pour un tableau de taille $n$ est $\Theta(n^2)$.

Complexité minimale du tri rapide

Proposition

La complexité du tri rapide est en $\mathcal{O}(n\ln(n))$ avec $n$ la taille tu tableau à trier.

preuve intuitive

Comme $C(n)$ est une fonction croissante et que $C(n) \geq \mathcal{O}(n)$, la complexité de l'algorithme croit de façon linéaire ou plus. Si la forme de $C(n)$ est sans point d'inflexion, au moins asymptotiquement, la courbe de complexité sera au-dessus de sa tangente : c'est une fonction convexe.

croissance convexe

On a alors $C_{\min}(\frac{n}{k}) + C_{\min}(\frac{(k-1)n}{k}) \geq 2\cdot C_{\min}(\frac{n}{2})$. Il sera donc toujours plus intéressant de couper notre tableau en 2 exactement. Dans ce cas là, on a l'équation de récurrence : $C_\min(n) = \mathcal{O}(n) + 2 \cdot C_\min(\frac{n}{2})$ et la preuve de l'algorithme fusion nous permet de conclure que :

$$ C_{\min(n)} = \mathcal{O}(n\ln(n)) $$

De façon générale, les courbes de complexités sont sans points d'inflexions (d'où viendraient-ils de toute façon ?). Les complexités plus grande que $\mathcal{O}(n)$ sont donc (quasiment) toutes convexes.

preuve formelle

Faisons la preuve de complexité rigoureusement.

Pour chaque exécution de l'algorithme, on crée (au maximum) deux tableaux à partir du tableau $T$ passé en paramètre. On peut ranger ces créations par étage, comme le montre la figure suivante :

étages récursions

On lance l’algorithme à l'étage 0 avec $T_0$ comme tableau originel. Ce tableau crée (au maximum) les tableaux $T_1$ et $T_2$ à l'étage 1 qui eux-même vont créer d'autres tableaux qui formeront l'étage 2 et ainsi de suite.

Chaque tableau $T_i$ crée donc soit :

0 tableau
1 tableau nommé $T_{2\cdot i}$
2 tableaux nommés $T_{2\cdot i}$ et $T_{2\cdot i + 1}$

L'étage $k>1$ est ainsi formé d'au plus $2^{k-1}$ tableaux, allant des tableaux allant des indices $(\sum_{0\leq i \leq k - 2}2^i) +1$ à $(\sum_{0\leq i \leq k-1}2^i)$.

Comme chaque exécution de l'algorithme hors récursion est proportionnelle à la taille du tableau en entrée, la complexité totale de l'exécution de toutes les récursion de l'algorithme sera proportionnelle à la somme des tailles des tableaux qui la composent (le tableau de $T_i$ ayant $n_i$ éléments) :

$$ C = \mathcal{O}(\sum_{i} n_i) $$

La complexité minimale sera atteinte pour la plus petite somme de $n_i$.

Chaque élément est compté 1 fois pour chaque tableau qui le compose. Comme l'ensemble des tableaux ayant un élément $x$ donné forme un chemin allant de $T_1$ à un tableau $T_i$ pour lequel $x$ est choisi comme pivot. En notant $e(x)$ l'étage pour lequel l'élément $x$ de $T_0$ a été choisi comme pivot, la complexité $C$ de l'algorithme vaut alors également :

$$ C = \mathcal{O}(\sum_{x \in T_0}e(x)) $$

La complexité minimale va donc être atteinte pour des arbres les plus tassés possibles puisqu'un élément $x$ choisi tard comme pivot aura un $e(x)$ plus important qu'un élément choisi plus tôt comme pivot. Comme chaque arbre de chaque étage produit 1 pivot on en conclut que :

La complexité minimale est atteinte si chaque étage $k$ est constitué du nombre maximum d'arbres, c'est à dire $2^k$.

Comme le nombre total d'arbre vaut $n$ on en déduit que pour les arbres réalisant la complexité minimale, on a :

$$ n = 1 + \sum_{2 \leq k \leq K}2^{k-1} = 2^K - 1 $$

La hauteur minimale de l'arbre est donc atteinte pour $K \simeq \log_2(n)$ avec des rangées pleines. Cet arbre minimisera effectivement $C = \mathcal{O}(\sum_{x \in T_0}e(x))$ puisque toutes les couches minimales seront prises. Pour cet arbre on aura $K=\log_2(n)$ et :

$$ C_{\min} = \mathcal{O}(\sum_{x \in T_0}e(x)) = \sum_{1 \leq k \leq K}k\cdot 2^{k-1} = (K-1)2^{K} + 1 = \mathcal{O}(n\log_2(n)) $$

On a utilisé le fait que $\sum_{1 \leq k \leq K}k\cdot 2^{k-1} = (K-1)2^{K} + 1$ (on le démontrera).

Complexité en moyenne du tri rapide

Proposition

La complexité en moyenne du tri rapide est en $\mathcal{O}(n\ln(n))$ avec $n$ la taille tu tableau à trier.

preuve intuitive

on utilise l'argument utilisé pour calculer la complexité en moyenne du tri par insertion. Si le tableau suit le modèle aléatoire, la moitié de T[1:] est plus grande que T[0]. De là, en moyenne, on va toujours couper le tableau en 2 parties (plus ou moins) égales.

Si l'on coupe toujours au milieu on a alors la même équation que pour la complexité minimale : $C(n) = \mathcal{O}(n) + 2 \cdot C(\frac{n}{2})$, ce qui donne une complexité de $\mathcal{O}(n\ln(n))$.

preuve formelle

Il faut résoudre l'équation :

$$ C_{\mbox{moy}}(n) = \mathcal{O}(n) + \sum_{0 \leq i < n}p_i(C_{\mbox{moy}}(i) + C_{\mbox{moy}}(n-i-1)) $$

où $p_i$ est la probabilité que le pivot soit le $i+1$ plus petit élément du tableau. On suppose pour cela que notre tableau suit le modèle aléatoire et donc que $p_i = \frac{1}{n}$ pour tout $i$.

$$ C_{\mbox{moy}}(n) = \mathcal{O}(n) + \frac{1}{n}\sum_{0 \leq i < n}(C_{\mbox{moy}}(i) + C_{\mbox{moy}}(n-i-1)) $$

Pour éviter de nous trimballer des $\mathcal{O}(n)$ partout, on va considérer que l'on y effectue $K\cdot n$ opérations où $K$ est une constante. On peut alors écrire :

$$ C_{\mbox{moy}}(n) = K\cdot n + \frac{1}{n}\sum_{0 \leq i < n}(C_{\mbox{moy}}(i) + C_{\mbox{moy}}(n-i-1)) $$

On peut simplifier cette écriture en remarquant que :

$\sum_{0 \leq i < n}C_{\mbox{moy}}(i) = \sum_{1 \leq i \leq n}C_{\mbox{moy}}(i-1)$
$\sum_{0 \leq i < n}C_{\mbox{moy}}(n-i-1) = \sum_{1 \leq i \leq n}C_{\mbox{moy}}(i-1)$

On doit donc résoudre l'équation :

$$ C_{\mbox{moy}}(n) = K\cdot n + \frac{2}{n}\sum_{1 \leq i \leq n}C_{\mbox{moy}}(i-1) $$

Il va maintenant y avoir 2 astuces coup sur coup. La première astuce est de considérer l'équation $n\cdot C_{\mbox{moy}}(n) - (n-1)\cdot C_{\mbox{moy}}(n-1)$ qui va nous permettre d'éliminer la somme :

$$ \begin{array}{lcl} n\cdot C_{\mbox{moy}}(n) - (n-1)\cdot C_{\mbox{moy}}(n-1) & = & K\cdot n^2 +2\sum_{1 \leq i \leq n}C_{\mbox{moy}}(i-1)\\ &&- K\cdot (n-1)^2 - 2\sum_{1 \leq i \leq n-1}C_{\mbox{moy}}(i-1)\\ &=& K(n^2 - (n-1)^2) + 2\cdot C_{\mbox{moy}}(n-1)\\ &=& K(2n - 1) + 2\cdot C_{\mbox{moy}}(n-1)\\ \end{array} $$

On en déduit :

$$ n\cdot C_{\mbox{moy}}(n) = K(2n - 1) + (n+1)\cdot C_{\mbox{moy}}(n-1) $$

Et maintenant la seconde astuce : on divise l'équation ci-dessus par $n(n+1)$ pour obtenir un terme générique identique des deux côtés de l'équation :

$$ \frac{C_{\mbox{moy}}(n)}{n+1}=\frac{C_{\mbox{moy}}(n-1)}{n} + K\cdot\frac{2n - 1}{n(n+1)} $$

On peut alors poser $A(n) = \frac{1}{n+1} \cdot C_{\mbox{moy}}(n)$ et on doit maintenant résoudre :

$$ A(n) = A(n-1) + K\cdot\frac{2n - 1}{n(n+1)} $$

Ce qui donne :

$$ \begin{array}{lcl} A(n) &=& A(n-1) + K\cdot\frac{2n - 1}{n(n+1)}\\ &=& A(n-2) + K\cdot\frac{2(n-1) - 1}{(n-1)(n)} + K\cdot\frac{2n - 1}{n(n+1)}\\ &=& \dots \\ &=&K \sum_{i=1}^{n}\frac{2i-1}{i(i+1)} + A(0)\\ &=&K \sum_{i=1}^{n}\frac{2}{(i+1)} - K \sum_{i=1}^{n}\frac{1}{i(i+1)} + A(0)\\ \end{array} $$

On peut facilement montrer (on le démontrera) que $\sum_{i=1}^{n}\frac{1}{i(i+1)} = \frac{n}{n+1} = \mathcal{O}(1)$ et donc que :

$$ \begin{array}{lcl} A(n) &=& 2K\sum_{i=1}^{n}\frac{1}{(i+1)} + \mathcal{O}(1)\\ &=& 2K\sum_{i=1}^{n}\frac{1}{i} - 2K + \mathcal{O}(1)\\ &=& 2K\sum_{i=1}^{n}\frac{1}{i} + \mathcal{O}(1)\\ &=& \mathcal{O}(\sum_{i=1}^{n}\frac{1}{i})\\ \end{array} $$

La suite $A(n)$ se comporte comme un $\mathcal{O}(H(n))$ où $H(n) = \sum_{i=1}^{n}\frac{1}{i}$.

Cette fonction est connue, elle s'appelle la série harmonique, et est équivalente à $\ln(n)$ lorsque $n$ tend vers $+\infty$ (ça aussi, on le démontrera). On a alors que $\mathcal{O}(H(n)) = \mathcal{O}(\ln(n))$, et enfin :

$$ A(n) = \mathcal{O}(\ln(n)) $$

Qui en revenant aux $C_{\mbox{moy}}(n) = n\cdot A(n)$ donne :

$$ C_{\mbox{moy}}(n) = \mathcal{O}(n\ln(n)) $$

ouf.

La complexité en moyenne du tri rapide pour un tableau de taille $n$ est $\mathcal{O}(n\ln(n))$

Conclusion

Le tri rapide a :

une complexité moyenne qui vaut sa complexité minimale et qui est $\mathcal{O}(n \ln(n))$, donc la meilleur possible
il très rapide pour les tableaux en désordre et très lent pour les tableaux déjà triés.

C'est donc rigolo :

Fun fact

Commencer par mélanger un tableau pour le trier avec rapide ensuite est plus rapide en moyenne que de le trier directement.