Les $\mathcal{O}()$ pour le calcul de complexité

Cours/Algorithmie/Mesures de complexités/Les $\mathcal{O}()$ pour le calcul de complexité

Les comparaisons asymptotiques sont plutôt intéressantes en algorithmie car elles permettent de supprimer les effets négatifs du comptage explicite de la complexité. La comparaisons la plus utilisée, et de loin, est le $\mathcal{O}$. Elle nous permettra de majorer par rapport à la taille $N$ de l'entrée de l'algorithme :

le nombre d'opérations élémentaires effectuées par l'algorithme avant de s'arrêter
le temps mis par l'algorithme pour s'exécuter
la taille de la mémoire utilisée pour par l'algorithme

Si le majorant n'est pas trop éloigné du compte exact, cela nous donne une idée générale de la valeur lorsque $N$ devient grand.

C'est le grand informaticien D. Knuth qui a popularisé l'usage de ces fonctions dans le calcul de la complexité avec son célèbre article BIG OMICRON AND BIG OMEGA AND BIG THETA

Gérer les constantes additives et multiplicatives

Les constantes additives et multiplicatives ne changent pas l'allure de la complexité.

Le plus grand intérêt dans le comptage de complexité algorithmique est que la règle des constantes montre qu'un nombre constant est toujours en $\mathcal{O}(1)$ (ainsi qu'en $\Omega(1)$ et en $\Theta(1)$). On l'a vu et vous l'avez expérimenté, pour un algorithme, il est souvent compliqué de savoir exactement de combien d'instructions basiques est constituée une opération ou le temps exact qu'elle va prendre. On pourra cependant toujours montrer qu'il y en a un nombre constant ou plus généralement borné :

À retenir

La complexité d'une instruction basique est de $\Theta(1)$ (donc également $\mathcal{O}(1)$) opérations.

De là :

Proposition

Un nombre constant d'instructions basiques nécessite $\Theta(1)$ (donc également $\mathcal{O}(1)$) opérations.

Enfin, la règle des constantes multiplicatives montre la proposition suivante :

Proposition

L'exécution un nombre constant de fois d'un bloc d'instruction de complexité $f(N)$ nécessite $\Theta(f(N))$ (donc également $\mathcal{O}(f(N))$) opérations.

Corollaire

L'exécution d'un nombre constant de fois un bloc d'instruction :

de complexité $\Theta(f(N))$ nécessite $\Theta(f(N))$ opérations.
de complexité $\mathcal{O}(f(N))$ nécessite $\mathcal{O}(f(N))$ opérations.

Ceci est pratique, car cela permet de ne pas compter toutes les opérations basiques précisément. Ainsi, en reprenant l'exemple initial de calcul de complexité :

age ← 42
si ((age ≥ 12) et (age < 20)):
    personne ← "teenager"

première ligne : 2 instructions donc $\mathcal{O}(1)$ instructions.
deuxième ligne : 8 instructions donc $\mathcal{O}(1)$ instructions.
troisième ligne : 2 instructions donc $\mathcal{O}(1)$ instructions.

Un nombre total d'instructions de $3 \cdot \mathcal{O}(1) = \mathcal{O}(1)$ instructions.

En revanche, faites attention, cela ne marche que pour les constantes !

Si le nombre d'opérations élémentaires est variable on a : $n \cdot \mathcal{O}(1) = \mathcal{O}(n)$. On ne peut pas simplifier les éléments variables.

Gérer des polynômes

Enfin, comme en algorithmie on manipulera souvent des polynômes, montrez que l'on peut, avec les différentes règles fonctions asymptotiques que :

On a : $$\sum_{i=0}^na_i x^i = \mathcal{O}(x^n) \mbox{ si } a_n \neq 0$$

corrigé

$\sum_{i=0}^na_i x^i = \mathcal{O}(\sum_{i=0}^na_i x^i)$
la règle des constantes multiplicative liée à la règle des polynômes montre que $\mathcal{O}(a_ix^i) = \mathcal{O}(a_jx^j)$ pour tout $i \leq j$.
on peut alors appliquer itérativement la règle des sommes négligeables pour montrer que $\mathcal{O}(\sum_{i=0}^na_i x^i) \Rightarrow \mathcal{O}(\sum_{i=j}^na_i x^i)$ pour tout $j \leq n$
pour $j=n$ on a $\mathcal{O}(\sum_{i=0}^na_i x^i) \Rightarrow \mathcal{O}(a_nx^n) = \mathcal{O}(x^n)$
Donc $\sum_{i=0}^na_i x^i = \mathcal{O}(x^n)$

Voir l'infini

Calculer avec les fonction asymptotiques va nous permettre de donner la complexité sous la forme d'une allure de complexité :

À retenir

On cherchera à borner la complexité par une allure de complexité :

complexité constante en $\mathcal{O}(1)$
complexité logarithmique en $\mathcal{O}(\log_2(n))$
complexité linéaire en $\mathcal{O}(n)$
complexité polynomiale en $\mathcal{O}(n^k)$ avec $k>1$ constant le plus petit possible
complexité exponentielle en $\mathcal{O}(k^n)$ avec $k>1$ constant le plus petit possible

Si nos approximations ne sont pas disproportionnés (genre en disant que $log_2(n) = \mathcal{O}(2^n)$), on aura trouvé l'allure de la complexité de notre algorithme sans trop de soucis.

Usage de $\Omega$ et $\Theta$

On utilisera très peu les fonctions $\Omega$ et $\Theta$ dans le calcul de complexité d'un algorithme car le but des calculs de complexité est de majorer et non de les minorer une complexité et utiliser des $\Theta$ est presque aussi contraignant que de faire des calculs de complexité exacts.

En revanche, ces deux fonctions asymptotiques trouveront leurs utilité lorsque l'on étudiera des complexité de problèmes algorithmiques où il faudra comparer plusieurs algorithmes entre eux.

Exemple de la recherche d'un élément dans un tableau

Prenons par exemple notre algorithme fétiche :

algorithme recherche(T: [entier], x: entier) → booléen:
    pour chaque e de T:
        si e == x:
            rendre Vrai
    rendre Faux

Cet algorithme recherche si le paramètre x est un élément de T.

Calculons ses complexités maximale et minimale. Commençons par regarder les complexités de chaque ligne :

définition de la fonction : $C_1 = \mathcal{O}(1)$
une boucle pour chaque de $k$ itérations
un test entre 2 variables : $C_3 = \mathcal{O}(1)$
un retour de fonction $C_4 = \mathcal{O}(1)$
un retour de fonction : $C_5 = \mathcal{O}(1)$

Comme il y a 2 retours de fonctions (lignes 4 et 5), la complexité sera soit :

$C = C_1 + k \cdot (C_3) + C_5 = \mathcal{O}(1) + k \cdot (\mathcal{O}(1)) + \mathcal{O}(1)$ si on utilise la sortie de la ligne 5 (on est jamais passé par le ligne 4)
$C' = C_1 + k \cdot (C_3) + C_4 = \mathcal{O}(1) + k \cdot (\mathcal{O}(1) + \mathcal{O}(1))$ si on utilise la sortie de la ligne 4 en passant lors de la dernière itération de la boucle pour chaque de la ligne 2

Les deux cas se simplifient en : $\mathcal{O}(k)$

En effet $\mathcal{O}(1) + \mathcal{O}(1) = \mathcal{O}(1)$ on a $C = C' = \mathcal{O}(1) + k \cdot (\mathcal{O}(1))$. De là, $C = C' = \mathcal{O}(1) + \mathcal{O}(k) = \mathcal{O}(k)$

On cherche le cas le pire, c'est à dire lorsque $k$ est maximum, donc lorsque la boucle pour chaque parcourt tout le tableau, c'est à dire pour deux cas :

l'élément recherché n'est pas dans le tableau
l'élément recherché est le dernier élément du tableau

On en conclut que :

La complexité de l'algorithme recherche est $\mathcal{O}(n)$ où $n$ est la taille du tableau qui est un paramètre d'entrée.

La complexité minimale est quant à elle atteinte lorsque l'on ne parcourt pas notre boucle, c'est à dire lorsque la valeur recherchée est la 1ère valeur du tableau :

La complexité minimale de l'algorithme recherche est $\mathcal{O}(1)$.