Analyse amortie

Cours/Algorithmie/Analyse et complexité amortie/Analyse amortie

Il existe trois types d'analyses amortie possibles : par agrégat, comptable et par potentiel. La méthode par potentielle est la plus générale mais également la plus ardue à mettre en oeuvre. La méthode comptable est intermédiaire et la méthode par agrégat (que l'on a déjà utilisé pour les listes) est la méthode la plus simple et qui est souvent suffisante.

Nous allons illustrer chaque méthode en utilisant l'algorithme tous qui affiche tous les entiers binaires inférieurs à $2^n$. Cet exemples est paradigmatique de l'analyse amortie où une même opération peut avoir une complexité très faible ou très importante selon les cas. Une analyse fine de la complexité montrera que dans l'exécution globale de l’algorithme ces complexités sont liées et qu'une opération de complexité importante sera forcément suivie d'opérations de faibles complexité.

Exemple du compteur binaire

Dans ce problème on encode un nombre binaire de $n$ bits par un tableau $N$ de taille $n$. Pour $n=3$ par exemple, $N = [0, 0, 1]$ correspondra à $n=1$ et $N = [1, 1, 0]$ à $n=6$. L'algorithme suivant est la variante itérative de l'algorithme vu en exercice

Soit lors l'algorithme suivant :

fonction successeur(N: [bit]) → vide:
    i ← N.longueur - 1

    tant que (i ≥ 0) et (N[i] == 1):
        N[i] ← 0
        i ← i - 1

    si i ≥ 0:
        N[i] ← 1

algorithme tous(n: entier) → vide:
    N ← un tableau de taille n
    N[:] ← 0

    pour chaque i de [0 .. 2^n[:        
        successeur(N)
        affiche N à l'écran

code python

def successeur(N):
    i = len(N) - 1

    while (i >= 0) and (N[i] == 1):
        N[i] = 0
        i -= 1

    if i >= 0:
        N[i] = 1

def tous(n):
    N = [0] * n

    for i in range(2 ** n):
        successeur(N)
        print(N)

À un nombre N écrit au format binaire donné, successeur(N) va l'incrémenter de 1.

On a déjà étudié les complexités de l'algorithme successeur(N). Ici c'est l'exécution de tous(n) qui nous intéresse et donc la complexité des $2^n$ exécutions successives de l'algorithme successeur(N). On verra juste multiplier la complexité par le nombre d'itération va donner un calcul trop frustre.

Problème

Trouver la complexité de l'exécution tous(n), qui consiste en l'exécution $2^n$ exécutions successives de l'algorithme successeur(N).

La difficulté du calcul vient du fait que le nombre d'opération effectuée par l'exécution de successeur(N) dépend de son paramètre :

au mieux, $N[-1] = 0$ et la complexité de successeur(N) est $\mathcal{O}(1)$,
au pire, $N = [1, \dots, 1]$ et la complexité de successeur(N) est $\mathcal{O}(n)$,

La complexité totale de l'exécution des $2^n$ instances de successeur(N) est alors estimée à : $\mathcal{O}(n \cdot 2^n)$.

On le démontrera précisément mais on peut intuitivement voir que cette borne surestime grandement la complexité réelle car on a prouvé qu'en moyenne, sous hypothèse d'uniformité, la complexité de successeur(N) est $\mathcal{O}(1)$ et ici $N$ va valoir tous les entiers sa complexité totale doit donc être proche de la complexité en moyenne.

Analyse par Agrégat

La méthode la plus simple, on compte tout. C'est ce qu'on a fait avec les listes.

Définition de l'analyse par agrégat

Définition

L'analyse par agrégat consiste à considérer l'ensemble des $m$ exécutions comme un tout.

On évalue la complexité des $m$ opérations en même temps, sans distinguer les différentes opérations.

Calcul de la complexité de l'algorithme `tous(n)` avec l'analyse par agrégat

Effectuons cette analyse pour le calcul de la complexité de tous(N). On remarque tout d'abord que le nombre d'opérations de successeur(N) dépend de l'indice du dernier 0 dans la liste N :

si N finit par la liste [0] il faut de l'ordre de 1 opération à successeur (la boucle tant que de la ligne 4 fait un test et aucune itération)
si N finit par la liste [0, 1] il faut de l'ordre de 2 opérations à successeur (la boucle tant que de la ligne 4 fait une itération)
si N finit par la liste [0, 1, 1] il faut de l'ordre de 3 opérations à successeur (la boucle tant que de la ligne 4 fait deux itérations)
...
si N finit par la liste [0] + [1] * i il faut de l'ordre de $i+1$ opérations à successeur
...
si N finit par la liste [0] + [1] * (n-1) il faut de l'ordre de $n$ opérations à successeur
si N finit par la liste [1] + [1] * (n-1) il faut de l'ordre de $n$ opérations à successeur

On peut partitionner l'ensemble des $2^n$ nombres binaires à $n$ bits en $n$ ensembles disjoints :

$\mathcal{N}_1$ tous les nombres qui finissent par 0. Il y en a $\frac{2^n}{2}$
$\mathcal{N}_2$ tous les nombres qui finissent par 01. Il y en a $\frac{2^n}{2^2}$
...
$\mathcal{N}_i$ tous les nombres qui finissent par 0 suivi de (i-1) 1. Il y en a $\frac{2^n}{2^i}$
$\mathcal{N}_n$ tous les nombres qui finissent par 0 suivi de (n-1) 1. Il y en a $\frac{2^n}{2^n}$
$\mathcal{N}'_{n}$ contenant le nombre ne contenant que des 1. Il y en a 1

Il faudra de l'ordre de $i$ opérations à successeur(N) pour traiter un nombre de $\mathcal{N}_i$ et $n$ opérations pour traiter l'élément de $\mathcal{N}'_n$. Comme on a partitionné l'ensemble de toutes les entrées possibles et que notre algorithme va les utiliser tous une unique fois, on en conclut que la complexité totale de l'algorithme tous(n) est :

$$ C = \sum_{i=1}^{n}i\cdot \frac{2^n}{2^i} + n = 2^n \cdot \sum_{i=1}^{n}\frac{i}{2^i} + n $$

Calculons cette complexité :

$$ \begin{array}{rcl} C&=& 2^n \cdot \sum_{i=1}^{n}\frac{i}{2^i} + n\\ &=& 2^n \cdot (\sum_{k=1}^n\sum_{i=k}^{n}\frac{1}{2^i}) + n\\ &=&2^n \cdot (\sum_{k=1}^n(\sum_{i=1}^{n}\frac{1}{2^i} - \sum_{i=1}^{k-1}\frac{1}{2^i})) + n\\ &=&2^n \cdot (n\cdot \sum_{i=1}^{n}\frac{1}{2^i} - \sum_{k=2}^n\sum_{i=1}^{k-1}\frac{1}{2^i}) + n \end{array} $$

On utilise alors le fait que : $\sum_{i=1}^{n} \frac{1}{2^i} = 1 - \frac{1}{2^{n}}$ (on l'a vu), ce qui permet d'obtenir :

$$ \begin{array}{rcl} C&=&2^n \cdot (n\cdot \sum_{i=1}^{n}\frac{1}{2^i} - \sum_{k=2}^n\sum_{i=1}^{k-1}\frac{1}{2^i}) + n\\ &=&2^n \cdot (n\cdot (1-\frac{1}{2^n}) - \sum_{k=2}^n(1-\frac{1}{2^{k-1}})) + n\\ &=&2^n \cdot (n\cdot (1-\frac{1}{2^n}) - (n-1) -\sum_{i=1}^{n-1}(1-\frac{1}{2^{i}})) + n\\ &=&2^n \cdot (1-\frac{n}{2^n}+1-\frac{1}{2^{n-1}}) + n\\ &=&2^n \cdot (2-\frac{n+2}{2^n}) + n\\ &=&2^{n+1} \cdot (1-\frac{1}{2^n}) \end{array} $$

Méthode comptable

La méthode comptable va associer des coûts différents à chaque opération, appelé coût amorti.

Définition de la méthode comptable

Définition

La méthode comptable pour calculer la complexité totale de $m$ exécutions successives d'un même algorithme consiste à associer à la $i$ème exécution de coût réel $c_i$ un coût amorti $\hat{c_i}$ tel que pour tout $1 \leq k \leq m$ :

$$ \sum_{i=1}^{k} \widehat{c_i} \geq \sum_{i=1}^{k} {c_i} $$

L'inégalité ci-dessus assure que la complexité totale des $m$ exécutions de l'algorithme sera bien inférieure à la somme des $m$ coûts amortis.

Lorsque l'on utilise la méthode comptable, l'astuce est de choisir certains coûts supérieur au coût réel et certains coûts inférieur : certaines opérations sont crédités d'un coût additionnel qui sera débité lors d'opérations futures. Il faut cependant toujours s'assurer d'avoir un crédit suffisant pour payer les coûts futurs.

Calcul de la complexité de l'algorithme `tous(n)` avec l'analyse par la méthode comptable

Appliquons cette méthode pour calculer la complexité de tous. La complexité totale à calculer est égale au nombre de bits modifiés. Or un bit n'est mit à 0 que s'il a été mis à 1 à une étape précédente. On peut donc donner comme coût amorti :

2 lorsqu'un bit est positionné à 1 (on compte son coût de positionnement à 1 et on crédite directement son coût de positionnement à 0)
0 lorsqu'un bit est positionné à 0

Ces coûts amortis assurent que la somme des $k$ premiers coûts amorti est supérieur à la somme réelle des $k$ coûts.

Enfin, comme à chaque exécution de successeur un unique bit est mis à 1, on en conclut que le coût amorti d'une exécution de successeur est 2. Le coût amorti de $m$ exécutions successives de successeur est donc de $C = m$ : l'exécution de tous(n) est de complexité $\mathcal{O}(2^n)$.

Analyse par potentiel

Cette méthode de calcul est une généralisation des deux méthodes précédentes.

Définition de l'analyse par potentiel

Définition

L'analyse par potentiel calcule la complexité totale de $m$ exécutions successives d'un même algorithme consiste à associer à la $i$ème exécution de coût réel $c_i$ un potentiel $\Omega(i)$ tel que $\Omega(i) \geq \Omega(0)$ pour tout $i \geq 1$ (on prend généralement $\Omega(0) = 0$)

Le coût amorti $\widehat{c_i}$ de la $i$ème exécution est alors défini tel que :

$$ \widehat{c_i} = c_i + \Omega(i) - \Omega(i-1) $$

L'égalité ci-dessus assure que la complexité totale des $m$ exécutions de l'algorithme sera bien inférieure à la somme des $m$ coûts amortis.

$$ \sum_{i=1}^{m} \widehat{c_i} = \sum_{i=1}^{m} ({c_i} + \Omega(i) - \Omega(i-1)) = \sum_{i=1}^{m} {c_i} + \Omega(m) - \Omega(0) \geq \sum_{i=1}^{m} {c_i} $$

Cette technique d'analyse vient de la physique où l'on peut associer à un système une énergie potentielle, qui sera modifiée après chaque action : $\Omega(i-1)$. Cette énergie potentielle $\Omega(i-1)$ correspond à l'état du système avant la $i$ème opération et $\Omega(i)$ son état après cette opération, rendant compte de la modification qu'à exercé l'opération sur le système.

En informatique, le potentiel sera souvent associé à la structure de donnée sous-tendant l'exécution de l'algorithme (ses paramètres, ses variables, etc).

Remarquez que toute mesure de potentielle fonctionne si $\Omega(i) \geq \Omega(0)$ pour tout $i \geq 1$, mais que pour être efficace, on va chercher à obtenir un coût amorti le plus petit possible, si possible constant. Ce faisant, la différence de potentiel absorbera les variations de coût réel sans trop les surévaluer.

Calcul de la complexité de l'algorithme `tous(n)` avec l'analyse par potentiel

Le nombre de bits changés à chaque exécution de successeur dépend du nombre de 1 dans la liste passée en paramètre. Comme $\Omega(0) = 0$, on garanti que $\Omega(i) \geq \Omega(0)$ pour tout $i$, c'est une mesure de potentiel correct.

A chaque exécution de successeur on a :

k bits passés à 0
1 bit passé à 1

On en déduit que :

la complexité d'exécution est de k + 1
la différence de potentiel $\Omega(i) - \Omega(i-1)$ vaut $1 - k$

Le coût amorti d'une exécution de successeur vaut alors $\widehat{c_i} = c_i + \Omega(i) - \Omega(i-1) = 1 + k + (1-k) = 2$ quelque soit $i$.

On a donc que, encore une fois, la complexité de l'algorithme tous(n) est :

$$ C \leq \sum_{i=1}^m \widehat{c_i} = \sum_{i=1}^m 2 = 2 \cdot m = \mathcal{O}(m) = \mathcal{O}(2^n) $$

Analyse amortie

Exemple du compteur binaire

Analyse par Agrégat

Définition de l'analyse par agrégat

Calcul de la complexité de l'algorithme tous(n) avec l'analyse par agrégat

Méthode comptable

Définition de la méthode comptable

Calcul de la complexité de l'algorithme tous(n) avec l'analyse par la méthode comptable

Analyse par potentiel

Définition de l'analyse par potentiel

Calcul de la complexité de l'algorithme tous(n) avec l'analyse par potentiel

Calcul de la complexité de l'algorithme `tous(n)` avec l'analyse par agrégat

Calcul de la complexité de l'algorithme `tous(n)` avec l'analyse par la méthode comptable

Calcul de la complexité de l'algorithme `tous(n)` avec l'analyse par potentiel