Clé 11 du livre "Des Outils pour la GPI" aux éditions AFNOR Gestion 1990.

Clef 11 : Statistiques


  1. Objectif
  2. Désignations similaires
  3. Origine
  4. Domaines et contraintes d'utilisation
  5. Les différentes distributions
  6. Paramètres d'une distribution
  7. Risque et confiance
  8. Principales caractéristiques des différentes lois
  9. Opérations sur les lois
  10. Exemples

Retour au sommaire du livre


1°) OBJECTIF

Le but de ce chapitre est de permettre d'évaluer l'erreur résultant d'un calcul en gestion de production.

Sommaire

2°) DESIGNATIONS SIMILAIRES

- théorème central limite
- calculs d'erreurs
- fiabilité d'un résultat

Sommaire

3°) ORIGINE

Il y a plus de quatre mille ans les chinois utilisaient déjà des tables de statistiques agricoles mais sans méthode d'interprétation des données : il s'agissait essentiellement de dénombrement. Jusqu'au dix-septième siècle on se contenta de recenser les personnes ou leurs biens. Avec Pascal, puis d'autres mathématiciens, l'étude des probabilités liées aux jeux de hasard vont se développer et déboucher sur des méthodes statistiques. La démographie, l'économie et la sociologie ont tout de suite trouvé grand intérêt à ses travaux et ont encouragé les chercheurs, même non-mathématicien, à développer et amplifier les études statistiques. Les travaux de C.F. Gauss, au dix-neuvième siècle, ont donné une base toujours reconnue à la science des statistiques.

On utilise actuellement les statistiques dans presque tous les domaines avec plus ou moins de rigueur et de succès. En production, l'application la plus connue est certainement la carte de contrôle. Les gestionnaires sous-utilisent cet outil à cause des calculs qui y sont liés. L'accès de plus en plus facile aux ordinateurs et le développement de logiciels adaptés va permettre une généralisation de l'outil statistique.

Sommaire

4°) DOMAINES ET CONTRAINTES D'UTILISATION

Comme nous venons de le voir les statistiques s'appliquaient, au départ, à des populations, des régions. Le nombre de données étaient donc très élevées et la plupart des théories statistiques sont basées sur le fait que le nombre d'enregistrements est grand ou que le nombre de répétitions est important. En pratique cela veut dire que si le nombre de données est inférieur à cinquante, il faut prendre des précautions ou apporter des corrections.

Malheureusement en gestion, ou en production, le nombre de données est rarement supérieur à cinquante. En conséquences, nous savons dès le départ, que nous utiliserons les théories statistiques loin des règles de l'art. Ceci nous permettra de ne pas nous enfermer dans des subtilités, et d'évaluer l'erreur sur les résultats rapidement, alors qu'une démarche plus juste aurait été longue, difficile, voir même impossible.

Au cours de ce chapitre, tout en privilégiant la notation recommandée par la norme NF X 06-003, nous n'hésiterons pas à simplifier et à arrondir les résultats.

Sommaire

5°) LES DIFFERENTES DISTRIBUTIONS

On peut représenter une distribution par un graphique où l'on trouve, en abscisse la valeur de la donnée, et en ordonnée sa probabilité. De nombreuses allures de distributions ont été étudiées par les mathématiciens. Nous présenterons les plus caractéristiques.

a- Loi équiprobable

Si une machine peut tomber en panne pour quatre causes différentes (repérées a, b, c, et d) ayant les mêmes probabilités d'apparition, on obtient le graphe :

Cette forme de distribution s'appelle équiprobable.

b- Loi normale

La représentation de la répartition des dimensions (d) obtenues sur une série de pièces a généralement l'allure suivante :

La loi normale (ou courbe de Gauss) est idéalement une cloche. Cette distribution lui est donc assimilable.

c- Loi asymétrique

Il est possible de rencontrer des répartitions asymétriques. Les lois qui peuvent y être associer se nomme :

Par exemple, si l'on veut représenter les probabilités liées à la durées des tâches d'un projet on peut obtenir :

Tprobable correspond à la probabilité maximum et s'appelle le mode.

Pour chacune des ses lois, il existe des formules et des tables qui permettent de connaître avec exactitude les probabilités. De plus il existe des tests afin de savoir si les données suivent, plus ou moins, une loi. Pour l'utilisation que nous en ferons une simple estimation visuelle sera suffisante.

Sommaire

6°) PARAMETRES D'UNE DISTRIBUTION

Afin de ne pas traiter en permanence toutes les données, on caractérise une distribution par quelques paramètres :

En notant n le nombre de données et Xi¸ la valeur de chaque donnée on a:

m = Somme(Xi) / n
W = MAXI - mini
s² = V
V = Somme |Xi - m|² / n
mode : point de probabilité maximale

 

Sommaire

7°) RISQUE ET CONFIANCE

On appelle couramment risque le pourcentage de données qui ne sont pas prises en considération lors d'un calcul. D'une façon générale, on prend un risque de 5%, on dit aussi que l'on a alors un niveau de confiance de 95% . Si l'on recherche la précision, et que les données sont parfaitement connues, alors, on peut ne prendre q'un risque de 1% .

Sommaire

8°) PRINCIPALES CARACTERISTIQUES DES DIFFERENTES LOIS

L'étendue W représente par définition 100% de la population, mais c'est rarement 100% des cas qui nous intéresse dans un problème de gestion. Regardons donc le pourcentage de population compris entre ±S, ±2S, ±3S et ±4S pour les différentes loi :

Type de loi :

Equiprobable

Normale

Asymétrique

Quelconque

± s

58%

68%

66%

? ? ?

± 2s

100%

95%

97%

> 75%

± 3s

 

99,8%

99,5%

> 89%

± 4s

     

> 94%

C'est Biénaymé-Techbychev qui a démontré que 89% de la population est comprise des les bornes ±3S au minimum et ce, quelle que soit la loi de distribution. On peut remarquer qu'avec un risque inférieur à 1%, on peut estimer l'étendue à 6S dans les cas les plus classiques.

Sur le tableau n'est pas précisé la référence de la loi asymétrique, signalons qu'il s'agit de loi où le mode est à environ une fois et demi l'écart type du minimum. Citons pour le lecteur féru en statistiques que :

répondent à ce critère.

Sachant que c'est la moyenne qui nous intéresse le plus en gestion et non le mode, nous utiliserons la formule approchée suivante :

Moyenne = (Mini + 4*Mode + Maxi) /6

Voici un tableau récapitulatif des caractéristiques qu'il faut retenir :

m = (mini+4*mode+Maxi)/6
s voisin de W/6 puisque W/4 >s> W/8
Loi Classique : 95% de la population dans ±2s

Sommaire

9°) OPERATION SUR LES LOIS

Tchébichef Markov a démontré que pour additionner des lois, il suffisait de sommer les moyennes et les variances :

m = Somme(mi)
V = Somme(Vi)

En revanche, la forme de la distribution obtenue n'est pas connue. C'est le théorème central limite de Liapounov qui va nous donner la réponse :

Si des variables sont mutuellement indépendantes, suffisamment nombreuses et suivent des lois quelconques de moyennes et variances connues et suffisamment homogènes, la somme de ses variables suit une loi normale (de moyenne égale à la somme des moyennes et de variance égale à la somme des variances).

Sans se lancer dans de grandes démonstrations, une petite simulation très pédagogique permet de bien mettre en évidence ce phénomène. La simulation se passe en trois phases :

-Phase 1-

Soit un dé rouge non pipé. Reporter sur le graphe suivant le nombre de possibilité d'obtenir 1, 2, .. jusqu'à 6 :

Si le nombre de jets de dé est assez élevés, la distribution se rapprochera bien évidemment de celle représentée par le graphe. Nous sommes donc dans le cas d'une distribution équiprobable.

-Phase 2-

Introduisons maintenant un deuxième dé, blanc cette fois-ci et recommençons notre exercice. Maintenant les valeurs possibles s'échelonnent de 2 (les deux as) à 12 (les deux six), mais, par exemple, il y a plusieurs manières de faire quatre :

  1. 1 sur le dé rouge et 3 sur le dé blanc
  2. 2 sur le dé rouge et 2 sur le dé blanc
  3. 3 sur le dé rouge et 1 sur le dé blanc

ce qui donne le graphe suivant :

On peut immédiatement visualiser que la combinaison de 2 variables équiprobables ne donne pas une répartion équiprobable.

-Phase 3-

Enfin continuons avec, cette fois-ci, trois dés : un bleu, un blanc et un rouge. Nous laissons au lecteur le plaisir de découvrir l'allure de la courbe obtenue :

Sommaire

10°) EXEMPLES

Nous allons reprendre les deux principales applications traitées dans ce livre.

a- Outil "Décision"

Dans l'utilisation d'un tableau de décision (voir page XXXX), le décideur, supposé de bonne foi, attribue des notes à plus ou moins un point près. Il faut, pour pouvoir continuer le calcul, définir le type de loi que suit cette attribution. Si nous nous plaçons dans un cas défavorable, nous pouvons choisir la loi équiprobable donc W=4s.

Maintenant que nous avons choisi le type de distribution, il faut déterminer les caractéristiques de celle-ci : l'étendue est 2(±1 point), soit un écart type sn de 0,5 (W=4s) et par suite une variance Vn de 0,25 (V=s²).

En appliquant le théorème central limite (Vt = Somme k²Vn¸), on obtient les caractéristiques de la loi de distribution du total (t):

Vt = 2².0,25 + 1².0,25 + 1².0,25 + 1².0,25 + 3².0,25 = 4

soit st = Racine(Vt) = 2.

Toujours d'après le théorème de Liapounov, nous savons que le total suit approximativement une loi normale. En conséquence, avec un risque de 5%, l'erreur est de ±4 points (±2s), ce qui est acceptable sur un total de plus de soixante points.

b- Outil "PERT"

Dans la recherche des différentes durées des tâches pour faire un PERT (voir page XXXX), nous avons vu que les données n'étaient pas toujours très fiables. Nous pouvons évaluer l'influence des variations des durées sur le délai en utilisant le théorème central limite. Pour cela il faut pour chaque tâche du chemin critique déterminer une valeur moyenne et un écart type. S'il existe un historique des temps cela sera facile, sinon, on approximera m et S en considérant une loi asymétrique. On recherchera alors les trois informations suivantes :

Ensuite on interprétera ces informations :

m = Topt + 4*Tprob + Tpes
s = ( Tpes - Topt ) / 6

La moyenne m est utilisée dans la méthodologie PERT et l'écart type S va nous permettre de quantifier l'erreur sur le délai. Soit pour l'exemple PERT.1 :

Repère

Tpes

Topt

s

V= s²

A

3

1

0,33

0,11

B

10

5

0,83

0,69

C

11

6

0,83

0,69

Nous pouvons donc calculer la variance du chemin critique qui est égale à la somme des variances:

Vchemin_critique = Somme Vi = 0,11+0,69+0,69 = 1,49

L'écart type est donc de Racine(1,49) soit 1,22. En prenant un risque de 5% nous avons une fluctuation sur le chemin critique de ±2S soit ± 2,44 jours.

Retour au sommaire du livre

 

 

Retour au sommaire

MP le 08/04/99