Tests Statistiques
Introduction
Les tests statistiques ont une place privilégiée dans la mise en place pratique d'un processus de décision. Il en existe de très nombreux. Nous présenterons dans cette page les principaux tests proposés dans SOSstat.
Les tests de comparaison
Lorsque l'on parle de tests de comparaison, il s'agit souvent des tests à hypothèse simple qui visent à accepter ou refuser une hypothèse. Parmi ces tests, on distingue deux grandes familles [1]:
- Les tests paramétriques, qui comme leur nom l'indique sont construits sur le calcul de paramètres des échantillons étudiés. Ces tests supposent que les échantillons proviennent d'une population normale.
- Les tests non paramétriques, qui à l'inverse de leurs prédécesseurs ne posent aucune hypothèse sur la loi de distribution de la population.
(1): Nous décrirons également dans cette page, les tests d'équivalence, qui suivent une toute autre logique.
Pour choisir entre ces deux familles de tests, il peut être conseillé de faire un test de Normalité.
Les tests de Normalité
Les tests de normalité sont très nombreux et chacun peut avoir des préférences. SOSstat propose les trois tests les plus utilisés dans les applications Qualité :
- Le test de Kolmogorov-Smirnov construit à partir de la fonction de répartition empirique de l'échantillon
- Le test de Anderson-Darling, qui se base sur des principes assez proches, mais qui est plus sensible sur des petits échantillons
- Le test de Shapiro-Wilk qui, grâce à des algorithmes relativement récents, peut traiter de gros échantillons
SOSstat fournit une interprétation claire de la décision du test, en plus de la traditionnelle p-value (pas toujours évidente à interpréter).
Pour compléter l'usage de ces tests, SOSstat représente les données sur des graphiques tels que l'histogramme ou le graphe des Quantiles Normaux.
Les tests paramétriques
Les tests paramétriques sont, sans aucun doute, les tests les plus utilisés dans les activités industrielles. Ils sont à la fois performants et simples à interpréter. En effet, leur dénomination provient du fait qu'ils utilisent des estimations de paramètres pour comparer certains caractères des populations étudiées : on utilise généralement la moyenne pour traiter des problématiques de centrage et la variance ou l'écart-type pour comparer les variabilités ou dispersions.
SOSstat propose des tests de comparaison de moyennes ou d'écart-types dans trois situations pratiques :
- Les cas où l'on compare un échantillon à une valeur théorique
- Les cas où l'on compare deux échantillons
- Les cas où l'on compare plus de deux échantillons (k échantillons)
Nombre d'échantillons | Moyenne | Écart-type |
---|---|---|
1 | Test de Student [2] | Test du Khi2 |
2 | Test de Welch [3] | Test de Fisher |
k | Analyse de la variance | Test de Bartlett |
- (2): Écart-type connu ou estimé
- (3): Écart-type connu ou estimé, échantillons appariés
Ces tests sont très largement utilisés pour l'analyse de données industrielles dans le cadre de résolution de problème :
- Comparaison de performance de deux processus ou deux instruments de mesure
- Comparaison de lots de produits
- Comparaison avant et après maintenance d'une machine ...
Les tests non-paramétriques
A la différence des tests précédents, les tests non-paramétriques ne posent aucune hypothèse sur la loi de distribution des variables. C'est en travaillant sur les rangs des observations, que ces tests peuvent s'affranchir de l'hypothèse de normalité des données. On dit aussi que ce sont des tests libres de distribution.
Les tests non-paramétriques ont donc un large potentiel d'applications : Ils peuvent s'appliquer sur des variables continues (des mesures par exemple) lorsque les caractéristiques ne suivent pas des lois normales, mais aussi sur des variables discrètes (comptage) ou encore des variables de rang (notamment dans le cas d'analyses sensorielles).
Comme pour les tests paramétriques, on peut classer les tests selon qu'ils s'intéressent au centrage ou à la dispersion des variables. D'autre part, on retrouve les trois situations d'échantillonnage décrites précédemment 3 familles de tests habituelles : les tests à une variable, 2 variables et plus de 2 variables (k).
Nombre d'échantillons | Centrage | Dispersion |
---|---|---|
1 | Test de signe Test de Wilcoxon | |
2 | Test U de Mann Whitney | Test de Ansari-Bradley |
k | Test de Kruskal Wallis , Test de Friedman | Test de Levene |
Assistant de tests
Pour guider l'utilisateur dans le choix du test le plus adapté, SOSstat propose un assistant de test. A l'aide d'une série de questions organisées dans un arbre de décision, l'utilisateur est orienté vers le test qui correspond le mieux à son besoin. Il n'est plus nécessaire de reprendre ses "vieux cours de stat".
L'assistant de test se charge d'ouvrir la boite de dialogue, avec les paramétrages appropriés, afin de réaliser le test dans la foulée.
Les tests d'équivalence
Les tests de comparaison, comme le test de Student par exemple, sont conçus pour détecter des écarts. Dans ce type de test, on pose l'hypothèse () selon laquelle il n'y a pas d'écart. Si l'analyse révèle un écart significatif entre les échantillons, l'hypothèse nulle () est rejetée : on démontre donc un écart. A l'inverse, si le test ne démontre pas d'écart significatif, on ne peut rien conclure (et surtout pas une équivalence !).
Dans les tests d'équivalence, l'hypothèse est formulée de sorte que le test prouve l'équivalence. A l'inverse, l'hypothèse alternative () est que l'écart entre les échantillons est inférieur à un écart acceptable (seuil d'équivalence). Ainsi, si l'on rejette l'hypothèse nulle, on peut affirmer que les échantillons sont équivalents. On a prouvé que l'écart était inférieur à l'écart acceptable .
Dans l'application des tests d'hypothèses, il existe une asymétrie logique implicite entre les rôles joués par l'hypothèse nulle () et l'hypothèse alternative (). Dans les tests d'équivalence, on propose de tester l'hypothèse de non-équivalence () avec un risque maîtrisé de conclure à l'équivalence à tort.
- : Il n'y a pas d'équivalence
- : On démontre l'équivalence
SOSstat propose deux types de tests d'équivalence :
- Les équivalences de moyenne , qui visent à démontrer qu'un écart entre les moyennes est inférieur à un écart acceptable
- Les équivalences de population , qui permettent de comparer simultanément la moyenne et la variance de deux échantillons. Cette technique est recommandée par le FDA pour les bio-équivalences.
Les tests d'équivalence ont un large potentiel d'application dans l'industrie. Ils sont largement utilisés dans l'industrie pharmaceutique pour démontrer l'équivalence entre un dispositif médical de référence et un dispositif générique. Ils peuvent être utilisés pour valider l'équivalence entre deux équipements de mesures (pour comparer un équipement neuf et un équipement historique), ils peuvent aussi être utilisés pour qualifier des processus industriels en cas de transfert de production ou de duplication d'équipements.
Bibliographie
DROESBEKE, J. - Éléments de Statistique , Éditions Ellipses, 2015, ISBN-13: 978-2340009080 GoogleBooks
SAPORTA, G. - Probabilités, analyse des données et statistique , Technip, 2011- 622 pages, ISBN-13: 978-2710809807 GoogleBooks
Chow SC, Liu JP. - Design and Analysis of Bioavailability and Bioequivalence Studies. 2nd edn. Marcel Dekker: New York, 1999. GoogleBook
FDA. Guidance for Industry on Bioavailability and Bioequivalence Studies for Nasal Aerosols and Nasal Sprays for Local Action. Center for Drug Evaluation and Research, Food and Drug Administration: Rockville, Maryland, 1999.
Gopal K. Kanji - 100 Statistical tests , SAGE Publications Ltd, 2006 , ISBN-13 : 978 14129 2375 0 Amazon