Retour au sommaire des cours

Une version pdf est à votre disposition ici.

Méthodologie

Statistiques

 

v Introduction :

Ø  Place de l’analyse statistique dans la recherche :

 

 

 

 

 

 

 

 

 

 


Ø  Rôle des statistiques dans les publications :

 

Plan de rapport :

-          Introduction,

-          Matériels et méthodes (avec, à la fin, les méthodes statistiques utilisées),

-          Résultats (avec les statistiques descriptives, résultats de tests, graphiques, statistiques géométriques)

-          Discussion (sans aucun résultat numérique !),

-          Annexes (présentation de tous les tests de manière à reproduire les tests, rapport d’analyse)

 

v Organisation des données :

 

Exemple : Observation de la durée de stéréotypie chez 20 individus pendant 5 jours.

Parmi les 20 individus, il y a 10 femelles et 10 mâles. La moitié de chaque sexe est placée dans des conditions 1, l’autre moitié dans des conditions 2.

On effectue 100 observations : 1 par jour pour 20 individus et pendant 5 jours.

 

Individu

Jour

Sexe

Conditions

1

2

3

4

5

1

 

 

 

 

 

Mâles

1

2

 

 

 

 

 

3

 

 

 

 

 

2

 

 

 

 

 

...

 

 

 

 

 

Femelles

1

 

 

 

 

 

 

 

 

 

 

2

20

 

 

 

 

 

 

-          Observation = case du tableau avec ses étiquettes autour et la valeur associée.

Le nombre de cases correspond au nombre d’observations.

 

-          Variable dépendante (VD) = durée de stéréotypie

 

-          Support du protocole = support des observations = tableau vide avec les étiquettes autour.

 

-          Facteurs = Variables indépendantes (VI) = étiquettes organisées en ensemble d’étiquettes.

Exemple : sexe : {M ; F} ou conditions : {1 ; 2}

L’intérêt est d’étudier les effets des variables indépendantes sur la variable dépendante.

 

La variable dépendante est :

-          Soit numérique,

-          Soit ordinale (= hiérarchisée),

-          Soit qualitative (le lieu d’un habitat, par exemple)

Dans ce cas, elle peut être binaire (réussite/échec, par exemple)

 

Distinction entre groupes indépendants et groupes appareillés :

Lors d’une étude sur les stéréotypies de 20 individus durant 2 jours, les observations portent sur 2 groupes (jour1 et jour2) appareillés.

-          2 groupes sont appareillés quand il est possible d’effectuer une correspondance de terme à terme naturelle entre les 2 groupes (= bijection)

-          2 groupes sont indépendants quand il y a l’absence de correspondance terme à terme.

 

v Description et inférence :

 

Objectifs = visées :

-          La visée descriptive : les conclusions cherchées portent uniquement sur les données recueillies (absence de généralisation)

-          La visée inductive : les conclusions cherchées vont au–delà des observations recueillies (généralisation)

 

Différents outils des statistiques descriptives :

-          Moyenne,

-          Ecart–type,

-          Variance,

-          Mode (= catégorie la plus observée, à l’effectif le plus important),

-          Médiane (= catégorie qui se situe au milieu de la distribution. Concerne les variables numériques ou ordinales),

-          Fréquence (= proportion d’observation),

-          Pourcentage (= façon de communiquer une proportion),

-          Co–variance,

-          Coefficient de corrélation (–1 £ г £ +1),

Plus г se rapproche de –1 ou de +1, plus la corrélation est forte.

-          Carré moyen de contingence f2 (mesure la liaison en 2 variables qualitative),

-          Analyse factorielle de correspondance (nuage de points)

 

Différents outils des statistiques inductives :

-          Test du c2,

-          t de Student,

-          Rapport F de Fischer,

-          Probabilité p (= seuil observé = p–value),

-          Intervalle de confiance IC.

 

Critère de distinction des statistiques descriptives des statistiques inductives :

Il faut dupliquer les observations, c’est–à–dire remplacer chaque observation par 2 observations de même valeur.

-          Les statistiques descriptives ne changent pas de valeurs.

-          Les statistiques inductives changent de valeurs, car elles sont fondamentalement liées aux effectifs.

 

Une démarche statistique fonctionne toujours en 2 temps :

On effectue d’abord la description, puis on se dirige vers des tests (inférences)

 

Inférence :

En général, on réalise des tests de signification dans une situation où les individus forment un échantillon au hasard d’une population parente.

On parle de cadre fréquentiel ou de cadre probabiliste.

 

On peut aussi réaliser des tests de signification lorsque les individus observés ne  forment un échantillon au hasard d’une population parente. La mécanique est la même mais les conclusions seront différentes : les tests permettent de légitimer les commentaires sur la conclusion.

On parle de cadre ensembliste ou de cadre combinatoire.

 

v Test binomial :

 

Ce test permet une inférence sur les fréquences d’un seul groupe d’observation avec une seule variable dépendante binaire. Il permet une comparaison sur une fréquence observée par rapport à une fréquence théorique.

 

Ø  Exemple 1 (musée) :

 

On observe le trajet de 10 visiteurs (adultes seuls) dans une salle entourée de tableaux. On s’intéresse à l’orientation à l’entrée (gauche ou droite)

 

Gauche

Droite

Total

3

7

10

Observation :

 

Analyse descriptive :

La fréquence observée, fOBS, est la fréquence d’orientation à droite.

fOBS = 0,7

Conclusion : La majorité des visiteurs vont à droite.

 

Inférence (cadre fréquentiste) :

Peut–on généraliser à la population parente l’observation descriptive ?

Y a–t–il une préférence significative pour le coté droit ?

 

Ø  Exemple 2 (gouvernement) :

 

On observe le sexe de 10 ministres.

 

Hommes

Femmes

Total

9

1

10

Observation :

 

Analyse descriptive :

La fréquence observée, fOBS, est la fréquence de femmes dans le gouvernement.

fOBS = 0,1

Conclusion : Les femmes sont sous–représentées au gouvernement.

 

Inférence (cadre ensembliste) :

Peut–on dire que la fréquence des femmes dans le gouvernement est significativement inférieure à 0,5 ?

 

Ø  Test :

 

On démarre sur une hypothèse nulle H0 où la distribution de la variable binaire est aléatoire :

H0 : j0 = 0,5

-          k = nombre d’évènements d’intérêt au cours d’une observation

-          n = nombre d’évènements totaux au cours d’une observation

-          F = variable

 

F=k/n

0/10

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

p(F=k/n)

0,001

0,01

0,044

0,117

0,205

0,246

0,205

0,117

0,044

0,01

0,001

 


Loi de distribution binomiale

 

-          j0 = fréquence d’orientation à droite

-          1–j0 = fréquence d’orientation à gauche

-           = nombre de combinaisons de n objets pris k à k

  = nombre de façons de choisir k éléments dans un ensemble de n éléments

 

Remarques :  1! = 1  ;  0! = 1

 

 

Pour évaluer l’extrémalité, on se fonde sur la probabilité d’obtenir un échantillon au moins aussi extrême que l’échantillon observé du même coté de la distribution. Cette probabilité est appelée seuil observé unilatéral du test (= one–sided p–value)

 


Musée :                                                                                              Gouvernement :

pSUP = 0,117 + 0,044 + 0,01 + 0,001 = 0,172                                    pINF = 0,01 + 0,001 = 0,011

 


 

Plus le seuil observé est petit, plus l’échantillon est extrême.

Par convention, on a considéré comme extrême 5% de la distribution (= seuil bilatéral a=0,05) Si on se situe dans l’une des 2 régions, on dit que le test est significatif au seuil bilatéral 5%.

 

 

 

 

 

 

L’objectif d’un test d’hypothèse est de rejeter les hypothèses qui rendent peu probables l’échantillon observé. Quand pINF est supérieure (ou pSUP inférieure) à 0,025, l’hypothèse n’est pas rejetée mais elle n’est pas pour autant validée.

Musée :

Si fOBS = 9/10, alors pSUP = 0,011 (< 0,025)

Le résultat est significatif : l’hypothèse H0 : j0 = 0,5 est rejetée, ainsi que toutes les hypothèses H0 : j0 < 0,5 qui rendraient l’échantillon encore moins probable

(Résultats encore plus significatifs)

Conclusion : la fréquence d’orientation à droite est significativement supérieure à droite (conclusion orientée) Cela veut dire que l’on rejette toutes les hypothèses d’une fréquence dans la population inférieure à 0,025.

 

Si fOBS = 7/10, alors pSUP = 0,172 (< 0,025)

Le résultat est non–significatif : on ne peut pas rejeter l’hypothèse nulle H0. On dit que l’hypothèse nulle est compatible avec les données.

 

 

 Un résultat non significatif est un constat d’ignorance..

 

Tous les tests portent sur une différence (entre 2 groupes) ou sur un écart à une valeur de référence ont pour objectif de se prononcer sur le signe du paramètre dans la population. Les tests ne répondent pas à une question de ressemblance.

-          Lorsque le résultat est significatif, on peut se prononcer sur le signe du paramètre dans la population.

-          Lorsque le résultat est non–significatif, on ne peut pas se prononcer sur le signe du paramètre.

Gouvernement :

fOBS = 1/10, alors pSUP = 0,011 (< 0,025)

Le résultat est significatif : l’hypothèse H0 : j0 = 0,5 est rejetée.

Conclusion : le résultat significatif ne ressemble pas (pour la fréquence de femmes) à la plupart des échantillons issus d’une population où il y a autant d’hommes que de femmes.

C’est–à–dire que le gouvernement n’est pas assimilable (pour la fréquence des femmes) à un échantillon au hasard de notre population

Þ Les femmes sont sous–représentées dans le gouvernement.

 

Si le résultat du test est non–significatif, les données sont assimilables à un échantillon au hasard issu d’une population où il y a autant d’hommes que de femmes. Dans ce cas, il n’y a de commentaire sur le fait que les femmes soient sous–représentées dans le gouvernement.

 

 

Le cadre ensembliste est un filtre de commentaire entre la description des données et la conclusion (interprétation)

 

Ø  Analyses individuelles :

 

Exemple : Etude du délai moyen de réaction avec un médicament agissant sur la vigilance :

Période P1 :    jour1 " jour7             Þ  Moyenne1

Période P2 :    jour8 " jour14           Þ  Moyenne2

(Périodes non contiguës : les jours de tests sont espacés de jours neutres)

 

-          L’unité statistique n’est pas l’individu mais le jour. P1 et P2 sont 2 groupes indépendants (absence de correspondance terme à terme)

-          Le test est situé dans un cadre ensembliste avec une analyse individuelle.

Cf. poly (comparaison de moyenne dans un cadre ensembliste)

 

v Test Z et test c2 :

Ø  Test Z :

 

Gauche

Droite

Total

3

7

10

Exemple : Musée :

 

 

Le test binomial est un test exact qui calcule la probabilité pUNI. Mais quand les effectifs sont trop importants, il devient fastidieux.

 

Dans la méthode approchée (test Z), on remplace la distribution binomiale par une distribution normale de même moyenne et de même écart–type. Le seuil observé unilatéral exact est remplacé par son approximation (proportion calculée sous une distribution normale)

 

 

ZOBS = 1,265          Z2,5% = 1,960

On utilise des tables pour déterminer la proportion dans la distribution de Z.

 

Ø  Test c2 :

 

Il est utilisé pour des tableaux de contingence à 2 entrées.

 

 

 

Gauche

Droite

Total

Observé

3

7

10

Théorique

5

5

10

Exemple : Musée :

 

 

 

Si c2 = 0 ; alors les valeurs observées sont égales aux valeurs théoriques.

 

v Tests non paramétriques :

 

Ils portent sur la comparaison de moyennes ou de fréquences.

 

Ø  Test de permutation (= randomisation test) :

 

9 élèves sont répartis au hasard dans 2 conditions expérimentales (enseignements traditionnel et moderne) et on étudie leurs résultats scolaires.

 

 

Condition 1

(= moderne)

 

Condition 2

(= traditionnel)

Ind 1

3

Ind 5

1

Ind 2

8

Ind 6

1

Ind 3

10

Ind 7

2

Ind 4

10

Ind 8

5

 

 

Ind 9

5

 

Analyse descriptive :


Moy1 = 7,75

 

Moy2 = 2,8

 

dOBS = 4,95


Conclusion : La pédagogie moderne donne en moyenne de meilleurs résultats.

Test :


H0 : même population parente pour les conditions (les observations sont échangeables) C'est–à–dire : on peut construire d’autres répartitions possibles.

 

-          Construire tous les protocoles possibles en mélangeant les 9 élèves dans les 2 conditions,

-          Calculer, pour chaque protocole, la différence entre les moyennes des 2 conditions,

-          Situer la différence observée dans la distribution des différences obtenues dans tous les protocoles possibles et en déduire le résultat du test.

 

Le nombre de protocoles est le nombre de façons de choisir les individus dans les conditions 1.

 

 

 

Parmi les 126 protocoles possibles, il y a 2 protocoles plus extrêmes que le protocole observé (obtenus en remplaçant ind1 par ind8 ou 9) et un protocole aussi extrême que le protocole observé (le protocole observé lui–même)

pSUP = 3/126 = 0,024  (< 0,025)

Le résultat est significatif au seuil unilatéral supérieur de 2,5%.

 

Conclusion : La moyenne des notes de la pédagogie moderne est significativement supérieure à celle des notes de la pédagogie traditionnelle.

 

Dans un cadre ensembliste :

Ce résultat significatif veut dire que la répartition des notes entre les 2 conditions n’est pas assimilable à une population répartie au hasard.

 

Ø  Méthode de Monté Carlo :

 

Quand la quantité de protocoles est énorme, le logiciel fait un tirage au hasard de protocoles. pUNI est calculé sur cet échantillon au hasard. C’est une approximation fournie avec un intervalle de confiance IC.

 

Ø  Mann Whitney :

 

Cette méthode utilise un codage en rang des observations effectuées dans 2 groupes.

Remarque :

-          Pour 2 groupes appareillés, la permutation se fait entre 2 observations appareillées. Il y a donc 2n permutations.

1/2n = 0,025  Þ  n = 6

Le résultat est significatif à partir de n=6

-          Lorsque l’on s’intéresse à la corrélation entre 2 variables dépendantes, on fixe le 1er groupe et on permute toutes les observations du 2nd groupe. Il y a donc n! permutations.

1/n! < 0,025 (=1/40)  Þ n = 5 ; p = 1/120

Le résultat est significatif à partir de n=5

 

Test paramétrique

Test non paramétrique

Test t de Student (comparaison de 2 groupes indépendants)

La population a une distribution normale.

Il y a des conditions sur les paramètres des populations parentes des 2 groupes étudiés : égalité des variances

Avec des effectifs importants, la distribution d’échantillonnage du rapport de Student coïncide toujours avec la distribution classique du t de Student.

Le test t est robuste vis–à–vis des conditions ; c’est–à–dire au–delà de 20–30 individus, il est possible de l’utiliser sans crainte.

Test de permutation (entre 2 groupes indépendants)

Il y a absence de conditions sur les paramètres des populations parentes des 2 groupes étudiés.

Ils sont utilisés pour de petits effectifs (inférieurs à 20–30 individus), mais il fonctionne aussi pour les effectifs plus importants.

 

v Méthodes géométriques :

Ø  AFC (= analyse factorielle des correspondances) :

 

Elle étudie des tableaux de contingence d’effectifs où les individus sont décrits par 2 variables qualitatives.

 

Ø  ACM (= analyse de correspondances multiples) :

 

Elle correspond à une ACP avec des variables qualitatives, dans des tableaux individu–variable (1 ligne par individu)

Elle ne sert pas à construire le nuage de point, mais à le partager.

 

On peut prolonger l’analyse géométrique (= méthode descriptive) par des tests de comparaison de moyenne (par exemple)

 

Ø  ACP (= analyse en composantes principales) :

 

Elle permet d’étudier les liaisons linéaires (corrélations) entre des variables dépendantes numériques.

 

 

Variables dépendantes numériques

Variables indépendantes qualitatives

i1 …

 

 

… i10

 

 

Le logiciel donne 2 nuages :


Nuage des individus :

-          Chaque ligne est représentée par un point.

-          La distance entre 2 points provient des écarts entre les descriptions des 2 individus par les variables numériques.

-          Les variables qui servent à construire la distance entre les points sont appelées variables actives.

-          La dimension du nuage est élevée. Sa projection orthogonale dans un plan entraîne une perte de la profondeur.

-          La dimension est au minimum entre le nombre de variables actives et le nombre d’individus voisins (conseil : il vaut mieux avoir plus d’individus que de variables actives, dans ce cas, la dimension est égale au nombre de variables dépendantes actives)

Nuage des variables :

-          Chaque variable numérique active est représentée par un vecteur de longueur (= norme) égale à l’écart–type de la variable.

-          L’angle entre 2 vecteurs a pour cosinus le coefficient de relation linéaire entre 2 variables.

-          Le nuage des variables a la même dimension que le nuage des individus.

 


 

Les variables numériques peuvent être ou non sur la même échelle.

 

Echelle commune aux 2 variables :

On peut définir une distance entre 2 points (en généralisant le théorème de Pythagore à plus de 2 dimensions) et donc un écart–type pour chaque variable. Dans ce cas, les variables ayant les plus grands écarts–type sont celles qui différencient le plus les individus.

 

Echelles différentes aux variables :

Pour définir la distance entre 2 points, on change les échelles en échelles pures, c’est–à–dire sans dimensions. On dit que l’on fait une réduction (obtention de variables réduites = variables normées)

On construit une variable réduite en remplaçant chaque valeur d’une variable par son écart–type réduit. C’est un nombre pur, sans unité.

 

Exemple du QI :

QI moyen = 100 ± 15 points

       Pour QI = 130 points, QIREDUIT = (130–100)/15 = 2

 

Une variable réduite a un écart–type de 1. Conséquence sur le nuage des variables : tous les vecteurs sont de longueur (= norme) égale à 1. Donc toutes les variables ont exactement la même importance dans la différence entre les individus.

 

Les vecteurs sont donc inclus dans une sphère de rayon 1. Dans une projection, on obtient un cercle de rayon 1, appelé cercle de corrélation.

-          Les vecteurs qui frôlent le cercle sont proches du plan du dessin (peu de déformation)

Plus les vecteurs sont petits, plus ils sont déformés.

-          On peut commenter (en terme de corrélation) les positions des vecteurs qui frôlent le cercle entre eux ou avec un vecteur très petit.

 

 

 

 

 

 

 


Choix du plan (= 1er plan principal) :

Il se fait avec la variance la plus grande possible.

 

-          Le logiciel détermine le 1er axe factoriel, qui (par convention) passe par le point moyen du nuage (» barycentre), sur lequel la variance projetée est maximale. Elle est appelée la 1ère valeur propre du nuage.

-          Le point moyen sert d’origine sur l’axe avec un choix arbitraire du sens de l’axe. Chaque point a une coordonnée factorielle sur le 1er axe.

-          Le 2ème axe est perpendiculaire au 1er axe. La variance projetée sur le 2ème axe est maximale (après la 1ère valeur) et appelée 2ème valeur propre du nuage.

 

La somme des valeurs propres est égale à la variance du nuage initial. Chaque axe exprime donc une proportion de la variance du nuage initial.

 

La variance correspond à la moyenne des écarts entre les valeurs et la moyenne. La variance du nuage correspond à la moyenne des écarts entre les valeurs et le point moyen.

 

Pour un nuage de dimension élevée, tous les axes factoriels passent pour le point G qui sert d’origine. Les axes factoriels sont perpendiculaires 2 à 2. Les axes qui suivent le 1er axe sont déterminés l’un après l’autre (dans l’ordre) avec la règle suivante :

« Parmi toutes les directions perpendiculaires à celles des 1ers axes trouvés, la direction d’un nouvel axe factoriel est celle sur laquelle le nuage projeté a la plus grande variance possible. »

 

Les valeurs propres successives vont donc en descendant.