Licence de démographie: |
Analyse statistique bivariée |
Travaux pratiques |
|||
Exercice 5 (corrigé)
|
|||||
Fréquence conditionnelle * Effectif attendu * Fréquence conditionnelle attendue * Statistique khi-carré * Conclusion 1 * Mesures d'association * Coefficient de Pearson * Coefficient de Cramére * Conclusion 2 * Mesures d'association pour les tableau 2x2 |
|||||
|
Statistique khi-carré:
Logements: date d'emménagement selon l'âge de la personne de référence
Source: INSEE Alsace. Fiche profil "Logements: date
d'emménagement"
|
|||||||||||||||||||||||||||||||||||||||||||||||
1. Calculer la fréquence conditionnelle en colonnes
Apparemment, il existe l’association entre l’âge et la durée d’occupation d’un logement.
|
|||||||||||||||||||||||||||||||||||||||||||||||
2. Calculer l'efffectif attendu: On suppose que s’il n’y aucune relation entre les variables, les fréquences dans les cellules du tableau croisé doivent être proportionnelles aux valeurs marginales. Soit nij – la fréquence (l’effectif) d’une cellule se trouvant sur le croisement de la ligne i et de la colonne j mij – la fréquence (l’effectif) attendue dans la cellule se trouvant sur le croisement de la ligne i et de la colonne j, si les variables sont indépendantes ou « indifférentes » l’une par rapport à l’autre.
Effectif attendu :
|
|||||||||||||||||||||||||||||||||||||||||||||||
3. Calculer la fréquence conditionnelle en colonnes pour l'effectif attendu
Les structures de l'effectif attendu (fréquence conditionnelle en colonnes) sont les même (Sic!) Or c'est la structure attendue sous la condition qu'il n'y a aucune association entre les variables
|
|||||||||||||||||||||||||||||||||||||||||||||||
4. Calculer la statistique khi-carré On sait que χ2 = khi – deux ou khi carré où O = ni j à effectif observé et à effectif espéré (attendu). Formule développée |
|||||||||||||||||||||||||||||||||||||||||||||||
++ Calculer d'abord pour chaque cellule
++ Calculer ensuite pour la somme des valeurs
Nombre de dergés de liberté est égale à 10: on a trois modalités pour la variable "durée" et six modalités pour la variable "âge". DL = (n-1)(m-1) = (3-1)(6-1) = 2 x 5 = 10 ++ Chercher la valeur critique de χ² dans le tableau Pour 10 DL et la probabilité 0.005 la valeur de χ² dans le tableau est égale à 25,18818 ce qui est largement inférieur à la statistique de khi-carré dans notre tableau. Donc on peut dire qu'avec la probabilité supérieur à 99,5% il y a une association entre l'âge et la duréé d'occupation de logement. En travaillant dans l'Excel on peut trouver la valeur critique de khi-carré avec la fonction =KHIDEUX.INVERSE("probabilité";"degrés_liberté"). Dans notre cas =KHIDEUX.INVERSE(0.005;10) = 25,18805486
|
|||||||||||||||||||||||||||||||||||||||||||||||
On sait que la valeur de la statistique χ²
dépend beaucoup du nombre d'observations.
5. Pour niveler l'effet du nombre d'observations, on calcule le coefficient χ² standardisé de Pearson (coefficient de contingence - C) et le coefficient fc de Cramér (fi de Cramér) : χ² standardisé ou coefficient C de contingence de Pearson
fc le coefficient de Cramér (fi de Cramér) où k est la plus petite valeur entre le nombre de ligne (6 dans cet exercice) et de colonne (3 dans cette exercice).
On voit que l'association entre les deux variables est importante, mais pas très forte.
Dans le cas des tableaux 2 x 2 on peut utiliser comme une mesure d'association des statistique assez simples comme f ou f²
D
l'indice d'association de Yule (Q) et l'indice de contingence de Pearson (Ф). Les formules sont simples: L'indice d'association de Yule (Q)
L'indice de contingence de Pearson (Ф)
La valeur de l'indice de
contingence est toujours à peu près deux fois inférieur de l'indice
d'association,
|