Analyse bivarié

Licence de démographie:

Analyse statistique bivariée

Travaux pratiques

Adolphe Quételet

Exercice 6 (corrigé)

 

Analyse de tendance  * Analyse de saisonalité

Chroniques: tendance et saisonnalité:
 

Voyageurs en TGV: décembre 2000 - novembre 2003

Source: INSEE http://www.indices.insee.fr/bsweb/servlet/bsweb?action=BS_SERIE&ONGLET=2&BS_IDBANK=049343391&BS_IDARBO=12120100000000

Transports - Voyageurs - SNCF (milliards de voyageurs-km) -Réseau TGV

 

 

Il faut commercer par créer le tableau de travail en remplacent les dates par les numéros d'ordre (1,2,3,...36).
Ce seront les valeurs de la variable explicative t.
La variable dépendante Y est le nombre de voyageurs-km (en milliards)

 Tableau de travail
T Y t y ŷ = a t + b
1 3.03 1 9.18 3.03 3.37
2 3.37 4 11.36 6.74 3.36
3 3.15 9 9.92 9.45 3.35
4 3.55 16 12.60 14.20 3.34
5 3.72 25 13.84 18.60 3.33
6 3.09 36 9.55 18.54 3.32
7 3.15 49 9.92 22.05 3.31
8 3.48 64 12.11 27.84 3.31
9 3.24 81 10.50 29.16 3.30
10 3.08 100 9.49 30.80 3.29
11 2.95 121 8.70 32.45 3.28
12 3.28 144 10.76 39.36 3.27
13 2.99 169 8.94 38.87 3.26
14 3.29 196 10.82 46.06 3.25
15 3.22 225 10.37 48.30 3.24
16 3.51 256 12.32 56.16 3.23
17 3.75 289 14.06 63.75 3.22
18 3.44 324 11.83 61.92 3.21
19 3.31 361 10.96 62.89 3.21
20 3.44 400 11.83 68.80 3.20
21 3.34 441 11.16 70.14 3.19
22 3.04 484 9.24 66.88 3.18
23 2.93 529 8.58 67.39 3.17
24 3.24 576 10.50 77.76 3.16
25 2.91 625 8.47 72.75 3.15
26 3.09 676 9.55 80.34 3.14
27 3.18 729 10.11 85.86 3.13
28 3.5 784 12.25 98.00 3.12
29 3.82 841 14.59 110.78 3.11
30 3.38 900 11.42 101.40 3.11
31 2.91 961 8.47 90.21 3.10
32 2.9 1024 8.41 92.80 3.09
33 2.76 1089 7.62 91.08 3.08
34 2.8 1156 7.84 95.20 3.07
35 2.7 1225 7.29 94.50 3.06
36 3.01 1296 9.06 108.36 3.05
Somme 666.00 115.55 16206 373.63 2102.42 115.55
Moyenne 18.50 3.21 450.17 10.38 58.40 3.21

 

 

1. Analyse de tendance

Le tableau de travail donne la possibilité de calculer les statistiques (moyenne, variance et covariance) et, ensuite, calculer les paramètres de la droite de tendance.

Les moyennes

Les variances

 

et covariances:

Les paramètres de la ligne de tendance sont

 

Donc l'équation de tendance est

avec le rapport de détermination  r²=0.11663

Puisque le coefficient de corrélation est

Sinon:

 

bullet

Dessiner le graphique avec la ligne de tendance et les valeurs observer (fig.1),
ensuite,
dessiner le graphique qui ne représentante que les fluctuations saisonnières (ou les écarts à la tendance - fig.2).

Fig. 1

Fig.2

 

Graphique 2 présente les fluctuations en état pure. On peut obtenir la même présentation sans passer par la régression, si on soustrait de chaque valeur observée une moyenne. (Fig.3) Les données pour ce graphique sont déjà disponible dans le tableau de travail. On peut également présenter la tendance avec la moyenne mobile centrée. (Fig.4) Dans ce cas on perde quelques observations dans le début et à la fin de la période T.
 

Fig.3

Fig.4

2. Analyse de la saisonnalité

Dans cet exemple on peut utiliser le mois comme unité de base et une année comme une période.
Alors il faut calculer les moyenne pour chaque mois de calendrier, et ensuite calculer la valeur attendue
qui représente le nombre de voyageurs-km en absence de toute fluctuation saisonnière.
Ainsi le rapport entre les valeurs moyennes et les valeurs attendues sont les coefficients de saisonnalité (dans le cas d'un modèle multiplicatif).

 
    Distribution multiplicateur ou écart sais.=
Mois moyenne égalitaire coef.saison =(1- coef.sais)
décembre 3.1767 3.2097 0.9897 -0.0103
novembre 2.9767 3.2097 0.9274 -0.0726
octobre 3.2500 3.2097 1.0125 0.0125
septembre 3.1833 3.2097 0.9918 -0.0082
août 3.5200 3.2097 1.0967 0.0967
juillet 3.7633 3.2097 1.1725 0.1725
juin 3.3033 3.2097 1.0292 0.0292
mai 3.1233 3.2097 0.9731 -0.0269
avril 3.2733 3.2097 1.0198 0.0198
mars 3.1133 3.2097 0.9700 -0.0300
février 2.9733 3.2097 0.9264 -0.0736
janvier 2.8600 3.2097 0.8910 -0.1090
Somme 38.516667 38.51666667 12 0.0000

Les résultas sont présentés sur le graphique 5 à droite.

Pour améliorer la présentation on peut calculer "un écart saisonnier"
égale à 1-coefficient saisonnier.

Les résultat sont présentés sur le graphique 6.

 

Fig.5

 

Finalement on a utilisé un modèle multiplicatif 
Y(i) = Tendance x Sm,
où Sm est coefficient saisonnier pour le mois m.

Graphique 7 montre comment ce modèle décrit les donnée.

On voit que les données sont suffisamment bien décrites par le modèle,

mais il existe toutefois les écarts entre les valeurs estimées et ceux observées.

Ces écarts sont les résidus (ε)qui peuvent être intégrés dans le modèle:
 Y(i) = Tendance x Sm +
ε

ou

    

 

L'analyse des résidus est un problème particulier dans l'analyse statistique.

Le graphique 8 montre les résidus.

La moyenne des valeurs résidus ne s'élève que de 0.02% par rapport à la moyenne mensuelle pour toute la période de 36 mois. Il est rassurant qu'on ne voit sur le graphique aucune régularité des valeurs résiduelles.

Fig.7 
Modèle multiplicative Y(i) = Tendance x Sm, et les valeurs observées

 

Fig.8
Les résidus du modèle.