S6-Econométrie-Statistiques Discriptioves-19-20 PDF
S6-Econométrie-Statistiques Discriptioves-19-20 PDF
S6-Econométrie-Statistiques Discriptioves-19-20 PDF
Dependent Variable: Y
Y X1 X2 X3 Method: Least Squares
Included observations: 33
Mean 103387.6 3529508. 101533.3 312958.5
Median 81957.00 3071450. 74737.00 211542.0
Maximum 235141.0 7998860. 259680.0 992176.0 Variable Coefficient Std. Error t-Statistic Prob.
Minimum 17363.00 724411.4 21071.00 34232.00
Std. Dev. 70526.82 2224999. 71860.86 286870.3 X1 0.02649 0.00550 4.81232 0.0000
Skewness 0.589346 0.581208 0.930648 1.107619
Kurtosis 2.001576 2.181527 2.649562 3.083675 X2 0.66432 0.30080 2.20844 0.0353
X3 -0.12954 0.05782 -2.24037 0.0329
Jarque-Bera 3.280975 2.779027 4.932441 6.757132 C -17037.6 6289.47 -2.70891 0.0112
Probability 0.193886 0.249197 0.084905 0.034096
R-squared 0.98050 Mean dependent var 103387.
Sum 3411792. 1.16E+08 3350598. 10327630
Adjusted R-
Sum Sq. Dev. 1.59E+11 1.58E+14 1.65E+11 2.63E+12
squared 0.97848 S.D. dependent var 70526.8
Observations 33 33 33 33 S.E. of regression 10343.9 Akaike info criterion 21.4394
Sum squared resid 3.1E+09 Schwarz criterion 21.6208
9
Log likelihood -349.750 Hannan-Quinnc riter 21.5004
8
F-statistic 486.196 Durbin-Watson stat 0.89136
7
Prob(F-statistic) 0.00000
6
Estimation Command:
Frequency
5
=========================
4 LS Y X1 X2 X3 C
3 Estimation Equation:
2 =========================
Y = C(1)*X1 + C(2)*X2 + C(3)*X3 + C(4)
1
Substituted Coefficients:
0
0 20,000 60,000 100,000 140,000 180,000 220,000 260,000
=========================
Y = 0.02649*X1 + 0.66432*X2 - 0.12954*X3 - 17037.6
SOMMAIRE
I. PRESENTATIONS DES VARIABLES D’ETUDE
II. STATISTIQUES DESCRIPTIVES DES VARIABLES ETUDIEES
III. ANALYSE GRAPHIQUE
IV. SPECIFICATION DU MODELE DE REGRESSION LINEAIRE MULTIPLE
V. APPLICATION
6 ème Semestre Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général
Pr. Amale LAHLOU Département des Sciences Économiques
Avant de lancer une analyse de régression, il est primordial d'avoir une idée de votre
ensemble de données brutes des variables. Autrement dit, quelles sont les caractéristiques
descriptives de chaque variable qui compose vos données d'échantillon? Notamment, si l'échantillon
est normalement distribué ? Y a-t-il des valeurs aberrantes dans les données ? etc.
Ce présent chapitre explique comment exécuter une analyse descriptive via le logiciel EViews8 et
interpréter les informations fournies par :
Les données empiriques brutes couvrent la période 1980-2011, soit un nombre de 32 observations :
Obser y x1 x2 x3 x4 x5
1980 0,62 4,17 22,10 44,21 52,83 7,86
1981 0,75 5,83 25,50 51,05 71,37 10,62
1982 0,85 5,44 29,20 58,44 81,93 11,37
1983 0,86 5,85 26,45 52,87 96,52 11,47
1984 0,93 6,34 17,95 35,88 113,38 8,82
1985 1,00 6,10 22,60 45,22 131,69 11,72
1986 1,02 5,16 25,50 51,00 110,27 11,22
1987 1,08 4,61 21,20 42,42 117,36 9,93
1988 1,11 4,64 16,20 32,36 99,48 8,24
1989 1,34 5,50 20,35 40,73 103,54 9,51
1990 1,51 3,57 14,20 28,41 100,77 7,23
1991 1,44 4,35 17,20 34,47 84,21 8,92
1992 1,51 8,62 26,20 52,47 82,82 14,23
1993 1,55 5,19 23,05 46,10 86,41 12,99
1994 1,46 4,78 23,35 46,77 78,78 12,47
1995 1,63 4,39 20,20 40,46 75,11 11,88
1996 1,52 3,90 17,20 34,47 68,59 9,58
1997 1,64 3,53 16,20 32,45 72,90 9,74
1998 1,83 2,89 14,25 28,50 60,64 7,43
1999 1,94 3,04 14,60 29,25 59,52 8,16
2000 2,02 3,00 12,60 25,28 57,67 7,52
2001 2,07 2,76 11,60 23,22 51,44 7,26
2002 2,09 2,85 14,75 29,56 45,89 9,42
2003 2,44 2,73 14,70 29,40 37,58 8,81
2004 2,68 1,11 8,75 17,50 30,41 5,36
2005 2,98 1,01 7,90 15,81 27,74 4,65
2006 3,03 0,96 8,45 16,89 27,73 5,26
2007 2,94 0,94 8,10 16,15 27,85 5,42
2008 2,87 0,86 6,65 13,30 23,98 4,81
2009 2,88 0,79 6,85 13,69 27,83 3,86
2010 2,95 0,99 5,90 11,84 29,69 3,74
2011 2,83 0,81 4,95 9,91 29,43 3,36
6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 2
Pr. Amale LAHLOU Département des Sciences Économiques
File\open\EViews Workfile\LAHLOU-Econométrie-II-cours.wf1
6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 3
Pr. Amale LAHLOU Département des Sciences Économiques
Common sample : fournie les statistiques des observations pour lesquelles il n'y a aucune
valeur manquante dans aucune des séries du groupe.
Individual sample : fournie les statistiques de toutes les observations non manquantes pour
chaque série.
6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 4
Pr. Amale LAHLOU Département des Sciences Économiques
𝑦 𝑥1 𝑥2 𝑥3 𝑥4 𝑥5
Mean 1.792813 3.647188 16.39687 32.81500 67.66750 8.526875
Median 1.590000 3.735000 16.20000 32.40500 69.98000 8.815000
Maximum 3.030000 8.620000 29.20000 58.44000 131.6900 14.23000
Minimum 0.620000 0.790000 4.950000 9.910000 23.98000 3.360000
Std. Dev. 0.770610 2.017159 6.940019 13.88892 31.42847 2.902736
Skewness 0.312816 0.153496 0.006446 0.005322 0.179071 -0.096207
Kurtosis 1.800032 2.460441 1.904671 1.904443 1.929326 2.154012
Observations 32 32 32 32 32 32
7
Series: Y
6 Sample 1980 2011
Observations 32
5
Mean 1.792813
Median 1.590000
4 Maximum 3.030000
Minimum 0.620000
3 Std. Dev. 0.770610
Skewness 0.312816
2 Kurtosis 1.800032
Jarque-Bera 2.441782
1
Probability 0.294967
0
0.50 0.75 1.00 1.25 1.50 1.75 2.00 2.25 2.50 2.75 3.00 3.25
6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 5
Pr. Amale LAHLOU Département des Sciences Économiques
𝑛
1 𝑘
𝜇𝑘 = 𝑦𝑖 − 𝑦
𝑛
𝑖=1
𝑛
1 2
𝜎= 𝑦𝑖 − 𝑦
𝑛
𝑖=1
1 𝑛
2
𝑠= 𝑦𝑖 − 𝑦
𝑛−1 𝑖=1
𝑛
On a la formule : s= 𝜎 .
𝑛−1
1 3
𝜇3 𝜇3 1 𝑛 𝑦𝑖 − 𝑦
𝛽12 = 3 2 = =
𝜇2 𝜎3 𝑛 𝑖=1 𝜎
2
1 2
1 2 6 𝛽1 −0
𝛽1 ≡ 𝒩 0, 𝑎𝑖𝑛𝑠𝑖 𝑆𝑘𝑒 = ≡ 𝒩𝛼 0,1
𝑛 6
𝑛
6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 6
Pr. Amale LAHLOU Département des Sciences Économiques
Si 𝑆𝑘𝑒 < 1,96 on accépte, au risque 5%, la symétrie de la courbe de distribution de la série.
En résumé :
Lorsque la valeur de 𝑆𝑘𝑒 est significativement nulle (= 0) :
4
𝜇4 𝜇4 1 𝑛 𝑦𝑖 − 𝑦
𝐵2 = 4 2 = =
𝜇2 𝜎4 𝑛 𝑖=1 𝜎
2
24 𝛽2 − 3
𝛽2 ≡ 𝒩 3, 𝑎𝑖𝑛𝑠𝑖 𝐾𝑢𝑟 = ≡ 𝒩𝛼 0,1
𝑛 24
𝑛
6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 7
Pr. Amale LAHLOU Département des Sciences Économiques
Si 𝐾𝑢𝑟 < 1,96 on accépte, au risque 5%, l’aplatissement normal de la distribution de la série.
En résumé :
Lorsque la valeur de 𝐾𝑢𝑟 est significativement nulle 𝛽2 = 3 :
Si 𝑆𝑘𝑒 < 1,96 et 𝐾𝑢𝑟 < 1,96 on accépte, au risque 5%, la symétrie de la courbe et
l’aplatissement de la distribution de la série.
6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 8
Pr. Amale LAHLOU Département des Sciences Économiques
1 2
Pour le test de normalité, on peut appliquer aussi le test de Jarque-Bera : Si 𝛽1 et 𝛽2 suivent
des lois normales, alors la statistique de Jarque-Bera en statistique descriptive est donné par :
𝑛 𝑛 2
𝐽𝐵 = 𝛽1 + 𝛽 −3
6 24 2
1 2
Si 𝛽1 et 𝛽2 suivent des lois normales, alors 𝐽𝐵 ≡ 𝜒𝛼2 à 2 𝑑𝑑𝑙.
Règle de décision : au risque 𝛼, on accepte 𝐻0 de la série (ici des résidus) si 𝐽𝐵 < 𝜒𝛼2 (2) .
𝑥𝑖 − 𝑥 2
𝑖=1
donc la valeur de skewness est significativement nulle au risque 5%, donc la distribution est
symétrique ;
6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 9
Pr. Amale LAHLOU Département des Sciences Économiques
𝛽2 −3 1.800032 −3
le coefficient de kurtosis vaut 𝛽2 = 1.800032, comme 24
= 24
= 1.39 < 1.96, donc
𝑛 32
la valeur de kurtosis est significativement nulle au risque 5%, donc la distribution est aplatie
normalement ;
la statistique de Jarque-Bera est 𝐽𝐵 = 2.441782 en effet
𝑛 𝑛 2
32 32
𝐽𝐵 = 𝛽1 + 𝛽 −3 = (0.312816)2 + 1.80003 − 3 2 = 2.441791
6 24 2 6 24
au risque 5%, la valeur 𝐽𝐵 < 5.99 donc on accepte l’hypothèse de normalité de la série.
Interprétation :
L’analyse par la statistique descriptive des variables recèle des informations très importantes
permettant de décrire une variable quantitative. Pour ce but, on utilise quelques indicateurs de
tendance centrale, indicateurs de dispersion, indicateurs de forme de la distribution ainsi que des
représentations graphiques.
6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 10
Pr. Amale LAHLOU Département des Sciences Économiques
Quick\Graph
Y X5
3.5 16
3.0 14
12
2.5
10
2.0
8
1.5
6
1.0 4
0.5 2
1980 1985 1990 1995 2000 2005 2010 1980 1985 1990 1995 2000 2005 2010
X4 X3
140 60
120 50
0.51.01.52.02.53.03.51980198519901995200020052010Y2468101214161980198519901995200020052010X5204060801001201401980198519901995200020052010X401020304050601980198519901995200020052010X30510152025301980198519901995200020052010X202468101980198519901995200020052010X1
100 40
80 30
60 20
40 10
20 0
1980 1985 1990 1995 2000 2005 2010 1980 1985 1990 1995 2000 2005 2010
X2 X1
30 10
25
8
20
6
15
4
10
2
5
0 0
1980 1985 1990 1995 2000 2005 2010 1980 1985 1990 1995 2000 2005 2010
Interprétation :
Les six premiers graphes montrent la tendance d’évolution des variables durant la période étudiée.
Dans le premier graphe, on remarque que la variable 𝑦 évolue dans le temps avec un rythme différent
de celui suivi par les autres variables. Les graphes des deux variables exogènes 𝑥2 et 𝑥3 se
superposent ; il est clair qu’il existe une relation de colinéarité entre ces deux variables exogènes.
6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 11
Pr. Amale LAHLOU Département des Sciences Économiques
La variable endogène est représentée par 𝑦 et les variables 𝑥1 , 𝑥2 , 𝑥3 , 𝑥4 𝑥5 sont les variables
exogènes introduites. On cherche à établir une combinaison linéaire entre ces variables. Pour la
période 𝑡 = 1980, … ,2011 ou encore pour 𝑖 = 1, … ,32
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥1𝑖 + 𝛽2 𝑥2𝑖 + 𝛽3 𝑥3𝑖 + 𝛽4 𝑥4𝑖 + 𝛽5 𝑥5𝑖 + 𝜀𝑖
𝜀i est l’erreur du modèle. Ce terme aléatoire résume toute l’information qui n’est pas prise en compte
dans la relation linéaire.
On commence par estimer les coefficients 𝛽k , k = 1, … ,5 par la méthode des Moindres Carrées
Ordinaires (MCO) :
Quick\Estimate Equation LS y c x1 x2 x3 x4 x5
6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 12
Pr. Amale LAHLOU Département des Sciences Économiques
Soit alors,
Dependent Variable: Y
Method: Least Squares
Included observations: 32
𝑦𝑖 = 3.130 − 0.064 𝑥1𝑖 + 3.156 𝑥2𝑖 − 1.633 𝑥3𝑖 − 0.010 𝑥4𝑖 + 0.164 𝑥5𝑖 + 𝑒𝑖
Estimation Command:
=========================
LS Y C X1 X2 X3 X4 X5
Estimation Equation:
=========================
Y = C(1) + C(2)*X1 + C(3)*X2 + C(4)*X3 + C(5)*X4 + C(6)*X5
Substituted Coefficients:
=========================
Y = 3.130044 - 0.064483 *X1 + 3.155817 *X2 - 1.632840 *X3 - 0.009795 *X4 + 0.163819 *X5
6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 13
Pr. Amale LAHLOU Département des Sciences Économiques
𝛽
Ratio de Student (t-Statistic) : les ratios de Student 𝑡𝛽 = associés respectivement aux six
𝜎𝛽
paramètres sont : 𝑡𝛽0 = 17.92143 , 𝑡𝛽1 = −0.935060 , 𝑡𝛽2 = 1.079837 , 𝑡𝛽3 = −1.116088 ,
𝑡𝛽4 = −3.644787, 𝑡𝛽5 = 3.624788
La p-value associée au ratio de Student (Prob) : les p-values associées respectivement aux cinq
paramètres sont : 𝑃𝑣 𝑡𝛽0 = 0.0000 , 𝑃𝑣 𝑡𝛽1 = 0.3584 , 𝑃𝑣 𝑡𝛽2 = 0.2901 , 𝑃𝑣 𝑡𝛽3 = 0.2746 ,
Interprétation :
6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 14
Pr. Amale LAHLOU Département des Sciences Économiques
Dependent Variable: Y
Method: Least Squares
Sample: 1980 2011
Included observations: 32
6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 15
Pr. Amale LAHLOU Département des Sciences Économiques
Formules :
Included observations: @regobs = 𝑛 = 20
@coefs i = 𝛽𝑖 = 𝐶(𝑖)
Std. Error Variable 𝑿𝒊 : l’estimation de l’écart type du coefficient de régression , @stderrs i = 𝜎𝛽𝑖
𝛽𝑖
@tstats i = 𝑡𝛽∗ =
𝑖 𝜎𝛽𝑖
𝛽
t-Statistic 𝑪 : le ratio de Student de la constante, 𝑡𝛽∗0 = 𝜎 0
𝛽0
𝑆𝐶𝐸 𝑆𝐶𝑅
@𝑟 2 = 𝑅 2 = =1−
𝑆𝐶𝑇 𝑆𝐶𝑇
Adjusted R-squared: le coefficient de détermination ajusté
𝑆𝐶𝑅 𝑛 − 𝑘 − 1 𝑛−1
@𝑟𝑏𝑎𝑟2 = 𝑅𝑎2 = 1 − =1− 1 − 𝑅2
𝑆𝐶𝑇 𝑛 − 1 𝑛−𝑘−1
S.E. of regression (Standard Error of the Regression) : Square Error of regression ou l’écart type des erreurs
𝑛 2
𝑖 =1 𝑒𝑖 𝑆𝐶𝑅
@se = 𝜎𝜀 = =
𝑛−𝑘−1 𝑛−𝑘−1
Log Likelihood :
−𝑛 𝑆𝐶𝑅
@𝑙𝑜𝑔𝑙 = 𝑙 = 1 + ln(2𝜋) + ln
2 𝑛
Sum squared resid (Sum-of-Squared Residuals) : Somme des carrés résiduels
𝑛
2
@ssr = 𝑆𝐶𝑅 = 𝑦𝑖 − 𝑦𝑖
𝑖=1
6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 16
Pr. Amale LAHLOU Département des Sciences Économiques
𝑅2
@𝑓 = 𝐹 = ∗ 𝑘
(1 − 𝑅 2 )
𝑛−𝑘−1
Prob(F-statistic) : p-value du modèle, @𝑓𝑝𝑟𝑜𝑏 = 𝑃 𝐹 𝑘,𝑛 −𝑘−1 > F − statistic = 𝑃 𝐹 𝑘,𝑛 −𝑘−1 > 𝐹 ∗
S.D. dependent var (Standard Deviation (S.D.) of the Dependent Variable) : l’écart type empirique de la variable
dépendante
𝑛
𝑖=1𝑦𝑖 − 𝑦 2
@sddep = 𝜎𝑦 =
𝑛−1
Durbin-Watson Stat (Durbain-Watson Statistic) (DW) : Le test de D urbin Waston permet de détecter
l’existence ou non de l’autocorrélation des erreurs.
𝑛 2
𝑖 =2 𝑒𝑖 − 𝑒𝑖 −1
@𝑑𝑤 = 𝐷𝑊 = 𝑛 2
𝑖=1 𝑒𝑖
Akaike Information Criterion (AIC) : pour la section du modèle de régression optimal avec 𝑘 variables
explicatives (Problème de multicolinéairité : on cherche le modèle optimal ayant la plus petite AIC
2𝑙 2(𝑘 + 1) 𝑆𝐶𝑅 2(𝑘 + 1)
@aic = 𝐴𝐼𝐶 = − + = 1 + ln(2𝜋) + ln +
𝑛 𝑛 𝑛 𝑛
Schwarz Criterion (SC) : pour la section du modèle de régression optimal avec 𝑘 variables explicatives
(Problème de multicolinéairité : on cherche le modèle optimal ayant la plus petite SC
2𝑙 (𝑘 + 1) ln(𝑛) 𝑆𝐶𝑅 (𝑘 + 1) ln(𝑛)
@schwarz = 𝑆𝐶 = − + = 1 + ln(2𝜋) + ln +
𝑛 𝑛 𝑛 𝑛
6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 17