Nothing Special   »   [go: up one dir, main page]

S6-Econométrie-Statistiques Discriptioves-19-20 PDF

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 17

Filière de Sciences Économiques et de Gestion

Licence d’Études Fondamentales en Sciences Économiques


Département des Sciences Économiques

Pr. : Amale LAHLOU


CHAPITRE :
REGRESSION MULTIPLE ET STATISTIQUES DESCRIPTIVES

DES VARIABLES ETUDIEES

Dependent Variable: Y
Y X1 X2 X3 Method: Least Squares
Included observations: 33
Mean 103387.6 3529508. 101533.3 312958.5
Median 81957.00 3071450. 74737.00 211542.0
Maximum 235141.0 7998860. 259680.0 992176.0 Variable Coefficient Std. Error t-Statistic Prob.
Minimum 17363.00 724411.4 21071.00 34232.00
Std. Dev. 70526.82 2224999. 71860.86 286870.3 X1 0.02649 0.00550 4.81232 0.0000
Skewness 0.589346 0.581208 0.930648 1.107619
Kurtosis 2.001576 2.181527 2.649562 3.083675 X2 0.66432 0.30080 2.20844 0.0353
X3 -0.12954 0.05782 -2.24037 0.0329
Jarque-Bera 3.280975 2.779027 4.932441 6.757132 C -17037.6 6289.47 -2.70891 0.0112
Probability 0.193886 0.249197 0.084905 0.034096
R-squared 0.98050 Mean dependent var 103387.
Sum 3411792. 1.16E+08 3350598. 10327630
Adjusted R-
Sum Sq. Dev. 1.59E+11 1.58E+14 1.65E+11 2.63E+12
squared 0.97848 S.D. dependent var 70526.8
Observations 33 33 33 33 S.E. of regression 10343.9 Akaike info criterion 21.4394
Sum squared resid 3.1E+09 Schwarz criterion 21.6208
9
Log likelihood -349.750 Hannan-Quinnc riter 21.5004
8
F-statistic 486.196 Durbin-Watson stat 0.89136
7
Prob(F-statistic) 0.00000
6
Estimation Command:
Frequency

5
=========================
4 LS Y X1 X2 X3 C
3 Estimation Equation:
2 =========================
Y = C(1)*X1 + C(2)*X2 + C(3)*X3 + C(4)
1
Substituted Coefficients:
0
0 20,000 60,000 100,000 140,000 180,000 220,000 260,000
=========================
Y = 0.02649*X1 + 0.66432*X2 - 0.12954*X3 - 17037.6

SOMMAIRE
I. PRESENTATIONS DES VARIABLES D’ETUDE
II. STATISTIQUES DESCRIPTIVES DES VARIABLES ETUDIEES
III. ANALYSE GRAPHIQUE
IV. SPECIFICATION DU MODELE DE REGRESSION LINEAIRE MULTIPLE
V. APPLICATION

6 ème Semestre Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général
Pr. Amale LAHLOU Département des Sciences Économiques

Avant de lancer une analyse de régression, il est primordial d'avoir une idée de votre
ensemble de données brutes des variables. Autrement dit, quelles sont les caractéristiques
descriptives de chaque variable qui compose vos données d'échantillon? Notamment, si l'échantillon
est normalement distribué ? Y a-t-il des valeurs aberrantes dans les données ? etc.

Ce présent chapitre explique comment exécuter une analyse descriptive via le logiciel EViews8 et
interpréter les informations fournies par :

 les indicateurs de la tendance centrale : moyenne, médiane, etc.


 les indicateurs de dispersion : la variance, la dérivation standard, etc.
 Les indicateurs de la normalité : kurtosis et skewness, Jarque-Bera, etc.

I. PRESENTATIONS DES VARIABLES D ’ETUDE


LAHLOU-Econométrie-II-cours.xls ou LAHLOU-Econométrie-II-cours.wf1

Les données empiriques brutes couvrent la période 1980-2011, soit un nombre de 32 observations :

Obser y x1 x2 x3 x4 x5
1980 0,62 4,17 22,10 44,21 52,83 7,86
1981 0,75 5,83 25,50 51,05 71,37 10,62
1982 0,85 5,44 29,20 58,44 81,93 11,37
1983 0,86 5,85 26,45 52,87 96,52 11,47
1984 0,93 6,34 17,95 35,88 113,38 8,82
1985 1,00 6,10 22,60 45,22 131,69 11,72
1986 1,02 5,16 25,50 51,00 110,27 11,22
1987 1,08 4,61 21,20 42,42 117,36 9,93
1988 1,11 4,64 16,20 32,36 99,48 8,24
1989 1,34 5,50 20,35 40,73 103,54 9,51
1990 1,51 3,57 14,20 28,41 100,77 7,23
1991 1,44 4,35 17,20 34,47 84,21 8,92
1992 1,51 8,62 26,20 52,47 82,82 14,23
1993 1,55 5,19 23,05 46,10 86,41 12,99
1994 1,46 4,78 23,35 46,77 78,78 12,47
1995 1,63 4,39 20,20 40,46 75,11 11,88
1996 1,52 3,90 17,20 34,47 68,59 9,58
1997 1,64 3,53 16,20 32,45 72,90 9,74
1998 1,83 2,89 14,25 28,50 60,64 7,43
1999 1,94 3,04 14,60 29,25 59,52 8,16
2000 2,02 3,00 12,60 25,28 57,67 7,52
2001 2,07 2,76 11,60 23,22 51,44 7,26
2002 2,09 2,85 14,75 29,56 45,89 9,42
2003 2,44 2,73 14,70 29,40 37,58 8,81
2004 2,68 1,11 8,75 17,50 30,41 5,36
2005 2,98 1,01 7,90 15,81 27,74 4,65
2006 3,03 0,96 8,45 16,89 27,73 5,26
2007 2,94 0,94 8,10 16,15 27,85 5,42
2008 2,87 0,86 6,65 13,30 23,98 4,81
2009 2,88 0,79 6,85 13,69 27,83 3,86
2010 2,95 0,99 5,90 11,84 29,69 3,74
2011 2,83 0,81 4,95 9,91 29,43 3,36

6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 2
Pr. Amale LAHLOU Département des Sciences Économiques

File\open\EViews Workfile\LAHLOU-Econométrie-II-cours.wf1

Sélectionner y (touche ‘ctrl’ enfoncée) puis sélectionner x1 x2 x3 x4 x5


puis avec une touche à droite sur la sourie Open\as Group

L’équation estimée du modèle sera sous la forme :

𝑦𝑡 = 𝛽0 + 𝛽1 𝑥1𝑡 , +𝛽2 𝑥2𝑡 + 𝛽3 𝑥3𝑡 + 𝛽4 𝑥4𝑡 + 𝛽5 𝑥5𝑡 + 𝑒𝑡

6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 3
Pr. Amale LAHLOU Département des Sciences Économiques

II. STATISTIQUES DESCRIPTIVES DES VARIABLES ETUDIEES :

Quick\Group Statistics\Descriptive View\Descriptive Stats\Common sample 


Statistics\Common sample  View\Descriptive Stats\Individual sample 

 Common sample : fournie les statistiques des observations pour lesquelles il n'y a aucune
valeur manquante dans aucune des séries du groupe.

 Individual sample : fournie les statistiques de toutes les observations non manquantes pour
chaque série.

View\Descriptive Statistics & Tests\Histogram and Stats 

6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 4
Pr. Amale LAHLOU Département des Sciences Économiques

Une description synthétique des données étudiées :

𝑦 𝑥1 𝑥2 𝑥3 𝑥4 𝑥5
Mean 1.792813 3.647188 16.39687 32.81500 67.66750 8.526875
Median 1.590000 3.735000 16.20000 32.40500 69.98000 8.815000
Maximum 3.030000 8.620000 29.20000 58.44000 131.6900 14.23000
Minimum 0.620000 0.790000 4.950000 9.910000 23.98000 3.360000
Std. Dev. 0.770610 2.017159 6.940019 13.88892 31.42847 2.902736
Skewness 0.312816 0.153496 0.006446 0.005322 0.179071 -0.096207
Kurtosis 1.800032 2.460441 1.904671 1.904443 1.929326 2.154012

Jarque-Bera 2.441782 0.513824 1.599884 1.600478 1.699478 1.003624


Probability 0.294967 0.773436 0.449355 0.449221 0.427527 0.605433

Sum 57.37000 116.7100 524.7000 1050.080 2165.360 272.8600


Sum Sq. Dev. 18.40905 126.1368 1493.080 5979.965 30620.22 261.2021

Observations 32 32 32 32 32 32

7
Series: Y
6 Sample 1980 2011
Observations 32
5
Mean 1.792813
Median 1.590000
4 Maximum 3.030000
Minimum 0.620000
3 Std. Dev. 0.770610
Skewness 0.312816
2 Kurtosis 1.800032

Jarque-Bera 2.441782
1
Probability 0.294967

0
0.50 0.75 1.00 1.25 1.50 1.75 2.00 2.25 2.50 2.75 3.00 3.25

 Observations (observations) : les données étudiées sont au nombre de 𝑛 observations (taille de


l’échantillon) ;
𝑛
𝑖=1 𝑦 𝑖
 Mean 𝑥 = : la moyenne arithmétique des observations de la série, elle mesure la
𝑛
tendance centrale au sens que les réponses se trouvent réparties de part et d’autre de la moyenne .
La moyenne est sensible aux valeurs extrêmes ou atypiques ;
 Median : la médiane des observations de la série, elle mesure la tendance centrale qui permet de
diviser la série d’observations en deux parties égales. Ce paramètre se lie toujours à la moyenne
pour une bonne interprétation de la série statistique ;
 Maximum : l’observation maximale de la série d’observations ;
 Minimum : l’observation minimale de la série d’observations. On peut ainsi, calculer l’étendu
(indicateur de dispersion), soit la différence entre le maximum et le minimum de la distribution ;
 std. Dev (standard Deviation) : l’écart type corrigé est la mesure de la dispersion, ou l’étalement,
des observations autour de la moyenne de la série statistique. Plus l’écart type est faible, plus la
population est homogène.

Notons par 𝜇𝑘 le moment centré d’ordre 𝑘.

6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 5
Pr. Amale LAHLOU Département des Sciences Économiques

𝑛
1 𝑘
𝜇𝑘 = 𝑦𝑖 − 𝑦
𝑛
𝑖=1

Le moment d’ordre 2 donne la variance de la série,


𝑛
1
𝜎2 = 𝜇2 = 𝑦𝑖 − 𝑦 2
𝑛
𝑖=1

et l’écart type est donné par :

𝑛
1 2
𝜎= 𝑦𝑖 − 𝑦
𝑛
𝑖=1

L’écart type corrigé est donc donné par :

1 𝑛
2
𝑠= 𝑦𝑖 − 𝑦
𝑛−1 𝑖=1

𝑛
On a la formule : s= 𝜎 .
𝑛−1

 Skewness : le coefficient Skewness de Fisher :

1 3
𝜇3 𝜇3 1 𝑛 𝑦𝑖 − 𝑦
𝛽12 = 3 2 = =
𝜇2 𝜎3 𝑛 𝑖=1 𝜎

permet de mesurer l’asymétrie de la distribution d’une variable aléatoire autour de sa moyenne,


c’est un paramètre de forme. Si la distribution est normale et pour 𝑛 > 30, on a :

2
1 2
1 2 6 𝛽1 −0
𝛽1 ≡ 𝒩 0, 𝑎𝑖𝑛𝑠𝑖 𝑆𝑘𝑒 = ≡ 𝒩𝛼 0,1
𝑛 6
𝑛

Pour le test de symétrie on pose l’hypothèse nulle 𝐻0 suivante :

𝐻0 ∶ 𝑆𝑘𝑒 = 0 la courbe de la distribution est symétrie par rapport à la moyenne

Règle de décision : au seuil 𝛼, on accepte l’hypothèse 𝐻0 si 𝑆𝑘𝑒 ≤ 𝑁𝛼 0,1

Exemple : pour le quantile à 95% de la loi normale centré réduite est :


(𝑠𝑢𝑟 𝐸𝑥𝑐𝑒𝑙 ∶ 𝐿𝑂𝐼. 𝑁𝑂𝑅𝑀𝐴𝐿𝐸 . 𝑆𝑇𝐴𝑁𝐷𝐴𝑅𝐷 . 𝐼𝑁𝑉𝐸𝑅𝑆𝐸 (1 − (0,05/2)) = 1,96)

6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 6
Pr. Amale LAHLOU Département des Sciences Économiques

Si 𝑆𝑘𝑒 < 1,96 on accépte, au risque 5%, la symétrie de la courbe de distribution de la série.

En résumé :
 Lorsque la valeur de 𝑆𝑘𝑒 est significativement nulle (= 0) :

la distribution est symétrique autour de la moyenne


(graphique du milieu) ;

𝑚𝑒𝑎𝑛 = 𝑚𝑒𝑑𝑖𝑎𝑛 = 𝑚𝑜𝑑𝑒

 Lorsque la valeur de 𝑆𝑘𝑒 est significativement négative < 0 :

L'asymétrie négative signifie que la queue du côté gauche de


la distribution est plus longue ou plus grosse que la queue du
côté droit. La moyenne et la médiane seront inférieures au
mode.

𝑚𝑒𝑎𝑛 < 𝑚𝑒𝑑𝑖𝑎𝑛 < 𝑚𝑜𝑑𝑒


 Lorsque la valeur de 𝑆𝑘𝑒 est significativement positive (> 0) :

L'asymétrie positive signifie que la queue du côté droit de la


distribution est plus longue ou plus grosse. La moyenne et la
médiane seront supérieures au mode

𝑚𝑜𝑑𝑒 < 𝑚𝑒𝑑𝑖𝑎𝑛 < 𝑚𝑒𝑎𝑛

 Kurtosis : le coefficient de Kurtosis de Pearson :

4
𝜇4 𝜇4 1 𝑛 𝑦𝑖 − 𝑦
𝐵2 = 4 2 = =
𝜇2 𝜎4 𝑛 𝑖=1 𝜎

permet de mesurer le degré d’aplatissement de la courbe de la distribution d’une variable


aléatoire (pointue ou aplatie), c’est aussi un paramètre de forme. Si la distribution est normale et
pour 𝑛 > 30, on :

2
24 𝛽2 − 3
𝛽2 ≡ 𝒩 3, 𝑎𝑖𝑛𝑠𝑖 𝐾𝑢𝑟 = ≡ 𝒩𝛼 0,1
𝑛 24
𝑛

Pour le test d’aplatissement normal on pose l’hypothèse nulle 𝐻0 suivante :

𝐻0 ∶ 𝐾𝑢𝑟 = 0 aplatissement normal de la distribution

6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 7
Pr. Amale LAHLOU Département des Sciences Économiques

Règle de décision : au seuil 𝛼, on accepte l’hypothèse 𝐻0 si 𝐾𝑢𝑟 ≤ 𝒩𝛼 0,1

Exemple : pour le quantile à 95% de la loi normale centré réduite est :

(𝑠𝑢𝑟 𝐸𝑥𝑐𝑒𝑙 ∶ 𝐿𝑂𝐼. 𝑁𝑂𝑅𝑀𝐴𝐿𝐸 . 𝑆𝑇𝐴𝑁𝐷𝐴𝑅𝐷 . 𝐼𝑁𝑉𝐸𝑅𝑆𝐸 (1 − (0,05/2)) = 1,96)

Si 𝐾𝑢𝑟 < 1,96 on accépte, au risque 5%, l’aplatissement normal de la distribution de la série.

En résumé :
 Lorsque la valeur de 𝐾𝑢𝑟 est significativement nulle 𝛽2 = 3 :

la distribution est normale (gaussienne, Mésokurtotique) ;

 Lorsque la valeur de 𝐾𝑢𝑟 est significativement positive 𝛽2 > 3 :

la queue compte un plus grand nombre d’observations que


dans une distribution gaussienne, autrement dit, la distribution
est pointue (distribution Leptokurtotique) ;

 Lorsque la valeur de 𝐾𝑢𝑟 est négative significative 𝛽2 < 3 :

la queue compte moins de nombre d’observations que dans


une distribution gaussienne, autrement dit, la distribution est
plus aplatie que la normale (distribution Playkurtotique).

 Jarque-Bera : pour le test de normalité, on conjoindra le test de symétrie avec le test


d’aplatissement normal en posant l’hypothèse nulle 𝐻0 :

𝐻0 ∶ 𝑆𝑘𝑒 = 0 symétrie de la courbe de la distribution


𝑒𝑡 𝐾𝑢𝑟 = 0 aplatissement normal de la distribution

Règle de décision : au risque 𝛼, on accepte 𝐻0 si 𝑆𝑘𝑒 ≤ 𝒩𝛼 0,1 𝑒𝑡 𝐾𝑢𝑟 ≤ 𝒩𝛼 0,1

Exemple : pour le quantile à 95% de la loi normale centré réduite est :

(𝑠𝑢𝑟 𝐸𝑥𝑐𝑒𝑙 ∶ 𝐿𝑂𝐼. 𝑁𝑂𝑅𝑀𝐴𝐿𝐸 . 𝑆𝑇𝐴𝑁𝐷𝐴𝑅𝐷 . 𝐼𝑁𝑉𝐸𝑅𝑆𝐸 (1 − (0,05/2)) = 1,96)

Si 𝑆𝑘𝑒 < 1,96 et 𝐾𝑢𝑟 < 1,96 on accépte, au risque 5%, la symétrie de la courbe et
l’aplatissement de la distribution de la série.

6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 8
Pr. Amale LAHLOU Département des Sciences Économiques

1 2
Pour le test de normalité, on peut appliquer aussi le test de Jarque-Bera : Si 𝛽1 et 𝛽2 suivent
des lois normales, alors la statistique de Jarque-Bera en statistique descriptive est donné par :

𝑛 𝑛 2
𝐽𝐵 = 𝛽1 + 𝛽 −3
6 24 2

L'hypothèse nulle est la normalité des données, soit :

𝐻0 ∶ la distribution obeit à une loi normale

1 2
Si 𝛽1 et 𝛽2 suivent des lois normales, alors 𝐽𝐵 ≡ 𝜒𝛼2 à 2 𝑑𝑑𝑙.

Règle de décision : au risque 𝛼, on accepte 𝐻0 de la série (ici des résidus) si 𝐽𝐵 < 𝜒𝛼2 (2) .

Exemple : pour le risque 5% le quantile de la loi 𝜒𝛼2 (2) est :

(𝑠𝑢𝑟 𝐸𝑥𝑐𝑒𝑙 ∶ 𝐾𝐻𝐼𝐷𝐸𝑈𝑋. 𝐼𝑁𝑉𝐸𝑅𝑆𝐸 (0,05; 2) = 5,991)

Si 𝐽𝐵 < 5,99 on accépte, au risque 5%, la normalité de la distribution de la série.

 Probability : ici c’est la p-value ou la probabilité pour laquelle la statistique de Jarque-Bera


dépasse la valeur critique.
 Sum : c’est la somme des observations de chaque série.
 Sum Sq. Dev. (sum of squared Deviations) : sum of squared deviations from the mean, c’est-à-
dire, la somme des carrés des observations centrées,

𝑥𝑖 − 𝑥 2

𝑖=1

Exemple : La variable endogène 𝑦 possède les caractéristiques suivantes :

 le nombre d’observations est 𝑛 = 32 ;


 la moyenne de la série est égale à 𝑦 = 1.792813 ;
 la médiane 𝑀 de la série à hauteur de 1.590000, on remarque que la moyenne supérieure à la
médiane ;
 une valeur maximale des observations est 𝑦max = 3.030000 ;
 une valeur minimale des observations est 𝑦𝑚𝑖𝑛 = 0.620000 ;
 l’écart type corrigé de la série est 𝑠 = 0.770610 ;
1
1 𝛽12 −0
0.312816 −0
 le coefficient de skewness vaut 𝛽1 = 0.312816 , comme
2
6
= 6
= 0.72 < 1.96,
𝑛 32

donc la valeur de skewness est significativement nulle au risque 5%, donc la distribution est
symétrique ;

6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 9
Pr. Amale LAHLOU Département des Sciences Économiques

𝛽2 −3 1.800032 −3
 le coefficient de kurtosis vaut 𝛽2 = 1.800032, comme 24
= 24
= 1.39 < 1.96, donc
𝑛 32

la valeur de kurtosis est significativement nulle au risque 5%, donc la distribution est aplatie
normalement ;
 la statistique de Jarque-Bera est 𝐽𝐵 = 2.441782 en effet

𝑛 𝑛 2
32 32
𝐽𝐵 = 𝛽1 + 𝛽 −3 = (0.312816)2 + 1.80003 − 3 2 = 2.441791
6 24 2 6 24

au risque 5%, la valeur 𝐽𝐵 < 5.99 donc on accepte l’hypothèse de normalité de la série.

 la probabilité associée à la statistique de Jarque-Bera (p-value) est 𝑃 𝐽𝐵 > 2.441791 =


0.294967 > 0.05 donc on accepte l’hypothèse nulle : la distribution de la série 𝑦 obeit à une loi
normale avec un risque de 5% ;
 la somme des observations de la série est de 32
𝑖=1 𝑦𝑖 = 57.37000 ;
 la somme des carrées des observations centrées : 32
𝑖=1 𝑦𝑖 − 𝑦
2 = 18.40905.

Interprétation :

L’analyse par la statistique descriptive des variables recèle des informations très importantes
permettant de décrire une variable quantitative. Pour ce but, on utilise quelques indicateurs de
tendance centrale, indicateurs de dispersion, indicateurs de forme de la distribution ainsi que des
représentations graphiques.

L’idéal d’information à tirer de la description statistique des données est la normalité de la


distribution de la série analysée, condition nécessaire pour de nombreux tests statistiques. Pour
chaque série étudiée :

 la moyenne doit être proche de la médiane ;


 le coefficient de skewness doit être nul significativement ;
 le coefficient de kurtosis doit être égal à 3 significativement ;
 la statistique de Jarque-Bera doit être inférieure à 𝜒𝛼2 (2) (5.99 pour 𝛼 = 5%) ;
 la p-value de la statistique de Jarque-Bera doit être supérieure au seuil 𝛼.

À titre d’exemple, au risque de 5 %, l’hypothèse de normalité de la série de la variable 𝑦 est


acceptée.

III. A NALYSE GRAPHIQUE :

L’évolution de chaque variable étudiée durant la période d’étude.

6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 10
Pr. Amale LAHLOU Département des Sciences Économiques

Quick\Graph
Y X5
3.5 16

3.0 14

12
2.5
10
2.0
8
1.5
6

1.0 4

0.5 2
1980 1985 1990 1995 2000 2005 2010 1980 1985 1990 1995 2000 2005 2010

X4 X3
140 60

120 50
0.51.01.52.02.53.03.51980198519901995200020052010Y2468101214161980198519901995200020052010X5204060801001201401980198519901995200020052010X401020304050601980198519901995200020052010X30510152025301980198519901995200020052010X202468101980198519901995200020052010X1
100 40

80 30

60 20

40 10

20 0
1980 1985 1990 1995 2000 2005 2010 1980 1985 1990 1995 2000 2005 2010

X2 X1
30 10

25
8

20
6
15
4
10

2
5

0 0
1980 1985 1990 1995 2000 2005 2010 1980 1985 1990 1995 2000 2005 2010

Interprétation :
Les six premiers graphes montrent la tendance d’évolution des variables durant la période étudiée.
Dans le premier graphe, on remarque que la variable 𝑦 évolue dans le temps avec un rythme différent
de celui suivi par les autres variables. Les graphes des deux variables exogènes 𝑥2 et 𝑥3 se
superposent ; il est clair qu’il existe une relation de colinéarité entre ces deux variables exogènes.

6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 11
Pr. Amale LAHLOU Département des Sciences Économiques

IV. SPECIFICATION DU MODELE

La variable endogène est représentée par 𝑦 et les variables 𝑥1 , 𝑥2 , 𝑥3 , 𝑥4 𝑥5 sont les variables
exogènes introduites. On cherche à établir une combinaison linéaire entre ces variables. Pour la
période 𝑡 = 1980, … ,2011 ou encore pour 𝑖 = 1, … ,32
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥1𝑖 + 𝛽2 𝑥2𝑖 + 𝛽3 𝑥3𝑖 + 𝛽4 𝑥4𝑖 + 𝛽5 𝑥5𝑖 + 𝜀𝑖

𝜀i est l’erreur du modèle. Ce terme aléatoire résume toute l’information qui n’est pas prise en compte
dans la relation linéaire.

On commence par estimer les coefficients 𝛽k , k = 1, … ,5 par la méthode des Moindres Carrées
Ordinaires (MCO) :

Quick\Estimate Equation  LS y c x1 x2 x3 x4 x5 

Sélection dans l’ordre y x1 x2 x3 x4 x5 puis Open\as Equation 

6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 12
Pr. Amale LAHLOU Département des Sciences Économiques

Soit alors,

Dependent Variable: Y
Method: Least Squares
Included observations: 32

Variable Coefficient Std. Error t-Statistic Prob.

C 3.130044 0.174654 17.92143 0.0000


X1 -0.064484 0.068962 -0.935060 0.3584
X2 3.155817 2.922493 1.079837 0.2901
X3 -1.632840 1.463002 -1.116088 0.2746
X4 -0.009795 0.002687 -3.644787 0.0012
X5 0.163819 0.045194 3.624788 0.0012

R-squared 0.913582 Mean dependent var 1.792813


Adjusted R-squared 0.896963 S.D. dependent var 0.770610
S.E. of regression 0.247361 Akaike info criterion 0.211428
Sum squared resid 1.590879 Schwarz criterion 0.486253
Log likelihood 2.617154 Hannan-Quinn criter. 0.302525
F-statistic 54.97242 Durbin-Watson stat 1.414810
Prob(F-statistic) 0.000000

L’équation s’écrit (à valider ou non ultérieurement) :

𝑦𝑖 = 3.130 − 0.064 𝑥1𝑖 + 3.156 𝑥2𝑖 − 1.633 𝑥3𝑖 − 0.010 𝑥4𝑖 + 0.164 𝑥5𝑖 + 𝑒𝑖

Quick\Estimate Equation … View\Representations 

Estimation Command:
=========================
LS Y C X1 X2 X3 X4 X5

Estimation Equation:
=========================
Y = C(1) + C(2)*X1 + C(3)*X2 + C(4)*X3 + C(5)*X4 + C(6)*X5

Substituted Coefficients:
=========================
Y = 3.130044 - 0.064483 *X1 + 3.155817 *X2 - 1.632840 *X3 - 0.009795 *X4 + 0.163819 *X5

 Les coefficients estimés du modèle (Coefficient) : la constante 𝛽0 = 3.130044 et les coefficients


associés respectivement aux variables 𝑥1 , 𝑥2 , 𝑥3 , 𝑥4 , 𝑥5 sont : 𝛽1 = −0.064484, 𝛽2 = 3.155817,
𝛽3 = −1.632840, 𝛽4 = −0.009795, 𝛽5 = 0.163819
 Les écarts type estimés (Std. Error) des estimateurs : les écarts type estimés associés
respectivement aux cinq paramètres sont : 𝜎𝛽0 = 0.174654, 𝜎𝛽1 = 0.068962, 𝜎𝛽2 = 2.922493,
𝜎𝛽3 = 1.463002, 𝜎𝛽4 = 0.002687, 𝜎𝛽5 = 0.045194

6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 13
Pr. Amale LAHLOU Département des Sciences Économiques

𝛽
 Ratio de Student (t-Statistic) : les ratios de Student 𝑡𝛽 = associés respectivement aux six
𝜎𝛽

paramètres sont : 𝑡𝛽0 = 17.92143 , 𝑡𝛽1 = −0.935060 , 𝑡𝛽2 = 1.079837 , 𝑡𝛽3 = −1.116088 ,
𝑡𝛽4 = −3.644787, 𝑡𝛽5 = 3.624788

 La p-value associée au ratio de Student (Prob) : les p-values associées respectivement aux cinq
paramètres sont : 𝑃𝑣 𝑡𝛽0 = 0.0000 , 𝑃𝑣 𝑡𝛽1 = 0.3584 , 𝑃𝑣 𝑡𝛽2 = 0.2901 , 𝑃𝑣 𝑡𝛽3 = 0.2746 ,

𝑃𝑣 𝑡𝛽4 = 0.0012, 𝑃𝑣 𝑡𝛽5 = 0.0012

 Le coefficient de détermination (R-squared) : 𝑅2 = 0.913582


 Le coefficient de détermination ajusté (Adjusted R-squared) : 𝑅𝑎2 = 0.896963
 L’écart type de l’erreur de la régression (S.E. of regression) : 𝜎𝜀 = 0.247361
 La somme des carrés résiduels (Sum squared resid) : 𝑆𝐶𝑅 = 1.590879
 La valeur utilisée par la méthode de maximum de vraisemblance (Log likelihood) :
𝑙 = 2.617154
 La valeur de la statistique de Fischer (F-statistic) : 𝐹∗ = 54.97242
 La p-value associée à la statistique de Fisher (Prob(F-statistic)) : 𝑃 𝐹∗ = 0.000000
 La moyenne de la variable dépendante ou encore endogène (Mean dependent var) :
𝑦 = 1.792813
 L’écart type corrigé de la variable dépendante (S.D dependent var) : sa valeur est 𝜎𝑦 = 0.770610
 Le critère de Akaike (Akaike Info Criterion) : 𝐴𝐼𝐶 = 0.211428 .
 Le critère BIC de Schwartz (Schwarz Criterion) : 𝑆𝐶 = 0.486253
 Le critère de Hannan-Quinn (Hannan-Quinn criter.) : 𝐻𝑄 = 0.302525
 La statistique de Durbin-Watson (Durbin-Watson stat) : 𝐷𝑊 = 1.414810

Interprétation :

 Le pouvoir explicatif est 𝑅2 = 91.36 %, c'est-à-dire, la variation de 𝑦 est expliquée à 91.36 %.


Reste seulement 8.64% à expliquer par d’autres variables non prises en compte dans le modèle.
En plus, 𝑅𝑎2 = 0.8969. On peut dire que la régression est de bonne qualité ;
 Le modèle est globalement significatif au seuil 𝛼 = 5% puisque la p-value associée à la
statistique de Fisher est égale à 0.000000 et est donc inférieur au seuil 0.05. Autrement dit, il
existe au moins une variable parmi les cinq variables exogènes qui contribue à l’explication de la
variable endogène 𝑦 ;

6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 14
Pr. Amale LAHLOU Département des Sciences Économiques

 Le modèle estimé est significativement avec constante positive au seuil 𝛼 = 5% puisque la p-


value associée à la statistique de Student associée à la constante vaut 0.0000 < 0.05 ;
 La variable 𝑥4 est significative au seuil 𝛼 = 5% puisque la p-value associée à la statistique de
Student est 0.0012 < 0.05 ;
 La variable 𝑥5 est significative au seuil 𝛼 = 5% puisque la p-value associée à la statistique de
Student est 0.0012 < 0.05 ;
 La variable 𝑥1 n’est pas significative au seuil 𝛼 = 5% puisque la p-value associée à la statistique
de Student 0.3584 est supérieure à 0.05. Donc la variable 𝑥1 n’est pas pertinente ;
 La variable 𝑥2 n’est pas significative au seuil 𝛼 = 5% puisque la p-value associée à la statistique
de Student 0.2901 est supérieure à 0.05. Donc la variable 𝑥2 n’est pas pertinente ;
 La variable 𝑥3 n’est pas significative au seuil 𝛼 = 5% puisque la p-value associée à la statistique
de Student 0.2746 est supérieure à 0.05. Donc la variable 𝑥3 n’est pas pertinente.
 La non pertinence de chacune des variables exogènes 𝑥1 , 𝑥2 et 𝑥3 peut être expliquée par :
o soit la variable n’a aucun lien avec la variable endogène 𝑦 ;
o soit la variable est effectivement liée avec la variable endogène y mais l’information
qu’elle apporte est redondante. On dit que la variable est colinéaire avec une autre (ou
plus) variable exogène qui peut être non pertinente.
 L’équation 𝑦𝑖 = 3.130 − 0.064 𝑥1𝑖 + 3.156 𝑥2𝑖 − 1.633 𝑥3𝑖 − 0.010 𝑥4𝑖 + 0.164 𝑥5𝑖 + 𝑒𝑖 est non
validée. Il faut réestimer les coefficients de régression après suppression des variables non
pertinentes :

Dependent Variable: Y
Method: Least Squares
Sample: 1980 2011
Included observations: 32

Variable Coefficient Std. Error t-Statistic Prob.

C 3.252917 0.144880 22.45248 0.0000


X3 -0.057130 0.008852 -6.453871 0.0000
X4 -0.010569 0.002183 -4.842551 0.0000
X5 0.132498 0.040185 3.297197 0.0027

R-squared 0.906177 Mean dependent var 1.792813


Adjusted R-squared 0.896124 S.D. dependent var 0.770610
S.E. of regression 0.248366 Akaike info criterion 0.168639
Sum squared resid 1.727193 Schwarz criterion 0.351856
Log likelihood 1.301784 Hannan-Quinn criter. 0.229370
F-statistic 90.14472 Durbin-Watson stat 1.211821
Prob(F-statistic) 0.000000

6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 15
Pr. Amale LAHLOU Département des Sciences Économiques

Formules :
Included observations: @regobs = 𝑛 = 20

Variable 𝑿𝒊 : les variables explicatives 𝑖 = 1, … , 𝑘

@coefs i = k, modèle sans constante et @coefs i = k + 1 modèle avec constante

Coefficient 𝑪 : la valeur de la constante du modèle de régression linéaire à l’origine :

𝛽0 = 𝐶 1 ou 𝐶 𝑘 + 1 selon l’écriture de la commande

Coefficient Variable 𝑿𝒊 : l’estimation du coefficient de régression linéaire lié à la variable 𝑥𝑖

@coefs i = 𝛽𝑖 = 𝐶(𝑖)

Std. Error 𝑪 : l’estimation de l’écart type de la constante : 𝜎𝛽0

Std. Error Variable 𝑿𝒊 : l’estimation de l’écart type du coefficient de régression , @stderrs i = 𝜎𝛽𝑖

t-Statistic Variable 𝑿𝒊 : le ratio de Student du coefficient de la régression

𝛽𝑖
@tstats i = 𝑡𝛽∗ =
𝑖 𝜎𝛽𝑖

𝛽
t-Statistic 𝑪 : le ratio de Student de la constante, 𝑡𝛽∗0 = 𝜎 0
𝛽0

Prob. 𝑪 : p-value de la constante

𝑃 𝑇𝑛−𝑘−1 > 𝑡 − 𝑆𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐 𝐶 = 𝑃 𝑇𝑛−𝑘 −1 > 𝑡𝛽∗0

Prob. Variable 𝑿𝒊 : 𝑃 𝑇𝑛−𝑘−1 > 𝑡 − 𝑆𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐 𝑋𝑖 = 𝑃 𝑇𝑛−𝑘−1 > 𝑡𝛽∗


𝑖

R-squared: le coefficient de détermination

𝑆𝐶𝐸 𝑆𝐶𝑅
@𝑟 2 = 𝑅 2 = =1−
𝑆𝐶𝑇 𝑆𝐶𝑇
Adjusted R-squared: le coefficient de détermination ajusté

𝑆𝐶𝑅 𝑛 − 𝑘 − 1 𝑛−1
@𝑟𝑏𝑎𝑟2 = 𝑅𝑎2 = 1 − =1− 1 − 𝑅2
𝑆𝐶𝑇 𝑛 − 1 𝑛−𝑘−1

S.E. of regression (Standard Error of the Regression) : Square Error of regression ou l’écart type des erreurs
𝑛 2
𝑖 =1 𝑒𝑖 𝑆𝐶𝑅
@se = 𝜎𝜀 = =
𝑛−𝑘−1 𝑛−𝑘−1

Log Likelihood :

−𝑛 𝑆𝐶𝑅
@𝑙𝑜𝑔𝑙 = 𝑙 = 1 + ln(2𝜋) + ln
2 𝑛
Sum squared resid (Sum-of-Squared Residuals) : Somme des carrés résiduels
𝑛
2
@ssr = 𝑆𝐶𝑅 = 𝑦𝑖 − 𝑦𝑖
𝑖=1

F-statistic : la statistique de Fisher calculée

6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 16
Pr. Amale LAHLOU Département des Sciences Économiques

𝑅2
@𝑓 = 𝐹 = ∗ 𝑘
(1 − 𝑅 2 )
𝑛−𝑘−1

Prob(F-statistic) : p-value du modèle, @𝑓𝑝𝑟𝑜𝑏 = 𝑃 𝐹 𝑘,𝑛 −𝑘−1 > F − statistic = 𝑃 𝐹 𝑘,𝑛 −𝑘−1 > 𝐹 ∗

Mean dependent var: la moyenne de la variable dépendante


𝑛
1
@𝑚𝑒𝑎𝑛𝑑𝑒𝑝 = 𝑦 = 𝑦𝑖
𝑛
𝑖=1

S.D. dependent var (Standard Deviation (S.D.) of the Dependent Variable) : l’écart type empirique de la variable
dépendante

𝑛
𝑖=1𝑦𝑖 − 𝑦 2
@sddep = 𝜎𝑦 =
𝑛−1

Durbin-Watson Stat (Durbain-Watson Statistic) (DW) : Le test de D urbin Waston permet de détecter
l’existence ou non de l’autocorrélation des erreurs.
𝑛 2
𝑖 =2 𝑒𝑖 − 𝑒𝑖 −1
@𝑑𝑤 = 𝐷𝑊 = 𝑛 2
𝑖=1 𝑒𝑖

Akaike Information Criterion (AIC) : pour la section du modèle de régression optimal avec 𝑘 variables
explicatives (Problème de multicolinéairité : on cherche le modèle optimal ayant la plus petite AIC
2𝑙 2(𝑘 + 1) 𝑆𝐶𝑅 2(𝑘 + 1)
@aic = 𝐴𝐼𝐶 = − + = 1 + ln(2𝜋) + ln +
𝑛 𝑛 𝑛 𝑛

Où 𝑙 est 𝐿𝑜𝑔 𝐿𝑖𝑘𝑒𝑙𝑖𝑕𝑜𝑜𝑑 et (𝑘 + 1) est le nombre de variables explicatives en plus de la constante.

Schwarz Criterion (SC) : pour la section du modèle de régression optimal avec 𝑘 variables explicatives
(Problème de multicolinéairité : on cherche le modèle optimal ayant la plus petite SC
2𝑙 (𝑘 + 1) ln(𝑛) 𝑆𝐶𝑅 (𝑘 + 1) ln(𝑛)
@schwarz = 𝑆𝐶 = − + = 1 + ln(2𝜋) + ln +
𝑛 𝑛 𝑛 𝑛

Hannan-Quinn criter (Hannan-Quinn Criterion) (HQ) :

2𝑙 2(𝑘 + 1) ln(ln(𝑛)) 𝑆𝐶𝑅 2(𝑘 + 1) ln(ln(𝑛))


@𝑕𝑞 = 𝐻𝑄 = − + = 1 + ln(2𝜋) + ln +
𝑛 𝑛 𝑛 𝑛

6 ème Semestre -- Licence des Études Fondamentales – Filière des Sciences Économiques -- Parcours Général Page 17

Vous aimerez peut-être aussi