Nothing Special   »   [go: up one dir, main page]

0% ont trouvé ce document utile (0 vote)
162 vues6 pages

®el Merouani FP Tetouan: A) La Régression Multiple

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1/ 6

www.elmerouani.jimdo.

com 03/05/2012

• Le plus souvent, un modèle éconmétrique


devra faire appel à plusieurs variables
explicatives, ce qui amènera à recourir à
des techniques de régression multiple, et
®E

ce qui demandera également de résoudre


les problèmes pratiques liés à la définition
lM

et à la sélection des variables.


ero

1
ua
ni
FP

a) La régression multiple:
Te

• Un modèle de régression linéaire multiple vise à


expliquer la valeur de la variable dépendante Y
comme une combinaison linéaire des valeurs
tou

des variables explicatives X1,…, Xn:


Y=a+b1X1+…+bnXn
• Un tel modèle peut s’appliquer chaque fois que
an
les relations entre Y et les Xi sont linéaires et
chaque fois que des transformations
appropriées permettent de retrouver le schéma
linéaire.

1
www.elmerouani.jimdo.com 03/05/2012

• Par exemple, un modèle multiplicatif du type


Y = aX 1b1 X 2b2 L X nbn
devient linéaire en appliquant des
logarithmes, et l’évolution des coefficients a,
®E
b1,…,bn est réalisée à l’aide de la régression
linéaire multiple.
• Les coefficients optimaux sont déterminés par
lM
la méthode des moindres carrés. Dans le cas
de deux variables explicatives X1 et X2, il
s’agira de minimiser l’expression
E2=Σ(Y-a-b1X1-b2X2)2
ero

par rapport à a, b1 et b2.

3
ua
ni
FP

• Ces coefficients seront solution du système


formé par les trois équations suivantes:
∑ Y = na + b1 ∑ X 1 + b2 ∑ X 2
Te

∑ X Y = a∑ X
1 1 + b1 ∑ X12 + b2 ∑ X1 X 2

Y = a ∑ X 2 + b1 ∑ X 1 X 2 + b2 ∑ X 22
tou
∑X 2

• Les coefficients bi ont une signification similaire à


celle qui avait été notée dans le cas de la
régression linéaire simple: ils indiquent de combien
an

varie Y en moyenne pour une variation unitaire de


Xi.
• Les mêmes tests de qualités et de fiabilité de la
représentation se retrouvent également.
4

2
www.elmerouani.jimdo.com 03/05/2012

Exemple:
• Le tableau suivant donne les résultats d’une étude transversale sur
dix régions: Les ventes Y du produit sont mises en relation avec
les dépenses X1 de publicité-presse et les dépenses X2 de publicité
sur les lieux de vente (PLV). (L’unité est 103 DH)
®E
Observations Ventes Publicité presse PLV
(i) (Y) (X1) (X2)
1 30 2 6
lM
2 22 1 3
3 29 6 2
4 35 4 5
5 25 3 3
6 40 2 8
ero
7 24 6 1
8 21 2 2
9 32 7 2
10 15 1 1
5
ua
ni
FP

• Les calculs présentés dans le tableau suivant conduisent à


l’expression: Y=2,15X1+3,13X2+9,65
Te
Observation Y X1 X2 X1Y X2Y X12 X22 X1X2
1 30 2 6 60 180 4 36 12
2 22 1 3 22 66 1 9 3
tou
3 29 6 2 174 58 36 4 12
4 35 4 5 140 175 16 25 20
5 25 3 3 75 75 9 9 9
6 40 2 8 320 320 4 64 16
an
7 24 6 1 24 24 36 1 6
8 21 2 2 42 42 4 4 4
9 32 7 2 64 64 49 4 14
10 15 1 1 15 15 1 1 1
Total……… 273 34 33 976 1019 160 157 97
Moyenne.... 27,3 3,4 3,3
6

3
www.elmerouani.jimdo.com 03/05/2012

• On a les équations suivantes:


273=10·a+34b1+33b2 a=9,65
976=34·a+160b1+97b2 b1=2,15
®E
1019=33·a+97b1+157b2 b2=3,13.
lM
• Ce modèle explique 96,8% (R2=0,968) de
la dispersion totale avec un coefficient de
corrélation multiple R=0,983.
ero

7
ua
ni
FP

• Le test F est également favorable:


Degrés de Somme des Carrés F
liberté carrés moyens
Te

Régression… k=2 472 236 110


Erreur……… n-k-1 = 7 15 2,14
tou
Total n-1 = 9 477

F0,01 = 9,55
• De même que le test t sur chacun des coefficients de
régression partielle b1 et b2:
an

∑ (Yˆ − Y )
2
- Écart-type des erreurs:
SY ⋅12 = =1,47
n−3

- Erreur-standard sur b1: SY ⋅12


Sb = = 0,23
1
∑X 2
1 − nX12
8

4
www.elmerouani.jimdo.com 03/05/2012

- Erreur-standard sur b2:


S Y ⋅12
Sb = = 0 , 22
2
∑ X 22 − nX 2
2
®E

- Test t pour b1: 2 ,15


t1 = = 9 ,3
0 , 22
lM

3 ,13
- pour b2: t2 = = 14 , 2
0 , 21
ero

t0,01=2,9 pour n-k-1=7 degrés de liberté.

9
ua
ni
FP

b) Problèmes pratiques:
Te
• Dans le cadre de modèles exogènes, on peut être
amené à traiter un grand nombre de variables
explicatives, dont a priori le pouvoir explicatif n’est pas
connu. Il serait certes concevable d’appliquer la
tou

technique décrite ci-dessus à toutes les combinaisons


envisageables de variables explicatives. Mais cette
procédure entraînerait de trop nombreux calculs.
Certains programmes informatiques permettent à partir
an
d’un ensemble de variables explicatives potentielles de
ne retenir que celles qui sont les plus intéressantes, en
introduisant succéssivement dans l’équation de
régression les variables qui absorbent le plus de
variance résiduelle.

10

5
www.elmerouani.jimdo.com 03/05/2012

• Quand plusieurs variables interviennent dans le


modèle de régression, il faut envisager le risque
de multicolinéarité. Ce phénomène se produit
quand deux variables explicatives ou plus sont
®E
fortement corrélées entre elles. Une bonne
définition des coefficients bi demande de ne
retenir que des variables indépendantes. Une
lM
première opération consiste donc, avant tout
traitement par le modèle de régression, à
examiner la matrice des coefficients de
corrélation entre les Xi et à sélectionner pour
ero

chaque ensemble de variables corrélées un seul


représentant.
11
ua
ni
FP

• La nature des variables utilisables dans les


modèles de régression peut être une source de
difficulté. Les variables quantitatives sont les
Te

plus adaptées à ce type de formalisation. Des


variables nominales (Les variables nominales
tou
correspondent à des catégories,comme par
exemple, classes d’âge, de revenu, localisation
géographique,…etc) peuvent également être
utilisées, mais il faut alors recourir à des
variables muettes (valeur égale à 0 ou 1) ce qui
an

alourdit la formulation. Quand on ne dsipose que


de variables nominales, il est préférable de s’en
remettre à d’autres types de formulation comme
la segmentation ou l’analyse de variance.
12

Vous aimerez peut-être aussi