Mathematics">
Comparaison de Plan de Sondage
Comparaison de Plan de Sondage
Comparaison de Plan de Sondage
Groupe 2 :
ASSELOKA E. Amadou R.
DIOP Rockaya
MBOJD Soda
Sous l’encadrement de :
Docteur CISSE, …
Table des matières
LISTE DES GRAPHIQUES .................................................................................................................................... 1
INTRODUCTION ..................................................................................................................................................... 2
Présentation de la base ....................................................................................................................................... 2
Méthodologie du travail ...................................................................................................................................... 3
I. Estimation de la superficie totale des fermes aux Etats-Unis........................................................... 4
1. Préambule ....................................................................................................................................................... 4
2. Estimation avec un seul échantillon ..................................................................................................... 6
2.1 Plan SI........................................................................................................................................................ 6
2.2 Plan stratifié............................................................................................................................................ 7
2.3 Plan PPS .................................................................................................................................................... 9
2.4 Plan à deux degrés (SI SI) ................................................................................................................ 10
2.5 Redressement des estimateurs ..................................................................................................... 11
3. Simulation ..................................................................................................................................................... 14
3.1 Comparaison de quatre plans de sondage ................................................................................ 14
3.2 Comparaison des méthodes d’estimation pour un SI ........................................................... 16
II. Estimation sur un domaine ........................................................................................................................ 17
CONCLUSION ......................................................................................................................................................... 19
ANNEXE des codes R compilé ................................................................................................................ 20
1
INTRODUCTION
« La statistique est une science ayant pour objet l’étude quantitative des
populations, à l’aide de données représentatives, le plus souvent incomplètes, et
comportant généralement, de ce fait, un caractère d’incertitude. ». En plus des
connaissances théoriques acquise au cours de sa formation, le statisticien doit se
familiariser avec la mise en œuvre de cette théorie en pratique. C’est ainsi que, la mise en
avant de cette préoccupation a abouti à la réalisation d’un travail sur le logiciel R par les
étudiants en troisième année d’ITS. Cet exercice pratique permet de faire le point sur les
50 heures de cours de Théorie des sondages dont il a pour objectif d’être un complément.
Nous avons ainsi eu cette année l’opportunité de traiter les données du recensement
américain agricole réalisé tous les cinq ans dans 50 états. Le travail a été effectué sous la
supervision de M. CISSÉ, Professeur à l’ENSAE. Toutefois, les omissions et inexactitudes
notées dans le présent document, sont à la responsabilité exclusive des auteurs. Dans
cette partie nous allons faire une brève présentation de la base sur laquelle le travail a été
réalisé puis nous expliquerons la méthodologie adoptée pour réaliser ce projet.
Présentation de la base
La base mise à notre disposition pour la réalisation de ce projet comporte les résultats du
recensement américain agricole réalisé tous les cinq ans dans 50 états. Ce recensement
donne des informations sur le nombre de fermes, la superficie dédiée aux fermes, etc. Le
détail des variables est :
2
• FARMS82=nombre de fermes en 1982 ;
Notations :
• U : population cible, ensemble des 2992 communes (COUNTY) ;
Méthodologie du travail
Pour réaliser le projet, nous avons utilisé le logiciel R qui fournit une grande variété de
statistiques et de techniques graphiques, auxquels peuvent s’ajouter des éléments
complémentaires. Package : Un package est un ensemble de programmes non
initialement accessibles dans le logiciel mais lorsqu’il est chargé donne accès à un
ensemble de fonctions. Pour la réalisation de ce projet les packages spéciaux que nous
avons utilisés sont :
- Sampling qui contient des fonctions permettant de tirer des échantillons selon
différentes méthodes ;
- Survey qui contient des fonctions permettant d'analyser des plans
d’échantillonnage ;
- Teachingsampling qui nous permet de calculer les estimations des estimateurs et
leurs variances, selon le plan considéré ;
- Pps qui nous permet d'effectuer le plan PPS (Probability proportional to size).
3
I. Estimation de la superficie totale des fermes aux Etats-Unis
1. Préambule
La superficie totale des fermes en 1992 aux Etats-Unis est de ty. Dans la suite du
travail, c’est cette valeur qui fera l’objet d’estimation par les différentes méthodes
d’estimation et de redressement. Le tableau suivant nous indique la répartition de ce total
selon la situation géographique (REGION).
Ainsi, nous remarquons que les zones nord-est (NE) et ouest (W) sont celles qui
ont le moins de communes avec respectivement 211 et 404, alors que les zones nord-
centre (NC) et sud ont 1029 et 1348 communes respectivement. La zone qui a la plus
grande superficie des fermes est le nord-centre avec 337110792 acres dédiées aux
fermes, suit l’ouest avec une superficie de 298796138 acres bien que la zone ne regorge
pas de beaucoup de communes. Les deux autres zones ont des superficies respectives de
267517407 et 19931525 acres respectivement pour le sud et le nord-est.
4
graphique 1: Dispersion des superficies en 1992 en fonction des superficies de 1982
5
graphique 2: Boxplot des superficies dans les régions
Dans le cas de notre projet nous avons tiré un échantillon de taille n = 200 selon
un plan aléatoire simple sans remise (SI) dans toute la population des communes
(COUNTY) américaines en utilisant la fonction srswor.
6
de Horvitz-Thompson de la superficie totale ty dédiée aux fermes en 1992, une estimation
de la variance et le coefficient de variation de l’estimateur. Les résultats sont consignés
dans le tableau qui suit :
Nos résultats montrent que la superficie totale dédiée aux fermes en 1992 est
estimée à 1 022 323 360, sa variance quant à elle est estimée à 7,73e+15 et le coefficient
de variation de à 0,09.
Pour choisir la variable auxiliaire la plus pertinente nous avons procédé à une
modélisation de la variable ACRES92 pour voir la variable qui l’explique le mieux dans la
7
base. Ainsi la régression de la variable ACRES92 par la variable STATE donne un BIC de
5867.234 alors que celle avec REGION donne un BIC de 5748.657. Donc on peut dire que
la variable REGION est la variable auxiliaire la plus appropriée.
La stratification optimale est plus appropriée par ce qu’elle est plus précise et les résultats
sont consignés dans le tableau suivant :
Nous avons choisi de stratifier suivant les régions car la variable REGION répartie
la population à des groupes assez homogènes. Aussi, une stratification avec allocation
optimale des tailles de strates est adoptée pour effectuer le tirage et avoir des estimations
avec la meilleure précision dans le cas stratifié.
𝜏ˆ𝑆𝑇𝑂 = ∑ 𝑁ℎ 𝑦ℎ
ℎ=1
Avec
𝑁ℎ
1 𝜎ℎ;𝑐𝑜𝑟𝑟
𝑦ℎ = ∑ 𝑦𝑖 𝑒𝑡 𝑛ℎ = 𝑛( 𝑁 )
𝑛ℎ 𝑁ℎ
𝑖∈ 𝑆ℎ ∑𝐻 𝜎
𝑙=1 𝑁 𝑙;𝑐𝑜𝑟𝑟
8
2.3 Plan PPS
On tire un échantillon de taille n= 200 selon un plan aléatoire simple avec remise
et à probabilité de sélection proportionnelles à la taille de la variable ACRES82. Pour tirer
cet échantillon, nous avons exécuté la librairie PPS. La probabilité de sélection se calcule
en faisant le rapport entre la taille de la ferme sur la somme des tailles des fermes.
Puisque la probabilité de tirage est proportionnelle à la taille alors ce tirage est donc à
probabilité inégale. Ainsi pour estimer le total, nous pouvons utiliser l’estimateur de
Hansen-Hurwitz qui s’écrit comme suit :
𝑁 𝑦𝑖
𝑡ˆ𝐻𝐻 = ∑
𝑚 𝑝𝑖
𝑖∈𝑆
Après estimation, le total s’élève à 9,09.10^8 acres comme le montre la table suivante :
Coefficient de
Estimateur Estimation Variance
variation
𝑡ˆ𝐻𝐻 9,09.10^08 5,35.10^13 0,08.10^(-1)
9
graphique 3: Dispersion des superficies en 1992 en fonction des proba de sélection
10
2.5 Redressement des estimateurs
Il est important de chercher à améliorer son estimation lorsque qu’on a les moyens. Il
s’agit alors de retrouver des variables qualitatives ou quantitatives qui sont liées à la
variable d’intérêt. Contrairement aux méthodes de stratification et de plusieurs degrés,
les méthodes de redressements s’appliquent après la phase de tirage de l’échantillon avec
une ou plusieurs variables auxiliaires. La philosophie du redressement selon une variable
auxiliaire est la suivant : on essaye de restituer la structure de la population d’étude
grâce à une variable dont on a accès.
𝑈 = ⨄ 𝑈ℎ
ℎ=1
Où les 𝑈ℎ sont les strates formées selon la variable REGION. L’estimateur de la post
stratification s’écrit alors comme suit :
𝑛 𝑛
𝑛ℎ
1
𝜇ˆℎ = ∑ 𝑦ℎ𝑖
𝑛ℎ
𝑖=1
11
Avec 𝑦ℎ𝑖 la superficie des des fermes dans la commune i de la région h. \ La variance de
l’estimateur post stratifié (dans le cas d’un tirage aléatoire simple) vaut
approximativement (n “assez grand” et 𝑁ℎ /𝑁) “pas trop petit” pour tout h):
𝐻 𝐻
1−𝑓 2
1−𝑓 2
𝑉𝑎𝑟(𝜏ˆ𝑝𝑜𝑠𝑡 ) ≈ 𝑁 ( ∑ 𝑁ℎ 𝜎ℎ,𝑐𝑜𝑟𝑟 + 2 ∑(𝑁 − 𝑁ℎ )𝜎ℎ,𝑐𝑜𝑟𝑟 )
𝑛 𝑛
ℎ=1 ℎ=1
Etant donné qu’on a pas accès à la vraie variance corrigée (par hypothèse), c’est à dire
2
𝜎ℎ,𝑐𝑜𝑟𝑟 , l’estimateur de la variance est donné par :
𝐻 𝐻
1−𝑓 1−𝑓
ˆ (𝜏ˆ𝑝𝑜𝑠𝑡 ) = 𝑁 (
𝑉𝑎𝑟 2
∑ 𝑁ℎ 𝑠ℎ,𝑐𝑜𝑟𝑟 2
+ 2 ∑(𝑁 − 𝑁ℎ )𝑠ℎ,𝑐𝑜𝑟𝑟 )
𝑛 𝑛
ℎ=1 ℎ=1
Avec
Yh: le total de superficies dans la région h
Nh: le nombre de communes dans la région h avant échantillonnage
nh: le nombre de communes dans la région h après échantillonnage
Après calcul, nous avons les résultats suivants :
Coefficient de
Estimateur Estimation Variances variation
𝜏ˆ𝑝𝑜𝑠𝑡 9,733686.10^10 1,695607627.10^11 0.0816806
τ̂HP SI 1.0223234.10^9 7,733317310^15 0.0936265
12
observations sont plus concentrées autour de l’estimation dans le cas de la post
stratification que dans celui du SI sans remise, soit 0.08 contre 0.09.
Le principe de l’estimation par le ratio est de considérer une variable auxiliaire (la
superficie de ferme en 82) 𝑋𝑖 liée à la variable d’interêt (la superficie de ferme en 92) par
une relation de type :
𝑌𝑖 = 𝛽𝑞𝑢𝑜𝑡 . 𝑋𝑖 + 𝑈𝑖
𝜏ˆ𝑌 𝜇ˆ𝑌 𝑌
𝛽ˆ𝑞𝑢𝑜𝑡 = = =
𝜏ˆ𝑋 𝜇ˆ 𝑋 𝑋
Avec 𝜏ˆ𝑌 , 𝜏ˆ𝑋 , 𝜇ˆ𝑌 et 𝜇ˆ𝑋 les estimateurs des totaux et des moyennes.
13
3. Simulation
3.1 Comparaison de quatre plans de sondage
Pour pouvoir comparer plusieurs plans de sondage et plusieurs méthodes, nous
sommes amenés à réaliser des simulations, c’est-à-dire générer plusieurs échantillons.
C’est ce qui fait l’objet de cette partie.
Considérons les plans SI, stratifié, PPS et à deux degrés (SI, SI) nous allons calculez
les effets plans et les coefficients de variation à partir de la variance empirique des
estimations obtenues à partir de 500 tirages d’échantillons.
Par un programme sur R (mis en annexe partie 3.1) nous avons tirés 500 échantillons
pour les quatre plans de sondage.
➢ Pour le sondage aléatoire simples les résultats obtenus sont dans le tableau qui
suit :
Estimateur Moyenne Variance empirique Coefficient de variation Effet plan
ty_SI 922751982 6,92E+15 0,09013799 1
Ainsi la variance empirique des estimations sur les 500 échantillons de la superficie totale
dédiée aux fermes en 1992 est de 6,92E+15. En moyenne, pour la méthode SI,
l’estimateur SI est de 922 751 982. Les estimations du total sont assez concentrées au
niveau de la moyenne (CV=0,09).
➢ Pour le sondage stratifié les résultats obtenus sont dans le tableau qui suit :
Effet plan
Estimateur Moyenne Variance empirique Coefficient de variation
920047877 4,28E+15 0,61849711
ty_SPO 0,07107301
14
➢ Pour le sondage PPS les résultats obtenus sont dans le tableau qui suit :
Variance
Estimateur Moyenne Coefficient de variation Effet plan
empirique
ty_PPS 922765059 5,63E+13 8,13E-03 8,13E-03
On remarque que la variance empirique de la superficie totale dédiée aux fermes en 1992
pour la méthode PPS est de 5,63.10^13. ce qui est inférieur aux variances de SI et STO.
L’effet plan estimée est de 8,13.10^3, soit une précision de 123 fois plus grande que celle
de SI et 77 fois plus grande que le STO.
➢ Pour le sondage à deux degrés les résultats obtenus sont dans le tableau qui suit :
Estimateur Moyenne Variance Coefficient de variation Effet plan
empirique
ty_SI_SI 891109364 2,71E+16 1,85E-01 3,92E+00
La variance empirique de la superficie totale dédiée aux fermes en 1992 estimée par
simulation dans le cas de sondage à deux degrés est de 2,71.10^16 avec une moyenne de
891 109 364 acres sur l’ensemble des 500 échantillons. L’effet plan est estimé est à 3,92.
Ce résultat stipule que l’estimateur par la méthode SI SI est 3,92 fois moins précis que
l’estimateur SI. Ce résultat est inattendu, mais cela peut être du à une mauvais choix de
plan.
Récapitulatif des effets plans :
Pour appuyer d’avantage ces résultats, nous représentons le graphique ci-dessous qui
nous montre les comportements d’estimateur SI(vert), de l’estimateur STO (bleu), de
l’estimateur PPS (rouge) et de l’estimateur de 2 degrés (jaune) autour de la droite du vrai
15
total (en violet). On remarque que l’estimateur PPS est celui qui se stabilise le plus autour
du vrai total.
16
Ainsi on peut remarquer qu’en faisant le cumul pour chaque méthode d’estimation,
les estimateurs de chaque méthode convergent vers le vrai total (trait en violet). Notons
que l’estimateur par le ratio (en rouge) est celui qui se stabilise le plus et qui converge
« plus tôt », comparé aux autres estimateurs. Viens ensuite, l’estimateur de HP de SI (en
vers) qui se stabilise et converge aux alentours de 100e échantillon alors l’estimateur post
stratifié ne commence à se stabiliser qu’aux alentours du 300e échantillon.
17
Estimateur de Horvitz-Thompson du total
L’estimateur de Horvitz-Thompson du total pour un plan SI est donné par :
𝑛
𝑌𝑖
𝑡ˆ𝑈𝑑 = ∑ 𝑎𝑣𝑒𝑐 𝜋𝑖 𝑙𝑒𝑠 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑡é𝑠 𝑑′𝑖𝑛𝑐𝑙𝑢𝑠𝑖𝑜𝑛
𝜋𝑖
𝑖=1
𝑛
Comme le plan est à probabilité égale, les probabilités d’inclusion sont égales (𝜋𝑖 = )
𝑁𝑈𝑑
𝑛
𝑁
𝑡ˆ𝑈𝑑 = ∑ 𝑌𝑖
𝑛
𝑖=1
𝑁𝑑
𝑡ˆ𝑈𝑑,𝑟𝑎𝑡 = 𝑡ˆ𝑈𝑑
𝑁ˆ𝑑
1
Avec 𝑁𝑑 la taille du domaine 𝑈𝑑 et 𝑁ˆ𝑑 = ∑𝑖∈𝑆 l’estimation de cette taille.
𝑝𝑖
18
CONCLUSION
Au terme de ce travail, nous pouvons dire que la réalisation de ce projet nous a
permis d’appliquer certaines de nos connaissances en théorie des sondages.
En théorie de l’inférence comme en théorie des sondages, le statisticien n’a pas toujours
accès à la vraie information. Dans ce cas, il est obligé de procéder par des estimations. Et
il y a autant d’estimations que de méthodes. C’est ce qui fait que les estimations des
totaux, des variances et coefficients de variation diffèrent d’un plan de sondage à l’autre.
Pour remédier à ces différences, des améliorations telles que la post stratification et
l’estimation par ratio ont été apportées à ces estimateurs.
S’agissant des simulations, les plans de sondage ont été comparés grâce à l’effet plan de
sondage. Suite à des comparaisons, nous pouvons conclure que le plan PPS est le meilleur
car il donne plus de précision avec un effet plan de l’ordre de 0,008 et est l’estimateur qui
converge au mieux vers la vraie valeur du total (graphique 4).
19
ANNEXE des codes R compilé
library(survey)
library(sampling)
library(TeachingSampling)
library(pps)
#########1.1
ty=sum(BASE$ACRES92) # le total de superficie en 92
ReparREGION=table(BASE$REGION)# nombre des communes par region
table(BASE$STATE)
#########1.2
plot(BASE$ACRES82,BASE$ACRES92)# dispersion
20
#l'estimation
cv_tyHP.SI= cv(tyHP.SI) # coefficient de variation
BIC(model2)
nh_opt= round(n*Nh*sd_Y/sum(Nh*sd_Y))
poids_PS_opt= c(rep(Nh[1]/nh_opt[1],nh_opt[1]),rep(Nh[2]/nh_opt[2],nh_o
pt[2]),rep(Nh[3]/nh_opt[3],nh_opt[3]),
rep(Nh[4]/nh_opt[4],nh_opt[4])) ## le poids des individus
fpc_PS_opt= c(rep(nh_opt[1]/Nh[1],nh_opt[1]),rep(nh_opt[2]/Nh[2],nh_opt
[2]),rep(nh_opt[3]/Nh[3],nh_opt[3]),
rep(nh_opt[4]/Nh[4],nh_opt[4])) ## correction en population finie
tyHP.SP_opt= svytotal(~ACRES92,EchanPS_opt.design)
cv_tyHP.SP_opt = cv(tyHP.SP_opt)
detach(BASE)
21
#####~~~~~~~~~~~~~~~~~~~ 2.3 plan PPS~~~~~~~~~~~~~~~~~~~~~~~~~~~~####
set.seed(40)
tiragPPS=ppswr(BASE$ACRES82,n) # tirage PPS avec remise
BASE$prbSelec82<-BASE$ACRES82/sum(BASE$ACRES82) ## prob de select prop
a accres sur l'ensemble de la base
EchanPPS=BASE[tiragPPS,] # echantillon PPS
Estimation.Hansen=E.PPS(EchanPPS$ACRES92,EchanPPS$prbSelec) ## estimati
on du total, variance et CV
ty_HH=Estimation.Hansen[1,]
varty_HH=Estimation.Hansen[2,]^2
cvty_HH=Estimation.Hansen[3,]
# ty_HH1= sum(EchanPPS$ACRES92/EchanPPS$prbSelec)/200" # verification d
e l'estimateur de Hansen
plot(EchanPPS$prbSelec,EchanPPS$ACRES92)
####~~~~~~~~~~~~~~~~~~~2.4 (SI,SI)~~~~~~~~~~~~~~~~~~~~~~~~~~~`~~#####
#boucle pour eleminer les etats qui ne feront pas l'objet du tirage (mo
ins de 10 communes)
for ( j in 1:length(BASE_1[,1]) ) {
for (i in 1:length(BASE_1[,1])) {
if ( is.element(BASE_1[i,2], names(ReparSTATE_1) ))
BASE_1=BASE_1[-as.integer(i),]
} }
22
length(tira$`2`$ID_unit)
## [1] 200
dim(EchanSI_SI)
## [1] 200 16
NI=length(names(ReparSTATE_2))
nI=20
Ni=as.vector(table(tira$`1`$STATE))
Ni=Ni[Ni!=0]
ni=c(rep(10,20))
estimation.HP= E.2SI(NI,nI,Ni,ni,EchanSI_SI$ACRES92,as.character(EchanS
I_SI$STATE)) # estimation du total,
# de la variance et du CV
23
cv_ty.ration= cv(b.ration) ## coefficient de variation
detach(EchanSI)
n=200
N=2992
ty.esti= as.data.frame(ty.esti)
i=1
ty_HH=Estimation.Hansen[1,]
ty.esti[i,"tyHP.SI"]=tyHP.SI[1]
ty.esti[i,"tyHP.SP"]=tyHP.SP[1]
ty.esti[i,"ty_HH"]=ty_HH[2]
while (i<=500)
24
{
## Pour le plan SI
base_si= BASE[Echanti_si==1,]
N=sum(Nh)
n=200
nh_opt= round(n*Nh*sd_Y/sum(Nh*sd_Y))
nh_opt[2]=nh_opt[2]+1
25
poids_PS= c(rep(Nh[1]/nh_opt[1],nh_opt[1]),rep(Nh[2]/nh_opt[2],nh_opt
[2]),rep(Nh[3]/nh_opt[3],nh_opt[3]),
fpc_PS= c(rep(nh_opt[1]/Nh[1],nh_opt[1]),rep(nh_opt[2]/Nh[2],nh_opt[2
]),rep(nh_opt[3]/Nh[3],nh_opt[3]),
BASE$prbSelec<-BASE$ACRES82/sum(BASE$ACRES82)
Estimation.Hansen=E.PPS(EchanPPS$ACRES92,EchanPPS$prbSelec) ## estima
tion du total, variance et CV
ty_HH=Estimation.Hansen[1,]
#Pour le plan SI SI
26
tira=mstage(BASE_1,stage=list("cluster","cluster"), varnames=list("ST
ATE","COUNTY"),
size=list(20,c(rep(10,20))), method=list("srswor","srswor
"))
EchanSI_SI=BASE_1[tira$`2`$ID_unit,]
length(tira$`2`$ID_unit)
dim(EchanSI_SI)
NI=length(names(ReparSTATE_2))
nI=20
Ni=as.vector(table(tira$`1`$STATE))
Ni=Ni[Ni!=0]
ni=c(rep(10,20))
estimation.HP= E.2SI(NI,nI,Ni,ni,EchanSI_SI$ACRES92,as.character(Echa
nSI_SI$STATE))
ty.esti[i,"tyHP.SI"]=tyHP.SI[1]
ty.esti[i,"tyHP.SP"]=tyHP.SP[1]
ty.esti[i,"ty_HH"]=ty_HH[2]
ty.esti[i,"tyHP.SI_SI"]=tyHP.SI_SI
i=i+1
27
###tirage de 500 echantillon et calcul estimateur SI, postStrat et rati
o
i=1
BASE_ESTIMATEUR[,"Echantillon"]= i
set.seed(20*2*i)
tiragSI= srswor(200,2992)
Echantillon=BASE[tiragSI==1,]
BASE_ESTIMATEUR[i,"tyHP.SI"]= svytotal(~ACRES92,EchanSI.disg)[1]
length(unique(Echantillon$COUNTY))
BASE_ESTIMATEUR[i,"VarEmp.SI"]= (E.SI(2992,200,Echantillon$ACRES92)[2
,2])^2
BASE_ESTIMATEUR[i,"typost.SI"]= svytotal(~ACRES92,post.disg)[1]
BASE_ESTIMATEUR[i,"var_typost.SI"]= svyvar(~ACRES92,post.disg)[1]
ration.SI= svyratio(~ACRES92,~ACRES82,EchanSI.disg)
BASE_ESTIMATEUR[i,"ty.ration.SI"]=predict(ration.SI,sum(BASE$ACRES82))
[1]
BASE_ESTIMATEUR[i,"var_ty.ration"]=2992^2*(1-200/2992)/200*1/199*sum((
Echantillon$ACRES92-mean(Echantillon$ACRES92)/mean(Echantillon$ACRES82)*Echan
tillon$ACRES82)*
(Echantillon$ACRES92-mean(Echantillon$ACRES92)/mean(Echantillon$ACRES82)*Echa
ntillon$ACRES82))
28
i=i+1
VARmthd_SI= var(BASE_ESTIMATEUR$tyHP.SI)
VARmthd_post= var(BASE_ESTIMATEUR$typost.SI)
VARmthd_ration= var(BASE_ESTIMATEUR$ty.ration.SI)
var(BASE_ESTIMATEUR[,2:4])
N<-seq(1,500, by=1)
abline(h=sum(BASE$ACRES92),col = "purple")
abline(h=sum(BASE$ACRES92),col = "purple")
29
30