Nothing Special   »   [go: up one dir, main page]

Pertemuan 4 Stratified Random Sample

Unduh sebagai pdf atau txt
Unduh sebagai pdf atau txt
Anda di halaman 1dari 30

Politeknik Statistika STIS “for a better official statistics”

Jl. Otto Iskandardinata No.64C Jakarta 13330 www.stis.ac.id

KS
Pertemuan 4:

Stratified Random
Sampling
Dr. Azka Ubaidillah, SST., M.Si.
azka@stis.ac.id
Outline
 Pengertian
 Skema Pembentukan Strata
 Estimasi Rata-rata, Total, Varians, Varians
 Estimasi Proporsi
 Alokasi Sampel

2
Pengertian
 Populasi sebanyak 𝑁 unit dikelompokkan menjadi 𝐿 subpopulasi,
masing-masing subpopulasi terdiri dari 𝑁1 , 𝑁2 , …, 𝑁𝐿 unit
Subpopulasi yang terbentuk tidak boleh saling tumpang tindih
(overlapping).
 Jumlah unit dari semua subpopulasi sama dengan jumlah
populasi, sehingga:
𝑁1 + 𝑁2 + ⋯ + 𝑁𝐿 = 𝑁
 Subpopulasi ini disebut strata.
 Penarikan sampel dilakukan untuk setiap strata, dan bersifat
independent antara strata satu dengan strata lainnya.
𝑛1 + 𝑛2 + ⋯ + 𝑛𝐿 = 𝑛
 Jika penarikan sampel di setiap strata dilakukan secara SRS,
prosedur ini disebut stratified random sampling.
3
Skema Pembentukan Strata
♦ ♠ ♦ ♥ ♥ ♠ ♥ ♣ ♦ ♠ ♦ ♣
POPULASI ♠ ♦ ♠ ♣ ♠ ♥ ♠ ♦ ♠ ♠ ♣ ♠
♣ ♥ ♣ ♦ ♣ ♦ ♣♥♣ ♣ ♥ ♦
♥ ♣ ♥ ♠ ♥♣ ♥ ♥ ♠ ♦ ♥ ♥

♦♦♦ ♠♠♠ ♣♣♣ ♥♥♥


♦♦♦ ♠♠♠ ♣♣♣ ♥♥♥
STRATIFIKASI
POPULASI ♦♦♦ ♠♠♠ ♣♣♣ ♥♥♥
♦♦♦ ♠♠♠ ♣♣♣ ♥♥♥
Strata 1 Strata 2 Strata 3 Strata 4
4
Prinsip
1. Unit/elemen yang karakteristiknya hampir sama dikelompokkan
dalam satu strata.
 Unit-unit dalam strata (within stratum) -- > homogeny

2. Perbedaan rata-ratakarakteristik antarstrata dibuat sebesar


mungkin.
 Unit-unit antar strata (between stratum) -- > heterogen

5
Keuntungan
 Meningkatkan efisiensi desain/presisi estimasi karakteristik
populasi.
 Masing-masing strata bisa dianggap sebagai populasi tersendiri
sehingga bisa diterapkan desain sampling yang berbeda.
 Estimasi bisa dilakukan untuk penyajian sampai level strata.
 Untuk kemudahan administratif.

6
Strata untuk Meningkatkan Presisi
• Untuk membentuk strata diperlukan variabel pendukung untuk
mengelompokkan unit sampling sehingga varians dari nilai variabel di
dalam strata menjadi lebih homogen.
• Bila memungkinkan lebih baik lagi bila dapat diusahakan agar
perbedaan rata-rata nilai karakteristik antar strata dibuat sebesar
mungkin.
• Untuk meningkatkan presisi maka perlu dipilih suatu variabel yang
diperkirakan mempunyai korelasi dengan data yang akan dikumpulkan.
• Contoh: variabel yang baik untuk dasar stratifikasi survei sosial
ekonomi nasional antara lain pengelompokan wilayah elit dan non elit,
atau daerah perkotaan dan daerah pedesaan.

7
Dasar Pembentukan Strata
Dasar pembentukan strata tergantung dari tujuan pembentukan strata dan sifat-
sifat variabel yang akan dijadikan dasar pembentukan strata, contohnya:
a. Unit sampling itu sendiri, misalkan mahasiswa laki-laki dan mahasiswa
perempuan
b. Variabel wilayah administrasi,misalnya desa perkotaan dan desa pedesaan.
c. Variabel letak geografis, misalnya desa pantai dan desa bukan pantai.
d. Variabel lainnya misalnya kepadatan penduduk, jenis lapangan usaha
(daerah pertanian dan non pertanian).
e. Perusahaan/usaha bisa dibedakan usaha skala besar, sedang, dan kecil,
misalnya berdasarkan omzet atau jumlah tenaga kerja.
f. Sekolah, bisa sekolah negeri dan sekolah swasta.

8
Notasi
𝑦ℎ𝑖 : nilai karakteristik unit ke-i strata ke-h
𝑁 : jumlah populasi
𝐿
𝑁ℎ : jumlah populasi di strata ke-h dimana ℎ=1 𝑁ℎ =𝑁
𝑊ℎ : penimbang strata ke-h (stratum weight)
𝑁ℎ
𝑊ℎ =
𝑁
𝑛 : jumlah sampel
𝑛ℎ : jumlah sampel di strata ke-h
𝐿

𝑛ℎ = 𝑛
ℎ=1
𝑓ℎ : fraksi sampling strata ke-h
𝑛ℎ
𝑓ℎ =
𝑁ℎ
9
Rata-Rata Populasi

• Rata-rata karakteristik populasi di strata ke-h


𝑁ℎ
1
𝑌ℎ = 𝑌ℎ𝑖
𝑁ℎ
𝑖=1

• Rata-rata karakteristik populasi


𝐿 𝑁ℎ 𝐿 𝐿
1 1
𝑌= 𝑌ℎ𝑖 = 𝑁ℎ ∙ 𝑌ℎ = 𝑊ℎ ∙ 𝑌ℎ
𝑁 𝑁
ℎ=1 𝑖=1 ℎ=1 ℎ=1

10
Varians Populasi

• Varians karakteristik populasi di strata ke-h


𝑁ℎ
2
1 2
𝜎ℎ = 𝑌ℎ𝑖 − 𝑌ℎ
𝑁ℎ
𝑖=1𝑁

2 1 2
𝑆ℎ = 𝑌ℎ𝑖 − 𝑌ℎ
𝑁ℎ − 1
𝑖=1
• Varians karakteristik populasi
𝑁
2
1 2
𝜎 = 𝑌𝑖 − 𝑌
𝑁
𝑖=1

11
Estimasi Rata-Rata
• Estimasi rata-rata karakteristik di strata
𝑛ℎ
ke-h
1
𝑦ℎ = 𝑦ℎ𝑖
𝑛ℎ
𝑖=1
• Estimasi rata-rata karakteristik populasi:
𝐿 𝐿
1
𝑦𝑠𝑡 = 𝑁ℎ ∙ 𝑦ℎ = 𝑊ℎ ∙ 𝑦ℎ
𝑁
ℎ=1 ℎ=1
Estimator rata-rata di atas merupakan unbiased estimator, dibuktikan:
𝐿
1
𝐸 𝑦𝑠𝑡 = 𝐸 𝑁ℎ ∙ 𝑦ℎ
𝑁
ℎ=1
𝐿 𝐿 𝐿
1 1
= 𝑁ℎ ∙ 𝐸 𝑦ℎ = 𝑁ℎ ∙ 𝑌ℎ = 𝑊ℎ ∙ 𝑌ℎ = 𝑌
𝑁 𝑁
ℎ=1 ℎ=1 ℎ=1
12
Sampling Varians
𝐿 𝐿

𝑉 𝑦𝑠𝑡 = 𝑉 𝑊ℎ ∙ 𝑦ℎ = 𝑊ℎ 2 ∙ 𝑉(𝑦ℎ )
ℎ=1 ℎ=1

Jika masing-masing strata dilakukan penarikan sampel secara


SRS WOR, maka:
𝑆ℎ 2
𝑉 𝑦ℎ = 1 − 𝑓ℎ ∙
𝐿
𝑛ℎ
2
𝑆ℎ
𝑉 𝑦𝑠𝑡 = 𝑊ℎ 2 ∙ 1 − 𝑓ℎ ∙
𝑛ℎ
ℎ=1
Unbiased estimator dari 𝑆ℎ 2 adalah 𝑠ℎ 2 sehingga unbiased
estimator dari sampling varians adalah
𝐿
2
𝑠ℎ
𝑣 𝑦𝑠𝑡 = 𝑊ℎ 2 ∙ 1 − 𝑓ℎ ∙
𝑛ℎ 13
ℎ=1
Estimasi Total
• Estimasi total karakteristik𝑛di strata ke-h

𝑁ℎ
𝑌ℎ = 𝑦ℎ𝑖 = 𝑁ℎ ∙ 𝑦ℎ
𝑛ℎ
𝑖=1
• Varians estimasi total karakteristik di strata ke-h
𝑣 𝑌ℎ = 𝑁ℎ 2 ∙ 𝑣 𝑦ℎ
• Estimasi total karakteristik populasi:
𝐿

𝑌𝑠𝑡 = 𝑁𝑦𝑠𝑡 = 𝑁ℎ ∙ 𝑦ℎ
ℎ=1
• Varians estimasi total karakteristik:
𝑣 𝑌𝑠𝑡 = 𝑁 2 ∙ 𝑣 𝑦𝑠𝑡

14
Proporsi Populasi
• Misalkan, populasi sebanyak N unit dibagi menjadi L strata sehingga sehingga
banyaknya unit untuk strata ke-h adalah 𝑁ℎ .
• 𝑌ℎ𝑖 adalah nilai karakteristik dari variabel kategorik (bernilai 0 atau 1) untuk
unit ke-i strata ke-h, sehingga jumlah kejadian untuk variabel tsb di strata ke-h
adalah:
𝑁ℎ

𝐴ℎ = 𝑌ℎ𝑖
𝑖=1
• Proporsi populasi di strata ke-h:
𝑁ℎ
1 𝐴ℎ
𝑃ℎ = 𝑌ℎ𝑖 =
𝑁ℎ 𝑁ℎ
𝑖=1
• Proporsi populasi:
𝐿 𝐿
𝑁ℎ
𝑃= ∙ 𝑃ℎ = 𝑊ℎ ∙ 𝑃ℎ
𝑁
ℎ=1 ℎ=1 15
Estimasi Proporsi
• Jika 𝑦ℎ1 , 𝑦ℎ2 , … , 𝑦ℎ𝑛ℎ adalah random sampel dengan ukuran 𝑛ℎ yang
diambil dari populasi sebanyak 𝑁ℎ , maka estimasi proporsi di strata
ke-h: 𝑛ℎ
1 𝑎ℎ
𝑝ℎ = 𝑦ℎ𝑖 =
𝑛ℎ 𝑛ℎ
𝑖=1
Keterangan:
𝑦ℎ𝑖 harus bernilai 0 atau 1 𝑛ℎ

𝑦ℎ𝑖 = 𝑎ℎ
𝑖=1
Estimasi proporsi populasi:
𝐿

𝑝𝑠𝑡 = 𝑊ℎ ∙ 𝑝ℎ
ℎ=1 16
Estimasi Varians Proporsi
• Sampling varians dari estimasi proporsi:
𝐿
2 𝑃ℎ ∙ 𝑄ℎ
𝑉 𝑝𝑠𝑡 = 𝑊ℎ ∙ (𝑤𝑟)
𝑛ℎ
𝐿 ℎ=1
2 𝑃ℎ ∙ 𝑄ℎ
𝑉 𝑝𝑠𝑡 = 𝑊ℎ ∙ 1 − 𝑓ℎ ∙ (𝑤𝑜𝑟)
𝑛ℎ
ℎ=1
• Unbiased estimator dari sampling varians di atas:
𝐿
2 𝑝ℎ ∙ 𝑞ℎ
𝑣 𝑝𝑠𝑡 = 𝑊ℎ ∙ (𝑤𝑟)
𝑛ℎ − 1
𝐿 ℎ=1
2 𝑝ℎ ∙ 𝑞ℎ
𝑣 𝑝𝑠𝑡 = 𝑊ℎ ∙ 1 − 𝑓ℎ ∙ (𝑤𝑜𝑟)
𝑛ℎ − 1
ℎ=1

17
Contoh
Misalkan, kita ingin menghitung proporsi unit yang bewarna merah
POPULASI SAMPEL
♦♦♦ ♠♠♠ ♣♣♣ ♥♥♥ ♦♦ ♠♠ ♣♣ ♥♥♥
♦♦♦ ♠♠♠ ♣♣♣ ♥♥♥ ♦♦ ♠♠ ♣♣ ♥♥♥
♦♦ ♠♠♠ ♣♣♣ ♥♥♥♥ ♦ ♠♠ ♣♣ ♥♥
♦♦ ♠♠♠ ♣♣♣ ♥♥♥♥
Strata 1 Strata 2 Strata 3 Strata 4 Strata Strata Strata Strata
1 2 3 4
𝑁1 = 10 𝑁2 = 12 𝑁3 = 12 𝑁4 = 14 𝑛1 = 5 𝑛2 = 6 𝑛3 = 6 𝑛4 = 8

𝐴1 = 4 𝐴2 = 4 𝐴3 = 5 𝐴4 = 7 𝑎1 = 2 𝑎2 = 2 𝑎3 = 2 𝑎4 = 4

𝑃1 = 4/10 𝑃2 = 4/12 𝑃3 = 5/12 𝑃4 = 7/14 𝑝1 = 2/5 𝑝2 = 2/6 𝑝3 = 2/6 𝑝4 = 4/8

4 4 5 7 2 2 2 4
10 ∙ + 12 ∙ + 12 ∙ + 14 ∙ 10 ∙ + 12 ∙ + 12 ∙ + 14 ∙
𝑃= 10 12 12 14 = 23 𝑝𝑠𝑡 = 5 6 6 8 = 19
10 + 12 + 12 + 14 48 (10 + 12 + 12 + 14) 48 18
Alokasi Sampel

• Alokasi sembarang --> jarang digunakan


• Alokasi sama (equal)
• Alokasi sebanding (proportional)
• Alokasi Neyman
• Alokasi optimum

19
Alokasi Sama (Equal)
• Alokasi ini sering digunakan jika varians strata 𝑆ℎ 2 hampir sama.
• Jumlah sampel untuk setiap strata sama.
• Ukuran sampel untuk strata ke-h
𝑛
𝑛ℎ =
𝐿
𝑛 : jumlah sampel
𝑛ℎ : jumlah sampel di strata ke-h
𝐿 : jumlah strata
• Ukuran sampel keseluruhan:
𝐿 2 2
𝐿 ℎ=1 𝑁ℎ ∙ 𝑆ℎ
𝑛=
𝑁 2 𝐷2 + 𝐿ℎ=1 𝑁ℎ ∙ 𝑆ℎ 2
Keterangan:
𝑑
𝐷=
𝑍𝛼/2
20
Varians untuk Alokasi Equal
• Alokasi sama (equal)
𝑛
𝑛ℎ =
𝐿
𝐿
𝑠ℎ 2
𝑣 𝑦𝑠𝑡 = 𝑊ℎ 2 1 − 𝑓ℎ
𝑛ℎ
ℎ=1
𝐿
𝑠ℎ 2 𝐿
= 𝑊ℎ 2 1 − 𝑓ℎ
𝑛
ℎ=1
𝐿
𝐿
= 𝑊ℎ 2 1 − 𝑓ℎ 𝑠ℎ 2 (𝑤𝑜𝑟)
𝑛
ℎ=1
𝐿
𝐿
𝑣 𝑦𝑠𝑡 = 𝑊ℎ 2 𝑠ℎ 2 (𝑤𝑟)
𝑛
ℎ=1
21
Alokasi Sebanding (Proportional)
• Alokasi ini sering digunakan jika varians strata 𝑆ℎ 2 tidak berbeda signifikan antara
strata yang satu dengan strata yang lainnya.
• Jumlah sampel untuk setiap strata sebanding dengan ukuran populasi di strata tsb.
• Ukuran sampel strata ke-h
𝑁ℎ
𝑛ℎ = ∙𝑛
𝑁
𝑛 : jumlah sampel
𝑛ℎ : jumlah sampel di strata ke-h
𝑁 : jumlah populasi
𝑁ℎ : jumlah populasi di strata ke-h
• Ukuran sampel keseluruhan:
𝐿 2
𝑁 ℎ=1 𝑁ℎ ∙ 𝑆ℎ
𝑛=
𝑁 2 𝐷2 + 𝐿ℎ=1 𝑁ℎ ∙ 𝑆ℎ 2
22
Varians untuk Alokasi Proportional
• Fraksi sampling sama untuk setiap strata
𝑛ℎ 𝑛
𝑓ℎ = = =𝑓
𝑁ℎ 𝑁
• Dengan menggunakan alokasi proportional, akan membentuk selfweighting
design (desain yang tertimbang otomatis), hal ini dibuktikan:
𝐿 𝐿 𝑛ℎ 𝐿 𝑛ℎ
𝑁ℎ 1 1
𝑦𝑠𝑡 = 𝑊ℎ ∙ 𝑦ℎ = ∙ 𝑦ℎ𝑖 = 𝑦ℎ𝑖
𝑁 𝑛ℎ 𝑛
𝐿 ℎ=1 ℎ=1
𝐿 𝑖=1 ℎ=1 𝑖=1 𝐿
2
1 − 𝑓ℎ 𝑁ℎ 1 − 𝑓 1−𝑓
𝑣 𝑦𝑠𝑡 = 𝑊ℎ 2
∙ ∙ 𝑠ℎ 2 = 2
∙ 2
∙ 𝑠ℎ = 𝑊ℎ ∙ 𝑠ℎ 2 (wor)
𝑛ℎ 𝑁 𝑛ℎ 𝑛
ℎ=1 ℎ=1 ℎ=1

𝐿 𝐿
1 2
1
𝑣 𝑦𝑠𝑡 = 𝑊ℎ ∙ 𝑠ℎ = 𝑁ℎ 𝑠ℎ 2 (𝑤𝑟)
𝑛 𝑁𝑛
ℎ=1 ℎ=1
23
Alokasi Neyman
• Jika ada variabel pendukung yang bisa digunakan untuk mengetahui nilai varians
strata 𝑆ℎ 2 atau 𝑠ℎ 2 , maka alokasi Neyman akan meningkatkan presisi dari metode
sampling.
• Biaya setiap strata diasumsikan sama.
• Dalam metode ini sampel dialokasikan ke dalam setiap strata agar diperoleh standar
error sekecil mungkin dan dengan memperhatikan besarnya varians.
• Makin besar varians strata, maka jumlah sampel yang dialokasikan ke dalam strata
tsb akan semakin besar.
• Ukuran sampel strata ke-h:
𝑁ℎ ∙ 𝑆ℎ
𝑛ℎ = 𝐿 ∙𝑛
ℎ=1 𝑁ℎ ∙ 𝑆ℎ
• Ukuran sampel keseluruhan:
𝐿 2
ℎ=1 𝑁ℎ ∙ 𝑆ℎ
𝑛=
𝑁 2 𝐷2 + 𝐿ℎ=1 𝑁ℎ ∙ 𝑆ℎ 2
24
Varians untuk Alokasi Neyman
𝑁ℎ ∙ 𝑠ℎ
𝑛ℎ = 𝐿 ∙𝑛
𝑁
ℎ=1 ℎ ∙ 𝑠ℎ

𝐿 𝐿 2 𝐿
𝑠ℎ 2 𝑁ℎ 𝑠ℎ 2
𝑣 𝑦𝑠𝑡 = 𝑊ℎ 2 1 − 𝑓ℎ = 1 − 𝑓ℎ ∙ 𝑁ℎ 𝑠ℎ
𝑛ℎ 𝑁 𝑛𝑁ℎ 𝑠ℎ
ℎ=1 ℎ=1 ℎ=1
𝐿 𝐿
1
= 2 1 − 𝑓ℎ 𝑁ℎ 𝑠ℎ ∙ 𝑁ℎ 𝑠ℎ (𝑤𝑜𝑟)
𝑁 𝑛
ℎ=1 ℎ=1
2
𝐿
1
𝑣 𝑦𝑠𝑡 = 2 𝑁ℎ 𝑠ℎ (𝑤𝑟)
𝑁 𝑛
ℎ=1

25
Alokasi Optimum
• Sampel yang berukuran n dialokasikan ke dalam setiap strata sedemikian
rupa sehingga diperoleh varians sekecil mungkin dengan biaya yang tersedia
atau meminimumkan biaya dengan varians tertentu.
• Fungsi biaya:
𝐿

𝐶 = 𝐶0 + 𝑐ℎ 𝑛ℎ
ℎ=1
• Ukuran sampel strata ke-h:
𝑁ℎ ∙ 𝑆ℎ / 𝑐ℎ
𝑛ℎ = 𝐿
∙𝑛
ℎ=1 𝑁ℎ ∙ 𝑆ℎ / 𝑐ℎ
Keterangan:
𝐶 : total biaya
𝐶0 : biaya tidak dipengaruhi desain dan metode sampling
𝑐ℎ : biaya per elemen untuk strata ke-h
26
Alokasi Optimum
• Ukuran sampel keseluruhan:
1. Meminimumkan biaya dengan varians
tertentu

𝐿 𝐿
ℎ=1 𝑁ℎ 𝑆ℎ 𝑐ℎ ℎ=1 𝑁ℎ 𝑆ℎ / 𝑐ℎ
𝑛= 𝐿 2
𝑁 2 𝐷2 + 𝑁 𝑆
ℎ=1 ℎ ℎ

2. Meminimumkan varians dengan biaya


tertentu

𝐿
𝐶 − 𝐶0 ℎ=1 𝑁ℎ 𝑆ℎ / 𝑐ℎ
𝑛= 𝐿
ℎ=1 𝑁ℎ 𝑆ℎ 𝑐ℎ
27
Varians untuk Alokasi Optimum
𝑁ℎ 𝑠ℎ / 𝑐ℎ
𝑛ℎ = 𝐿 ∙𝑛
ℎ=1 𝑁ℎ 𝑠ℎ / 𝑐ℎ

𝐿
𝑠ℎ 2
𝑣 𝑦𝑠𝑡 = 𝑊ℎ 2 1 − 𝑓ℎ
𝑛ℎ
ℎ=1
𝐿 𝐿
𝑁ℎ 2 𝑠ℎ 2
= 1 − 𝑓ℎ ∙ 𝑁ℎ 𝑠ℎ / 𝑐ℎ
𝑁 𝑛𝑁ℎ 𝑠ℎ / 𝑐ℎ
ℎ=1 ℎ=1
𝐿 𝐿
1
= 1 − 𝑓ℎ 𝑁ℎ 𝑠ℎ / 𝑐ℎ ∙ 𝑁ℎ 𝑠ℎ / 𝑐ℎ (𝑤𝑜𝑟)
𝑁2𝑛
ℎ=1 ℎ=1
2
𝐿
1
𝑣 𝑦𝑠𝑡 = 2 𝑁ℎ 𝑠ℎ / 𝑐ℎ (𝑤𝑟)
𝑁 𝑛
ℎ=1
28
Ukuran Sampel Strata
• Ukuran sampel pada suatu strata akan lebih
besar dari strata lainnya jika:
1. Jumlah populasi di strata tsb lebih besar
2. Varians strata lebih besar
3. Biaya lebih murah pada strata yang
bersangkutan

29
Politeknik Statistika STIS “for a better official statistics”

Jl. Otto Iskandardinata No.64C Jakarta 13330 www.stis.ac.id

Terima kasih

Anda mungkin juga menyukai