3 Sondaj
3 Sondaj
3 Sondaj
x−m
⋅ 100
m
Dacă procentul privind eroarea de reprezentativitate este sub 5%, se poate aprecia că sondajul este
reprezentativ şi oferă o imagine fidelă a realităţii.
Teoretic, eroarea poate fi redusă oricât de mult; aceasta implică însă o creştere a dimensiunii eşantionului,
până la limita întregii colectivităţi, dar în acest caz dispar avantajele verificării prin sondaj, adică economie
de timp şi bani. Deci pentru dimensionarea eşantionului trebuie să se găsească un raport convenabil între
nivelul erorii de reprezentativitate şi costul măririi eşantionului.
3_SONDAJ.doc 1
-2–
Din punct de vedere al modului de extragere a unităţilor, sondajele pot fi grupate în:
- sondaje repetate, atunci când o unitate extrasă este reintrodusă în colectivitatea generală, şi deci
are şansa de a reintra în eşantion
- sondaje nerepetate, atunci când unităţile nu sunt reintroduse în colectivitatea generală.
Extragerea unităţilor se efectuează după diverse metode, dintre care cele mai des utilizate sunt:
1. Procedeul LOTO, în care unităţile sunt perfect identificabile, iar extragerea se face după
corespondentul înregistrat pe bileţele amestecate şi extrase aleator dintr-o urnă.
2. Procedeul tabelelor cu numere aleatoare este aproximativ similar celui anterior, dar se aplică la
colectivităţi de dimensiuni mari, la care metoda LOTO este neoperantă. Numerele sunt înregistrate într-un
tabel cu N unităţi, din care se aleg serii de numere întâmplătoare ce vor alcătui un eşantion de n unităţi.
3. Procedeul mecanic constă în alegerea unităţilor la intervale (de timp sau numerice) bine
precizate, deci la un anumit pas de numărare, aplicat bazei de sondaj.
Exemplu: dacă eşantionul n reprezintă 10% din volumul colectivităţii N, atunci se va extrage fiecare
a 10-a unitate a colectivităţii. Pentru a îmbunătăţi caracterul aleator, nu se va începe extragerea cu unitatea 1,
ci se alege o unitate din primele 10, apoi se vor extrage şi celelalte, cu pasul egal cu 10.
4; 4 + 10 = 14; 14 + 10 = 24; 24 + 10 = 34; …
Este varianta elementară de sondaj, celelalte tipuri reprezintă soluţii obţinute prin particularizarea unor
elemente ale acestui tip de sondaj.
Sondajul aleator simplu se poate realiza în una din cele două variante (repetat şi nerepetat), din punct de
vedere al modului de extragere a unităţilor. Indicatorii de bază utilizaţi sunt numărul de unităţi din întreaga
colectivitate şi din eşantion, media aritmetică a unei caracteristici pentru întreaga colectivitate şi pentru
eşantion, dispersia pentru întreaga colectivitate şi pentru eşantion, abaterea pătratică medie.
Indicatorii statistici calculaţi pe baza datelor de sondaj diferă de la un eşantion la altul, ei pot fi interpretaţi
ca variabile aleatoare.
Indicatorii estimaţi pe baza sondajului, fiind variabile aleatoare, pentru a putea fi extinşi la întreaga
colectivitate, trebuie să fie estimări:
- nedeplasate (adică valoarea medie a indicatorului de sondaj să fie egală cu parametrul din
colectivitatea generală);
- consistente (indicatorul de sondaj să tindă în probabilitate, pentru valori mari ale lui “n”, către
parametrul teoretic din colectivitatea generală);
- eficiente (să aibă dispersie minimă).
Estimaţiile obţinute pe baza datelor de sondaj constituie evaluări aproximative ale adevăratelor valori ale
parametrilor necunoscuţi din colectivitatea generală. Rezultă că datele obţinute prin sondaj sunt afectate de
erori. Prin sondaj nu se obţine valoarea adevărată a parametrului căutat, ci un interval de încredere care
acoperă valoarea necunoscută a parametrului din colectivitatea generală, cu o probabilitate fixată de
cercetător. Acest interval poartă numele de interval de estimaţie sau interval de încredere.
3_SONDAJ.doc 2
-3–
Cele două limite ale intervalului de încredere, Θinf şi Θsup se calculează pe baza datelor sondajului:
P(Θinf < Θ < Θsup) = 1 – α
Intervalul (Θinf; Θsup) reprezintă intervalul de încredere şi defineşte precizia estimaţiei.
Probabilitatea P = 1 – α caracterizează siguranţa afirmaţiilor şi se numeşte nivel de încredere.
Parametrul α este valoarea complementară a nivelului de încredere şi se numeşte nivel sau prag de
semnificaţie şi se fixează prin programul de cercetare.
Cele mai utilizate valori ale probabilităţii de încredere sunt 90%, 95%, 99% şi 99,9%, cărora le corespund
niveluri de semnificaţie de 10%, 5%, 1% şi 0,1%.
si poate fi un estimator nedeplasat al mediei “m” a colectivităţii generale dacă se îndeplineşte condiţia ca
media mediilor de selecţie să fie egală cu media generală: M( x ) = m
Relaţia exprimă că media de sondaj, x , într-un sondaj este un estimator nedeplasat al mediei “m” a
colectivităţii generale.
σ2
Dispersia mediei de sondaj se calculează după relaţia: D(x ) =
n
Deci disperisa mediei de sondaj într-un eşantion este de n ori mai mică decât dispersia σ2 a colectivităţii
σ
generale. De aici rezultă relaţia pentru abaterea medie pătratică: σ x =
n
3_SONDAJ.doc 3
-4–
Eroarea limită maxim admisă defineşte siguranţa estimării mediei m prin variabila de sondaj x şi se măsoară
cu ajutorul relaţiei:
Mărimea ∆x caracterizează precizia estimaţiei, x − m < ∆x
Aprecierea satisfacerii inegalităţii nu se poate face decât ca o probabilitate de realizare:
x−m
P( x − m < ∆x ) = 1 − α tα =
σ
n
Eroarea limită se determină pornind de la variabila:
σ
∆x = t α ⋅ , pentru selectia repetata.
n
Rezultă că eroarea x − m este egală cu: ∆x şi
σ n
∆x = t α ⋅ ⋅ 1− , pentru selectia nerepetata.
n N
Pentru valorile uzuale: α = 0,05; 0,01; 0,001 valorile variabilei t corespunzătoare în tabele sunt:
t = 1,96; 2,33; 3,09
Intervalul de încredere desemnează zona probabilă în interiorul căreia se va plasa media colectivităţii
generale. Se determină pornind de la media de sondaj corectată cu nivelul erorii limită maxim admisă.
x − m < ∆x , din care rezultă dubla inegalitate: x − ∆x < m < x + ∆x
Deci intervalul de încredere delimitează zona probabilă în care se va plasa valoarea adevărtaă, dar
necunoscută a mediei din colectivitatea generală.
Lungimea intervalului de încredere este direct proporţională cu mărimea împrăştierii valorilor (măsurată prin
abaterea medie pătratică) şi invers proporţională cu nivelul pragului de semnificaţie (la valori mici ale lui α,
valorile lui tα cresc) şi mărimea eşantionului (la creşterea lui n, intervalul de încredere devine mai mic, deci
precizia estimaţiei sporeşte).
În unele situaţii prezintă interes şi poate avea sens logic calculul intervalului probabil de plasare a nivelului
totalizat al caracteristicii în colectivitatea generală. Intervalul de încredere pentru valoarea agregată Nx este:
σ σ
N x − t α ⋅ ≤ N m ≤ N x + t α ⋅
n n
Pentru sondajul nerepetat, relaţia se adaptează cu formula adecvată acestui tip de sondaj.
La organizarea unei cercetări prin sondaj, una din problemele de rezolvat este dimensionarea lor raţională.
Este adevărat că mărimea n a sondajului sporeşte precizia rezultatelor, reduce eroarea medie probabilă.
Ţinând seama de criteriile economice este necesar ca acest volum să fie cât mai mic.
Luând în considerare ambele aspecte, se determină numărul minim de unităţi de observat care să satisfacă
exigenţele de precizie şi siguranţă formulate în raport cu cercetarea respectivă.
Calculul volumului eşantionului se realizează pornind de la eroarea limită maxim admisă.
pentru sondajul repetat
σ
∆x = tα σ2
n ∆x =t
2 2
α
n
3_SONDAJ.doc 4
-5–
t 2α ⋅ σ 2
n=
∆2 x
Selecţia simplă nerepetată este mai economicoasă decât cea repetată, deoarece în aceleaşi condiţii volumul
necesar al eşantionul este mai mic.
Intrarea produselor în circuitul economic este însoţită de un control calitativ, numit control de recepţie.
Controlul de recepţie reprezintă controlul calităţii loturilor de produse (materii prime, piese, subansamble,
produse finite), precum şi a produselor mai greu individualizate (tesături, fire, hârtie, etc.), asupra cărora
operaţiile de producţie sunt terminate. Controlul calităţii loturilor poate fi efectuat printr-o gamă variată de
metode adaptate specificului producţiei controlate, tipului caracteristicilor de calitate, importanţei şi
implicaţiilor erorilor de decizie.
După volumul produselor controlate, se deosebesc:
controlul 100%, în care se controlează volumul întregii producţii obiect cu obiect. Acest tip de control se
poate aplica unei producţii de serie mică sau unicate, la care condiţiile tehnice impuse sunt deosebit de
severe;
controlul prin sondaj este o variantă în care se controlează numai o parte a producţiei. Acest tip de control se
impune ca unică alternativă raţională şi eficientă, care răspunde tehnic şi economic necesităţilor producţiei de
masă.
Sinteza elementelor necesare efectuării controlului loturilor o regăsim într-un plan de control, care conţine:
volumul eşantionului, riscurile asumate de partenerii controlului (furnizor-beneficiar), nivelul calităţii
producţiei şi criteriile de decizie.
Se va porni de la presupunerea logică, conform căreia orice lot conţine o anumită proporţie de produse
necorespunzătoare, denumită fracţiunea defectivă – P. Aceasta se stabileşte ca raport între numărul de
rebuturi din lot (D) şi mărimea lotului (N).
Pe baza mărimii fracţiunii defective, care teoretic poate lua orice valoare între zero şi unu, se apreciază
calitatea lotului. Scopul controlului de recepţie este de a decide dacă această fracţiune defectivă nu depăşeşte
un anumit nivel critic Po, stabilit în funcţie de considerente de ordin economic.
lotul se acceptă dacă P ≤ Po, sau
lotul se respinge dacă P > Po.
Pe măsura îndepărtării de P = 0 (calitatea perfectă) şi a înaintării pe axa fracţiunii defective P spre 1 (calitatea
nulă), are loc o înrăutăţire a calităţii lotului. Probabilitatea de acceptare a lotului este o funcţie
descrescătoare, având valoarea 1 în punctul zero şi fiind nulă în punctul 1.
Modul de operare în cazul aplicării unui plan de control simplu prin măsurare este următorul:
se extrage întâmplător din lotul prezentat la recepţie un eşantion de mărime n;
se măsoară valorile caracteristicii cercetate pentru n unităţi şi se înregistrează valorile acestora: x1, x2, …,
xn;
se calculează la luarea deciziei în funcţie de modul cum este limitată caracteristica de calitate.
3_SONDAJ.doc 5
-6–
Sondajul tipic
Este o variantă recomandată în situaţia în care colectivitatea este grupată sau se poate separa în grupe
distincte bine determinate; din fiecare grupă se extrage un număr fixat de unităţi după schema sondajului
aleator repetat sau nerepetat.
Cel mai frecvent se foloseşte în studiul populaţiei, când aceasta se separă în grupe folosind clasificările
oficiale sau personale în funcţie de scopul cercetării. Dacă stratificarea a fost bine făcută, atunci erorile sunt
mai mici decât dacă aceeaşi colectivitate ar fi fost studiată pe baza unui sondaj simplu.
Principalele variante ale acestui sondaj sunt: sondajul proporţional şi sondajul repetat.
Sondajul tipic proporţional se caracterizează prin faptul că din fiecare grupă tipică se extrag atâtea unităţi
astfel ca raportul dintre numărul lor şi volumul grupei din care s-a extras să fie egal cu raportul dintre
volumul general al eşantionului şi volumul populaţiei generale.
Sondajul tipic optim se caracterizează prin faptul că volumul sondajului de grupă este astfel dimensionat
încât eficienţa să fie maximă. Pentru sondajul tipic optim, numărul unităţilor dintr-o grupă oarecare este
proporţional cu numărul unităţilor din această grupă şi cu abaterea medie pătratică a grupei respective.
Sondajul în serii
3_SONDAJ.doc 6