Management. Statistică Descriptivă
Management. Statistică Descriptivă
Management. Statistică Descriptivă
Statistică descriptivă
II III
2019
UNIVERSITATEA ”BABEŞ-BOLYAI” CLUJ-NAPOCA
FACULTATEA DE ŞTIINŢE ECONOMICE ŞI GESTIUNEA AFACERILOR
ANUL 2 ID
SEMESTRUL 3
Suport de curs ID
STATISTICĂ DESCRIPTIVĂ
Anul 2
Semestrul 3
Cluj-Napoca
Cuprins
Informaţii generale ii
0.1 Date de contact ale titularilor de curs . . . . . . . . . . . . . . . . . . . . . . . . . . . ii
0.2 Obiective . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
0.3 Competenţe profesionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
0.4 Competenţe transversale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
0.5 Materiale bibliografice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
0.6 Elemente de deontologie academică . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
0.7 Studenţi cu dizabilităţi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
1 Serii statistice 1
1.1 Concepte de bază . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Serii de distribuţie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Observarea statistică . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4 Reprezentări grafice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5 Teme de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4 Serii cronologice 69
4.1 Indici statistici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.2 Indicatori medii specifici seriilor cronologice . . . . . . . . . . . . . . . . . . . . . . . . 73
4.3 Componentele unei serii cronologice . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.4 Teme de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
i
Informaţii generale
ii
0.2. Obiective iii
0.2 Obiective
Disciplina Statistică descriptivă ı̂şi propune dobândirea unor cunoştinţe privind definirea unei populaţii
statistice, a variabilelor statistice, obţinerea de informaţii cu privire la fenomenul supus cercetării, or-
ganizarea datelor şi prezentarea acestora sub formă de serii statistice, evidenţierea structurii populaţiei
ı̂n raport cu variabilele observate, evidenţierea evoluţiei unui fenomen ı̂n timp sau spaţiu precum şi
reprezentarea grafică a datelor.
• Utilizarea eficientă a resurselor şi tehnicilor de ı̂nvăţare, pentru dezvoltarea personală şi profe-
sională.
2. Andrei T., Stancu S., Statistică - teorie şi aplicaţii, Ed. ALL, Bucureşti, 1995.
3. Bailly P., Carrere C., Statistiques descriptives: Cours, Ed. PUG, Grenoble, 2007.
4. Bressoud E., Kahane J.C., Gillet R., Statistique descriptive: Applications avec Excel et la calcu-
latrice, Ed. Pearson Education, Paris, 2008.
5. Buiga A., Dragoş C., Lazăr D., Brendea G., Litan C., Mare C., Statistică Descriptivă, Ed.
Napoca Star, Cluj-Napoca, 2018;
6. Delmas B., Statistique descriptive pour l’économie et la gestion, Ed. Presses Universitaires du
Septentrion, Lille, 2009.
7. Jaba E., Statistică descriptivă. Teste grilă şi probleme, Ed. Sedcom Libris Iaşi, 2002.
Serii statistice
Secţiuni
1.1. Concepte de bază
1.2. Serii statistice
1.3. Observarea statistică
1.4. Reprezentări grafice
1.5. Teme de control
Obiective
• definirea unei populaţii statistice, a variabilelor statistice
• obţinerea de informaţii cu privire la fenomenul supus cercetării
• organizarea datelor şi prezentarea acestora sub formă de serii statistice
• evidenţierea structurii populaţiei ı̂n raport cu variabilele observate
• evidenţierea evoluţiei unui fenomen ı̂n timp
Cuvinte cheie
• populaţie statistică, unitate statistică, volum, eşantion, variabilă statistică, observare statistică,
indicator statistic, serie statistică
• observare statistică, serii statistice unidimensionale şi bidimensionale
• reprezentarea grafică a datelor relativ la o variabilă cantitativă, la o variabilă calitativă şi la
două variabile
Rezultate aşteptate
Cunoaşterea şi stăpânirea noţiunilor statistice de bază, cunoaşterea tehnicilor de culegere, grupare
şi prezentare a datelor. Utilizarea indicatorilor statistici cu scopul evidenţierii variaţiei unei mărimi
sau a structurii populaţiei supuse studiului.
1
2 Capitolul 1. Serii statistice
a) După natura lor, variabilele statistice pot fi atributive, de timp sau de spaţiu.
• Variabila atributivă exprimă un atribut sau ı̂nsuşire esenţială (alta, decât timpul sau
spaţiul) unităţilor populaţiei;
• Variabila de timp ne arată timpul ı̂n care au luat fiinţă unităţile populaţiei sau perioada
de timp ı̂n care au existat (există);
• Variabila de spaţiu ne arată spaţiul ı̂n care există sau au luat naştere unităţile populaţiei.
• Variabila cantitativă este variabila ale cărei stări se exprimă prin valori numerice. Se mai
numeşte şi variabilă metrică.
• Variabila calitativă este variabila ale cărei stări se exprimă prin cuvinte sau coduri. Se mai
numeşte variabilă nominală (stările se exprimă prin cuvinte) sau variabilă ordinală (stările
se exprimă prin coduri).
• Variabilă discretă este acea variabilă care ı̂n intervalul său de definiţie ı̂nregistrează cel mult
valori raţionale.
• Variabilă continuă este acea variabilă care poate lua orice valoare reală din intervalul său
de variaţie.
Exemple de variabile statistice relativ la populaţia formată din mulţimea consumatorilor unui
produs:
- vârsta: variabilă atributivă, cantitativă, continuă
Observarea statistică - constă ı̂n identificarea unităţilor populaţiei şi ı̂nregistrarea stărilor va-
riabilelor ı̂n raport cu care este studiată. Ansamblul stărilor variabilelor rezultate prin observare se
numesc statistici.
După gradul de cuprindere al populaţiei statistice, observarea statistică este de două feluri: totală
şi parţială.
• Observarea totală este acel tip de observare statistică ı̂n care are loc ı̂nregistrarea tuturor
unităţilor care fac parte din populaţia statistică supusă studiului. Recensământul populaţiei României
este un exemplu de observare totală.
• Observarea parţială presupune observarea şi ı̂nregistrarea unui anumit număr de unităţi din
populaţie, alese după criterii bine definite.
În cercetarea statistică a unei populaţii punctul de pornire ı̂l poate constitui fie statisticile exha-
ustive rezultate prin observarea populaţiei univers, fie statisticile rezultate din observarea parţială a
unui eşantion à ⊆ A, ı̂n ambele cazuri scopul final fiind acelaşi, respectiv obţinerea de informaţii la
nivelul populaţiei univers A.
Observarea statistică se realizează de obicei prin intermediul chestionarului.
4. În raport cu natura indicatorului din care este alcătuită seria, avem:
Seria statistică redând distribuţia populaţiei ı̂n raport cu una sau mai multe variabile constituie
o descompunere a acesteia ı̂ntr-un număr R de clase. O astfel de serie este formată ı̂n exclusivitate
din frecvenţe (absolute cumulate sau necumulate, relative cumulate sau necumulate) şi de aceea se
numesc serii de frecvenţă, de distribuţie sau de repartiţie. Prescurtat se mai foloseşte şi denumirea de
repartiţie statistică sau distribuţie statistică.
Seria statistică ce redă variaţia unei mărimi ı̂n timp, ı̂n spaţiu sau de la o categorie la alta se
numeşte serie de variaţie.
Prezentăm ı̂n continuare cele mai importante serii statistice:
unde Ni este frecvenţa absolută a clasei i, i = 1, R şi reprezintă numărul de unităţi ale populaţiei
pentru care variabila X a ı̂nregistrat valoarea xi . Remarcăm faptul că volumul populaţiei se poate
exprima cu ajutorul frecvenţelor absolute
N = N1 + N2 + . . . + NR .
Clasa (grupa) de unităţi ı̂n raport cu o variabilă reuneşte acele unităţi din cadrul populaţiei care
ı̂nregistrează aceeaşi stare a variabilei sau stările variabilei aparţinând unui anumit interval de variaţie.
Ca urmare, ı̂n raport cu o variabilă statistică populaţia poate fi structurată ı̂ntr-un anumit număr
de clase.
De asemenea, relativ la seria statistică unidimensională având la bază variabila X, aceasta poate
fi formată cu frecveţe relative, frecvenţe absolute cumulate sau relative cumulate.
1.2. Serii de distribuţie 5
unde fi ne arată ponderea unităţilor din populaţie care au ı̂nregistrat pentru variabila X starea xi :
Ni
fi = , i = 1, R.
N
Pornind de la seria (1.1) se poate deduce seria formată cu frecvenţe absolute cumulate, respectiv:
x1 x2 . . . xi . . . xR
X: (1.3)
Nx1 Nx2 . . . Nxi . . . NxR
unde Nxi reprezintă numărul de unităţi din populaţia studiată pentru care variabila ı̂nregistrează
valori ce nu depăşesc valoarea xi . Avem că:
Nxi = N1 + N2 + . . . + Ni , i = 1, R.
Pornind de la seria (1.1) sau (1.2) se poate deduce seria formată cu frecvenţe relative cumulate,
respectiv:
x1 x2 . . . xi . . . xR
X: (1.4)
Fx1 Fx2 . . . Fxi . . . FxR
unde Fxi exprimă ponderea unităţilor populaţiei studiate pentru care variabila a ı̂nregistrat valori ce
nu depăşesc valoarea xi . Avem că
Nxi
Fxi = f1 + f2 + . . . + fi sau Fxi = · 100%, i = 1, R.
N
- Aplicaţie. Distribuţia clienţilor ı̂n raport cu sortimentele de cafea servite ı̂ntr-o anumită zi la o
cafenea a fost:
a) Identificaţi populaţia statistică, unitatea statistică
Sortiment cafea Nr. clienţi şi volumul populaţiei statistice;
Naturală 21 b) Construiţi seriile de distribuţie unidimensionale cu
Cappuccino 32 frecvenţe derivate;
Espresso 43 c) Caracterizaţi variabila care stă la baza seriilor uni-
dimensionale.
Rezolvare. a) Populaţia statistică este reprezentată ı̂n acest caz de mulţimea clienţilor. Unitatea
statistică este clientul. Volumul populaţiei statistice este N = 21 + 32 + 43 = 96 clienţi.
b) Folosind tabelul de mai sus, se pot construi următoarele
serii:
Naturală Cappuccino Espresso
- Seria unidimensională cu frecvenţe absolute: X : , 96
21 32 43
- Seria unidimensională cu frecvenţe absolute cumulate:
Naturală Cappuccino Espresso Naturală Cappuccino Espresso
X: ⇔X:
21 21 + 32 21 + 32 + 43 21 53 96
6 Capitolul 1. Serii statistice
c) La baza seriilor unidimensionale de mai sus, se află variabila statistică X ce indică sortimentul
de cafea ales de clienţii cafenelei. Variabila X este atributivă şi calitativă.
Nij − reprezintă numărul de unităţi pentru care, variabila X ı̂nregistrează starea xj şi
variabila Y ı̂nregistrează starea yi ;
Ni· − reprezintă numărul de unităţi pentru care Y = yi , indiferent de nivelul ı̂nregistrat
de variabila X;
N·j − reprezintă numărul de unităţi pentru care X = xj , indiferent de nivelul ı̂nregistrat
de variabila Y ;
N − reprezintă numărul total de unităţi analizate, adică volumul populaţiei statistice.
De asemenea se poate elabora sau deduce seria de repartiţie bidimensională formată cu frecvenţe
relative, unde:
Nij Ni· N·j
fij = , fi· = , f·j = , pentru orice i = 1, L, j = 1, K.
N N N
- Aplicaţie. Se consideră repartiţia angajaţilor unei firme de IT din Cluj-Napoca ı̂n funcţie de
venitul lunar (e) şi funcţia deţinută ı̂n firmă:
```
``` Venitul lunar
``` [100 − 500) [500 − 1000) [1000 − 3000)
Funcţia ```
``
Analist − 2 8
P rogramator 13 24 17
Rezolvare. Pentru ı̂nceput, notăm variabilele statistice: X - venitul lunar şi Y - funcţia deţinută.
Rescriem tabelul de mai sus folosind notaţiile convenite şi totalurile aferente:
PP
X
[100 − 500) [500 − 1000) [1000 − 3000)
PP
PP T otal
Y P P
P
Analist − 2 8 10
P rogramator 13 24 17 54
T otal 13 26 25 64
[100 - 500) [500 - 1000) [1000 - 3000)
X/Y =Analist :
- 2 8
[100 - 500) [500 - 1000) [1000 - 3000)
respectiv, X/Y =P rogramator : .
13 24 17
d) Din seria bidimensională cu frecvenţe relative constatăm că 58% din programatori obţin un
venit lunar de cel mult 1000e.
Diferenţa absolută a unei mărimi (∆Y ) exprimă diferenţa dintre nivelul cercetat şi nivelul bază
de comparaţie al mărimii analizate. Se exprimă ı̂n aceeaşi unitate de măsură ı̂n care este cuantificat
fenomenul analizat şi ne arată cu cât s-a modificat acesta de la un nivel la altul.
Indicele statistic al unei mărimi (IY ) exprimă raportul dintre nivelul cercetat şi nivelul bază
de comparaţie al mărimii analizate. Ne arată de câte ori se modifică acea mărime, de la un nivel la
altul.
Diferenţa relativă a unei mărimi (RY ) exprimă raportul dintre diferenţa absolută a mărimii
respective şi nivelul bază de comparaţie al acesteia. Ne arată cu cât la sută se modifică mărimea de
la un nivel la altul.
Indicatorul relativ de intensitate (d) se defineşte ca raport ı̂ntre doi indicatori de nivel de
natură diferită şi arată gradul de răspândire a fenomenului cuantificat de indicatorul de la numărător
ı̂n raport cu fenomenul cuantificat de indicatorul de la numitor. De exemplu: producţia diferitelor
culturi/ha, densitatea populaţiei, producţia principalelor produse/locuitor, rata şomajului, etc.
Serii cronologice
Seria cronologică reflectă evoluţia ı̂n timp a unei mărimi.
Valorile variabilei ca funcţie de timp pot fi fixate la un anumit moment de timp sau să se refere la
un interval de timp.
Seria cronologică de momente este o serie de observaţii ordonate ı̂n timp, exprimând stocuri
[Trebici V., 1985]. De exemplu: volumul populaţiei, numărul de universităti, bănci, instituţii, fonduri
fixe, numărul salariaţilor, ı̂ntreprinderile mici şi mijlocii din diferite domenii de activitate, unităţile
de cazare turistică, etc. Într-o astfel de serie ı̂nsumarea mărimii analizate nu are sens din punct de
vedere al conţinutului, aceasta fiind permisă din considerente de calcul, ajustări etc.
Seria cronologică de intervale este o serie de observaţii ordonate ı̂n timp exprimând fluxuri. De
exemplu: născuţii vii, divorţurile, decesele, producţia diferitelor culturi sau produse, venituri, cheltu-
ieli, producţia industrială, agricolă, exportul, importul etc. Într-o astfel de serie are sens ı̂nsumarea
mărimii analizate.
Fie o serie cronologică de momente sau de intervale ce reflectă evoluţia ı̂n timp a nivelului unei
mărimi Y ,
0 1 2 ... t ... T
Y : (1.6)
y0 y1 y2 . . . yt . . . yT
Pornind de la această serie se pot deduce seriile formate cu diferenţe absolute, indici statistici şi
diferenţe relative. În funcţie de modul de raportare a stărilor variabilei timp t, mărimile de mai sus
se pot calcula cu bază fixă (t/t0 ) (baza de comparaţie rămâne aceeaşi) sau cu bază ı̂n lanţ (t/t − 1)
(baza de comparaţie se schimbă, fiind considerată cea precedentă nivelului comparat).
t/0
unde ∆y = yt − y0 , pentru orice t = 0, T ;
• diferenţe absolute cu bază ı̂n lanţ:
!
0 1 2 ... t ... T
∆yt/t−1 : 1/0 2/1 t/t−1 T /T −1 (1.8)
− ∆y ∆y . . . ∆y . . . ∆y
10 Capitolul 1. Serii statistice
t/t−1
unde ∆y = yt − yt−1 , pentru orice t = 1, T .
Între cele două tipuri de diferenţe absolute cu bază fixă şi cu bază ı̂n lanţ, există relaţii de legătură
ce ne permit exprimarea unora ı̂n funcţie de celelalte. În acest context, ı̂nsumând diferenţele absolute
cu bază ı̂n lanţ se obţin diferenţele absolute cu bază fixă:
Scăzând diferenţele succesive cu bază fixă se obţin diferenţele cu bază ı̂n lanţ:
∆t/0 t−1/0
y − ∆y = yt − y0 − yt−1 + y0 = ∆t/t−1
y .
t/0 yt
unde Iy = (·100%), pentru orice t = 0, T ;
y0
• indici statistici cu bază ı̂n lanţ
!
0 1 2 ... t ... T
Iyt/t−1 : 1/0 2/1 t/t−1 T /T −1 (1.10)
− Iy Iy . . . Iy . . . Iy
t/t−1 yt
unde Iy = (·100%), pentru orice t = 1, T .
yt−1
Între cele două tipuri de indici există următoarele relaţii de legătură:
- Facând produsul indicilor cu bază ı̂n lanţ până la o anumită stare a variabilei t, se obţine indicele
cu bază fixă al clasei respective.
y1 y2 yt
Iy1/0 · Iy2/1 · . . . · Iyt/t−1 = · · ... · = Iyt/0 , pentru orice t = 0, T .
y0 y1 yt−1
- Împărţind doi indici succesivi cu bază fixă se obţine un indice cu bază ı̂n lanţ:
t/0
Iy yt y0 yt
t−1/0
= · = = Iyt/t−1 , pentru orice t = 1, T .
Iy y0 yt−1 yt−1
Indicele statistic ne arată de câte ori se modifică fenomenul analizat. Este mărimea cel mai des
folosită ı̂n caracterizarea evoluţiei fenomenelor din economie.
Având ca bază de referinţa o serie cronologică de forma (1.7) se pot elabora serii formate cu:
1.2. Serii de distribuţie 11
t/0
t/0 ∆y yt − y0 yt
unde Ry = = = − 1 = (I t/0 − 1)(·100%), pentru orice t = 0, T ;
y0 y0 y0
• diferenţe relative cu baza ı̂n lanţ
!
0 1 2 ... t ... T
Ryt/t−1 : 1/0 2/1 t/t−1 T /T −1 (1.12)
− Ry Ry . . . Ry . . . Ry
t/t−1
t/t−1 ∆y yt − yt−1 yt
unde Ry = = = − 1 = (I t/t−1 − 1)(·100%), pentru orice t = 1, T .
yt−1 yt−1 yt−1
Această mărime la fel ca şi indicele statistic, se foloseşte frecvent ı̂n caracterizarea fenomenelor din
economie.
- Aplicaţie. Evoluţia producţiei de grâu (mil. tone) ı̂nregistrată ı̂n România, ı̂n perioada 2013 -
2016 este redată ı̂n seria cronologică de mai jos:
2013 2014 2015 2016
Y :
7,2 7,4 7,8 8,4
Calculaţi si interpretaţi diferenţele absolute, indicii statistici şi diferenţele relative cu bază fixă şi bază
ı̂n lanţ.
Rezolvare. Pentru simplificare, vom interpreta rezultatele doar pentru anul 2016. În mod analog,
se pot face interpretări şi pentru ceilalţi ani.
Seria diferenţelor absolute cu bază fixă este:
t/0 2013 2014 2015 2016 t/0 2013 2014 2015 2016
∆y : ⇔ ∆y :
7, 2 − 7, 2 7, 4 − 7, 2 7, 8 − 7, 2 8, 4 − 7, 2 0 0,2 0,6 1,2
Se observă că producţia din anul 2016 a fost cu 1, 2 mil. tone mai mare decât producţia din anul 2013.
Seria diferenţelor absolute cu bază ı̂n lanţ este:
t/t−1 2013 2014 2015 2016 t/t−1 2013 2014 2015 2016
∆y : ⇔ ∆y :
7, 2−? 7, 4 − 7, 2 7, 8 − 7, 4 8, 4 − 7, 8 − 0,2 0,4 0,6
Se observă că producţia din anul 2016 a fost cu 0, 6 mil. tone mai mare decât producţia din anul 2015.
Seria indicilor statistici cu bază fixă este:
2013 2014 2015 2016 2013 2014 2015 2016
Iyt/0 : 7,2 7,4 7,8 8,4 ⇔ Iy
t/0
:
7,2 7,2 7,2 7,2 1 1,03 1,08 1,17
Se observă că producţia din anul 2016 a fost de 1, 17 ori mai mare decât producţia din anul 2013.
Seria indicilor statistici cu bază ı̂n lanţ este:
2013 2014 2015 2016 2013 2014 2015 2016
Iyt/t−1 : 7,2 7,4 7,8 8,4 ⇔ I t/t−1
y :
? 7,2 7,4 7,8 − 1,028 1,054 1,077
12 Capitolul 1. Serii statistice
Se observă că producţia din anul 2016 a fost de 1, 077 ori mai mare decât producţia din anul 2015.
Seria diferenţelor relative cu bază fixă este:
t/0 2013 2014 2015 2016 t/0 2013 2014 2015 2016
Ry : ⇔ Ry :
1 − 1 1, 03 − 1 1, 08 − 1 1, 17 − 1 0% 3% 8% 17%
Se observă că producţia din anul 2016 a fost cu 17% mai mare decât producţia din anul 2013.
Seria diferenţelor relative cu bază ı̂n lanţ este:
t/t−1 2013 2014 2015 2016 t/t−1 2013 2014 2015 2016
Ry : ⇔ Ry :
1−? 1, 028 − 1 1, 054 − 1 1, 077 − 1 − 2,8% 5,4% 7,7%
Se observă că producţia din anul 2016 a fost cu 7, 7% mai mare decât producţia din anul 2015.
unde:
s /s0
unde: ∆zi = zi − z0 , pentru orice i = 0, K.
• indicii statistici cu bază fixă
!
s/s s0 s1 s2 ... si ... sK
IZ 0 : s /s s /s0 s /s s /s (1.15)
1 Iz 1 0 Iz 2 . . . Iz i 0 . . . Iz K 0
s /s0 zi
unde: Iz i = (·100%), pentru orice i = 0, K.
z0
1.3. Observarea statistică 13
s /s0
s /s0 ∆zi zi − z 0 s /s
unde: Rzi = = = (Iz i 0 − 1)(·100%), pentru orice i = 0, K.
z0 z0
- Aplicaţie. Seria statistică de mai jos arată valorile PIB/loc (e) ı̂n unele state membre ale Uniunii
Europene ı̂n anul 2009.
România Cehia Ungaria Bulgaria Slovacia Slovenia
S:
5900 13000 9100 4600 12600 18200
Calculaţi şi interpretaţi parametrii specifici seriilor de spaţiu.
Constatăm că PIB/loc al Bulgariei a fost mai mic cu 1300e faţă de PIB/loc al României.
Seria formată cu indicii statistici cu bază fixă este:
s/s0 România Cehia Ungaria Bulgaria Slovacia Slovenia
IS :
1 2,20 1,54 0,78 2,14 3,08
Constatăm că PIB/loc al Sloveniei a fost de 3, 08 ori mai mare faţă de PIB/loc al României.
Seria formată cu diferenţe relative cu bază fixă este:
s/s0 România Cehia Ungaria Bulgaria Slovacia Slovenia
RS :
0% 120% 54% -22% 114% 208%
Constatăm că PIB/loc al Sloveniei a fost cu 208% mai mare faţă de PIB/loc al României.
trebuie să fie esenţiale şi să prezinte interes din punct de vedere al studiului ı̂ntreprins. În al treilea
rând, trebuie stabilite criterii exacte pentru delimitarea corectă a unităţilor statistice care alcătuiesc
populaţia. Şi nu ı̂n ultimul rând, dacă observarea şi ı̂nregistrarea datelor este făcută de mai multe
persoane, este necesar ca acestea să se alinieze unei metodologii unitare pentru a asigura corectitudinea
necesară datelor rezultate.
Observarea statistică, ca primă etapă ı̂ntr-un studiu de cercetare, presupune: specificarea unităţilor
statistice care trebuie să fie urmărite şi ı̂nregistrate, alegerea variabilelor statistice care caracterizează
cel mai bine populaţia şi care răspund obiectivului urmărit, ı̂nregistrarea stărilor variabilelor statistice
considerate.
Atingerea scopului cercetării statistice presupune rezolvarea următoarelor probleme care să asigure
o pregătire ştiinţifică a observării statistice:
- delimitarea populaţiei supuse observării;
- definirea unităţilor statistice de observat;
- timpul şi locul unde va avea loc observarea;
- programul observării;
- alegerea purtătorilor de informaţie;
- pregătirea persoanelor ce urmează să facă observarea.
Fiecăreia din aceste probleme trebuie să i se acorde importanţa cuvenită, fiindcă fiecare dintre
ele conduce la o pregătire cât mai completă a observării, de rezultatele căreia depinde corectitudinea
celorlalte etape ale cercetării statistice.
Delimitarea populaţiei supuse observării faţă de alte populaţii statistice cu care aceasta se află ı̂n
legătură se realizează prin evidenţierea ı̂nsuşirilor şi trăsăturilor comune ce caracterizează populaţia
supusă studiului.
Definirea unităţilor statistice de observat presupune claritate şi precizie pentru a nu da loc confuzi-
ilor. În momentul observării trebuie cunoscut exact care sunt unităţile statistice ce trebuie ı̂nregistrate
ı̂n raport cu variabilele de studiat.
Stabilirea timpului şi a locului unde va avea loc observarea are importanţă din punct de vedere a
comparabilităţii datelor rezultate din observare. Noţiunea de timp al observării are ı̂n statistică două
accepţiuni:
- momentul sau perioada la care se referă datele ı̂nregistrate (timpul de referinţă);
- durata observării.
Locul observării reprezintă punctul din spaţiu ı̂n care se derulează procesul supus cercetării (incinta
unei ı̂ntreprinderi, a unui magazin, o localitate ı̂n cazul ı̂n care populaţia o reprezintă familiile, etc.).
În cadrul programului observării statistice trebuie stabilite variabilele statistice care urmează să fie
studiate ı̂n populaţia de cercetat. Alegerea şi definirea variabilelor statistice trebuie să fie ı̂n consens
cu natura populaţiei şi obiectivul cercetării statistice ı̂ntreprinse. Variabilele statistice care fac parte
din programul cercetării trebuie să surprindă aspectele esenţiale, să expliciteze fenomenul sau procesul
studiat, să permită prelucrarea şi generalizarea acestora la nivelul ı̂ntregii populaţii.
Alegerea purtătorilor de informaţie se face ı̂n funcţie de volumul datelor ce urmează a fi ı̂nregistrate.
Purtătorii de informaţie reprezintă suporţii materiali pe care se ı̂nregistrează datele din observarea
unităţilor statistice.
Observarea statistică se poate desfăşura ı̂n diverse forme ı̂n raport cu: natura proceselor social-
economice de studiat, obiectivul cercetării, formele de organizare cât şi posibilităţile practice de
urmărire şi ı̂nregistrare a unităţilor statistice din populaţie.
După cum se ştie, ı̂n raport cu gradul de cuprindere al populaţiei considerate avem: observarea
totală şi observarea parţială. Observarea totală permite ı̂nregistrarea, ı̂n raport cu variabilele statistice
a tuturor unităţilor statistice din populaţie. Implicând un volum mare de muncă, antrenează, de obicei,
un număr de persoane şi durează mult timp. Ca urmare se creează condiţii pentru apariţia de erori
1.3. Observarea statistică 15
de observare, ceea ce va conduce la micşorarea eficienţei observării. Forma cea mai frecventă de
observare totală o constituie recensământul populaţiei. Observarea totală se practică şi ı̂n domeniul
controlului tehnicii de calitate, ı̂n cazul produselor de ı̂naltă tehnicitate, cum ar fi: televizoare, maşini
de spălat, frigidere, automobile, etc. Este necesară o observare totală ı̂n acest caz, deoarece constatarea
defecţiunilor de către cumpărători ar implica cheltuieli mult mai mari cu remedierea acestora ı̂n
comparaţie cu organizarea unei observări totale a loturilor de produse ce urmează a fi scoase pe
piaţă.
În cazul altor produse, unde cheltuielile legate de remedierea defectelor sunt nesemnificative, este
suficientă realizarea unor observări parţiale prin care să se asigure că rebuturile nu depăşesc un anumit
procent admis. O astfel de observare, care include doar o parte din unităţile populaţiei supuse studiului
corespunde observării parţiale. Observarea parţială constituie o alternativă la observarea totală ı̂n
cazul populaţiilor infinite sau chiar dacă sunt finite prin observare are loc distrugerea acestora. Având
la bază procedeul observării parţiale se pot evalua rezervele de ţiţei, cărbune sau alte minerale, se
poate evalua masa de material lemnos din fondul silvic al unei zone sau la nivelul ı̂ntregii ţări. În
general, observarea parţială se recomandă ı̂n toate cazurile ı̂n care se consideră mai avantajoasă decât
observarea totală.
Eşantionul, ca rezultat al observării parţiale, presupune respectarea cu stricteţe a principiului
reprezentativităţii, ı̂n conformitate cu care fiecare unitate statistică din populaţia generală să aibă
aceeaşi şansă de a face parte din eşantion. Asigurarea respectării principiului reprezentativităţii ı̂n
formarea eşantionului de observat permite acestuia o structură foarte apropiată cu cea a populaţiei
din care a fost format. Aceasta ne asigură, cu o anumită probabilitate dinainte fixată, că rezultatele
obţinute la nivelul eşantionului pot fi extinse la nivelul ı̂ntregii populaţii. În raport cu legea de
probabilitate urmată de variabilele urmărite ı̂n populaţia generală sunt două tipuri de eşantioane:
eşantioane de volum mare şi eşantioane de volum redus.
Observarea statistică ı̂n raport cu procedeul folosit este de două feluri:
- observarea directă;
- observarea indirectă.
Observarea directă presupune o observare nemijlocită a unităţilor din populaţie, care sunt prevăzute
pentru cercetare. Acest mod de observare se realizează printr-un contact direct cu unităţile statistice,
fie prin măsurare, fie prin interogare, dacă unităţile sunt persoane. Acest procedeu permite observato-
rului perceperea nemijlocită a fenomenelor luate ı̂n studiu ı̂n vederea măsurării nivelelor ı̂nregistrate
de variabilele considerate.
Observarea indirectă presupune un intermediar ı̂ntre unităţile care urmează să fie supuse observării
şi observator. Intermediarul poate fi un document special conceput ı̂n vederea observării şi atunci
observarea este pe bază de document sau intermediarul poate fi o altă persoană decât observatorul,
caz ı̂n care avem observare prin interogare.
Suportul pentru culegerea datelor ı̂l reprezintă chestionarul.
Deoarece ı̂n prelucrarea statistică primul pas ı̂l constituie prezentarea datelor observate sub formă
de serie (tabel), pentru construirea seriilor statistice se aleg variabilele care trebuie să fie ı̂n strânsă
dependenţă cu scopul cercetării şi cu natura fenomenului cercetat. Odată precizate variabilele de la
baza seriei, se ştie care va fi conţinutul primului şir de date şi ca urmare este elucidat criteriul ı̂n
raport cu care informaţiile rezultate din observare vor fi ordonate, necunoscându-se ı̂nsă cum se face
propriu-zis ordonarea şi cum se completează primul şir al seriei.
Operaţia de stabilire a claselor presupune ı̂mpărţirea unităţilor unei populaţii ı̂n clase distincte ı̂n
raport cu una sau mai multe variabile şi aranjarea claselor rezultate ı̂ntr-o anumită ordine. În urma
unei asemenea operaţii, fiecare unitate trebuie să se găsească ı̂n una şi numai una din clasele rezultate.
Această operaţie nu trebuie să conducă la pierderi de unităţi, regăsindu-se ı̂nsa ı̂ntr-o altă ordine decât
cea după care s-a realizat observarea.
Omogenitatea constituie o proprietate de bază pe care trebuie să o aibă clasele. Se spune că o clasă
este omogenă dacă, pentru unităţile care fac parte din ea, variabila de grupare ı̂nregistrează variaţii
nesemnificative.
În cele ce urmează se va prezenta operaţia de stabilire a claselor ı̂n cazul unei serii unidimensionale.
Dacă la baza seriei avem o variabilă calitativă, atunci clasele se stabilesc ı̂n raport cu stările
acesteia. Pentru fiecare stare a variabilei se va construi o clasă. Ca urmare, ı̂n acest caz, ı̂ntr-o clasă
vor intra toate unităţile care au ı̂nregistrat aceeaşi stare ı̂n timpul observării ı̂n raport cu variabila
considerată.
În cazul unei serii care are la bază o variabilă cantitativă discretă (numărul stărilor nu este prea
mare), clasele se stabilesc ı̂n mod asemănător ca şi la variabilele calitative, respectiv:
x1 x2 . . . x R
X: .
N1 N2 . . . NR
În condiţiile ı̂n care cercetarea populaţiei presupune elaborarea unei serii care are la bază o variabilă
cantitativă continuă sau o variabilă cantitativă discretă, dar care ı̂n populaţia considerată ı̂nregistrează
un număr prea mare de stări, clasele nu se mai pot stabili cu ajutorul stărilor variabilei. Pentru
asemenea cazuri, gruparea unităţilor populaţiei ı̂n clase se face cu ajutorul intervalelor de grupare
(variaţie), fiecare interval cuprinzând un număr oarecare de valori ale variabilei. Ca urmare, pentru o
serie continuă, clasele se definesc cu ajutorul intervalelor de grupare.
Două probleme se pun ı̂n cazul elaborării unei serii care are la bază o variabilă cantitativă continuă:
• determinarea lungimii intervalelor de variaţie;
• stabilirea formei de scriere a intervalelor de variaţie.
Determinarea lungimii intervalelor de variaţie conduce la două situaţii:
• serii construite cu intervale de lungime egală;
• serii construite cu intervale de lungime diferită.
Stabilirea numărului de intervale de variaţie trebuie să asigure satisfacerea următoarelor condiţii:
- informaţia care se pierde ı̂n urma operaţiei de grupare să nu fie prea mare, iar populaţia să nu
fie prea farâmiţată ı̂n raport cu variabilele de grupare;
- media aritmetică a fiecarei grupe (ı̂n raport cu valorile ı̂nregistrate) sa fie cât mai aproape de
centrul intervalului de variaţie respectiv;
- să nu existe grupe vide;
- reprezentarea grafică a seriei rezultate să permită conturarea unei regularităţi a fenomenului de
studiat din cadrul populaţiei. Trebuie remarcat că acest lucru nu este posibil nici ı̂n cazul unui număr
mic de intervale deoarece se pierd prea multe date, nici ı̂n cazul unui număr prea mare de intervale,
populaţia farâmiţându-se prea tare.
1.3. Observarea statistică 17
Dacă se doreşte elaborarea unei serii cu intervale de lungime egală, mai ı̂ntâi se va calcula lungimea
unui interval (λ), raportând ı̂ntregul interval de variaţie ([xmin , xmax ]) la numărul de intervale (R), ce
se doresc a fi obţinute. Mai precis,
xmax − xmin
λ= .
R
Se stabilesc apoi intervalele având ca punct de pornire valoarea minimă. Se elaborează seria de
intervale de lungime egală după cum urmează:
[xmin , xmin + λ] . . . [xmin + (i − 1)λ, xmin + iλ] . . . [xmin + (R − 1)λ, xmin + Rλ]
X: .
N1 ... Ni ... NR
Nu ı̂ntotdeauna ı̂mpărţirea domeniului de variaţie al variabilei ı̂n intervale de lungime egală este
relevantă din punct de vedere al scopului urmărit ı̂n ceea ce priveşte reliefarea tipurilor calitative din
cadrul populaţiei cercetate. Numeroase sunt cazurile practice ı̂n care studiul unei populaţii ı̂n raport
cu o variabilă sau mai multe presupune ı̂mpărţirea domeniilor de variaţie ale acestora ı̂n intervale de
lungime neegală. În asemenea cazuri nu există o relaţie de calcul ı̂n acest sens. Stabilirea intervalelor
de variaţie se face ı̂n directă legătură cu variaţia variabilelor şi distribuirea unităţilor ı̂n raport cu
acestea.
Dacă la baza seriei ı̂n cauză stau două sau mai multe variabile calitative sau cantitative atunci
clasele se stabilesc ı̂n raport cu fiecare din variabilele considerate prin stările acestora (vezi seria (1.5)).
Nu este recomandat ca numărul variabilelor ı̂n raport cu care se studiază populaţia să fie prea
mare, deoarece aceasta duce la o divizare exagerată a populaţiei pierzându-se din vedere aspectele
principale.
După ce clasele au fost definite, are loc repartizarea unităţilor populaţiei ı̂n clasele respective,
folosind ı̂n acest scop un algoritm adecvat.
Pentru elaborarea şi prezentarea seriilor statistice se apelează la pachete de programe statistice
cum ar fi: S.P.S.S. (Statistical Package for the Social Sciences), STATISTICA, S.A.S. (Statistical
Analysis System), STATGRAPHICS, etc.
- Aplicaţie. Managerul unui site informatic a contorizat numărul de tranzacţii online efectuate de
utilizatori pentru achiziţionarea unor produse. În decursul unei luni, numărul de tranzacţii efectuate
pe zi a fost: 31, 27, 12, 32, 34, 33, 33, 22, 27, 15, 31, 37, 43, 23, 25, 27, 41, 39, 11, 14, 21, 37, 24,
19, 30, 28, 34, 20, 27, 33. Construiţi o serie unidimensională continuă, cu frecvenţe absolute, care să
grupeze tranzacţiile efectuate ı̂n patru clase.
Rezolvare. Pentru ı̂nceput, vom ordona crescător şirul tranzacţiilor efectuate. Fie X variabila
statistică ce indică numărul de tranzacţii efectuate ı̂ntr-o zi. Stările variabilei X, ordonate crescător,
sunt: 11, 12, 14, 15, 19, 20, 21, 22, 23, 24, 25, 27, 27, 27, 27, 28, 30, 31, 31, 32, 33, 33, 33, 34, 34, 37,
37, 39, 41, 43.
Dorim să construim o serie statistică formată cu R = 4 clase (intervale). Cunoaştem valoarea
minimă xmin = 11 şi valoarea maximă xmax = 43. Lungimea unui interval este:
xmax − xmin 43 − 11
λ= = = 8.
R 4
Obţinem seria unidimensională continuă
[11, 19) [19, 27) [27, 35) [35, 43]
X: , 30.
4 7 14 5
18 Capitolul 1. Serii statistice
Histograma
Graficul specific seriilor care au la bază o variabilă continuă (de intervale) este histograma. Aceasta
se construieşte ı̂ntr-un sistem de axe rectangulare după cum urmează: pe abscisă se trec intervalele de
variaţie, iar pe ordonată se trasează scara frecvenţelor. Scara frecvenţelor se construieşte ı̂n confor-
mitate cu respectarea principiului proporţionalităţii ı̂ntre frecvenţe şi segmentele delimitate pe scara
ordonatelor. Pentru fiecare interval de variaţie al seriei [xi−1 , xi ) se construieşte un dreptunghi a cărui
bază este chiar lungimea intervalului, iar cealaltă latură se determină din condiţia proporţionalităţii
ariei dreptunghiului cu mărimea indicatorului ı̂n clasa respectivă.
1.4. Reprezentări grafice 19
Li · li = k · Ni (1.17)
unde:
li = latura cunoscută a dreptunghiului cores-
punzător intervalului (xi−1 , xi );
Li = latura necunoscută a dreptunghiului co-
respunzător intervalului (xi−1 , xi );
Ni = frecvenţa absolută a clasei i;
k = coeficient de proporţionalitate care se
alege ı̂n raport cu scara de reprezentare.
- Aplicaţie. Se consideră repartiţia salariaţilor unei ı̂ntreprinderi ı̂n raport cu vechimea ı̂n muncă:
[0, 10) [10, 20) [20, 30) [30, 40) [40, 50]
V : , 50.
10 8 14 12 6
Rezolvare. Pentru fiecare interval de variaţie a vechimii ı̂n muncă, vom calcula mai ı̂ntâi lungimea
intervalului. Avem: l1 = 10 − 0 = 10; l2 = 20 − 10 = 10; l3 = 30 − 20 = 10; l4 = 40 − 30 = 10;
l5 = 50 − 40 = 10.
Alegem factorul de proporţionalitate k = 10 şi folosind formula (1.18) găsim:
20 Capitolul 1. Serii statistice
k · N1 10 · 10
L1 = = = 10
l1 10
k · N2 10 · 8
L2 = = =8
l2 10
k · N3 10 · 14
L3 = = = 14
l3 10
k · N4 10 · 12
L4 = = = 12
l4 10
k · N5 10 · 6
L5 = = =6
l5 10
Figura 1.2: Distribuţia salariaţilor ı̂n funcţie
de vechimea ı̂n muncă
- Aplicaţie. La un magazin alimentar, ı̂n decursul unei luni, s-au ı̂nregistrat următoarele date
privind consumul de ciocolată: 32 clienţi au cumpărat ciocolată M ilka, 40 clienţi ciocolată P oiana
şi 17 clienţi ciocolată Heidi. De asemenea, privind consumul de cafea, s-a constatat că: 50 clienţi
au cumpărat cafea Jacobs, 20 clienţi cafea T schibo, 10 clienţi cafea Amaroy. Reprezentaţi grafic
distribuţia clienţilor ı̂n raport cu ciocolata, respectiv cafeaua cumpărată.
Rezolvare. Pentru distribuţia clienţilor ı̂n raport cu sortimentul de ciocolată ales vom utiliza dia-
grama cu coloane, iar pentru distribuţia clienţilor ı̂n raport cu sortimentul de cafea ales vom utiliza
diagrama cu benzi.
1.4. Reprezentări grafice 21
Cercul de structură
Cercul de structură permite punerea ı̂n evidenţă sub formă grafică a structurii unei populaţii
statistice.
Se construieşte un cerc de rază oarecare, a cărui suprafaţă se consideră că reprezintă volumul
ı̂ntregii populaţii ı̂n cauză (exprimat ı̂n frecvenţe absolute sau relative).
Fiecare clasă ı̂n care este divizată populaţia supusă studiului este reprezentată printr-un sector de
cerc de arie direct proporţională cu volumul clasei. Trasarea sectorului de cerc presupune determinarea
măsurii ı̂n grade a unghiurilor la centru a fiecărui sector. Unghiul la centru de 360◦ corespunde
volumului ı̂ntregii populaţii. Unghiurile sectoarelor de cerc care reprezintă clase din populaţie trebuie
să fie proporţionale cu volumul acestora (exprimat ı̂n frecvenţe absolute sau relative). clasei respective.
Fie, de exemplu, seria de distribuţie unidimensională formată cu frecvenţe absolute:
x1 x2 . . . xi . . . xR
X: , N.
N1 N2 . . . Ni . . . NR
Fie αi unghiul la centru corespunzător sectorului aferent clasei i, de volum Ni . Atunci:
360◦ · Ni
αi = = 360◦ · fi , i = 1, R (1.19)
N
22 Capitolul 1. Serii statistice
- Aplicaţie. În urma alegerilor parlamentare pentru Camera Deputaţilor din anul 2016, partidele
politice din România au obţinut următoarele rezultate privind voturile valabil exprimate:
P SD PNL U SR U DM R ALDE PMP P RU P RM
45% 21% 10% 8% 6% 5% 3% 2%
Reprezentaţi grafic structura voturilor valabil exprimate pentru fiecare partid politic.
Cronograma (historiograma)
O categorie foarte importantă de serii o constituie seriile cronologice, a căror reprezentare grafică
se realizează prin intermediul cronogramei. Trasarea unei cronograme se realizează ı̂ntr-un sistem de
axe rectangulare.
Fie seria cronologică:
0 1 2 ... t ... T
Y : ,
y0 y1 y2 . . . yt . . . yT
unde: t = 0, T , reprezintă momentele (sau perioadele) de timp care se reprezintă pe axa absciselor, iar
mărimile yt se reprezintă pe axa ordonatelor. Fiecărei perechi de valori (t, yt ), t = 0, T ı̂i corespunde
un punct ı̂n planul axelor rectangulare. Unind prin segmente de dreaptă punctele consecutive astfel
determinate, se obţine ceea ce se numeşte cronogramă. În acelaşi sistem de axe pot fi reprezentate
una sau mai multe serii cronologice, care pot fi exprimate ı̂n aceeaşi unitate de măsură sau ı̂n unităţi
de măsură diferite. Cronogramele asociate unor serii cronologice ne permit compararea fenomenelor
surprinse de asemenea serii şi sesizarea perioadelor critice ı̂n evoluţia acestora.
- Aplicaţie. Conform datelor Institutului Naţional de Statistică (IN S), evoluţia producţiei de ţiţei
(mii tone) din România, ı̂n perioada 2010-2015, este redată ı̂n tabelul de mai jos:
Rezolvare. Cronograma aferentă producţiei de ţiţei din România, ı̂n perioada 2010-2015 este următoarea:
Norul de puncte
Norul de puncte constituie o modalitate de reprezentare grafică a seriilor atributive de distribuţie
bidimensionale. Se consideră o serie bidimensională de repartiţie ı̂n raport cu variabilele discrete X şi
Y . În sistemul de axe rectangulare xOy se marchează toate punctele de coordonate (xi , yj ), i = 1, L,
j = 1, K pentru care frecvenţele Nij 6= 0. Mărimea acestor frecvenţe se poate marca pe grafic ı̂n două
moduri:
- dacă frecvenţele sunt mici, atunci pentru fiecare punct de pe grafic (xi , yj ), i = 1, L, j = 1, K
pentru care Nij 6= 0, se marchează atâtea puncte de câte ori se repetă perechea respectivă.
- dacă ı̂nsă frecvenţele sunt prea mari, pentru marcarea lor pe grafic se pot utiliza diagrame areale
prin cercuri ale căror arii trebuie sa fie proporţionale cu rădăcina pătrată a frecvenţelor pe care le
reprezintă.
În cazul ı̂n care cele două variabile X şi Y sunt continue, ı̂ntrucât la intersecţia a două intervale
se formează o rubrică (căsuţă), frecvenţele diferite de zero se reprezintă ı̂n interiorul acestei rubrici,
fie prin puncte, fie prin diagrame areale cu respectarea unuia din cele două moduri de elaborare mai
sus amintite.
- Aplicaţie. Un produs a fost lansat simultan pe 13 pieţe. Pe aceste pieţe, produsul a fost propus la
preţuri diferite (P ), veniturile consumatorilor fiind şi ele diferite. Pentru fiecare piaţă s-a ı̂nregistrat
un anumit nivel al cererii (C), rezultatele fiind sintetizate ı̂n tabelul următor:
N r. crt. 1 2 3 4 5 6 7 8 9 10 11 12 13
C 15, 4 3, 2 4, 9 10, 5 8, 0 5, 1 7, 6 11, 3 14, 0 6, 4 13, 2 8, 8 12, 1
P 1, 4 5, 1 2, 5 1, 7 1, 8 3, 4 2, 1 1, 6 3, 6 3, 5 1, 9 1, 8 1, 9
Rezolvare. Folosind datele ı̂nregistrate pentru preţ şi cerere, se poate construi următorul nor de
puncte:
P2. Să se extragă din Anuarul Statistic sau alte surse informaţionale o serie statistică bidimensională
ce redă distribuţia unei populaţii ı̂n raport cu două variabile atributive, relativ la care se cere:
P3. Din Anuarul Statistic sau alte surse informaţionale extrageţi o serie statistică de repartiţie, având
la bază o variabilă de spaţiu, relativ la care se cere:
P4. Din Anuarul Statistic sau alte surse informaţionale extrageţi două serii cronologice având la bază
indicatorul de nivel, una de momente, alta de intervale şi deduceţi seriile formate cu diferenţe
absolute, indici statistici, diferenţe relative, cu bază fixă şi cu bază ı̂n lanţ (interpretări).
P5. Dati cinci exemple de serii cronologice având la bază indicatorul relativ de intensitate.
P6. Din Anuarul Statistic sau alte surse informaţionale extrageţi o serie de spaţiu formată cu indica-
tor de nivel sau indicator relativ de intensitate şi deduceţi seriile formate cu diferenţe absolute,
indici şi diferenţe relative, calculate cu bază fixă. Interpretare.
P7. Extrageţi cinci exemple de serii de spaţiu ce conţin informaţii importante pentru domeniul
economic.
P8. Luând ca exemplu o populaţie statistică studiată ı̂n raport cu un anumit număr de variabile
(stabilite ı̂n raport cu obiectivul studiului), se cere:
Bibliografie:
1. Buiga A., Metodologie de sondaj şi analiza datelor ı̂n studiile de piaţă, Ed. Presa Universitară
Clujeană, Cluj-Napoca, 2001;
2. Buiga A., Dragoş C., Lazăr D., Parpucea I., Todea A., Statistică I, Ed. Presa Universitară
Clujeană, Cluj-Napoca, 2003;
3. Buiga A., Dragoş C., Lazăr D., Brendea G., Litan C., Mare C., Statistică Descriptivă, Ed.
Napoca Star, Cluj-Napoca, 2018;
4. Florea I., Parpucea I., Buiga A., Statistică descriptivă, Ed. Continental, Cluj-Napoca, 1998.
Capitolul 2
Parametrii repartiţiilor
unidimensionale
Secţiuni
2.1. Parametrii tendinţei centrale
2.2. Parametrii de structură
2.3. Parametrii variaţiei
2.4. Parametrii formei
2.5. Parametrii concentrării
2.6. Teme de control
Obiective
• Cunoaşterea şi ı̂nţelegerea modului de calcul şi a semnificaţiei parametrilor statistici
• Ilustrarea trăsăturilor esenţiale care caracterizează fenomenele social-economice
• Cunoaşterea şi măsurarea variaţiei unei mărimi ı̂n raport cu nivelul mediu al acesteia
Cuvinte cheie
• valoare medie, valoare mediană, valoare modală
• quantilă, quartilă, decilă, centilă
• variaţie, dispersie, abatere medie pătratică
• asimetrie, boltire
• energie informaţională
Rezultate aşteptate
Cunoaşterea modului de calcul şi a semnificaţiei parametrilor tendinţei centrale, a gradului de
reprezentativitate a mediei, respectiv a medianei, analiza structurii unei populaţii şi formularea unei
concluzii privind forma distribuţiei unei populaţii.
27
28 Capitolul 2. Parametrii repartiţiilor unidimensionale
v Valoarea medie
Valoarea medie reprezintă principalul parametru care caracterizează tendinţa centrală a unei
repartiţii statistice.
În vederea definirii parametrului valoarea medie se consideră o populaţie statistică studiată ı̂n
raport cu variabila cantitativă X şi o funcţie G(x1 , x2 , . . . , xR ) unde xi , i = 1, R , reprezintă stările
variabilei X. Funcţia G exprimă o anumită ı̂nsuşire esenţială, un atribut al populaţiei ı̂n raport cu
variabila X. Această funcţie se numeşte funcţie determinantă.
Prin definiţie, valoarea medie X a variabilei X este parametrul care lasă invariantă funcţia deter-
minantă, adică:
semnificând numărul total de copii din localitatea respectivă. Pentru a găsi numărul mediu de copii
pe familie se particularizează relaţia (2.1) după cum urmează
R
X R
X
xi · Ni = X · Ni
i=1 i=1
2.1. Parametrii tendinţei centrale 29
de unde rezultă:
R
X
xi · Ni
i=1
X= R
X
Ni
i=1
La acelaşi rezultat se putea ajunge pornind de la faptul că numărul mediu de copii pe familie se
poate exprima ca un raport ı̂ntre numărul total de copii şi numărul de familii din localitatea respectivă,
adică:
N r. total de copii
X= (2.2)
N r. de f amilii
În acest exemplu, fenomenul fiind de natură demografică, volumul acestuia se cuantifică prin
numărul total de copii la nivelul populaţiei statistice considerate. Aceasta este ı̂n directă concordanţă
cu natura şi semnificaţia variabilei ı̂n raport cu care se face cercetarea statistică.
Cunoaşterea ”naturii” parametrului valoare medie, conduce la o definiţie mai completă şi plină de
semnificaţie.
Pentru a ı̂nţelege semnificaţia valorii medii X, trebuie subliniat faptul că, ı̂n general, variaţia unui
fenomen, de orice natură, şi ı̂n particular variaţia unei variabile X ı̂n raport cu care este cercetată
o populaţie, este determinată de acţiunea simultană a două categorii de factori: factori esenţiali şi
factori neesenţiali.
În categoria factorilor esenţiali intră acei factori care acţionează asupra tuturor unităţilor populaţiei
ı̂n mod continuu şi ı̂n acelaşi sens, determinând, ı̂n principal, nivelul de dezvoltare a variabilei pentru
fiecare unitate componentă din populaţie.
Factorii esenţiali se conjugă ı̂n acţiunea lor cu factorii neesenţiali, care, ı̂n general, au un caracter
aleator, sunt numeroşi şi neuniform raspândiţi printre unităţile populaţiei.
Fiecare din factorii consideraţi neesenţiali acţionează numai asupra unui anumit număr de unităţi
din populaţie. Ca urmare, aceştia pot contribui fie la creşterea nivelului variabilei (pentru unele unităţi
din populaţie), fie la scăderea nivelului variabilei (pentru alte unităţi din populaţie).
La rândul lor factorii esenţiali nu acţionează cu aceeaşi intensitate asupra tuturor unităţilor din
cadrul populaţiei considerate, determinând, ı̂n acest fel, variaţia neuniformă a variabilei respective ı̂n
cadrul populaţiei.
În consens cu cele subliniate mai sus, se poate afirma că parametrul valoarea medie a unei serii
statistice care are la bază variabila X, constituie acel nivel pe care l-ar putea ı̂nregistra variabila ı̂n
cadrul populaţiei cercetate ı̂n condiţiile ı̂n care factorii neesenţiali nu s-ar fi manifestat, iar factorii
esenţiali ar fi acţionat asupra unităţilor din populaţie cu aceeaşi intensitate.
Parametrul valoarea medie, calculat pentru o serie statistică, pune ı̂n evidenţă ceea ce este comun,
general şi esenţial sub aspectul nivelului de dezvoltare al variabilei, ı̂n raport cu care este studiată o
populaţie.
În raport cu natura variabilei ce stă la baza seriei, cât şi a formei de prezentare a indicatorilor cu
care aceasta este construită, există mai multe posibilităţi de calcul a valorii medii.
Funcţia determinata G, sub forma sa cea mai generală, are următoarea expresie analitică:
R
X 1
k
G(x1 , x2 , . . . , xR ) = xki · fi (2.3)
i=1
Pentru diverse valori ale lui k, ı̂n strictă concordanţă cu conţinutul şi semnificaţia functi̧ei G, se
ı̂ntâlnesc mai multe tipuri de medii:
30 Capitolul 2. Parametrii repartiţiilor unidimensionale
În caz concret, valoarea medie reală X este aceea care se obţine prin indicatorul (mediu) rezultat
fie prin aplicarea criteriului relaţiei determinante, fie criteriului raportului.
1. Media aritmetică
Acesta este indicatorul cel mai utilizat ı̂n calculul parametrului valoare medie a unei serii statistice,
aşa cum rezultă din practica statistică.
Pentru o serie statistică de distribuţie cu frecvenţe absolute
x1 x2 . . . xi . . . xR
X:
N1 N2 . . . Ni . . . NR
În mod analog, pentru o serie statistică continuă de distribuţie cu frecvenţe relative
[x1 , x2 ) [x2 , x3 ) . . . [xi , xi+1 ) . . . [xR , xR+1 ]
X:
f1 f2 ... fi ... fR
2. Media armonică
În cazul unei serii discrete de forma (2.8), media armonică notată cu X −1 se defineste prin:
R
X
Ni
i=1
X −1 = R
(2.9)
X 1
· Ni
xi
i=1
Şi ı̂n acest caz, dacă ponderile sunt egale, se obţine relaţia de calcul a mediei armonice simple, de
forma:
R
X −1 = R (2.12)
X 1
mi
i=1
3. Media geometrică
Pentru o serie care are la bază variabila discretă X, formată cu frecvenţe absolute, media geometrică
notată cu Xg (sau Xo ) este definită prin expresia:
q
NR
xN N2
N
1 · x2 · . . . · xR
1
Xg = (2.13)
Din relaţia (2.13) pentru media geometrică ponderată exprimată cu frecvenţe relative se deduce:
q R
Y 1 R Ni R
N
xfi i
NR Ni
Y Y
N1
N N2
Xg = x1 · x2 · . . . · xR = xi = xiN = (2.14)
i=1 i=1 i=1
Dacă variabila X, de la baza seriei este de variaţie continuă, atunci relaţiile de calcul pentru diversele
variante de medie geometrică, rămân valabile cu singura modificare că valorile xi , i = 1, R, se ı̂nlocuiesc
cu mijloacele intervalelor de variaţie, calculate conform formulei:
xi + xi+1
mi = , i = 1, R. (2.15)
2
v Valoarea mediană
Valoarea mediană, notată cu Me este acea valoare a variabilei cantitative X care ı̂mparte repartiţia
ı̂n două parţi egale, respectiv:
N N
FN (Me ) = sau N (Me ) = (2.16)
2 2
Calculul valorii mediane se face diferenţiat, după cum seria are la bază o variabilă discretă sau continuă.
Pentru o repartiţie discretă, calculul medianei nu implică probleme deosebite şi nici un volum mare
de calcule.
Se consideră o repartiţie cu frecvenţe absolute:
x1 x2 . . . xi . . . xR
X:
N1 N2 . . . Ni . . . NR
În calculul valorii mediane a unei serii discrete, pot apărea două situaţii:
a) volumul N al populaţiei este un număr impar;
b) volumul N al populaţiei este un număr par.
În ambele cazuri, calculul medianei presupune, ı̂n prima fază, determinarea rangului medianei,
notat cu rMe , conform următoarei relaţii:
R
1 X
rMe = · Ni = N (Me ) (2.17)
2
i=1
2.1. Parametrii tendinţei centrale 33
a) Daca volumul populaţiei N este un număr impar, rangul medianei este un număr zecimal a
cărui parte ı̂ntreagă N2 indică numărul de unităţi din populaţie pentru care variabila X a ı̂nregistrat
valori
N
mai mici ca mediana. Ca urmare, Me trebuie să fie valoarea imediat următoare celei de rang
2 adică:
Me = x N (2.18)
2
+1
b) Daca volumul populaţiei este un număr par, rangul medianei este un număr ı̂ntreg şi ca urmare
la mijlocul seriei nu se mai află o valoare a variabilei X cu care să coincidă mediana, ci se găsesc
două valori, mediana calculându-se ı̂n acest caz ca medie aritmetică a acestora. Relaţia de calcul a
medianei, ı̂n acest caz, este:
x N + x N
2 2
+1
Me = (2.19)
2
Pentru o repartiţie continuă, calculul valorii mediane presupune verificarea egalităţii (2.16) şi ca
urmare, trebuie cunoscută densitatea de repartiţie f (x). Determinarea funcţiei f (x) implică un volum
mare de calcule şi deci, din acest motiv, ı̂n activitatea practică f (x) este aproximat. Acest lucru
va conduce la o expresie aproximativă de calcul a valorii mediane, care necesită un volum redus de
calcule.
Să considerăm o repartiţie continuă ı̂n raport cu variabila X, şi anume:
[x1 , x2 ) [x2 , x3 ) . . . [xi , xi+1 ) . . . [xR , xR+1 ]
X:
N1 N2 ... Ni ... NR
unde intervalele [xi , xi+1 ), i = 1, R, pot fi de lungime egală sau neegală. Calcularea rangului medianei
va permite stabilirea intervalului ı̂n care se află valoarea mediană, interval numit şi interval median.
Se cumulează frecvenţele absolute din aproape ı̂n aproape până ce este ı̂ndeplinită inegalitatea:
N
N1 + N2 + . . . + Ni ≥
2
Ultima frecvenţă Ni cumulată, ne permite să indicăm intervalul median [xi , xi+1 ).
Formula aproximativă de calcul a medianei este:
N (Me ) − N (xi−1 )
Me = x i + · (xi+1 − xi ) (2.20)
Ni
v Valoarea modală
Valoarea modală Mo (X) a unei repartiţii reprezintă aceea valoare a variabilei X căreia ı̂i corespunde
frecvenţa cea mai mare.
Acest parametru se mai numeşte modul, valoare dominantă sau modă şi se notează cu Mo .
Mod de calcul:
a) Pentru o serie de repartiţie discretă, dată sub forma
x1 x2 . . . xi . . . xR
X:
f1 f2 . . . fi . . . fR
valoarea modală se citeşte direct din serie, nefiind nevoie de nicio tehnică sau formulă de calcul. În
cazul acestui tip de serie, valoarea modală va fi acea valoare a variabilei X pentru care frecvenţa este
cea mai mare.
34 Capitolul 2. Parametrii repartiţiilor unidimensionale
O serie poate avea o singură valoare modală, caz ı̂n care seria se numeşte serie unimodală. Dacă o
serie are mai multe valori modale, atunci se numeşte serie plurimodală. O serie plurimodală evidenţiază
faptul că populaţia ı̂n cauză este neomogenă. Calculul valorii modale, ı̂n asemenea cazuri, presupune
o delimitare mai riguroasă a obiectului observării cât şi a populaţiei care urmează să fie studiată. O
altă cale, care poate duce la eliminarea unui asemenea neajuns, o constituie comasarea a două câte
două sau trei câte trei intervale, etc., până se ajunge la o serie unimodală.
În cazul unei serii simetrice valoarea modală coincide cu valoarea medie şi cu mediana. Pentru
serii uşor asimetrice, K. Pearson a stabilit următoarea relaţie ı̂ntre cei trei parametri:
Mo = X − 3(X − Me )
- Aplicaţie. Numărul vizitatorilor unui muzeu, ı̂n mai multe zile consecutive ale unei luni, a fost:
12, 13, 32, 24, 31, 15, 17, 11, 42, 44, 19, 33, 15.
a) Identificaţi populaţia statistică, unitatea statistică şi volumul populaţiei statistice;
b) Calculaţi şi interpretaţi parametrii tendinţei centrale.
Rezolvare. a) Pentru ı̂nceput, să remarcăm faptul că valorile date ı̂n enunţul problemei sunt aferente
unei variabile statistice care indică numărul de vizitatori.
Populaţia statistică este reprezentată de mulţimea zilelor, unitatea statistică este ziua, iar volumul
populaţiei statistice este 13 (avem 13 valori ı̂n enunţul problemei, fiecare valoare fiind ı̂nregistrată
ı̂ntr-o anumită zi).
b) Fie X variabila care indică numărul de vizitatori.
Valoarea medie pentru X este :
12 + 13 + 32 + 24 + 31 + 15 + 17 + 11 + 42 + 44 + 19 + 33 + 15
X= = 23, 69.
13
2.1. Parametrii tendinţei centrale 35
11, 12, 13, 15, 15, 17, 19, 24, 31, 32, 33, 42, 44.
N 13
Calculăm rangul medianei RMe = 2 = 2 = 6, 5. Valoarea medianei este:
În jumătate din zile, numărul vizitatorilor a fost ı̂ntre 11 şi 19 persoane, ı̂n timp ce ı̂n restul zilelor,
muzeul a avut ı̂ntre 19 şi 44 vizitatori.
Pentru a calcula valoarea modală, căutăm valorile lui X care au frecvenţa de apariţie cea mai mare.
Observăm ca valoarea 15 apare de două ori, ı̂n timp ce restul valorilor au frecvenţa 1. Deci valoarea
modală este Mo = 15. În majoritatea zilelor, muzeul a avut 15 vizitatori.
- Aplicaţie. Distribuţia salariaţilor unei firme ı̂n funcţie de salariul lunar (sute lei) este redată ı̂n
seria statistică de mai jos:
[10, 20) [20, 40) [40, 80) [80, 100]
S: , 24
3 7 11 3
a) Caracterizaţi variabila statistică de la baza seriei de mai sus;
b) Calculaţi şi interpretaţi parametrii tendinţei centrale.
Rezolvare. a) Variabila statistică S, aflată la baza seriei din enunţul problemei, este o variabilă
atributivă, cantitativă, continuă, având ca valori intervalele de salar lunar ale salariaţilor firmei.
b) Pentru a determina valoarea medie, vom calcula mai intâi mijloacele intervalelor din seria de
salarii. Pentru un interval [a, b), mijlocul se obţine cu formula m = a+b 2 . Avem:
15 30 60 90
!
S : [10, 20) [20, 40) [40, 80) [80, 100] , 24
3 7 11 3
Valoarea medie este:
15 · 3 + 30 · 7 + 60 · 11 + 90 · 3
X= = 49, 37.
24
Fiecare angajat al firmei obţine lunar un venit mediu de 4937 lei.
Pentru a calcula valoarea mediană, parcurgem următoarele etape:
• calculăm rangul medianei: rM e = N2 = 24
2 = 12.
• căutăm frecvenţa Ni pentru care
N1 + N2 + . . . + Ni ≥ rMe . (2.22)
3 ≥ 12, fals
3 + 7 ≥ 12, fals
3 + 7 + 11 ≥ 12, adevărat
Deci, Ni = 11, adică este ultima frecvenţă pe care am adăugat-o ca să obţinem inegalitatea (2.22)
adevărată.
36 Capitolul 2. Parametrii repartiţiilor unidimensionale
Frecvente sunt cazurile când este necesară studierea structurii unei populaţii ı̂n raport cu o variabilă
sau alta. Parametrii statistici, ı̂n forma cea mai generală, folosiţi ı̂n caracterizarea structurii unei
populaţii poartă denumirea de valori quantile.
Valorile quantile ale unei serii de repartiţie unidimensionale sunt acele mărimi ı̂nregistrate de
variabila X, care ı̂mpart seria ı̂n n părţi egale (mai precis ı̂mparte populaţia ı̂n n părţi egale). În acest
caz se vor calcula p quantile (p = n − 1).
Pentru o serie continuă, a cărei densitate de probabilitate f (x) este cunoscută, următoarea egalitate
este satisfăcută de cele p quantile:
Z q1 Z q2 Z xn
1
f (x)dx = f (x)dx = . . . = f (x)dx = (2.23)
x1 q1 qn−1 n
Pentru calculul valorii quantile de ordinul p (p = 1, n − 1), ı̂n prima etapă trebuie determinat rangul
acesteia:
N
rqp = N (qp ) = p · (2.25)
n
Se disting două cazuri:
a) dacă p · N se divide cu n atunci quantila de ordin p se calculează ca o medie aritmetică simplă
a valorilor variabilei X, de ordinul rangului şi al rangului majorat cu o unitate, după cum urmează:
xrqp + xrqp +1
qp = (2.26)
2
b) dacă p · N nu se divide cu n atunci quantila de ordin p este egală cu acea valoare a variabilei X
corespunzătoare părţii ı̂ntregi a rangului majorat cu 1:
qp = xrqp +1 (2.27)
În cazul seriilor care au la bază o variabilă continuă, conform definiţiei, cele n − 1 quantile trebuie
să satisfacă relaţia (2.23). Determinarea quantilelor din asemenea egalităţi ar presupune cunoaşterea
densităţii de probabilitate f (x). Ori ı̂n activitatea practică f (x) se aproximează prin diverse procedee,
implicând un volum exagerat de calcule.
În vederea găsirii unor formule aproximative de calcul a quantilei de ordin p (p = 1, n − 1) se
consideră o serie de variaţie continuă, ale cărei intervale de variaţie nu trebuie să fie neapărat egale ca
lungime:
[x1 , x2 ) [x2 , x3 ) . . . [xi , xi+1 ) . . . [xR , xR+1 ]
X: (2.28)
N1 N2 ... Ni ... NR
În prima etapă se determină rangul quantilei de ordinul p (p = 1, n − 1) conform următoarei relaţii:
R
1 X
rqp = N (qp ) = p · · Ni (2.29)
n
i=1
Cunoscând rangul, se poate identifica intervalul ı̂n care se află quantila de ordinul p, numit şi intervalul
quantilei de ordinul p (p = 1, n − 1). Cumulând frecvenţele pe clase pâna la egalarea sau depăşirea
rangului, conform inegalităţii:
N1 + N2 + . . . + Ni ≥ rqp (2.30)
ultima frecvenţa adunată Ni va corespunde intervalului [xi , xi+1 ) ı̂n care se află quantila de ordinul p
(p = 1, n − 1). Prin urmare, quantila de ordinul p, notată qp , se calculează conform relaţiei:
rqp − N (xi−1 )
qp = xi + · (xi+1 − xi ) (2.31)
Ni
38 Capitolul 2. Parametrii repartiţiilor unidimensionale
Procedeul de determinare a quantilei de ordinul p (p = 1, n − 1) este acelaşi şi ı̂n cazul ı̂n care
seria (2.28) este formată din frecvenţe relative.
Caracterizarea structurii unei serii se poate face utilizând diverse cazuri particulare de valori quantile.
Valoarea mediană (Me ) este şi un parametru de structură obţinându-se ca un caz particular de
quantilă, când n = 2. Dacă pentru o serie se cunoaşte Me (quantila de ordinul 2), atunci structura
populaţiei poate fi redată astfel:
xmin − Me Me − xmax
X: (2.32)
50% 50%
semnificând faptul că jumatate din populaţia supusă studiului a ı̂nregistrat pentru variabila X valori
cuprinse ı̂ntre valoarea minimă a lui X şi mediană, iar cealaltă jumătate din populaţie a ı̂nregistrat
pentru X valori cuprinse ı̂ntre mediană şi valoarea maximă a lui X.
Valorile quartile reprezintă acel caz particular al valorilor quantile pentru care n = 4. Cele trei
quartile, care se obţin, notate: Q1 , Q2 şi Q3 sunt acei parametri de structură care ı̂mpart populaţia
ı̂n patru părţi egale.
În raport cu mediana, quartila ı̂ntâi Q1 , se numeşte quartila mică (inferioară), quartila a doua Q2
coincide cu mediana şi se numeşte quartila mijlocie, iar quartila a treia Q3 se numeşte quartila mare
(superioară).
Cunoscându-se cele trei quartile, rezultă următoarea structură a populaţiei ı̂n raport cu variabila X:
xmin − Q1 Q1 − Q2 Q2 − Q3 Q3 − xmax
X: (2.33)
25% 25% 25% 25%
ceea ce semnifică o structurare a populaţiei supusă studiului ı̂n patru părţi egale. Aceasta ı̂nseamnă că
25% din unităţile populaţiei ı̂nregistrează valori pentru variabila X mai mici decât quartila mică, 25%
din unităţile populaţiei ı̂nregistrează valori, ı̂n raport cu aceeaşi variabilă X, cuprinse ı̂ntre quartila
mică şi cea mijlocie, 25% vor avea valori cuprinse ı̂ntre quartila mijlocie şi quartila mare, iar restul
de 25% din unităţile populaţiei vor avea valorile pentru variabila X cuprinse ı̂ntre quartila mare şi
valoarea maximă a lui X.
- Aplicaţie. Se consideră distribuţia unor hoteluri ı̂n funcţie de categoria de confort (număr de
stele):
a) Caracterizaţi structura hotelurilor folosind valorile quartile;
1 2 3 4 5 b) Calculaţi şi interpretaţi prima şi ultima decilă;
X: , 54
12 14 10 15 3 c) Calculaţi şi interpretaţi centila 78.
Rezolvare. a) Quartilele ı̂mpart populaţia statistică ı̂n 4 părti egale. Deci n = 4. Numărul hotelu-
rilor analizate este N = 54.
Rangul quartilei mici este rQ1 = p · N 54
n = 1 · 4 = 13, 5, iar valoarea quartilei mici este
N 54
Rangul quartilei mijlocii este rQ2 = p · n =2· 4 = 27, iar valoarea quartilei mijlocii este
N 54
Rangul quartilei mari este rQ3 = p · n =3· 4 = 40, 5, iar valoarea quartilei mari este
Deducem că 25% din hoteluri au cel mult 2 stele categorie de confort, 50% din hoteluri au ı̂ntre 1 şi
3 stele categorie de confort, iar 75% din hoteluri au cel mult 4 stele categorie de confort.
b) Valorile decile ı̂mpart populaţia statistică ı̂n zece părţi egale, fiecare parte reprezentând 10% din
populaţia statistică. În total, sunt nouă decile, notate de obicei cu d1 , d2 , . . ., d9 .
Rangul primei decile este rd1 = p · N 54
n = 1 · 10 = 5, 4, iar valoarea primei decile este
Aşadar, 90% din hoteluri au cel mult patru stele categorie de confort.
c) Valorile centile ı̂mpart populaţia statistică ı̂n o sută de părţi egale, fiecare parte reprezentând 1%
din populaţia statistică. În total, sunt 99 de centile, notate de obicei cu c1 , c2 , . . ., c99 .
Rangul centile 78 este rc78 = p · N 54
n = 78 · 100 = 42, 12, iar valoarea centilei 78 este
Aşadar, 78% din hoteluri au cel mult patru stele categorie de confort.
Observaţie: Avem următoarele egalităţi pentru valoarea mediană: Me = Q2 = d5 = c50 .
Studiul unor populaţii statistice prezintă importanţă numai din punct de vedere al unor mărimi care
variază de la o unitate la alta sau de la un grup de unităţi la altul.
Valorile ı̂nregistrate de o variabilă cantitativă, ı̂n raport cu care este studiată o populaţie, se
datorează acţiunii diferiţilor factori esenţiali şi neesenţiali.
Intensitatea diferită cu care se pot manifesta factorii esenţiali cât şi sensul contrar cu care pot
acţiona factorii neesenţiali ı̂n raport cu fiecare unitate, provoacă nivele diferite ı̂nregistrate de variabile
ı̂n raport cu care este studiată populaţia.
Problema măsurării variaţiei unei variabile cantitative este importantă pentru a vedea ı̂n ce măsură
valoarea medie a acesteia poate reprezenta ı̂ntrega populaţie.
Dacă abaterile de la valoarea medie sunt neesenţiale atunci se poate afirma că populaţia este
omogenă şi că acest parametru poate reprezenta tendinţa centrală, iar dacă aceste abateri sunt mari
atunci populaţia este eterogenă şi valoarea medie nu are capacitatea de a reprezenta populaţia.
Pentru unele serii, valoarea medie nu se poate calcula. În asemenea cazuri, parametrul valoarea
mediăna poate să-i ia locul. Aceeaşi problemă se pune şi ı̂n acest caz, de a vedea ı̂n ce măsură valoarea
mediană este sau nu reprezentativă pentru populaţia ı̂n cauză.
40 Capitolul 2. Parametrii repartiţiilor unidimensionale
O altă problemă care nu se poate rezolva fără a studia şi măsura variaţia ı̂nregistrată de o variabilă
ı̂n raport cu care este studiată o populaţie, o constituie verificarea de ipoteze. În activitatea practică,
de multe ori pornind de la valorile unor parametrii calculaţi pe baza datelor culese relativ la un număr
mic de unităţi, este necesar a fi extinşi la nivelul ı̂ntregii populaţii sau de a se verifica anumite ipoteze
statistice.
Parametrii variaţiei se pot calcula atât sub formă absolută cât şi relativă, şi măsoară ı̂mpraştierea
valorilor unei variabile cantitative faţă de valoarea medie sau valoarea mediană.
Ca urmare, ı̂n funcţie de elementul de referinţă folosit ı̂n măsurarea variaţiei, deosebim:
- parametrii variaţiei ı̂n raport cu valoarea medie;
- parametrii variaţiei ı̂n raport cu valoarea mediană.
dx = M |X − X| (2.34)
Dacă seria are la bază o variabilă continuă şi se cunoaşte f (x), atunci abaterea medie liniară se
calculează astfel: Z xR
dx = |x − X| · f (x)dx (2.36)
x1
Densitatea de probabilitate f (x) se poate aproxima cu densitatea empirică şi atunci pentru abaterea
medie liniară se pot obţine relaţii de calcul aproximativ, frecvent utilizate ı̂n activitatea practică, de
forma:
X R
|mi − X| · Ni R
i=1
X
dx = R
sau dx = |mi − X| · fi (2.37)
i=1
X
Ni
i=1
după cum seria ı̂n cauză este formată cu frecvenţe absolute sau relative, unde:
xi + xi+1
mi = , i = 1, R
2
este mijlocul intervalului i.
Acest parametru serveşte caracterizării sintetice a gradului de reprezentativitate a valorii medii,
aratând cu cât se abate ı̂n medie orice valoare a variabilei X de la valoarea medie X, ı̂ntr-un sens sau
altul.
2.3. Parametrii variaţiei 41
Sub formă relativă, acest indicator poartă denumirea de coeficient simplu de variaţie şi se calculează
conform relaţiei:
dx
Vx = · 100 (2.38)
X
Coeficientul simplu de variaţie (Vx ) arată cu cât se abate ı̂n medie orice valoare a variabilei X de la
valoarea medie echivalentă cu 1 sau 100%. Calculat pentru două serii diferite, se poate aprecia gradul
de reprezentativitate a celor două medii. Se apreciază ca fiind mai reprezentativă acea valoare medie
pentru care coeficientul simplu de variaţie este mai mic.
Parametrul abaterea medie liniară, ı̂n formă absolută sau relativă, prezintă unele deficienţe de-
oarece nu este suficient de sensibil la abaterile mici, adăugându-se şi unele inconveniente de natură
teoretică, generate de exprimarea abaterilor ı̂n valoarea absolută.
Înlăturarea acestor deficienţe se poate realiza apelând la un nou parametru privind măsurarea
variaţiei, numit abatarea medie pătratică.
Acest indicator este utilizat atât pentru caracterizarea gradului de reprezentativitate a valorii medii
cât şi ı̂n scopul estimării unor parametri necunoscuţi.
Abaterea medie pătratică, notată cu σx , se defineşte ca fiind media pătratică a abaterilor valorilor
variabilei X, de la valoarea medie X, adică:
q
σx = M (X − X)2 (2.39)
Un calcul intermediar ı̂n aflarea acestui parametru, ı̂l constituie calcularea pătratului abaterii medii
pătratice, care se numeşte dispersie sau varianţă şi care are următoarea expresie de calcul:
În cazul unei serii care are la bază o variabilă X continuă, varianţa se calculează conform următoarei
relaţii: Z xR
σx2 = (x − X)2 · f (x)dx (2.42)
x1
Parametrul abatere medie pătratică se poate exprima şi sub formă relativă, caz ı̂n care se numeşte
coeficientul de variaţie a lui Pearson şi se notează cu Vx . Expresia de calcul este:
σx
Vx = · 100% (2.43)
X
şi reprezintă abaterea medie a oricărei valori a variabilei X de la valoarea medie, considerată egală cu
1 sau 100.
Coeficientul de variaţie a lui Pearson calculat pentru două sau mai multe serii, poate fi folosit ı̂n
aprecieri comparative privind gradul de reprezentativitate a valorii medii calculate.
Deoarece gradul de reprezentativitate a valorii medii este ı̂n raport invers cu mărimea coeficientului
de variaţie a lui Pearson, se poate afirma, ı̂n cazul mai multor serii, că este mai reprezentativă valoarea
medie a acelei serii pentru care Vx este mai mic.
În concluzie, trebuie reţinut că parametrul abatere medie pătratică sub forma absolută σx şi sub
formă relativă Vx sunt indicatori fundamentali utilizaţi ı̂n măsurarea variaţiei unei variabile.
Atât abaterea medie liniară, cât şi abaterea medie pătratică constituie o măsură a variaţiei medii,
primul o medie de ordinul unu, iar al doilea o medie de ordinul doi (dx ≤ σx ).
Abaterea interquartilă
Abaterea interquartilă, prin definiţie, este media aritmetică simplă a segmentelor Me − Q1 şi
Q3 − Me , respectiv:
Me − Q1 + Q3 − Me Q3 − Q1
Q= = (2.44)
2 2
şi arată cu cât se abat ı̂n medie, ı̂n plus sau ı̂n minus, de la mediană, cele 50% din valorile variabilei
cuprinse ı̂ntre Q1 şi Q3 .
Forma relativă a acestui indicator notat cu Qr este:
Q Q3 − Q1
Qr = · 100% = · 100% (2.45)
Me 2 · Me
Qr se numeşte coeficient de variaţie interquartilic şi arată cu cât se abat ı̂n medie de la mediană
(considerată egală cu 100), valorile variabilei ı̂nregistrate pentru cele 50% din unităţile populaţiei
cuprinse ı̂ntre Q1 şi Q3 .
Ca atare, se apreciază că ı̂mprăştierea unităţilor ı̂n cadrul populaţiei studiate este cu atât mai
mare, ı̂n raport cu variabila de studiat, cu cât abaterea interquartilă ı̂n valoarea absolută (2.44) sau
relativă (2.45) este mai mare.
Abaterea interquantilă
Cu cât abaterea interquantilică (relativă sau absolută) este mai mică, cu atât valoarea mediană este
mai reprezentativă.
- Aplicaţie. În decursul unui an, veniturile (mii lei) ı̂nregistrate de mai multe magazine dintr-un
oraş au fost: 50, 45, 22, 13, 20.
a) În ce măsură se abat valorile veniturilor de la venitul mediu ?
b) Este venitul mediu reprezentativ pentru magazinele analizate ?
Rezolvare. Fie X variabila statistică pentru venit. Venitul mediu ı̂nregistrat de fiecare magazin
este:
50 + 45 + 22 + 13 + 20
X= = 30.
5
a) Calculăm dispersia veniturilor:
2 (50 − 30)2 + (45 − 30)2 + (22 − 30)2 + (13 − 30)2 + (20 − 30)2
σX = = 215, 6
5
iar abaterea medie pătratică este:
q p
σX 2 =
= σX 215, 6 = 14, 68.
Din aplicaţiile practice, precum şi din alte surse, s-au constatat că graficele pot avea diverse forme,
dintre care: formă de clopot, forma literei U , J, L sau alte forme. Ceea ce prezintă importanţă,
nefiind surprins de niciun parametru prezentat, ı̂l constituie modul de repartizare a valorilor variabilei
de o parte şi de alta a valorii medii, considerată şi centrul de greutate al seriei. Acest lucru nu
ı̂nseamnă altceva decât evidenţierea acelei curbe care aproximează cel mai bine conturul poligonal al
seriei respective şi ı̂n acelaşi timp o imagine mai clară asupra gradului de reprezentativitate a valorii
medii.
În marea majoritate a cazurilor, distribuţia unităţilor unei populaţii se face după un clopot (după
legea normală a lui Gauss). Dar unităţile nu se distribuie uniform ı̂n jurul valorii medii, ceea ce poate
conduce la ı̂nclinaţii ı̂ntr-o direcţie sau alta a valorii medii. Această distribuire neuniformă poate
conduce la cazul când diferite serii (diferit distribuite ı̂n jurul valorii medii) să aibă aceeaşi medie,
acelaşi σ şi totuşi o curbă să fie mai aplatizată decât cealaltă, simetrică sau mai puţin simetrică.
Evidenţierea acestor diferenţe poate fi realizată cu ajutorul parametrilor formei.
Parametrii formei unei serii de repartiţie, după conţinut, se clasifică ı̂n două grupe:
44 Capitolul 2. Parametrii repartiţiilor unidimensionale
- parametrii asimetriei;
- parametrii boltirii.
v Parametrii asimetriei
Asimetria unei serii se defineşte ı̂n raport cu dispunerea unităţilor ı̂ntr-o parte sau alta a valorii
medii.
În acest sens, o serie de repartiţie este simetrică ı̂n raport cu media sa dacă frecvenţele valorilor
variabilei X egal depărtate de valoarea medie sunt egale ı̂ntre ele, adică:
f (X − σ) = f (X + σ)
oricare ar fi σ astfel ı̂ncât X − σ şi X + σ să se afle printre valorile lui X.
Observaţie: Un alt coeficient utilizat pentru studiul asimetriei distribuţiei valorilor unei variabile
statistice X, este coeficientul de asimetrie al lui Pearson
X − Mo
α= .
σX
Acest coeficient are aceleaşi interpretări ca şi cele ale coeficientului de asimetrie al lui Fisher.
v Parametrii boltirii
Aprecierea boltirii unei serii este utilă ı̂n caracterizarea gradului de reprezentativitate a valorii
medii cât şi pentru compararea reprezentativităţii a două sau mai multe valori medii ce reprezintă
serii diferite.
Parametrul M (X − X)4 oferă o caracterizare numerică sub formă absolută a gradului de boltire
al unei serii. Sub formă relativă, gradul de boltire se măsoară cu parametrul:
M (X − X)4
β4 = 4 (2.50)
σX
2.4. Parametrii formei 45
Pentru a ı̂nţelege semnificaţia boltirii unei serii, se consideră două serii statistice care au la bază
variabilele X şi Y , iar X = Y şi σX = σY .
Mai presupunem, ı̂n plus, că cele două distribuţii au formă de clopot pentru care α3X = α3Y , adica
ambele sunt simetrice. Deşi s-ar părea că cele două serii nu au nimic care să le deosebească, totuşi
reprezentându-le grafic rezultă două curbe de forma:
unde graficul lui X este mai ı̂nalt, iar al lui Y mai plat. Ca urmare, se observă că cele două serii nu
sunt caracterizate de aceeaşi boltire.
Boltirea unei serii este utilă pentru a da o caracetrizare mai exactă reprezentativităţii valorii medii.
În cazul exemplului prezentat mai sus, atât mediile cât şi abaterile medii pătratice sunt egale şi
ca urmare, coeficientul de variaţie al lui Pearson este acelaşi pentru cele două serii. Deci rezultă că
ambele valori medii prezintă acelaşi grad de reprezentativitate. Cu toate acestea, graficele celor două
serii contrazic concluzia dedusă ı̂n urma comparării celor doi coeficienţi de variaţie.
Valoarea medie cea mai reprezentativă este ı̂n seria ı̂n care cele mai multe unităţi ale populaţiei
cercetate au ı̂nregistrat valori mai apropiate de valoarea medie. Pentru o astfel de serie, ı̂mprăştierea
faţă de valoarea medie fiind mică, graficul are o formă mai ascuţită ı̂n cazul seriei X şi mai plată ı̂n
cazul seriei Y .
Nivelul boltirii pentru o serie oarecare dată se măsoară cu ajutorul parametrului β4 , a cărui expresie
de calcul este dată de relaţia (2.50). Valoarea lui β4 pentru o distribuţie normală este egală cu 3. Pentru
orice altă curbă corespunzătoare unei serii date şi aproximată cu un clopot, raportul ı̂ntre momentul
centrat de ordinul patru şi pătratul momentului centrat de ordinul al doilea, este un număr diferit de
3, curba respectivă fiind mai ascuţită sau mai plată decât curba normală a lui Gauss.
Comparând gradul de boltire al unei serii oarecare şi gradul de boltire al clopotului lui Gauss,
Fisher a stabilit următoarea expresie de calcul al coeficientului boltirii, notat cu β40 :
M (X − X)4
β40 = 4 − 3 sau β40 = β4 − 3
σX
expresie cunoscută ı̂n literatura de specialitate sub denumirea de exces al seriei.
Următoarele cazuri sunt semnificative cu privire la aprecierea boltirii unei serii:
- dacă β40 = 0 (adică β4 = 3) atunci seria ı̂n cauză prezintă aceeaşi boltire cu a curbei normale
(excesul este nul);
46 Capitolul 2. Parametrii repartiţiilor unidimensionale
- dacă β40 > 0 (adică β4 > 3) atunci boltirea corespunzătoare curbei respective este mai ı̂naltă şi
mai ascuţită decât curba normală (serie leptokurtică);
- dacă β40 < 0 (adică β4 < 3) atunci boltirea corespunzătoare curbei respective este mai plată (mai
joasă şi mai largă) decât curba normală (serie platikurtică).
Asimetria şi boltirea joacă un rol ı̂nsemnat ı̂n caracterizarea formei unei serii atributive de repartiţie.
Cu ajutorul parametrilor prezentaţi poate fi formată o imagine mai clară asupra unei serii deja con-
struite, asupra măsurii ı̂n care seria respectivă poate fi reprezentată de valoarea sa medie.
- Aplicaţie. Distribuţia apartamentelor unui imobil, ı̂n raport cu numărul de camere, este redată
ı̂n tabelul de mai jos. Calculaţi şi interpretaţi parametrii formei distribuţiei.
Rezolvare. Considerăm variabila cantitativă X, care indică numărul de camere. Distribuţia varia-
bilei X este:
1 2 3
X: , 30
4 20 6
1·4+2·20+3·6
Pentru variabila X avem valoarea medie: X = 30 = 2, 066, modala M o = 2, dispersia
Observăm că α3 > 0, deci avem o asimetrie uşor pozitivă (de dreapta).
Coeficientul de boltire al lui Fisher:
(1−2,066)4 ·4+(2−2,066)4 ·20+(3−2,066)4 ·6
M (X − X)4 30
β4 = 4 = = 3, 0008
σX 0, 57344
iar β40 = β4 − 3 = 0, 0008 Observăm că β4 > 0, deci distribuţia este uşor leptokurtică.
0
Observaţie: În cazul aplicaţiei de mai sus, observăm că X = Me = Mo , iar α3 , β4 → 0. În acest caz,
spunem că distribuţia variabilei X urmează legea normală. Distribuţia are forma clopotului lui Gauss.
2.5. Parametrii concentrării 47
Energia informaţională
Acest parametru a fost introdus de Acad. Octav Onicescu. Prin definiţie:
R
X
E= fi2 (2.51)
i=1
unde s-a notat cu E energia informaţională. Este un parametru utilizat ı̂n cazul ı̂n care seria are la
bază o variabilă nenumerică.
În cazul unei populaţii caracterizată de un grad de concentrare maxim, va exista o clasă care va
avea frecvenţa relativă egală cu 1, iar celelalte vor avea frecvenţele relative 0 şi ca urmare: Emax = 1.
Dacă populaţia este caracterizată de o concentrare minimă, atunci:
x x . . . xR
X : 11 12
R R . . . R1
iar
1 1
Emax = R · = (2.52)
R2 R
Se observă că:
1
≤E≤1
R
Forma relativă a acestui parametru, notată cu Er , se deduce astfel:
R
X 1
1 fi2 −
E− R
Er = R = i=1
(2.53)
1 1
1− 1−
R R
de unde:
0 ≤ Er ≤ 1
Referitor la populaţia dată, studiată ı̂n raport cu o variabilă X, se calculează Er , iar dacă:
- Er se apropie de 1, atunci populaţia respectivă este caracterizată de un grad ı̂nalt de concentrare;
- Er se apropie de 0, populaţia ı̂n cauză se caracterizează printr-o concentrare minimă.
- Aplicaţie. În urma unui sondaj efectuat la un magazin privind calitatea unui anumit produs, s-au
obţinut următoarele rezultate: 20% din clienţi s-au declarat nesatisfăcuţi de produs, 50% satisfăcuţi,
ı̂n timp ce restul au fost foarte satisfăcuţi. Analizaţi gradul de concentrare al clienţilor ı̂n raport cu
nivelul de calitate al produsului.
Rezolvare. Fie variabila statistică S care indică nivelul de satisfacţie al clienţilor privind calitatea
produsului. În raport cu variabila S, distribuţia clienţilor este:
Nesatisfăcuţi Satisfăcuţi Foarte satisfăcuţi
S: , 100%
20% 50% 30%
Valoarea energiei informaţionale este:
E − R1 0, 38 − 1
3
Er = 1 = = 0, 07.
1− R 1 − 13
P1. Alegeţi două variabile (una cantitativă, cealaltă calitativă) şi construiţi repartiţia populaţiei ı̂n
raport cu fiecare dintre ele;
P2. Calculaţi şi interpretaţi corespunzător parametrii tendinţei centrale (valoarea medie, mediană,
modală) pentru seria care are la bază variabila cantitativă;
P3. Analizaţi reprezentativitatea parametrilor tendinţei centrale (sub formă absolută şi relativă);
P4. Folosind parametrii de structură analizaţi structura populaţiei ı̂n raport cu variabila cantitativă;
P5. Analizaţi gradul de dispersare al unităţilor populaţiei ı̂n raport cu variabila cantitativă;
P6. Caracterizaţi sintetic concentrarea unităţilor din populaţie folosind variabila nenumerică;
Bibliografie:
1. Buiga A., Metodologie de sondaj şi analiza datelor ı̂n studiile de piaţă, Ed. Presa Universitară
Clujeană, Cluj-Napoca, 2001;
2. Buiga A., Dragoş C., Lazăr D., Parpucea I., Todea A., Statistică I, Ed. Presa Universitară
Clujeană, Cluj-Napoca, 2003;
3. Buiga A., Dragoş C., Lazăr D., Brendea G., Litan C., Mare C., Statistică Descriptivă, Ed.
Napoca Star, Cluj-Napoca, 2018;
4. Florea I., Parpucea I., Buiga A., Statisticıa descriptivă, Ed. Continental, Cluj-Napoca, 1998.
Capitolul 3
Secţiuni
3.1. Analiza legăturii dintre variabile calitative
3.2. Analiza legăturii dintre variabile ordinale
3.3. Analiza legăturii dintre variabile cantitative
3.4. Funcţii de regresie
3.5. Teme de control
Obiective
• Însuşirea conceptelor de corelaţie şi regresie şi utilizarea lor ı̂n economie
• Cunoaşterea posibilităţilor de cuantificare a intensităţii legăturii dintre mărimi economice
• Însuşirea metodelor de stabilire a unei legături funcţionale ı̂ntre variabile
Cuvinte cheie
• Corelaţia dintre variabile, coeficienţi de asociere, coeficient de corelaţie
• Corelaţia rangurilor, coeficienţii lui Kendall şi Spearman
• Metoda celor mai mici pătrate, regresia liniară simplă
• Regresia liniară multiplă, regresii neliniare: hiperbolică, parabolică, exponenţială
Rezultate aşteptate
După parcurgerea acestui modul se cere studentului să stăpânească noţiunile de corelaţie şi regresie,
să poată identifica existenţa unei eventuale legături ı̂ntre două mărimi. De asemenea, să ştie măsura
intensitatea legăturii dintre variabile, fie ele cantitative sau calitative. Se urmăreşte şi cunoaşterea
metodelor de modelare funcţională a legăturilor.
49
50 Capitolul 3. Analiza legăturii dintre variabile statistice
1. Organizarea rezultatelor observării populaţiei sau eşantionului ı̂n raport cu variabilele cercetate
3. Analiza statistică a intensităţii legăturii sau a gradului de asociere dintre variabilele observate
Aceste etape pot fi parcurse integral sau parţial, ı̂n funcţie de natura variabilelor. Pentru variabilele
calitative nu vor fi parcurse (ı̂n statistica descriptivă) decât primele trei, deoarece posibilităţile de
prelucrare sunt mai reduse. În schimb, toate cele şase etape pot fi parcurse ı̂n cazul variabilelor
cantitative.
În scopul utilizării facile a informaţiei culese la nivelul populaţiei sau eşantionului, rezultatele
observării vor fi sistematizate ı̂ntr-o formă convenabilă prelucrării lor. Se preferă de obicei o formă
tabelară a prezentării, care poate sugera unele idei de lucru pentru etapele următoare, prin unele
remarci cu privire la valorile pe care le-au ı̂nregistrat variabilele.
Pentru studiul existenţei legăturii dintre variabile X şi Y , aflate la baza seriei bidimensionale, calculăm
parametrul
L X K
X (Nij − Nij∗ )2
χ2 = (3.1)
Nij∗
i=1 j=1
Ni· · N·j
unde Nij∗ = , i = 1, L, j = 1, K.
N
Distingem două cazuri:
1) Dacă χ2 = 0, atunci nu există legatură ı̂ntre variabile;
2) Dacă χ2 0, atunci există legatură ı̂ntre variabile.
Pentru studiul intensităţii legăturii dintre variabilele X şi Y , calculăm:
Coeficientul de asociere (contingenţă) al lui Pearson
s
χ2
c= (3.2)
N + χ2
52 Capitolul 3. Analiza legăturii dintre variabile statistice
- Aplicaţie. Dintre societăţile comerciale cotate la Bursa de Valori Bucureşti (BVB) s-a ales un
eşantion de 18 societăţi ı̂n raport cu variabilele X - domeniul de activitate şi Y - riscul acţiunilor.
PP Finanţe Alte a) Studiaţi existenţa legăturii dintre do-
PP X
PP Industrie şi bănci domenii
Y PPP meniul de activitate al societăţilor şi ris-
M ic 3 1 7 cul acţiunilor.
b) În cazul existenţei legăturii, precizaţi
M are 2 5 − intensitatea ei.
Ni· · N·j
Calculăm frecvenţele absolute teoretice Nij∗ = , i = 1, 2, j = 1, 3 şi găsim:
N
∗ 11 · 5 ∗ 11 · 6 ∗ 11 · 7
N11 = = 3, 06; N12 = = 3, 67; N13 = = 4, 28;
18 18 18
∗ 7·5 ∗ 7·6 ∗ 7·7
N21 = = 1, 94; N22 = = 2, 33; N23 = = 2, 72
18 18 18
iar rezulatele obţinute le trecem ı̂n tabelul de mai jos:
PP Finanţe Alte
PP X
PP Industrie şi bănci domenii T otal
Y P P
P
Mic 3, 06 3, 67 4, 28 11
Mare 1, 94 2, 33 2, 72 7
T otal 5 6 7 18
Calculăm numărul:
2 X
3
X (Nij − Nij∗ )2 (3 − 3, 06)2 (1 − 3, 67)2 (0 − 2, 72)2
χ2 = = + + . . . + = 9, 44.
Nij∗ 3, 06 3, 67 2, 72
i=1 j=1
Deoarece valoarea χ2 0 deducem că există legatură ı̂ntre domeniul de activitate al societăţilor şi
riscul acţiunilor.
3.2. Analiza legăturii dintre variabile ordinale 53
b) Pentru a studia intensitatea legăturii dintre variabilele X şi Y , calculăm coeficientul de contingenţă
(asociere) al lui Pearson:
s r
χ2 9, 44
c= 2
= = 0, 59 ∈ [0, 3; 0, 7)
N +χ 18 + 9, 44
Variabilele ordinale sunt tot variabile calitative, dar care, ı̂n plus, permit ierarhizări (clasificări) ale
unităţilor statistice. Legătura dintre variabilele ordinale se numeşte corelaţia rangurilor.
Studiul corelaţiei rangurilor se poate realiza prin intermediul următorilor coeficienţi:
În cazul unei legături directe de intensitate maximă, P va lua valoare sa maximă, iar Q pe cea
minimă, adică: P = n(n−1)
2 , iar Q = 0, deci τ = 1.
În cazul unei legături inverse de intensitate maximă, P va lua valoare sa minimă, iar Q pe cea
maximă, adică: P = 0, iar Q = n(n−1) 2 , deci τ = −1.
În cazul lipsei legăturii, P = Q, iar τ = 0.
Putem determina astfel intervalul ı̂n care va fi cuprins τ , respectiv τ ∈ [−1, 1].
Coeficientul de corelaţie simplă a rangurilor al lui Kendall oferă informaţii legate de:
• intensitatea legăturii dintre cele două variabile ordinale:
- Dacă |τ | ∈ (0; 0, 3) legătura este de intensitate slabă;
- Dacă |τ | ∈ [0, 3; 0, 7) legătura este de intensitate medie;
- Dacă |τ | ∈ [0, 7; 1] legătura este de intensitate puternică.
• sensul legăturii dintre cele două variabile ordinale:
- Dacă τ > 0 legătura este directă;
- Dacă τ = 0 legătura este nulă;
54 Capitolul 3. Analiza legăturii dintre variabile statistice
Limitele celor doi coeficienţi sunt aceleaşi, la fel şi interpretările valorilor numerice.
Caracterizaţi nivelul corelaţiei rangurilor, construind câte un clasament al ţărilor ı̂n raport cu
fiecare variabilă.
Rezolvare. Pentru stabilirea clasamentelor vom considera pe prima poziţie ţara cu cel mai mare
PIB/locuitor, respectiv ţara cu cel mai scăzut cost mediu lunar/angajat.
Obţinem următoarea ierarhie a ţărilor:
3 2 4 5 1
- valoarea PIB/locuitor: 9, 5 10, 7 8, 3 7, 9 12, 8
- costul mediu lunar/angajat: 103 100 97 73 85
5 4 3 1 2
şi tabelul rangurilor unităţilor statistice (ţărilor) ı̂n raport cu cele două variabile, fie aceastea X =
valoarea PIB/locuitor şi Y = costul mediu lunar/angajat
3.2. Analiza legăturii dintre variabile ordinale 55
Ţara T1 T2 T3 T4 T5
rang(X) 3 2 4 5 1 (3.6)
rang(Y ) 5 4 3 1 2
• Dacă dorim să calculăm coeficientul de corelaţie simplă a rangurilor al lui Kendall, atunci ordonăm
crescător valorile şirului rang(X).
Ţara T5 T2 T1 T3 T4
rang(X) 1 2 3 4 5
rang(Y ) 2 4 5 3 1
Valoarea factorilor de concordanţă P , respectiv discordanţă Q se obţin din linia rang(Y ), astfel:
Xn
P = pi , unde pi este numărul rangurilor mai mari decât i, situate la dreapta lui i.
i=1
n
X
Q= qi , unde qi este numărul rangurilor mai mici decât i, situate la dreapta lui i.
i=1
Avem P = 3 + 1 + 0 + 0 + 0 = 4, iar Q = 1 + 2 + 2 + 1 + 0 = 6, deci coeficientul de corelaţie simplă
a rangurilor al lui Kendall este:
P −Q 4−6 −2
K= = = = −0, 2
P +Q 4+6 10
Deoarece K < 0 avem o legătură inversă intre PIB/locuitor şi costul mediu lunar/angajat. Adică,
ţările care au un cost mediu lunar/angajat mic, au o valoarea a PIB-ului/locuitor mare.
Pe de altă parte, |K| = 0, 2 ∈ [0; 0, 3), sugerează existenţa unei legături de intensitate slabă ı̂ntre
costul mediu lunar/angajat şi PIB-ul/locuitor.
• Dacă dorim să calculăm coeficientul de corelaţie a rangurilor al lui Spearman, atunci ı̂n tabelul
rangurilor (3.6), calculăm diferenţa rangurilor, di = rang(X) − rang(Y ), pentru fiecare i = 1, 5.
Ţara T1 T2 T3 T4 T5
rang(X) 3 2 4 5 1
rang(Y ) 5 4 3 1 2
di −2 −2 1 4 −1
Deducem că avem o legătura inversă, de intensitate slabă ı̂ntre variabilele analizate.
• Dacă dorim să calculăm coeficientul de corelaţie multiplă a rangurilor al lui Kendall (atenţie: acesta
nu oferă informaţii legate de sensul legăturii, ci doar legate de intensitatea ei!), atunci ı̂n tabelul
rangurilor (3.6), calculăm suma rangurilor, si = rang(X) + rang(Y ), pentru fiecare i = 1, 5.
Xm
(Dacă am fi avut m variabile X1 , X2 , . . . , Xm , atunci si = rang(Xk ), pentru i = 1, n).
k=1
56 Capitolul 3. Analiza legăturii dintre variabile statistice
Ţara T1 T2 T3 T4 T5
rang(X) 3 2 4 5 1
rang(Y ) 5 4 3 1 2
si 8 6 7 6 3
4
2 1X (3 − 6)2 · 1 + (6 − 6)2 · 2 + (7 − 6)2 · 1 + (8 − 6)2 · 1
σS(efectivă) = (si − S)2 · Ni = = 2, 8
n 5
i=1
2 m2 (n2 − 1) 22 · (52 − 1)
σS(maximă) = = =8
12 12
Valoarea coeficientul de corelaţie multiplă a rangurilor al lui Kendall este:
2
σS(efectivă) 2, 8
K= 2 = = 0, 35
σS(maximă) 8
deci, potrivit acestui coeficient, am avem o legătură de intensitate medie ı̂ntre variabile.
Dacă dispunem de o repartiţie bidimensională care are la bază variabilele cantitative X şi Y , putem
descompune varianţa totală a variabilei de explicat Y ca sumă a varianţei datorate variabilei explicative
X (varianţa explicită) şi respectiv a varianţei celorlalţi factori (varianţa reziduală), adică:
Dacă nu există legătură, adică X nu are nici o influenţă asupra lui Y , mediile condiţionate Y /X vor
fi identice, iar dispersia lor va fi nulă: σY2 /X = 0.
Putem reţine deci ca regulă de decizie ı̂n statistica descriptivă:
1) Dacă σY2 /X = 0, atunci nu există legătură ı̂ntre variabile;
2) Dacă σY2 /X 0, atunci există legătură ı̂ntre variabile.
Observaţie: Varianţa explicită σY2 /X este cu atât mai mare cu cât mediile condiţionate Y /X sunt mai
diferite ı̂ntre ele. Ceea ce le face să difere este numai influenţa lui X, deoarece am ı̂mpărţit populaţia
ı̂n grupe având ca unic criteriu valorile lui X. Este firesc deci să folosim varianţa explicită ca o mărime
absolută a intensităţii legăturii dintre X şi Y şi ponderea varianţei explicite ı̂n varianţa totală ca o
mărime relativă.
3.3. Analiza legăturii dintre variabile cantitative 57
a) Regula de adunare a varianţelor pentru Y ı̂n funcţie de X este: σY2 = σY2 /X + σY2 /X
= σY2 .
• Varianţa totală pentru Y este Vtot
30 50 70 30·17+50·18+70·17
Pentru seria lui Y : , 52 avem Y = 52 = 50.
17 18 17
58 Capitolul 3. Analiza legăturii dintre variabile statistice
Deci RY X ∈ [0, 3; 0, 7), de unde deducem că legătura este de intensitate medie.
c) Calculăm Raportul de determinare:
Vexp 95, 34
RY2 X = · 100% = · 100% = 36, 45%.
Vtot 261, 53
Deci volumul vânzărilor depinde de cheltuielile cu publicitatea ı̂n proporţie de 36, 45%, şi de 100% −
36, 45% = 63, 55% de alţi factori.
d) Calculăm coeficientul de variaţie al lui Pearson pentru volumul vânzărilor ı̂n raport cu fiecare
grupă de cheltuieli. Volumul mediu al vânzărilor va fi mai reprezentativ, pentru grupa de cheltuieli
cu publicitatea care are valoarea coeficientul de variaţie al lui Pearson
minimă.
30 50 70
• Pentru prima grupă de cheltuieli cu publicitatea: G1 = Y /X∈[3,5] : , 19 avem:
14 3 2
q
2
σG
p
σG1 1 177, 28
CVG1 = · 100% = · 100% = · 100% = 35, 63%.
G1 G1 37, 37
30 50 70
• Pentru a doua grupă de cheltuieli cu publicitatea: G2 = Y /X∈[5,7] : , 19 avem:
2 10 7
q
2
σG
p
σG2 2 161, 77
CVG2 = · 100% = · 100% = · 100% = 23, 02%.
G2 G2 55, 26
30 50 70
• Pentru a treia grupă de cheltuieli cu publicitatea: G3 = Y /X∈[7,9] : , 14 avem:
1 5 8
q
2
σG
p
σG3 3 157, 14
CVG3 = · 100% = · 100% = · 100% = 20, 89%.
G3 G3 60
Observăm că cel mai mic coeficient de variaţie al lui Pearson se obţine pentru a treia grupă de cheltuieli
cu publicitatea. Deci, volumul mediu al vânzărilor este mai reprezentativ pentru grupa de cheltuieli
cu publicitatea cuprinse ı̂ntre 7000 − 9000 lei.
În funcţie de forma liniei frânte obţinute şi a poziţiei punctelor norului faţă de ea se formulează o
ipoteză cu privire la forma funcţiei de regresie. Dacă dorim să studiem o legătură multiplă, respectiv
dependenţa lui Y faţă de variabilele factoriale X1 , X2 , . . ., Xn atunci pentru fiecare pereche (Y, X1 ),
(Y, X2 ), . . ., (Y, Xn ) desenăm câte un nor statistic. Forma generală a variabilei Y ı̂n funcţie de
variabilele factoriale X1 , X2 , . . ., Xn se scrie:
Y = f (X1 , X2 , . . . , Xn ) + ε
unde f (X1 , X2 , . . . , Xn ) reprezintă funcţia de regresie care aproximează cel mai bine forma legăturii,
iar ε reprezintă o variabilă aleatoare numită reziduală, care ı̂nsumează efectul altor factori decât cei
luaţi ı̂n calcul.
Y (X1 , X2 , . . . , Xn ) = a0 + a1 X1 + a2 X2 + . . . + an Xn (3.10)
3.4. Funcţii de regresie 61
Coeficienţii a0 , a1 , a2 , . . ., an se numesc parametrii modelului şi vor rezulta din minimizarea următoarei
funcţii cu (n + 1) necunoscute:
2
G(a0 , a1 , . . . , an ) = M Y − (a0 + a1 X1 + . . . + an Xn ) (3.11)
Condiţiile de minim constă ı̂n anularea celor (n + 1) derivate parţiale ale funcţiei G(a0 , a1 , . . . , an ) ı̂n
raport cu necunoscutele a0 , a1 , . . ., an ceea ce conduce la următorul sistem de ecuaţii:
∂G(a0 , a1 , . . . , an )
= −2M Y − (a0 + a1 X1 + . . . + an Xn ) = 0
∂a0 (3.12)
∂G(a0 , a1 , . . . , an )
= −2M Y − (a0 + a X
1 1 + . . . + a X
n n ) · Xj = 0, ∀ j = 1, n
∂aj
de unde rezultă:
(
a0 + a1 M (X1 ) + . . . + an M (Xn ) = M (Y )
(3.13)
a0 M (Xj ) + a1 M (X1 Xj ) + . . . + an M (Xn Xj ) = M (Y Xj ), ∀ j = 1, n
Prin rezolvarea acestui sistem liniar de ecuaţii ı̂n raport cu necunoscutele a0 , a1 , . . ., an , se obţin
valorile parametrilor funcţiei de regresie liniare multiple. Astfel, legătura statistică dintre Y şi X1 ,
X2 , . . ., Xn este modelată prin aproximare cu o legătură funcţională.
Y = a + bX + ε,
Formulele (3.14) şi (3.15) se deduc din rezolvarea sistemului (3.13), pentru cazul când variabila endo-
genă Y depinde doar de factorul exogen X.
• Regresia parabolică
În economie sunt numeroase exemplele ı̂n care legătura dintre fenomene şi variabilele care le cuantifică
nu este liniară. Dacă Y reprezintă recolta la hectar dintr-un produs agricol, iar X cantitatea de
ı̂ngrăşăminte, ne vom da seama chiar şi intuitiv că o anumită creştere a lui X nu provoacă aceeaşi
creştere a lui Y pe tot intervalul de variaţie al celor două variabile. La valori mari ale cantităţii
de ı̂ngrăs.aminte, acestea provoacă saturaţie sau chiar nocivitate, ducând la o stagnare, respectiv
62 Capitolul 3. Analiza legăturii dintre variabile statistice
diminuare a producţiei. Alte exemple pot fi: legătura dintre vechimea ı̂n muncă şi mărimea salariului,
dintre cheltuielile cu publicitatea şi volumul vânzărilor, etc.
În cazul regresiei parabolice, norul de puncte al mediilor condiţionate are forma grafică prezentată
ı̂n figura 3.3
Funcţia de regresie parabolică are forma generală
Y = a + bX + cX 2 + ε
Y (X) = a0 + a1 X + a2 X 2
Rezolvând acest sistem ı̂n necunoscutele a0 , a1 , a2 , rezultă parametrii ecuaţiei de regresie parabolice.
În mod asemănător se poate proceda pentru orice regresie neliniară.
Y (X) = a + bX + cX 2
3.4. Funcţii de regresie 63
• Regresia exponenţială
În cazul regresiei exponenţiale, norul de puncte al mediilor condiţionate are forma grafică prezentată
ı̂n figura 3.4
Funcţia de regresie exponenţială are forma generală
Y = a · bX · eε (3.16)
ln Y = ln(a · bX · eε ) = ln a + ln b · X + ε
• Regresia hiperbolică
În cazul regresiei hiperbolice, norul de puncte al mediilor condiţionate are forma grafică prezentată ı̂n
figura 3.5
Funcţia de regresie hiperbolică are forma generală
1
Y =a+b· +ε (3.17)
X
unde a şi b sunt parametrii reali ai funcţiei.
Aducerea la forma liniară a ecuaţiei (3.17) presupune
folosirea substituţiei:
1
Z := .
X
Figura 3.5: Hiperbola de regresie
Obţinem astfel modelul liniar simplu: Y = a + bZ + ε.
Foarte des ı̂ntâlnite sunt funcţiile de producţie. Forma generală a acestora este:
Printr-o astfel de funcţie se defineşte o legătură ı̂ntre nivelul producţiei Y şi factorii de care aceasta
depinde: productivitatea muncii, calificarea forţei de muncă, gradul de ı̂nzestrare cu capital fix, etc.
Determinarea parametrilor se face prin reducere la cazul liniar prin logaritmare:
lg Y (X1 , X2 , . . . , Xn ) = lg a + m1 · lg X1 + . . . + mn · lg Xn
Coeficientul de corelaţie
Construcţia lui este similară cu a raportului de corelaţie, cu deosebirea că varianţa ı̂n fiecare grupă
este calculată folosind suma pătratelor abaterilor faţă de valorile ajustate prin funcţia de regresie şi
nu faţă de media grupei. Ca urmare, coeficientul de corelaţie va fi specific fiecărei funcţii ı̂n parte.
Expresia lui de calcul (admisă aici fără demonstraţie) este:
r
det M
rY X = 1 − ∈ [0; 1] (3.18)
m00 M00
unde M este matricea de variaţie şi covariaţie aferentă fiecărui model de regresie, m00 este primul
elemenet al matricii M , iar M00 este complementul algebric al lui m00 . Interpretarea acestui coeficient
ı̂n functie de valorile pe care le poate lua este următoarea:
- dacă rY X ∈ [0; 0, 3] funcţia nu este reprezentativă pentru modelarea legăturii dintre variabile;
- dacă rY X ∈ (0, 3; 0, 7] funcţia are o reprezentativitate medie pentru modelarea legăturii dintre
variabile;
- dacă rY X ∈ (0, 7; 1] funcţia este foarte reprezentativă pentru modelarea legăturii dintre variabile.
Aceste limite nu trebuie interpretate foarte rigid. Valorile coeficienţilor este bine să fie comparate
cu ale altor coeficienţi, ai altor funcţii. Pentru aceeaşi repartiţie de exemplu, pentru funcţiile de regresie
alese ca fiind posibile calculam coeficienţii de corelaţie şi ı̂l reţinem pe cel mai mare, considerând acea
funcţie ca fiind cea mai reprezentativă.
În cazul regresiei liniare simple, formula coeficientului de corelaţie (3.18) poate fi adusă la o formă
echivalentă mai simplă:
r r
m00 m11 − m01 m10 m01 m10 m01 M (XY ) − M (X)M (Y )
rY X = 1 − = =√ √ =
m00 m11 m00 m11 m00 · m11 σY · σX
- Aplicaţie. Se cunosc valorile cererii şi preţului unui anumit produs pe opt pieţe:
a) Pe un grafic adecvat, identificaţi formele posibile ale funcţiilor de regresie dintre cerere şi preţ;
b) Găsiţi parametrii funcţiilor de regresie identificate la punctul precedent şi analizaţi reprezenta-
tivitatea fiecărei funcţii.
3.4. Funcţii de regresie 65
Rezolvare. a) Pentru a identifica posibilele funcţii de regresie care ar modela legătura matematică
dintre cerere şi preţ, construim norul de puncte, reprezentând puncte de coordonate (preţ, cerere):
Din graficele prezentate ı̂n figura 3.6 identificăm dreapta şi hiperbola de regresie ca fiind cele mai
”apropiate” grafice de punctele de coordonate (preţ, cerere).
b) Dorim să găsim parametrii dreptei şi hiperbolei de regresie, precum şi gradul lor de reprezentativi-
tate.
• Dreapta de regresie Y = a + bX + ε are ca parametrii numerele reale a (termen liber constant) şi b
(coeficient de regresie liniar). Pentru a determina aceşti parametrii, folosim formulele:
M (XY ) − M (X)M (Y )
b= (3.19)
M (X 2 ) − [M (X)]2
a = M (Y ) − b · M (X) (3.20)
Ţinând cont ca Y = cererea, iar X = preţul, avem următoarele medii:
3, 2 + 4, 9 + 5 + 10 + 1, 2 + 2, 3 + 5, 8 + 7, 2
M (X) = = 4, 95
8
15, 4 + 11, 3 + 10 + 6 + 20 + 17 + 9, 4 + 8
M (Y ) = = 12, 13
8
3, 2 · 15, 4 + 4, 9 · 11, 3 + . . . + 7, 2 · 8
M (XY ) = = 48, 73
8
3, 22 + 4, 92 + 52 + 102 + 1, 22 + 2, 32 + 5, 82 + 7, 22
M (X 2 ) = = 31, 43
8
M (X)2 = 4, 952 = 24, 50
• Hiperbola de regresie Y = a + b X1 + ε are ca parametrii numerele reale a (termen liber constant) şi
b (coeficient de regresie hiperbolic). Pentru a determina aceşti parametrii, facem substituţia Z := X1
şi obţinem modelul de regresie liniar simplu Y = a + b · Z + ε. Formulele (3.19) şi (3.20) se rescriu
astfel:
M (ZY ) − M (Z)M (Y )
b= (3.22)
M (Z 2 ) − [M (Z)]2
a = M (Y ) − b · M (Z) (3.23)
1
Stările (valorile) variabilei Z le obţinem din tabelul iniţial, folosind transformarea Z = X. Avem:
Înlocuind valorile medii in relaţiile (3.22) şi (3.23), obţinem: b = 20, 84 şi a = 6, 08.
1
Deci, hiperbola de regresie este Y = 6, 08 + 20, 84 · +ε .
X
Pentru a studia nivelul de reprezentativitate al hiperbolei de regresie calculăm coeficientul de
corelaţie hiperbolică
cov(Z, Y ) M (ZY ) − M (Z)M (Y )
rY Z = =p p
σZ · σY M (Z ) − M (Z)2 · M (Y 2 ) − M (Y )2
2
3.5. Teme de control 67
Obţinem:
4, 56 − 0, 29 · 12, 13
rY Z = √ √ = 1.
0, 13 − 0, 08 · 167, 78 − 147, 14
Hiperbola este puternic reprezentativă pentru modelarea legăturii matematice dintre cerere şi preţ.
Deoarece |rY Z | > |rY X |, deducem că hiperbola de regresie este mai reprezentativă decât dreapta de
regresie.
P2. Pentru o populaţie observată ı̂n raport cu două variabile cantitative ı̂ntre care ar putea exista o
legătură, se cere:
P3. Cunoaştem următoarea distribuţie a 52 de societăţi comerciale cu acelaşi profil de activitate, ı̂n
raport cu variabilele X cheltuielile cu publicitatea (mil. lei) şi Y - volumul vânzărilor (mil. lei).
PP
PP X
PP [30; 50] (50; 70] (70; 90)
Y PPP
[200; 400] 14 2 1
(400; 600] 3 10 5
(600; 800] 2 7 8
1. Pe baza unui grafic adecvat să se emită ipoteze privind forma posibilă a funcţiei de regresie.
2. În ipoteza unei forme liniare a dependenţei dintre Y şi X, să se calculeze parametrii funcţiei
de regresie.
3. Să se studieze reprezentativitatea funcţiei de regresie pentru modelarea legăturii dintre cele
două variabile.
4. Care este valoarea medie a volumului vânzărilor pentru un nivel al cheltuielilor cu publici-
tatea de 55 milioane lei ?
5. Aceleaşi cerinţe de la punctele 2, 3 şi 4 pentru o formă parabolică a dependenţei dintre Y
şi X.
Bibliografie:
68 Capitolul 3. Analiza legăturii dintre variabile statistice
2. Buiga A., Dragoş C., Lazăr D., Parpucea I., Todea A., Statistică I, Ed. Presa Universitară
Clujeană, Cluj-Napoca, 2003;
3. Buiga A., Dragoş C., Lazăr D., Brendea G., Litan C., Mare C., Statistică Descriptivă, Ed.
Napoca Star, Cluj-Napoca, 2018;
4. Goldfarb B., Pardoux C., Introduction à la méthode statistique, Ed. Dunod, Paris, 1995;
6. Roger P., Statistique pour la gestion, Ed. Management et société, Caen, 2000;
Serii cronologice
Secţiuni
4.1. Indici statistici
4.2. Indicatori medii specifici seriilor cronologice
4.3. Componentele unei serii cronologice
4.3. Teme de control
Obiective
• Înţelegerea şi aplicarea metodelor de calcul a indicilor factoriali ı̂n analiza dinamicii indicatorilor
economici;
• Cuantificarea dinamicii medii a unui indicator;
• Cunoaşterea şi utilizarea metodelor cantitative de previziune. Metoda clasică de descompunere
a unei serii de timp.
Cuvinte cheie
• Indice al variaţiei integrale, indice factorial, indice al preţului;
• Nivel mediu al unei serii de timp, indice mediu, ritm mediu, diferenţa medie absolută;
• Serie de timp, model dinamic, funcţii de tendinţă, coeficienţii sezonalităţii, ciclicitate
• Medii mobile, previziune, erori de previziune, netezire exponenţială.
Rezultate aşteptate
Studentul ı̂nţelege noţiunile de indice factorial, nivel mediu, indice mediu, ritm mediu şi stăpâneşte
modalităţile de calcul ale acestora. Utilizează metode cantitative ı̂n previziune; ı̂n acest sens, identifică
componentele prezente ı̂ntr-o serie de timp, modelează şi extrapolează tendinţa, utilizează adecvat o
medie mobilă, modelează componenta sezonieră şi ciclică, utilizează metoda netezirii exponenţiale ı̂n
netezire şi previziune.
69
70 Capitolul 4. Serii cronologice
k/j Xi (k)
IXi =
Xi (j)
k/j
3) indici ai variaţiei parţiale ale lui Z sau indici factoriali: IZ/Xi - ne arată de câte ori s-a modificat
Z ı̂n starea k faţă de starea j sub influenţa exclusivă a factorului Xi .
unde pi (j) şi pi (k) sunt preţurile din perioada de bază şi perioada curentă, qi (j) sunt cantităţile din
perioada de bază, iar ki măsoară importanţa produsului sau bunului i ı̂n coşul indicelui la momentul
bază de comparaţie.
Pentru cazul general, când Z depinde de m factori de influenţă, iar forma funcţiei f este oarecare,
Florea (1986) deduce o regulă pentru elaborarea indicilor factoriali de tip Laspeyres.
Pentru o funcţie oarecare f , ı̂n care mărimea Z depinde de m factori, in Florea (1986) este prezentată
o generalizare.
- Aplicaţie. O societate hotelieră dispune de trei tipuri de locuri de cazare: camere cu un singur pat
(single), camere cu două paturi (double) şi apartamente. Numărul de camere ı̂nchiriate (X) şi tariful
practicat (Y) ı̂n două luni consecutive sunt date ı̂n tabelul următor:
Luna j Luna k
Tipul camerei X Y (e) X Y (e)
Single 80 30 110 35
Double 50 40 60 40
Apartament 20 50 25 45
Calculaţi volumul valoric al ı̂ncasărilor sub influenţa exclusivă a numărului de camere ı̂nchiriate,
respectiv sub influenţa exclusivă a tarifului practicat, folosind metoda Laspeyres.
72 Capitolul 4. Serii cronologice
Rezolvare. Volumul valoric al ı̂ncasărilor din ı̂nchirierea camerelor (Z) se va calcula dupa relaţia:
3
X
Z= Xi Yi
i=1
Constatăm că volumul valoric al ı̂ncasărilor a crescut ı̂n luna k faţă de luna j de 1, 287 ori sub influenţa
exclusivă a modificării numărului de camere ı̂nchiriate.
3
X
Xi (j)Yi (k)
k/j i=1 80 · 35 + 50 · 40 + 20 · 45
IZ/Y (L·) = = = 1, 055
X3 80 · 30 + 50 · 40 + 20 · 50
Xi (j)Yi (j)
i=1
Deducem că volumul valoric al ı̂ncasărilor a crescut ı̂n luna k faţă de luna j de 1, 055 ori sub influenţa
exclusivă a modificării tarifului practicat.
- Aplicaţie. Se consideră mărimea Z ca fiind profitul brut al unei societăţi şi factorii: X - veniturile
totale, respectiv Y - cheltuielile totale ale aceleaşi societăţi. În doi ani consecutivi variabilele X şi Y
au ı̂nregistrat valorile:
Anul
t−1 t
X (mld. lei) 10 12
Y (mld. lei) 8 9
Calculaţi indicii factoriali de tip Laspeyres pentru variaţia profitul brut sub influenţa exclusivă a
veniturilor totale, respectiv a cheltuielilor totale şi interpretaţi rezultatele găsite.
t/t−1 X(t) − Y (t − 1) 12 − 8
IZ/X (·L) = = =2
X(t − 1) − Y (t − 1) 10 − 8
- profitul brut a crescut ı̂n anul t faţă de anul t − 1 de 2 ori sub influenţa exclusivă a modificării
veniturilor totale;
t/t−1 X(t − 1) − Y (t) 10 − 9
IZ/Y (L·) = = = 0, 5
X(t − 1) − Y (t − 1) 10 − 8
- profitul brut a scăzut ı̂n anul t faţă de anul t − 1 de 0, 5 ori sub influenţa exclusivă a modificării
cheltuielilor totale.
4.2. Indicatori medii specifici seriilor cronologice 73
i=1 i=1
Pentru seriile cronologice de momente nivelul mediu este definit de următoarea relaţie:
Z tn
y(t)dt
t1
Y = Z tn
dt
t1
Dacă se aproximează evoluţia indicatorului y(t) ca fiind liniară ı̂ntre două momente consecutive de
timp, rezultă:
T1 T1 + T2 Tn−2 + Tn−1 Tn−1
y1 + y2 + . . . + yn−1 + yn
Y = 2 2 2 2
T1 + T2 + . . . + Tn−1
relaţie numită medie cronologică ponderată.
Dacă nivelul indicatorului se ı̂nregistrează la momente echidistante (T1 = T2 = . . . = Tn − 1),
atunci relaţia anterioară devine:
y1 yn
+ y2 + . . . + yn−1 +
Y = 2 2
n−1
si reprezintă media cronologică simplă.
yt = I y · yt−1 + εt , t = 2, 3, . . . , n
Utilizând metoda celor mai mici pătrate pentru estimarea parametrului I y , se obţine următoarea
expresie de calcul a indicelui mediu:
Xn
yt−1 · yt
t=2
Iy = n
X
2
yt−1
t=2
Metoda este ı̂ntâlnită ı̂n practică sub denumirea de metoda autoregresivă.
O altă expresie de calcul, adecvată pentru indicatori ce evoluează aproximativ exponenţial este
următoarea: r
yn
Iy = n−1
y1
Ritmul mediu Ry se determină pornind de la indicele mediu:
sau echivalent:
yn − y1
∆y = .
n−1
- Aplicaţie. Cifra de afaceri a unei societăţi comerciale, a scăzut, ı̂ncepând cu anul 2013:
De la un an la altul, in perioada 2013-2018, cifra de afaceri a scăzut ı̂n medie de 0, 712 ori.
Ritmul mediu este:
Ry = (I y − 1) · 100% = (0, 712 − 1) · 100% = −28, 8%
De la un an la altul, in perioada 2013-2018, cifra de afaceri a scăzut ı̂n medie cu 28, 8%.
b) Cifra de afaceri anticipată pentru anul 2019, utilizând indicele mediu, este:
O serie cronologică este o secvenţă de observaţii asupra unei variabile, ordonate după parametrul timp.
Frecvent, măsurătorile asupra variabilei sunt efectuate la intervale egale de timp, seria cronologica fiind
prezentată sub forma:
1 2 ... t ... n
Y :
y1 y2 . . . yt . . . yn
În abordarea tradiţională, fluctuaţiile din seriile cronologice sunt privite ca o rezultantă a suprapu-
nerii următoarelor componente: tendinţa T , componenta ciclică C, sezonieră S respectiv reziduală E.
Primele trei componente sunt considerate deterministe, sistematice, determinate de factori cu acţiune
continuă asupra fenomenului, ı̂n timp ce componenta reziduală are caracter aleator fiind efectul acţiunii
unor factori imprevizibili, accidentali.
Modelul clasic de descompunere al seriilor cronologice este de regulă:
• aditiv: Y = T + C + S + E sau
• multiplicativ: Y = T · C · S · E respectiv
76 Capitolul 4. Serii cronologice
Tt = a + bt + ct2 unde: X = t2
t/t−1
hiperbolă T = a + bX ∆ty = tyt − (t − 1)yt−1
1 1
Tt = a + b unde: X =
t t
t/t−1
exponenţială Zt = A + Bt ∆ln y = ln yt − ln yt−1
Tt = a · bt unde: Zt = ln Tt ;
A = ln a; B = ln b
putere Z = A + bX
Tt = a · tb unde: Zt = ln Tt ;
A = ln a; X = ln t
logaritmică T = a + bX
Tt = a + b ln t unde: X = ln t
curba logistică
a
Tt = ,
1 + eb−ct
a, c > 0
- Aplicaţie. Indicele lunar al preţului producţiei industriale pentru piaţa internă, ı̂n perioada ianu-
arie 1999 - iunie 2000, baza de comparaţie 1996, a avut o tendinţa crescătoare:
Luna 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
(t)
Indice 3,7 3,8 4,1 4,3 4,5 4,8 4,9 5,1 5,3 5,5 5,6 5,8 6,0 6,2 6,3 6,5 6,6 7,0
(yt )
yt = a + bt + εt , t = 1, 2, . . . , 18.
M (tY ) − M (t)M (Y )
b= ,
M (t2 ) − [M (t)]2
respectiv
Tt = 3, 55 + 0, 19t
Mediile mobile
Pentru eliminarea componentei sezoniere (desezonalizarea seriei) se aplică datelor o medie mobilă
de ordin p egal cu perioada componentei sezoniere.
Mediile mobile de ordin p, notate ı̂n continuare M M (p), sunt definite de următoarele relaţii:
• dacă p este impar, p = 2k + 1, mediile mobile de ordin p sunt:
yt−k + yt−k+1 + . . . + yt + . . . + yt+k−1 + yt+k
yt = , t = k + 1, k + 2, . . . , n − k;
p
• dacă p este par, p = 2k, mediile mobile se definesc analog
yt−k+0,5 + yt−k+1,5 + . . . + yt−0,5 + yt+0,5 + . . . + yt+k+0,5
yt = ,
p
4.3. Componentele unei serii cronologice 79
t = k + 0, 5, k + 1, 5, . . . , n − k + 0, 5.
În cazul p par, se introduc mediile mobile centrate de ordin p definite prin:
1
y t−0,5 + y t+0,5 yt−k + yt−k+1 + . . . + yt + . . . + yt+k−1 + 12 yt+k
yt = = 2 .
2 p
Notaţii: t indice pentru an (ı̂n general pentru un ciclu sezonier), variind de la 1 la n; s indice
pentru sezon, variind de la 1 la p. Modelul de descompunere a seriei are forma:
• determinarea unui indice mediu pentru fiecare sezon ca o medie a estimaţiilor precedente:
n−1
1 X
Ij = Sij , j = 1, 2, . . . , p,
n−1
i=1
aceasta justificându-se prin necesitatea eliminării efectului aleator din Sij . Pentru a nu fi afectaţi
de valorile extreme, uneori ı̂nainte de calculul mediei, aceste valori se elimină, sau ı̂n loc de medie
se ia valoarea mediană a estimaţiilor Sij ;
• determinarea componentei sezoniere Sj , etapă ce constă ı̂ntr-o corecţie adusa indicilor medii Ij
astfel ı̂ncât media lor sa fie 1:
Ij
Sj = p , j = 1, 2, . . . , p.
1X
Ii
p
i=1
80 Capitolul 4. Serii cronologice
- Aplicaţie. Datele privind evoluţia trimestrială a producţiei de bere din ţara noastră (zeci mii hl)
ı̂n perioada 1996 − 2001 sunt indicate mai jos:
An/Trim. I II III IV
1996 124,1 263,2 252,4 124,5
1997 130,1 280,2 260,6 151,1
1998 157,5 301,2 353,3 185,0
1999 169,7 340,0 350,9 168,7
2000 177,5 407,6 417,2 224,1
2001 202,9 385,3 425,6 196,6
Determinaţi ecuaţia tendinţei. În cazul prezenţei componentei sezoniere, desezonalizaţi seria cronolo-
gică a producţiei de bere.
0, 5 · y2 + y3 + y4 + y5 + 0, 5 · y6
y4 = =
4
0, 5 · 263, 2 + 252, 4 + 124, 5 + 130, 1 + 0, 5 · 280, 2
= = 194, 7
4
..
.
a) Construiţi seria cronologică aferentă profiturilor ı̂nregistrate ı̂n perioada 2010 - 2018.
b) Construiţi seriile cronologice cu diferenţe absolute, indici statistici şi diferenţe relative cu
bază fixă şi bază ı̂n lanţ.
c) Cu cât se modifică ı̂n medie profiturile de la un an la altul ?
d) De câte ori se modifică ı̂n medie profiturile de la un an la altul ?
e) Cu câte procente se modifică ı̂n medie profiturile de la un an la altul ?
f ) Găsiţi ecuaţia tendinţei care indică evoluţia profiturilor ı̂n timp.
g) Este tendinţa găsită la punctul precedent reprezentativă ?
h) Estimaţi profitul companiei ı̂n următorii trei ani (prin trei metode diferite).
i) De câte ori s-a modificat profitul ı̂n anul 2018 faţă de anul 2010 ?
j) Ştiind că ı̂n perioada 2010 - 1017 impozitul pe profit datorat statului a fost de 16%, iar
ı̂ncepând cu anul 2018 impozitul pe profit a fost de 10%, găsiţi seria cronologică a profitului
net. Reprezentaţi grafic seria cronologică aferentă profitului net.
P2. Veniturile unei cofetării obţinute din vânzările de prăjituri, cafea şi sucuri sunt redate ı̂n graficul
de mai jos:
4.4. Teme de control 83
a) Construiţi seriile cronologice aferente veniturilor obţinute din vânzările de prăjituri, sucuri
şi cafea ı̂n perioada 2012 - 2018.
b) Construiţi seria cronologică a veniturilor totale ale cofetăriei ı̂n perioada 2012 - 2018.
c) Cu cât la sută se modifică ı̂n medie veniturile totale de la un an la altul ?
d) De câte ori se modifică ı̂n medie veniturile obţinute din vânzarea prăjiturilor de la un an la
altul ?
e) Găsiţi ecuaţiile tendinţelor veniturilor obţinute din vânzările de prăjituri, cafea şi sucuri.
Care din ecuaţiile găsite este mai reprezentativă ?
f ) Folosind diferenţa absolută medie a veniturilor obţinute din vânzarea prăjiturilor, estimaţi
veniturile pentru prăjituri ı̂n următorii doi ani.
g) Folosind indicele statistic mediu al veniturilor obţinute din vânzarea sucurilor, estimaţi
veniturile pentru sucuri ı̂n următorii doi ani.
h) Indicele Laspeyres al veniturilor totale sub influenţa exclusivă a veniturilor obţinute din
vânzările de prăjituri ı̂n anul 2018 faţă de anul 2012. Calcul şi interpretare.
i) Indicele Paasche al veniturilor totale sub influenţa exclusivă a veniturilor obţinute din
vânzările de sucuri ı̂n anul 2018 faţă de anul 2012. Calcul şi interpretare.
j) Indicele Fisher al veniturilor totale sub influenţa exclusivă a veniturilor obţinute din vânzările
de cafea ı̂n anul 2018 faţă de anul 2012. Calcul şi interpretare.
k) Calculaţi şi interpretaţi nivelul mediu al veniturilor totale.
l) Cu cât la sută se abat ı̂n medie veniturile totale ı̂nregistrate ı̂n fiecare an faţă de venitul
total mediu ı̂nregistrat ı̂n perioada 2012 - 2018 ?
m) Reprezentaţi grafic cronograma veniturilor totale obţinute din vânzarea prăjiturilor şi sucu-
rilor. Precizaţi tendinţa pe grafic. Găsiţi parametrii tendinţei şi studiaţi reprezentativitatea
ei.
P3. În anul 2015 numărul de firme dintr-un judeţ a fost cu 17, 5% mai mic decât ı̂n 2018 şi cu 10%
mai mare decât ı̂n 2012. Ştiind că ı̂n 2011 ı̂n judeţ au fost 100 de firme, iar ı̂n 2012 numărul
firmelor a crescut de 1, 2 ori, se cere:
P4. Previzionaţi numărul zilnic de pacienţi ai unei clinici medicale private pentru săptămâna a cincea,
cunoscând evoluţia din primele patru săptămâni:
84 Capitolul 4. Serii cronologice
Bibliografie:
1. Buiga A., Dragoş C., Lazăr D., Parpucea I., Statistică I, Presa Universitară Clujeană, 2003.
2. Buiga A., Dragoş C., Lazăr D., Brendea G., Litan C., Mare C., Statistică Descriptivă, Ed.
Napoca Star, Cluj-Napoca, 2018;
3. Florea I., Parpucea I., Buiga A., Statistică descriptivă. Teorie şi aplicaţii, ed. Continental, Alba
Iulia, 1998;
4. Florea I., Parpucea I., Buiga A., Lazăr D., Statistică inferenţială, Presa Universitară Clujeană,
Cluj-Napoca, 2000;
5. Melard G., Méthodes des prévisions à court terme, Ed. de l’Université de Bruxelles, 1970.