MCS 3
MCS 3
MCS 3
STIINTIFICE
2015
curs 3.
MODULUL 3.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
CONCLUZIE:
Pentru a putea trece la analiza statistica corecta a datele rezultate dintr
un studiu clinic, trebuie sa avem un raspuns clar la 2 categorii de
intrebari :
1. Care este scopul cercetarii noastre (dpdv clinic la ce fel de
intrebare trebuie sa raspunda studiul/ ce ne propunem sa aflam ?
verificam corectitudinea ipotezei de studiu
verificam daca designulstudiului tipul/categoria (terapeutic,
diagnostic, supravietuirea etc) este adecvata/corespunde
intrebarii/ipotezei
2. Ce fel de date/parametrii colectam/masuram/inregistram in acest
scop?
verificam/stabilim care vor fi variabilele
studiate/colectate/masurate si ulterior analizate
Reguli de enuntare:
ipoteza de studiu este o
afirmaie/propoziie (nu
ntrebare, nu problem!);
lanseaz ideea unei posibile
relaii dintre factorii care vor fi
studiai;
ipoteza enunat orienteaz
alegerea tipului de studiu;
studiile descriptive nu se
bazeaz pe ipotez ele o
lanseaz;
studiul trebuie s aduc
argumente (inclusiv statistice)
pentru a demonstra c ipoteza
calitative (categorii):
Sunt aranjate pe o scala de interval (cand au un interval constant intre doua valori
masurate succesiv), sau pe o scara de raport (cand valorile lor poseda/includ si un
ZERO)
Categorii de variabile I:
variabile dependente /
independente
ordonare,
gruparea
prezentarea datelor (prin tabele, grafice i serii).
Tabele de date
Rezultate: La nceput proporia bilelor albe i cele negre era 1:4 sau
20%:80%.
La un numr mai mare de extrageri (100-200-250) proporia se
apropie de cea real 0,5:0,5 sau 50%:50%. Din acest moment orict
s-ar prelungi numrul de extrageri, proporia bilelor albe i negre nu
se va schimba!.
Concluzii:
Concluziile experimentului:
baza teoretica a statisticii inferentiale
Rezultatele experimentului au demonstrat, c
mrirea numrului de cazuri (n) n colectivitatea
selectiv/esantion a dus la 2 efecte:
P value : interpretare
Prin conventie, in cercetarea medicala, un anumit
nivel al lui p indica faptul ca relatiile intre
fenomene sau efecte sunt semnificative statistic
(=adica rezultatele obtinute nu se datoreaza
intamplarii!!!).
Aceasta valoare a fost stabilita arbitrar (prin
conventie), la 5%, adica p=0,05.
Cu cat p este mai mic decat 0,05 gradul de
certitudine al nostru este mai mare (creste),
permitandu-ne excluderea efectului intamplarii
(efect care ar fi putut influenta rezultatele
studiului nostru!!!)
Interpretarea CI:
1.
2.
3.
4.
Gruparea datelor:
Din nou despre scale (scari) de masurare.
1.Scala nominala:
2. Scala ordinala
Folosita pt variabilele
calitative ordinale, intre care
exista o ordine inerenta
(=pozitie, rang) intre
categoriile de date (datele
sunt unele fata de altele gen
mai mult sau mai mare)
Rank ordered scale .
Variabile utilizate/ordonate
in aceasta scara : scoruri de
riscuri la terapii , clasificari,
stadializari boli incl. TNM,
Apgar,
Suporta datele in procente
sau proportii
Datele masurate sunt bine
reprezentate de mediana
valorilor observate
3. Scala numerica
Estimare statistic
a parametrilor unei populaii pe baza rezultatelor
unui eantion
ex: utiliznd proprietile distribuiei normale se
poate estima intervalul in care se ncadreaz media
unei populaii, pe baza rezultatelor unui eantion
aplicarea CI, Intervalului de ncredere (este
intervalul in care se poate ncadra un parametru al
unei populaii, cu o anumit probabilitate)
Unul
dinaplicarea
scopurile de
baza a statisticii
este de a folosi
un
prin
Testelor
de semnificaie
statistic.
Elemente de statistica
descriptiv
Simbolul statistic:
Characteristic
Mean
Parameter
Symbol
Statistical
Symbol
XX
Standard
deviation
Variance
SD
s2
Correlation
Proportion
1.
Intervalul/range:
arata diferenta de dispersie dintre cea mai mare si cea mai mica
observatie
Variana (=dispersia)
Coeficientul de corelaie:
..este un index numeric folosit pentru a indica gradul de
coresponden, de potrivire,
dintre 2 seturi de msurtori
Interpretare: 1 = potrivire perfect, - 1 = corelaie negativ perfect
Coeficientul de variatie CV
Percentilele
procentajul dat al unei distributii (masoara
pozitia distributiei intr un tabel de date)
valoare care poate fi egala sau mai mica
decat o anumita valoare standard.
per centila
mparte distribuia n 100 de pri
c
egale
Percentila 50 (=P50) are valoare asemeni
medianei (este o valoare de mijloc)
Se folosesc (impreuna cu interquartilele, P25=Q1,
P50=Q2, P75=Q3) in interpretarea unei valori
individuale raportate la o norma
Utilizate aproape exclusiv in interpretarea
graficelor de crestere fizica standard (in greutate)
CONCLUZII:
De retinut!
atunci cand avem cazuri
putine in studiu (n<30) distributia
nongausiana este frecvent
intalnita.
In general in natura distributia
nongausiana (anormala) este
frecventa, iar in cazul variabilelor
biologice este foarte des
intalnita!!!
Tabelele:
Graficele:
Datele calitative
Diagrama din coloane i dreptunghiuri (sau
segmente) (bar chart)
Datele cantitative
Histograma
Poligonul de frecven
este o reprezentare a distribuiei categoriilor de
date ordonate i continue, asemntor cu
histograma.
axa x reprezint categoriile de date, iar axa y
frecvena datelor pe fiecare categorie.
frecvena este (punctat), marcat fa de
punctul mediu al fiecrei categorii i se trage o
linie ntre toate aceste puncte marcate.
nlimile corespunztoare distribuiei cantitative
de pe axa y se ridic perpendicular pe abscis,
pornind de la mijlocul intervalului de pe abscis.
Este mai folositor dect histograma deoarece n
grafic pot fi punctate cu uurin mai multe
distribuii
Reguli
testul t mperecheat;
pentru testul Mann-Whitney U: testul Wilcoxon;
pentru ANOVA: ANOVA pentru msurtori repetate.
analizmultivariabil
analizmultivariabil
2. Analiza multivariata :
Regresia lineara multipla (cand variabila dependenta este de tip variabila continua)
Regresia logistica (cand variabila dependenta este calitativa/nominala/ dihotomica)
Analiza hazardului proportional Cox (cand reprezentam durata de timp pana la
aparitia unui efect = supravietuirea= variabila dependenta)
3. Analiza stratificata:
In studiile observationale cu mai multi factori de risc exista posibilitatea ca una din variabilele
studiate sa devina factor de confuzie (..adica aceasta se poate asocia atat cu factorul de risc
presupus cat si cu efectul).
Paradoxul lui Simpson(Simpson's Paradox)
Ceea ce este adevrat pentru pri nu este n mod necesar adevrat i pentru ntreg
Acest aspect genereaza conceptul de confundare.
Dou variabile sunt confundate dac este imposibil s se determine care variabil este asociat
efectului observat.
Atunci cnd se compar un grup de control i un grup experimental (supus unui
tratament oarecare) i cnd diferenele dintre grupuri, altele dect tratamentul aplicat,
produc diferene ntre rezultate nedifereniabile de efectul tratamentului, aceste diferene
se eticheteaza drept confundate cu efectul tratamentului (dac acesta exist).
Exemplu, diferenele ntre maladiile fumtorilor i nefumtorilor pot fi confundate cu
calitile individuale difereniate ale subiecilor. Confundarea poate afecta studiile
observaionale i experimentele care nu sunt randomizate!
Pentru eliminarea factorilor de confuzie se poate utiliza analiza stratificata (dar uneori nici aceasta
nu este suficienta intrucat exista si alti factori necunoscuti si deci nemasurati.)