Statistics">
Conceptos de Estadística
Conceptos de Estadística
Conceptos de Estadística
SESIÓN 03
ANÁLISIS UNIVARIANTE
Definiciones fundamentales
Definiciones fundamentales
Características de la población
Seminario de Tesis II
Definiciones fundamentales
Tipos de muestra
Seminario de Tesis II
Definiciones fundamentales
Estadística descriptiva
Estadística descriptiva
Seminario de Tesis II
Estadística inferencial
Estadística inferencial
Seminario de Tesis II
Tabla de frecuencias
Tabla de frecuencias
xi ni fi Ni Fi
Seminario de Tesis II
Tabla de frecuencias en R
Tabla de frecuencias en R
Datos:
Tabla de frecuencias en R
> tabla<-c(174,180,187,174,179,172,180,180,176,180,160,160)
> table(tabla)
tabla
160 172 174 176 179 180 187
2 1 2 1 1 4 1
> a<-table(tabla)
> cumsum(a)
160 172 174 176 179 180 187
2 3 5 6 7 11 12
> prop.table(a)
tabla
160 172 174 176 179 180
0.16666667 0.08333333 0.16666667 0.08333333 0.08333333 0.33333333
187
0.08333333
Seminario de Tesis II
Tabla de frecuencias en R
> cumsum(prop.table(a))
160 172 174 176 179 180 187
0.1666667 0.2500000 0.4166667 0.5000000 0.5833333 0.9166667
1.0000000
Seminario de Tesis II
Tabla de frecuencias en R
Datos: xi ni fi Ni Fi
160 2 0.17 2 0.17
174, 180, 187, 174,
179, 172, 180, 180, 172 1 0.08 3 0.25
176, 180, 160, 160 174 2 0.17 5 0.42
176 1 0.08 6 0.5
179 1 0.08 7 0.58
180 4 0.33 11 0.92
187 1 0.08 12 1
Seminario de Tesis II
> tabla<-c(174,180,187,174,179,172,180,180,176,180,160,160)
> mean(tabla)
[1] 175.1667
> median(tabla)
[1] 177.5
> install.packages("modeest")
> library(modeest)
> mlv(tabla, method="mfv")
[1] 180
Seminario de Tesis II
x = 175.17 xi ni fi Ni Fi
Me = 177.5 160 2 0.17 2 0.17
172 1 0.08 3 0.25
Moda = 180 174 2 0.17 5 0.42
176 1 0.08 6 0.5
179 1 0.08 7 0.58
180 4 0.33 11 0.92
187 1 0.08 12 1
Seminario de Tesis II
Cuantiles
Cuantiles en R
Cuantiles en R
> quantile(tabla)
0% 25% 50% 75% 100%
160.0 173.5 177.5 180.0 187.0
Seminario de Tesis II
Medidas de dispersión
Seminario de Tesis II
Medidas de dispersión
Seminario de Tesis II
Medidas de dispersión
( ) ()
k k
s = f i xi − x s = f i xi − x
2 2 2 2 2
;
i =1 i =1
Medidas de dispersión
• Coeficiente de variación: CV = s / x
Seminario de Tesis II
Medidas de dispersión en R
Medidas de dispersión en R
> v<-var(tabla)*(length(tabla)-1)/length(tabla)
• Varianza = 60.14
>v
[1] 60.13889 • Desv. Típica =
> sqrt(v) 7.75
[1] 7.754927 • Rango = 27
> max(tabla)-min(tabla)
[1] 27
• Coeficiente de
> sqrt(v)/mean(tabla)
variación =
[1] 0.0442717
4.43%
Seminario de Tesis II
Gráficos
Diagrama de barras
X es un vector con las frecuencias de las observaciones del factor sabor
> x<-table(ejemplo_1_RStudio$Sabor)
> barplot(x, col ="yellow", xlab="Sabor", ylab="Frecuencias absolutas", main ="Diagrama
de barras para la variable Sabor")
Seminario de Tesis II
Diagrama de sectores
X es un vector con las frecuencias de las observaciones del factor sabor
> x<-table(ejemplo_1_RStudio$Sabor)
> pie(x, main ="Diagrama de sectores para la variable Sabor")
Seminario de Tesis II
Diagrama de cajas
Diagrama de cajas
X es un vector con las observaciones del factor olor
> X<-ejemplo_1_RStudio$Olor
> boxplot(X, horizontal = TRUE)
Seminario de Tesis II
Histograma
X es un vector con las frecuencias de las observaciones del factor olor
> x<-table(ejemplo_1_RStudio$Olor)
> hist(x, main = "Histograma de frecuencias", ylab = "Frecuencia")
Seminario de Tesis II
Medidas de forma
Asimetría
f (x − x )
k
3
i i
CA = i =1
s3
Seminario de Tesis II
Medidas de forma
Asimetría
2,4
2,4
2
2
1,6
1,6
1,2
1,2
0,8
0,4
0,8
0 0,4
0 0,2 0,4 0,6 0,8 1
0
0 0,2 0,4 0,6 0,8 1
CA<0
CA>0
2,4
1,6
1,2
Para los N = 48
CA = −0.21
0,8
0,4
0
0 0,2 0,4 0,6 0,8 1
CA~0
Seminario de Tesis II
Medidas de forma
Apuntamiento o curtosis
f (x − x )
k
4
i i
CAp = i =1
4
−3
s
Seminario de Tesis II
Medidas de forma
Apuntamiento o curtosis
12 2,4
10 2
8 1,6
6 1,2
4 0,8
2 0,4
0 0
0 0,2 0,4 0,6 0,8 1 0 0,2 0,4 0,6 0,8 1
CAp>0 CAp<0
0,4
0,3
Para los N = 48
0,2
CAp~0
Ignacio Cascos Depto. Estadística, Universidad Carlos III 47
Seminario de Tesis II
Bibliografía