Statistics">
Nothing Special   »   [go: up one dir, main page]

Conceptos de Estadística

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 48

Seminario de Tesis II

SESIÓN 03

ANÁLISIS UNIVARIANTE

Dr. Luis Moncada Albitres


Ms. Luis Moncada Torres
http://ingenieriaquimica.tech
Seminario de Tesis II

Definiciones fundamentales

• Población: conjunto de elementos de los que se


estudia una característica. Tamaño de la población
es su número de elementos (N, puede ser infinito).

• Muestra: conjunto (representativo) de elementos


de la población. Tamaño de la muestra es su
número de elementos (n).
Seminario de Tesis II

Definiciones fundamentales
Características de la población
Seminario de Tesis II

Definiciones fundamentales
Tipos de muestra
Seminario de Tesis II

Definiciones fundamentales

• Variable: característica a estudiar en los individuos


de la población (X ó Y).

• Dato: valor, numérico o no, que toma la variable


sobre un individuo concreto de la muestra, (x ó y).
Seminario de Tesis II

Estadística descriptiva

• Se refiere a las técnicas numéricas y gráficas


que son utilizadas para describir o
caracterizar los datos obtenidos sin extraer
conclusiones sobre la población a la que
pertenecen.
• Son técnicas que obtienen, organizan,
presentan y describen un conjunto de datos
utilizando el apoyo de tablas, medidas
numéricas o gráficas.
Seminario de Tesis II

Estadística descriptiva
Seminario de Tesis II

Estadística inferencial

• Incluye técnicas y métodos probabilísticos y


estadísticos que utilizan los datos muestrales
obtenidos para hacer inferencias acerca de
las poblaciones.
• Comprende la utilidad de métodos y
procedimientos a partir de datos que
muestra una población o muestra; a partir de
ello, se obtienen conclusiones útiles para
hacer deducciones sobre la totalidad, basada
en la información numérica de la muestra.
Seminario de Tesis II

Estadística inferencial
Seminario de Tesis II

Tabla de frecuencias

Tenemos k valores distintos en la muestra x1,…, xk


• Frecuencia absoluta de un valor xi
número de veces que aparece xi en la muestra, ni
• Frecuencia relativa de un valor xi
cociente de frecuencia absoluta entre tamaño, fi= ni /n

Si tenemos variables cuantitativas, ordenamos x1<…< xk


• Frecuencia absoluta acumulada del valor i-ésimo
suma de las frecuencias absolutas hasta la de xi, Ni=n1+…+ni
• Frecuencia relativa acumulada del valor i-ésimo
frecuencia absoluta acumulada entre tamaño, Fi= Ni /n
Seminario de Tesis II

Tabla de frecuencias

Valor de la Frecuencia Frecuencia Frecuencia Frecuencia


variable absoluta relativa absoluta relativa
acumulada acumulada

xi ni fi Ni Fi
Seminario de Tesis II

Tabla de frecuencias en R

• Frecuencia absoluta: table()


• Frecuencia absoluta acumulada: cumsum(x) donde x
es un objeto tipo table.
• Frecuencia relativa: prop.table(x)
• Frecuencia relativa acumulada:
cumsum(prop.table(x))
Seminario de Tesis II

Tabla de frecuencias en R

Datos:

174, 180, 187, 174,


179, 172, 180, 180,
176, 180, 160, 160
Seminario de Tesis II

Tabla de frecuencias en R

> tabla<-c(174,180,187,174,179,172,180,180,176,180,160,160)
> table(tabla)
tabla
160 172 174 176 179 180 187
2 1 2 1 1 4 1
> a<-table(tabla)
> cumsum(a)
160 172 174 176 179 180 187
2 3 5 6 7 11 12
> prop.table(a)
tabla
160 172 174 176 179 180
0.16666667 0.08333333 0.16666667 0.08333333 0.08333333 0.33333333
187
0.08333333
Seminario de Tesis II

Tabla de frecuencias en R

> cumsum(prop.table(a))
160 172 174 176 179 180 187
0.1666667 0.2500000 0.4166667 0.5000000 0.5833333 0.9166667
1.0000000
Seminario de Tesis II

Tabla de frecuencias en R

Datos: xi ni fi Ni Fi
160 2 0.17 2 0.17
174, 180, 187, 174,
179, 172, 180, 180, 172 1 0.08 3 0.25
176, 180, 160, 160 174 2 0.17 5 0.42
176 1 0.08 6 0.5
179 1 0.08 7 0.58
180 4 0.33 11 0.92
187 1 0.08 12 1
Seminario de Tesis II

Medidas de tendencia central

Valores típicos o representativos que pretenden


resumir los datos en un solo valor.

• Media: es la media aritmética de los datos.

Es sensible a valores extremos y particularmente útil


cuando los datos son simétricos respecto a ella.
Seminario de Tesis II

Medidas de tendencia central


Ejemplo media aritmética

Cómo obtenemos la media aritmética de las edades de


una pequeña población?
Seminario de Tesis II

Medidas de tendencia central

• Media general: Se utiliza para calcular la media a


todos los puntajes combinados. Esta ecuación
establece que la media general es igual a la suma de
la media de cada grupo por la cantidad de puntajes
en el grupo, divida entre la suma del número de
puntajes en cada grupo.
Seminario de Tesis II

Medidas de tendencia central


Ejemplo media general
Seminario de Tesis II

Medidas de tendencia central

• Mediana: al menos la mitad de los datos son mayores


o iguales que ella y al menos la mitad son menores o
iguales.
No es sensible a valores extremos (es robusta).
Seminario de Tesis II

Medidas de tendencia central


Ejemplo mediana
Seminario de Tesis II

Medidas de tendencia central

• Moda: es el valor con mayor frecuencia (no tiene por


qué se único)
Seminario de Tesis II

Medidas de tendencia central en R

• Media aritmética: mean()


• Mediana: median()
• Moda: El cálculo de la moda puede hacerse con la
función implementada en el paquete modeest.
Seminario de Tesis II

Medidas de tendencia central en R

> tabla<-c(174,180,187,174,179,172,180,180,176,180,160,160)
> mean(tabla)
[1] 175.1667
> median(tabla)
[1] 177.5

> install.packages("modeest")
> library(modeest)
> mlv(tabla, method="mfv")
[1] 180
Seminario de Tesis II

Medidas de tendencia central en R

x = 175.17 xi ni fi Ni Fi
Me = 177.5 160 2 0.17 2 0.17
172 1 0.08 3 0.25
Moda = 180 174 2 0.17 5 0.42
176 1 0.08 6 0.5
179 1 0.08 7 0.58
180 4 0.33 11 0.92
187 1 0.08 12 1
Seminario de Tesis II

Cuantiles

Son medidas de posición no central.


• Cuartiles: dividen a la muestra en 4 partes iguales
(Q1, Q2, Q3).
• Percentiles: dividen a la muestra en 100 partes
iguales (P25 = Q1).
• Deciles: dividen a la muestra en 10 partes iguales.
Seminario de Tesis II

Cuantiles en R

En R se alcanzan usando la función quantile(x,p),


siendo ‘x’ la variable aleatoria y ‘p’ el percentil
que se esté deseado en determinar. Dado que
Cuartiles y Deciles son un caso particular de
Percentiles, basta utilizar la función quantile en el
que se indica la variable en estudio y el porcentaje
que queda acumulado por debajo. Sino se indica el
valor de ‘p’ en la función, R devuelve un vector con
los cuartiles.
Seminario de Tesis II

Cuantiles en R

Dada la muestra anterior

> quantile(tabla)
0% 25% 50% 75% 100%
160.0 173.5 177.5 180.0 187.0
Seminario de Tesis II

Medidas de dispersión
Seminario de Tesis II

Medidas de dispersión
Seminario de Tesis II

Medidas de dispersión

Cuantifican la dispersión de los datos de la muestra.


• Varianza: promedio de las desviaciones cuadráticas a
la media

( ) ()
k k
s =  f i xi − x s =  f i xi − x
2 2 2 2 2
;
i =1 i =1

• Desviación estándar: raíz cuadrada de la varianza


Seminario de Tesis II

Medidas de dispersión

• Rango: Distancia entre observaciones extremas, xk


– x1

• Coeficiente de variación: CV = s / x
Seminario de Tesis II

Medidas de dispersión en R

• Varianza:Por defecto, R calcula la varianza muestral.


Por tanto, en R habría que realizar var() ∗ (n −
1)/n para obtener la varianza que es dividida por
‘n’
• Desviación estándar: Por defecto, R calcula la
desviación estándar muestral sd()
• Rango: min() y max()
• Coeficiente de variación: sd()/mean()
Seminario de Tesis II

Medidas de dispersión en R

Dada la muestra anterior

> v<-var(tabla)*(length(tabla)-1)/length(tabla)
• Varianza = 60.14
>v
[1] 60.13889 • Desv. Típica =
> sqrt(v) 7.75
[1] 7.754927 • Rango = 27
> max(tabla)-min(tabla)
[1] 27
• Coeficiente de
> sqrt(v)/mean(tabla)
variación =
[1] 0.0442717
4.43%
Seminario de Tesis II

Gráficos

Análisis sensorial. En la Tabla 01, se presentan los resultados de


la evaluación sensorial de las conservas de huevo de codorniz.
Tabla01. Análisis sensorial de las conservas después de los 10 días almacenamiento
MUESTRA Sabor Olor Textura Tratamiento
Muestra 1 4.7 4.63 3.3 1
Muestra 2 2.8 4.63 3.3 2
Muestra 3 5.9 4.85 3.6 1
Muestra 4 2.5 4.62 3.3 1
Muestra 5 1.7 4.6 3.6 2
Muestra 6 3 4.63 3.6 2
Muestra 7 2.4 4.7 3.2 1
Muestra 8 2.8 4.65 3.3 2
Muestra 9 4.5 4.78 3.6 2
Muestra 10 3.5 4.7 3.4 1
Muestra 11 5.2 4.77 3.8 1
Muestra 12 5.5 4.83 2.2 1
Muestra 13 4.5 4.74 3.5 2
Muestra 14 3.5 4.65 3.6 2
Seminario de Tesis II

Importando datos de Excel


Seminario de Tesis II

Importando datos de Excel


Seminario de Tesis II

Diagrama de barras
X es un vector con las frecuencias de las observaciones del factor sabor

> x<-table(ejemplo_1_RStudio$Sabor)
> barplot(x, col ="yellow", xlab="Sabor", ylab="Frecuencias absolutas", main ="Diagrama
de barras para la variable Sabor")
Seminario de Tesis II

Diagrama de sectores
X es un vector con las frecuencias de las observaciones del factor sabor

> x<-table(ejemplo_1_RStudio$Sabor)
> pie(x, main ="Diagrama de sectores para la variable Sabor")
Seminario de Tesis II

Diagrama de cajas

Aparecen cuartiles, mediana y valores extremos


Seminario de Tesis II

Diagrama de cajas
X es un vector con las observaciones del factor olor

> X<-ejemplo_1_RStudio$Olor
> boxplot(X, horizontal = TRUE)
Seminario de Tesis II

Histograma
X es un vector con las frecuencias de las observaciones del factor olor

> x<-table(ejemplo_1_RStudio$Olor)
> hist(x, main = "Histograma de frecuencias", ylab = "Frecuencia")
Seminario de Tesis II

Medidas de forma
Asimetría

• Coeficiente de Asimetría: sirve para estudiar las


desviaciones respecto de la media

 f (x − x )
k
3
i i
CA = i =1
s3
Seminario de Tesis II

Medidas de forma
Asimetría

2,4
2,4
2
2
1,6
1,6
1,2
1,2
0,8

0,4
0,8

0 0,4
0 0,2 0,4 0,6 0,8 1
0
0 0,2 0,4 0,6 0,8 1
CA<0
CA>0

2,4

1,6

1,2
Para los N = 48
CA = −0.21
0,8

0,4

0
0 0,2 0,4 0,6 0,8 1

CA~0
Seminario de Tesis II

Medidas de forma
Apuntamiento o curtosis

• Coeficiente de Apuntamiento (o curtosis): indica el


grado de concentración de los valores que toma la
variable en torno a su media

 f (x − x )
k
4
i i
CAp = i =1
4
−3
s
Seminario de Tesis II

Medidas de forma
Apuntamiento o curtosis

12 2,4

10 2

8 1,6

6 1,2

4 0,8

2 0,4

0 0
0 0,2 0,4 0,6 0,8 1 0 0,2 0,4 0,6 0,8 1

CAp>0 CAp<0

0,4

0,3
Para los N = 48
0,2

0,1 CAp = −0.86


0
-5 -3 -1 1 3 5

CAp~0
Ignacio Cascos Depto. Estadística, Universidad Carlos III 47
Seminario de Tesis II

Bibliografía

• Alarcón R. (2013). Métodos y diseños de invetifación del


comportamiento. Editorial Universitaria: Lima
• Palomino, J., Peña, J., Zevallos, G. y Orizano, L. (2016).
Metodología de la investigación. Lima: Editorial San
Marcos.
• Pagano, R. (2016). Estadística para las ciencias del
comportamiento. Ciudad de México. Cengage Learning.

También podría gustarte