Statistics">
Unidades Completas
Unidades Completas
Unidades Completas
Lo que indica que esa cantidad 𝜋 converge en distribución a una normal estándar,
luego de este resultado se puede deducir un intervalo de confianza a través de
una aproximación y el resultado es como sigue:
𝑍1−𝛼
2
𝐼(1−𝛼/2) (𝑝̂ ) = (𝑝̂ ± √𝑝̂ (1 − 𝑝̂ ))
√𝑛
𝑑 𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
𝑝̂1 − 𝑝̂ 2 → 𝑁 (𝑝1 − 𝑝2 , √ + )
𝑛1 𝑛2
𝑝̂1 (1 − 𝑝̂1 ) 𝑝̂ 2 (1 − 𝑝̂ 2 )
𝐼(1−𝛼/2) (𝑝1 − 𝑝2 ) = (𝑝̂1 − 𝑝̂ 2 ± 𝑍1−𝛼/2 √ + )
𝑛1 𝑛2
𝑥̅ − 𝜇
𝑃 (−𝑍𝛼/2 < 𝑠 < 𝑍𝛼/2 ) = 1 − 𝛼
⁄ 𝑛
√
3 Resumen
• Los intervalos de confianza que presentan los textos básicos de estadística,
construidos con base en la aproximación mediante la normal, tienen un
desempeño pobre, pueden resultar intervalos que no tienen sentido o
intervalos con probabilidad de cobertura por debajo del nivel de confianza
nominal, especialmente cuando las muestras no son muy grandes.
• Dentro de los intervalos de confianza para la proporción nos encontramos
con intervalos de confianza para la proporción e intervalos de confianza
para la diferencia de proporciones.
• También debemos tener en cuenta el intervalo aproximado para la media de
una distribución cualquiera, para cuando una muestra aleatoria simple siga
una distribución cualquiera con media µ.
4 Referencias Bibliográficas
• Miranda, I. E., Palacín, F., Sánchez, M. L., Márquez, M., Chía, A. R., Navas, A.
S., y otros. (3ra. Edición 2006). Estadística Descriptiva y Probabilidad. Cádiz:
Servicio de Publicaciones de la Universidad de Cádiz.
• Montgomery, D., & R., R. (2da. Edición 2008). Probabilidad y Estadística
Aplicada a la Ingeniería. México: Limusa Wiley.
• Walpole, R., Myers, R., & Myers, S. y. (2007). Probabilidad y Estadística para
Ingeniería y Ciencias. México: Pearson.
1 Introducción .......................................................................................................................... 3
2 Método de la Variable Pivotal .......................................................................................... 3
2.1 Intervalo Aleatorio .......................................................................................... 3
2.2 Intervalo de Confianza (1 – α) .................................................................... 3
2.3 Límites del Intervalo .....................................................................................4
2.4 Variable Aleatoria Pivotal .............................................................................4
2.5 Método de la Variable Pivotal .....................................................................4
3 Intervalos de Confianza en Poblaciones Normales ...................................................4
3.1 Intervalo de Confianza para la Media, Conocida la Varianza ............ 5
3.2 Intervalo de Confianza para la Media, Desconocida la Varianza......6
3.3 Intervalo de Confianza para la Varianza, Conocida la Media ............ 7
3.4 Intervalo de Confianza para la Varianza, Desconocida la Media ...... 7
3.5 Intervalo de Confianza para la Diferencia de Medias de Muestras
Pareadas ............................................................................................................ 7
3.6 Intervalo de Confianza para la Diferencia de Medias de Muestras
Independientes ...............................................................................................8
4 Resumen ............................................................................................................................... 10
5 Referencias Bibliográficas .............................................................................................. 10
1 Introducción
En esta unidad de aprendizaje estudiaremos uno de los métodos de estimación
que está tomando mayor importancia en el ámbito de la estadística aplicada.
Nos referimos a los intervalos de confianza, éstos presentan ventajas sobre
otros métodos de estimación que veremos más adelante, debido a que estos
aportan mayor información en magnitud y precisión de las estimaciones,
permitiendo una mejor interpretación de las estimaciones hechas sobre ellas.
Veremos cómo se hace inferencia sobre los parámetros más conocidos y
comunes, así como también las distintas interpretaciones que se presentan en
cada caso
Es un intervalo tal que al menos uno de sus extremos es una variable aleatoria.
Dada una muestra aleatoria simple proveniente de una variable aleatoria 𝑋 con
“En el intervalo aleatorio, al menos función de densidad o masa de probabilidad 𝑓𝑋 (𝑥; 𝜃), en la cual dicha distribución
uno de sus extremos es una variable depende de un parámetro desconocido 𝜃, dadas las estadísticas 𝜃(𝑥) y 𝜃 ′ (𝑥) el
aleatoria”
intervalo de confianza de nivel (1 − 𝛼)100%, es tal que:
𝑃[𝜃(𝑥) ≤ 𝜃 ≤ 𝜃 ′ (𝑥)] ≥ 1 − 𝛼
𝑥̅ − 𝜇
𝑧= ~𝑁(0,1)
𝜎 2⁄
√𝑛
𝜎 2 Es conocido.
Ejemplo 2: Sea 𝑥1 , 𝑥2 , … , 𝑥𝑛 una muestra aleatoria de una población normal
𝑥̅ −𝜇
𝑁(𝜇, 𝜎 2 ); 𝜎 2 conocido, la variable aleatoria 𝑡 = 𝑆 es una cantidad pivotal,
⁄
entonces tenemos que efectivamente, la variable √𝑛 aleatoria 𝑡 depende de los
valores 𝑥1 , 𝑥2 , … , 𝑥𝑛 a través de 𝑥̅ y 𝑆 2 . Además está en función del parámetro 𝜇,
entonces:
𝑥̅ − 𝜇
𝑡= ~𝑡(𝑛−1)
𝑆⁄
√𝑛
Sea 𝑄𝑥 una variable pivotal de 𝜃 de una cierta población con función densidad o
masa de probabilidad entonces para un cierto nivel de confianza 1 − 𝛼 ∈ (0,1),
existen constantes 𝑞1 ∧ 𝑞2 que dependen de un nivel de confianza 1 − 𝛼 tal que
𝑃𝜃 [𝑞1 ≤ 𝑄𝑥 ≤ 𝑞2 ] = 1 − 𝛼, si para cada valor muestral 𝑥1 , 𝑥2 , … , 𝑥𝑛 ; 𝑞1 ≤
(1) (2)
𝑄𝑥 (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) ≤ 𝑞2, si y solo si 𝑃[𝜃̂1 < 𝜃̂2 ] = 1 luego el intervalo (𝜃̂𝑛 , 𝜃̂𝑛 ) es un
intervalo de confianza para (1 − 𝛼)100%.
Gráfico 1: Valores 𝑍𝛼
2
Ejemplo 3. Suponga que la vida promedio útil, medida en horas, de focos de 100
watts producidos por cierta compañía, puede ser modelada mediante una variable
aleatoria con distribución normal de media 𝜇 y varianza 𝜎 2.
Suponga que la desviación estándar 𝜎 es conocida y es igual a 30 horas.
El objetivo es encontrar un intervalo de confianza para la vida promedio útil 𝜇 de
los focos producidos por esta compañía. Para ello se toma una muestra de 20
focos y mediante pruebas de laboratorio se determina la vida útil de cada uno de
ellos. Los resultados 𝑥1 , . . . , 𝑥20 arrojan una media muestral 𝑥̅ de 1050 horas.
Si consideramos un nivel de confianza del 95%, es decir, 𝛼 = 0.05, de la tabla de
“A un nivel de confianza 95% z=1,96” probabilidad normal se encuentra que 𝑍𝛼/2 = 𝑍0.025 = 1.96, y entonces puede ahora
calcularse el intervalo:
Puede estar un 99% seguro que las millas por galón promedio del auto es menor
que el mínimo de 27.5. Se le aconseja que busque otro modelo.
Se dice que dos variables aleatorias 𝑋 y 𝑌 son pareadas cuando los datos son
“Dos variables aleatorias son pareadas tomados por parejas de un solo individuo.
cuando los datos son tomados por
𝜎12 𝜎22 𝜎2 𝜎 2
𝑃 (𝑥̅ − 𝑦̅ − 𝑧1−𝛼 √ + ≤ 𝜇2 − 𝜇1 ≤ 𝑥̅ − 𝑦̅ + 𝑧1−𝛼 √ 1 + 2 ) = 1 − 𝛼
2 𝑛1 𝑛2 2 𝑛1 𝑛2
𝑆12 𝑆22
𝐼1−𝛼/2 (𝜇2 − 𝜇1 ) = (𝑥̅ − 𝑦̅ ± 𝑡(𝑎, 𝛼 √( + ))
1− )
2 𝑛1 𝑛2
5 Referencias Bibliográficas
• Miranda, I. E., Palacín, F., Sánchez, M. L., Márquez, M., Chía, A. R., Navas, A.
S., y otros. (3ra. Edición 2006). Estadística Descriptiva y Probabilidad. Cádiz:
Servicio de Publicaciones de la Universidad de Cádiz.
• Montgomery, D., & R., R. (2da. Edición 2008). Probabilidad y Estadística
Aplicada a la Ingeniería. México: Limusa Wiley.
• Walpole, R., Myers, R., & Myers, S. y. (2007). Probabilidad y Estadística para
Ingeniería y Ciencias. México: Pearson.
1.1 Insesgamiento
al parámetro”
𝐸(𝜃̂) = 𝜃
1.2 Consistencia
Pero
𝑉(𝑥̅ ) = 𝐸 2 (𝑥̅ ) − 𝐸(𝑥̅ 2 ) ⇒ 𝐸(𝑥̅ − 𝜇)2 = 𝑉(𝑥̅ ) + 𝐸 2 (𝑥̅ ) − 2𝜇𝐸(𝑥̅ ) + 𝜇2
Luego
𝜎2 𝜎2
𝐸(𝑥̅ − 𝜇)2 = 𝑉(𝑥̅ ) + 𝐸 2 (𝑥̅ ) − 2𝜇𝐸(𝑥̅ ) + 𝜇2 = + 𝜇2 − 2𝜇2 + 𝜇2 =
𝑛 𝑛
Ahora bien
𝜎2
lim 𝐸(𝑥̅ − 𝜇)2 = lim =0
𝑛→∞ 𝑛→∞ 𝑛
1.3 Suficiencia
1.4 Eficiencia
Este resultado se deduce del teorema del límite central, además de que por ser
combinaciones lineales de normales se hereda la normalidad.
Utilizando las mismas conclusiones a partir del teorema del límite central, como
es de saber para tamaños de muestra considerados grandes, para una población
con función de densidad masa 𝐵𝑒𝑟(𝑝), se tiene que la distribución de la
proporción muestral se puede aproximar mediante una normal, tal que:
𝑝𝑞
𝑝̂ ~𝑁 (𝑝, √ )
𝑛
4 Referencias Bibliográficas
• Miranda, I. E., Palacín, F., Sánchez, M. L., Márquez, M., Chía, A. R., Navas, A.
S., y otros. (3ra. Edición 2006). Estadística Descriptiva y Probabilidad. Cádiz:
Servicio de Publicaciones de la Universidad de Cádiz.
• Montgomery, D., & R., R. (2da. Edición 2008). Probabilidad y Estadística
Aplicada a la Ingeniería. México: Limusa Wiley.
• Walpole, R., Myers, R., & Myers, S. y. (2007). Probabilidad y Estadística para
Ingeniería y Ciencias. México: Pearson.
1 Introducción .......................................................................................................................... 3
2 Conceptos Básicos .............................................................................................................. 3
2.1 Muestra Aleatoria ............................................................................................ 3
2.2 Parámetro.......................................................................................................... 3
2.3 Estadística.........................................................................................................4
2.4 Estimador ..........................................................................................................4
3 Métodos de Estimación ......................................................................................................4
3.1 Método de los Momentos .............................................................................4
3.2 Método de Máxima Verosimilitud .............................................................. 5
3.3 Método por Analogía......................................................................................6
4 Resumen ................................................................................................................................. 7
5 Referencias Bibliográficas ................................................................................................ 7
1 Introducción
En esta unidad de aprendizaje trataremos el estudio de la rama de la estadística
que se encarga de sacar conclusiones a partir de la aplicación de estadísticas a
muestras aleatorias, las cuales siguen una distribución de probabilidad con
parámetros desconocidos.
Entonces nuestro interés se centra en este caso, en acercar valores estimados a
los valores reales de los parámetros poblacionales por medio de métodos de
estimación, teniendo en cuenta las propiedades de esos en cuanto a calidad y
errores se refiere.
2 Conceptos Básicos
2.2 Parámetro
generalmente desconocido”
• 𝜇 : Media poblacional
• 𝜎 2 : Varianza poblacional
• 𝜌 : Proporción poblacional
• 𝜏 :Total poblacional
• 𝑚á𝑥(𝑥𝑗 ): Máximo poblacional
• min(𝑥𝑗 ): Mínimo poblacional
Es una estadística.
• La función 𝑥̅ + 𝜎 2 no es una estadística, si 𝜎 2 es desconocido.
2.4 Estimador
3 Métodos de Estimación
̂ = (𝜽𝟏 , 𝜽𝟐 , … , 𝜽𝒌 )
Y se resuelve el sistema para hallar 𝜽
Ejemplo 3: Sea 𝒙𝟏 , 𝒙𝟐 , … , 𝒙𝒏 una muestra aleatoria de tamaño 𝒏 de una población
con distribución normal con media 𝝁 y varianza 𝝈𝟐 hallemos el estimador de 𝝁 por
el método de los momentos. Entonces:
𝑿~𝑵(𝝁, 𝝈𝟐 ), después 𝑬(𝑿) = 𝝁 y 𝑽𝒂𝒓(𝑿) = 𝝈𝟐 además 𝑽𝒂𝒓(𝑿) = 𝑬(𝑿𝟐 ) − [𝑬(𝑿)]𝟐,
así 𝑬(𝑿𝟐 ) = 𝝁𝟐 + 𝝈𝟐 , ahora usando el método de los momentos tenemos que:
𝑛
1
𝐸(𝑋) = 𝜇 = ∑ 𝑥𝑖
𝑛
𝑖=1
𝑛
1
𝐸(𝑋 2)
= 𝜇 + 𝜎 = ∑ 𝑥𝑖2
2 2
𝑛
𝑖=1
Luego
𝑛
1
𝜇̂ = ∑ 𝑥𝑖
𝑛
𝑖=1
𝑛
1
𝜇̂ + 𝜎̂ = ∑ 𝑥𝑖2
2 2
𝑛
𝑖=1
𝐿(𝜃, 𝑥̂) = 𝑓𝑥1… ,𝑥𝑛 (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) = 𝑓𝑥1 (𝑥1 ) ∙ 𝑓𝑥2 (𝑥2 ) ∙ ⋯ ∙ 𝑓𝑥3 (𝑥3 ) = ∏ 𝑓𝑥𝑖 (𝜃, 𝑥𝑖 )
𝑖=1
Así:
𝑛
𝐿(𝑝, 𝑥) = 𝑝 𝑛 𝑞∑𝑖=1 𝑥𝑖
ln 𝐿(𝑝, 𝑥) = 𝑛 ∙ ln 𝑝 + ∑ 𝑥𝑖 ln 𝑞
𝑖=1
Consta en elegir, luego de indagar, el papel que cumplen los componentes del
“El método por analogía deriva una
parámetro dentro del modelo; derivando una estadística que de manera similar
o análoga realice las mismas funciones en la función empírica.
estadística que de manera análoga
función empírica”
4 Resumen
• Sea 𝑥1 , 𝑥2 , … , 𝑥𝑛 𝑣. 𝑎 independientes con la misma función de densidad de
probabilidad 𝑓𝑋 (𝑥), se define 𝑥1 , 𝑥2 , … , 𝑥𝑛 como una muestra aleatoria de
tamaño 𝑛.
• El parámetro es un valor poblacional que caracteriza a una distribución o a
una población y por lo general es desconocido.
• La estadística es una función de 𝑣. 𝑎 observables que no contienen
parámetros desconocidos.
• El estimador es un estadístico de valores muestrales, que se usa para
estimar parámetros poblacionales.
• Dentro de los métodos de estimación encontramos e método de los
momentos, el método de máxima verosimilitud y el método por analogía.
5 Referencias Bibliográficas
• Miranda, I. E., Palacín, F., Sánchez, M. L., Márquez, M., Chía, A. R., Navas, A.
S., y otros. (3ra. Edición 2006). Estadística Descriptiva y Probabilidad. Cádiz:
Servicio de Publicaciones de la Universidad de Cádiz.
• Montgomery, D., & R., R. (2da. Edición 2008). Probabilidad y Estadística
Aplicada a la Ingeniería. México: Limusa Wiley.
• Walpole, R., Myers, R., & Myers, S. y. (2007). Probabilidad y Estadística para
Ingeniería y Ciencias. México: Pearson.
1 Introducción .......................................................................................................................... 3
2 Conceptos Básicos .............................................................................................................. 3
2.1 Unidad Experimental...................................................................................... 3
2.2 Tratamientos .................................................................................................... 3
2.3 Factor ................................................................................................................. 3
2.4 Nivel del factor................................................................................................. 3
2.5 Replicación .......................................................................................................4
2.6 Modelo Asociado a los Datos ......................................................................4
2.7 Modelo de Efectos Fijos................................................................................4
2.8 Modelo de Efectos Aleatorios .....................................................................4
3 Análisis del Modelo de Efectos Fijos .............................................................................4
3.1 Análisis de Varianza de un Solo Factor .................................................... 5
3.2 Descomposición de las Sumas de Cuadrados Total .............................6
3.3 Análisis Estadístico: Diseño Completamente Aleatorizado (DCA).... 7
4 Resumen ............................................................................................................................... 10
5 Referencias Bibliográficas .............................................................................................. 10
1 Introducción
En las anteriores unidades de aprendizaje observamos los distintos métodos de
estimación en el caso que se tuvieran dos poblaciones. Esta inferencia basada
tanto en los intervalos de confianza como en las pruebas de hipótesis se limita al
estudio de máximo dos poblaciones.
Sin embargo en la mayoría de los estudios el número de poblaciones objeto es
“Hasta ahora hemos visto la mayor a la cantidad mencionada. Esto hace necesario la aplicación de técnicas
estadística aplicada a un máximo de de descomposición de la variabilidad en función del interés que existe en sus
dos poblaciones, no obstante en la diferencias. Dicho esto es lógico pretender determinar la existencia o ausencia de
diferencias entre las medias de las poblaciones a través de la metodología
mayoría de estudios el número de
del análisis de varianza.
poblaciones es mayor”
2 Conceptos Básicos
Son los elementos sobre los cuales se hacen las mediciones y a los cuales un
tratamiento puede ser asignado.
2.2 Tratamientos
2.3 Factor
aleatorios los tratamientos son escogidos Es aquel en el cual los tratamientos son escogidos de manera aleatoria para el
de manera aleatoria” estudio de interés.
Nivel de formación
Donde los unos y ceros son los valores de la variable dicótoma que indica la
pertenecía o no al nivel del factor de la observación.
variable”
⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮
𝑦.. 𝑦̅..
𝑦𝑖. = ∑ 𝑦𝑖𝑗
𝑗=1
Que se usa como medida de la variabilidad debida a los errores y determina así
mismo la cantidad de información que no explica el modelo.
𝑎
Entre los
tratamientos 𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠
a-1 𝑀𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 𝐹
Error (Dentro de los 𝑆𝑆𝐸 𝑀𝑆0𝑇𝑡𝑜𝑠
=
Tratamientos) N-a 𝑀𝑆𝐸 𝑀𝑆𝐸
𝑆𝑆𝑇𝑜𝑡𝑎𝑙
Total
Tabla 3: Tabla ANAVA para el modelo con un factor del modelo de efectos fijos
Donde
𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠
𝑀𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 =
𝑎−1
Y
𝑆𝑆𝐸
𝑀𝑆𝐸 =
𝑁−𝑎
Se les llama cuadrados medios. Ahora bajo el supuesto de que la hipótesis nula
es cierta, el cociente:
𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 /(𝑎 − 1)
𝐹0 =
𝑆𝑆𝐸 /(𝑁 − 𝑎)
5 Referencias Bibliográficas
• Miranda, I. E., Palacín, F., Sánchez, M. L., Márquez, M., Chía, A. R., Navas, A.
S., y otros. (3ra. Edición 2006). Estadística Descriptiva y Probabilidad. Cádiz:
Servicio de Publicaciones de la Universidad de Cádiz.
• Montgomery, D., & R., R. (2da. Edición 2008). Probabilidad y Estadística
Aplicada a la Ingeniería. México: Limusa Wiley.
• Walpole, R., Myers, R., & Myers, S. y. (2007). Probabilidad y Estadística para
Ingeniería y Ciencias. México: Pearson.
3 Resumen ................................................................................................................................. 5
Y
𝑎
𝑦𝑖.2 𝑦..2
𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 = ∑ −
𝑛𝑖 𝑁
𝑖=1
2.3 Autocorrelación
los errores deben ser incorrelacionados o Existen procedimientos en la teoría de las series temporales que ayudan a
no correlacionados entre sí” determinar el supuesto de correlación serial pero la más conocida y de mayor
aplicación, es la Prueba de Durbin Watson, sin embargo, al igual que en los
anteriores casos, depende de una buena percepción del problema y se
recomienda el uso de un paquete de software estadístico.
4 Referencias Bibliográficas
• Miranda, I. E., Palacín, F., Sánchez, M. L., Márquez, M., Chía, A. R., Navas, A.
S., y otros. (3ra. Edición 2006). Estadística Descriptiva y Probabilidad. Cádiz:
Servicio de Publicaciones de la Universidad de Cádiz.
• Montgomery, D., & R., R. (2da. Edición 2008). Probabilidad y Estadística
Aplicada a la Ingeniería. México: Limusa Wiley.
• Walpole, R., Myers, R., & Myers, S. y. (2007). Probabilidad y Estadística para
Ingeniería y Ciencias. México: Pearson.
1 Introducción .......................................................................................................................... 3
2 Conceptos Básicos .............................................................................................................. 3
2.1 Hipótesis Estadística ..................................................................................... 3
2.2 Tipos de Hipótesis ..........................................................................................4
1 Introducción
En esta unidad de aprendizaje analizaremos uno de los objetivos fundamentales
en un estudio estadístico para determinar el mínimo nivel de incertidumbre a
través de los conceptos básicos y aplicación de pruebas de hipótesis.
Esto se hace con el fin de encontrar herramientas útiles a la hora de tomar
decisiones acerca de una sospecha o duda razonable que se tenga en un
estudio de investigación. Nuestro interés se centrará entonces en la construcción
de estadísticas de prueba pertenecientes a una determinada distribución
para luego compararla con valores de la tabla en una distribución conocida y
mirar si se rechaza o no cierta hipótesis de interés.
2 Conceptos Básicos
En casos donde se tengan experimentos con múltiples resultados basados en
“Cuando se tengan experimentos eventos aleatorios y la finalidad sea la toma de una decisión, es de mayor interés
con múltiples resultados basados en el buen planteamiento de una hipótesis. Con base a esto, la estrategia natural
eventos aleatorios y la finalidad sea
es decidirse por uno de los experimentos en cuestión. Así el establecimiento de la
regla de decisión delimitara la región de rechazo y con ello las probabilidades
la toma de una decisión, conviene el
de errores a la hora de la toma de decisiones.
planteamiento de una hipótesis”
A continuación veremos los conceptos básicos involucrados en el estudio de las
pruebas de hipótesis para entender mejor la aplicación de esta técnica de
inferencia estadística.
tipo I”
Para probar esta hipótesis en primera instancia se tiene en cuenta que existen
dos zonas de rechazo en ambas colas como se muestra en el Gráfico 1 y en
“Suponemos dos zonas de rechazo
segunda instancia se calcula el estadístico de prueba 𝑍 y se compara con los
para probar esta hipótesis”
valores críticos 𝑍 en la tabla, así tenemos que el valor en mención viene dado por:
𝑥̅ − 𝜇𝐻
𝑍= 𝜎
⁄ 𝑛
√
Ahora comparando 𝑍 con los valores críticos de 𝑧 de la tabla que son ±1.96. La
regla de decisión sería: no se rechaza la hipótesis nula sí −1.96 ≤ 𝑍 ≤ 1.96. Se
rechaza si 𝑍 < −1.96 o 𝑍 > 1.96.
Luego como 𝑍 = 2.91 > 1.96 se rechaza la hipótesis nula a un nivel de
significancia del 5% en favor de la hipótesis alternativa.
En contraste con el anterior caso, en este solo se está interesado en una de las
dos colas de la distribución. Como se muestra en los Gráficos 2 y 3
respectivamente.
Ejemplo 4: En una reunión informativa para una oficina corporativa, el gerente de
un importante hotel, reporto que el número promedio de habitaciones alquiladas
por noche es de por lo menos 212. Uno de los funcionarios corporativos cree que
esta cifra puede estar sobreestimada. Una muestra de 150 noches produce una
media de 201.3 habitaciones y una desviación estándar de 45.5 habitaciones. Si
estos resultados sugieren que el gerente ha inflado su reporte, será amonestado
severamente. A un nivel del 1% ¿Cuál es el destino del gerente?
La afirmación del gerente de que 𝜇 ≥ 212 lleva el signo igual y por tanto se toma
la siguiente hipótesis nula
𝐻0 : 𝜇 ≥ 212 vs 𝐻1 : 𝜇 < 212
Luego
201.3 − 212
𝑍= = −2.88
45.5
√150
4 Resumen
• En casos donde se tengan experimentos con múltiples resultados basados
en eventos aleatorios y la finalidad sea la toma de una decisión, es de
mayor interés, el buen planteamiento de una hipótesis.
5 Referencias Bibliográficas
• Miranda, I. E., Palacín, F., Sánchez, M. L., Márquez, M., Chía, A. R., Navas, A.
S., y otros. (3ra. Edición 2006). Estadística Descriptiva y Probabilidad. Cádiz:
Servicio de Publicaciones de la Universidad de Cádiz.
• Montgomery, D., & R., R. (2da. Edición 2008). Probabilidad y Estadística
Aplicada a la Ingeniería. México: Limusa Wiley.
• Walpole, R., Myers, R., & Myers, S. y. (2007). Probabilidad y Estadística para
Ingeniería y Ciencias. México: Pearson.
1 P Valores y su Interpretación
El p valor para una prueba es la probabilidad de obtener resultados muestrales a
lo menos tan extremos como los que se obtuvieron dado que la hipótesis nula es
verdadera. Se encuentra de la misma manera que el área de la cola, que va más
allá de valor del estadístico para la muestra.
En la practica el p valor es el nivel más bajo de significancia al cual se puede
“El p valor es el nivel más bajo de rechazar la hipótesis nula. Es el área en la cola que está más allá del valor del
significancia al cual se puede rechazar a estadístico para la prueba.
hipótesis nula” Ejemplo 5: Un jefe de personal a partir de un breve análisis de los registros de
los empleados, cree que puede afirmar que los empleados tienen un promedio de
más de 31000 dólares americanos en sus cuentas de pensión. Al tomar una
muestra de 100 empleados, el jefe de personal encuentra una media de 31366,
con una desviación estándar de 1894. Luego el contraste viene dado por:
𝐻0 : 𝜇 ≤ 31000 vs 𝐻1 : 𝜇 > 31000
En conclusión
• Si se tomara un nivel de significancia 𝜶 = 𝟎. 𝟎𝟓 , se tiene que 𝟎. 𝟎𝟐𝟔𝟖 <
𝟎. 𝟎𝟓 lo que indica que cae en zona de rechazo de la hipótesis nula.
• Si se tomara un nivel de significancia 𝜶 = 𝟎. 𝟎𝟏 , se tiene que 𝟎. 𝟎𝟐𝟔𝟖 >
𝟎. 𝟎𝟏 lo que indica que cae en zona de no rechazo de la hipótesis nula.
El error estándar es
0.60(1 − 0.60)
𝜎𝑝 = √ = 0.017
800
Entonces,
0.615 − 0.60
𝑍= = 0.88
0.017
En este caso 𝜎12 = 𝜎22 son desconocidas pero iguales. Además tenemos
(𝑥̅1 − 𝑥̅ 2 ) − (𝜇1 − 𝜇2 )
𝑍=
𝑆12 𝑆22
√
𝑛1 + 𝑛2
En este caso 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐 son desconocidas pero diferentes y la regla de decisión es:
No rechazar si 𝒕 esta entre ±𝟐. 𝟓𝟐𝟖. En otro caso se rechaza.
Para las muestras tomadas de a pares por individuo, se tiene que al igual que en
el caso de una población se calculan las diferencias y se tiene el siguiente
estadístico de prueba:
𝑑̅ − (𝜇1 − 𝜇2 )
𝑡=
𝑆𝑑
√𝑛
Hombres Mujeres
𝑥̅ = 3.5 ℎ 𝑥̅ = 4.9 ℎ
𝑠 = 0.9 ℎ 𝑠 = 1.5 ℎ
Luego:
(3.5 − 4.9) − 0
𝑍= = −5.45
0.257
(0.57)(0.43) (0.527)(0.473)
𝑆𝑝1−𝑝2 = √ + = 0.069
100 110
Con lo que se concluye que, debido a que 𝒁 está entre ±𝟐. 𝟓𝟖 no se puede
rechazar la hipótesis nula con un nivel 𝜶 = 𝟎. 𝟎𝟏 y por tanto el minorista no puede
concluir que las proporciones de compras entre mujeres y hombres son
diferentes.
5 Resumen
• El p valor para una prueba es la probabilidad de obtener resultados
muestrales a lo menos tan extremos como los que se obtuvieron dado que
la hipótesis nula es verdadera.
• Análogo al caso de intervalos de confianza donde las muestras pequ eñas de
poblaciones consideradas normales, puede utilizarse la distribución 𝑡, en
casos en que supone 𝑛 < 30.
• En las pruebas para la proporción, nuestro interés se centra en la
estadística que arroja proporciones o términos de porcentajes, que son de
la mayor importancia en la mayoría de estudios estadísticos.
6 Referencias Bibliográficas
• Miranda, I. E., Palacín, F., Sánchez, M. L., Márquez, M., Chía, A. R., Navas, A.
S., y otros. (3ra. Edición 2006). Estadística Descriptiva y Probabilidad. Cádiz:
Servicio de Publicaciones de la Universidad de Cádiz.
• Montgomery, D., & R., R. (2da. Edición 2008). Probabilidad y Estadística
Aplicada a la Ingeniería. México: Limusa Wiley.
• Walpole, R., Myers, R., & Myers, S. y. (2007). Probabilidad y Estadística para
Ingeniería y Ciencias. México: Pearson.
1 Introducción .......................................................................................................................... 3
4 Distribución Marginal..........................................................................................................8
5 Resumen ............................................................................................................................... 10
1 Introducción
Iniciamos esta unidad de aprendizaje con un repaso por los conceptos básicos
de la teoría de variables aleatorias, con el fin de enlazar los contenidos de la
última unidad de aprendizaje vista en el curso de Estadística I.
Siguiendo con la orientación objeto del curso, nuestro interés ahora se centrará
en determinar la forma en cómo se estudian variables aleatorias
bidimensionales y la interacción que consigo lleva su medición. También es de
interés final medir el grado, intensidad y el sentido de asociación entre las
características de interés.
reales” 𝑋: Ω → ℝ
Decimos que una variable aleatoria es discreta, cuando toma un valor particular y
“Una variable aleatoria es discreta este resulta de ser un valor entero.
cuando oma un valor particular y este
Ejemplo:
resulta ser un valor entero”
Una variable aleatoria discreta puede ser la edad, debido a que toma valores en el
conjunto {0, 1, 2,….., n} que es un conjunto discreto porque es finito.
Decimos que una variable aleatoria es continua cuando toma todos los valores
dentro de un intervalo (a, b) ⊆ ℝ. Esta clasificación de variables aleatorias es
“Una variable aleatoria es continua
limitada ya que existen variables aleatorias que no son absolutamente continuas o
cuando toma todo los valores dentro
absolutamente discretas, es decir, pueden tomar valores de ambos conjuntos
de un intervalo” numéricos.
Dada una variable aleatoria 𝑋 discreta que toma los valores en un conjunto finito
o numerable y con probabilidades no nulas. La función de probabilidad de la
variable 𝑋 denotada por 𝑓(𝑥) ∶ 𝑅 → [0, ∞) se define como sigue:
𝑃(𝑋 = 𝑥) 𝑠𝑖, 𝑥 = 𝑥1 , 𝑥2 , …
𝑓(𝑥) = {
0 𝑐. 𝑜. 𝑐
• ∑∞
𝑖=1 𝑓(𝑥𝑖 ) = 1
∞
• ∫−∞ 𝑓(𝑥) 𝑑𝑥 = 1.
• ∑𝑥,𝑦 𝑓(𝑥, 𝑦) = 1.
Ejemplo 1: Considere el par de variables aleatorias dado (𝑿, 𝒀), con función de
densidad dada por la siguiente tabla.
𝑥/𝑦 0 1
−1 0.2 0.1
1 0.5 0.2
Tabla 1: ejemplo 1
De la tabla se deduce que la variable 𝑋 toma valores del conjunto {−1,1}, mientras
que 𝑌 toma valores en {0,1}. Además las probabilidades conjuntas están dadas
por las entradas de la tabla.
Ejemplo: 𝑃(𝑋 = −1, 𝑌 = 0) = 0.2, esto es, la probabilidad de que 𝑋 tome el valor
de −1 y al mismo tiempo 𝑌 tome el valor 0 es 0.2. El resto de la información puede
escribirse de la siguiente manera.
0.2 𝑆𝑖 𝑥 = −1, 𝑦 = 0,
0.1 𝑆𝑖 𝑥 = −1, 𝑦 = 1,
𝑓(𝑥, 𝑦) = 𝑃(𝑋 = 𝑥, 𝑌 = 𝑦) = 0.5 𝑆𝑖 𝑥 = 1, 𝑦 = 0,
0.2 𝑆𝑖 𝑥 = 1, 𝑦 = 1,
{ 0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
𝐹(𝑥, 𝑦) = ∫ ∫ 𝑓(𝑢, 𝑣) 𝑑𝑢 𝑑𝑣
−∞ −∞
Ejemplo 2: Dado el par de variables aleatorias (𝑿, 𝒀), con función de densidad
conjunta dada por:
𝑥𝑦
𝑘( + 1) 𝑆𝑖 0 < 𝑥 < 1, −1 < 𝑦 < 1.
𝑓(𝑥, 𝑦) = { 2
0 𝐶𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑐𝑎𝑠𝑜
4 Distribución Marginal
En los escenarios donde la función de distribución F(x,y) del par de variables
“Si la función de distribución F(x, y) es aleatorias (X,Y), es dada, se hace posible obtener la función de distribución de
dada, es posible obtener la función de cada una de las variables aleatorias independientes, de la siguiente manera.
distribución de cada una de las
Dado el par de variables aleatorias (𝑿, 𝒀), con función de distribución 𝑭(𝒙, 𝒚).
Entonces la función:
𝐹(𝑥) = lim 𝐹(𝑥, 𝑦).
𝑦→∞
Dado el par de variables aleatorias (𝑿, 𝒀), absolutamente continuas con función
masa o de densidad de probabilidad 𝒇(𝒙, 𝒚). Entonces la función:
∞
𝑓(𝑥) = ∫−∞ 𝑓(𝑥, 𝑦) 𝑑𝑦.
Nota: Si el vector es de tipo discreto solo basta con reemplazar las integrales con
términos de sumatorias para que las definiciones cobren sentido para tal caso.
𝑥 1 1
Tabla 2: Marginal de 𝑥
De manera similar, la marginal de 𝒀 vendría dada por:
𝑦 0 1
Tabla 3: Marginal de 𝑦
Ejemplo 4: En concordancia con los datos del ejemplo 2 y a partir de su función
masa o de densidad de probabilidad se tiene que la marginal de 𝑿 vendría dada
por:
1
𝑥𝑦 1 𝑥 1 1 1 𝑥 1
𝑓1 (𝑥) = ∫ ( + ) 𝑑𝑦 = ∫ 𝑦𝑑𝑦 + ∫ 𝑑𝑦 = 𝑦 2 |1−1 + 𝑦|1−1
−1 4 2 4 −1 2 −1 8 2
𝑥 2 1 𝑥 1
= (1 − (−1)2 ) + (1 − (−1)) = ∙ (0) + ∙ (2) = 1
8 2 8 2
6 Referencias Bibliográficas
• Miranda, I. E., Palacín, F., Sánchez, M. L., Márquez, M., Chía, A. R., Navas, A.
S., y otros. (3ra. Edición 2006). Estadística Descriptiva y Probabilidad. Cádiz:
Servicio de Publicaciones de la Universidad de Cádiz.
• Montgomery, D., & R., R. (2da. Edición 2008). Probabilidad y Estadística
Aplicada a la Ingeniería. México: Limusa Wiley.
• Rincón, L. (2010). Curso elemental de Probabilidad y Estadística. México:
Circuito Exterior de CU.
• Walpole, R., Myers, R., & Myers, S. y. (2007). Probabilidad y Estadística para
Ingeniería y Ciencias. México: Pearson.
1 Independencia ...................................................................................................................... 3
1.1 Independencia de un par de Variables Aleatorias............................... 3
2 Estadísticos de Asociación ............................................................................................... 3
2.1 Covarianza......................................................................................................... 3
2.2 Coeficiente de Correlación .......................................................................... 5
3 Resumen .................................................................................................................................6
4 Referencias Bibliográficas ................................................................................................ 7
1 Independencia
Dado que el interés se centra en el estudio de la relación existente entre dos
variables aleatorias, se hace pertinente el definir el concepto de
independencia de dos variables aleatorias con las herramientas teóricas vistas
hasta aquí.
Se puede afirmar que en un par de variables aleatorias dado (𝐗, 𝐘), las variables
“Se puede afirmar que en un par de aleatorias 𝐗 e 𝐘 son independientes si cumple que:
variables aleatorias dado (X, Y), las variables
f(x, y) = f(x)f(y).
aleatorias X e Y son independientes si:
2 Estadísticos de Asociación
Ahora veamos dos de las estadísticas más importantes en el estudio de variables
aleatorias de tipo bidimensional, una interpretación y sentido al número que
arrojan como resultado.
2.1 Covarianza
La covarianza para el par de variables aleatorias dado (𝐗, 𝐘), denotada por
𝐂𝐨𝐯(𝐗, 𝐘), es el número:
Cov(X, Y) = E[(X − E(X))(Y − E(Y))].
1 1 x2
= ∫ [ y 2 |1−1 + xy|1−1 ] dx
2 0 4
1 1 x2
= ∫ [ (12 − (−1)2 ) + x(1 − (−1))] dx
2 0 4
1 1 x2 1 1 1
1 1 1
= ∫ [ ∙ (0) + x ∙ (2)] dx = ∫ 2x dx = ∫ xdx = x 2 |10 = (12 − 02 ) =
2 0 4 2 0 0 2 2 2
1 1 x 1
= ∫ [ y 3 |1−1 + y 2 |1−1 ] dx
2 0 6 2
1 1 x 1
= ∫ [ (13 − (−1)3 ) + (12 − (−1)2 )] dx
2 0 6 2
1 1 x 1 1 1 x 1 1 1 x2 1 1 2 1
= ∫ [ ∙ (2) + ∙ (0)] dx = ∫ [ ] dx = ∫ xdx = |0 = (1 − 02 ) =
2 0 6 2 2 0 3 6 0 62 12 12
• Por último se calcula el producto cruzado de las variables aleatorias del par:
E(XY)
1 1 1 x2y2 1 1 x2 1 1
= ∫ ∫ ( + xy) dy dx = ∫ [ ∫ y 2 dy + x ∫ ydy] dx
2 0 −1 2 2 0 2 −1 −1
1 1 x2 x 1 1 x2 x
= ∫ [ y 3 |1−1 + y 2 |1−1 ] dx = ∫ [ (13 − (−1)3 ) + (12 − (−1)2 )] dx
2 0 6 2 2 0 2 2
1 1 x2 x 1 1 1 x3 1 1 3 1
= ∫ [ ∙ (2) + ∙ (0)] dx = ∫ x 2 dx = |0 = (1 − 03 ) =
2 0 2 2 2 0 63 18 18
3 Resumen
• Se puede afirmar que en un par de variables aleatorias dado (𝐗, 𝐘), las
variables aleatorias 𝐗 y 𝐘 son independientes si cumple que 𝐟(𝐱, 𝐲) =
𝐟(𝐱)𝐟(𝐲).
• La covarianza para el par de variables aleatorias dado (𝐗, 𝐘), denotada por
𝐂𝐨𝐯(𝐗, 𝐘), es el número:
Cov(X, Y) = E[(X − E(X))(Y − E(Y))].
4 Referencias Bibliográficas
• Miranda, I. E., Palacín, F., Sánchez, M. L., Márquez, M., Chía, A. R., Navas, A.
S., y otros. (3ra. Edición 2006). Estadística Descriptiva y Probabilidad. Cádiz:
Servicio de Publicaciones de la Universidad de Cádiz.
• Montgomery, D., & R., R. (2da. Edición 2008). Probabilidad y Estadística
Aplicada a la Ingeniería. México: Limusa Wiley.
• Rincón, L. (2010). Curso elemental de Probabilidad y Estadística. México:
Circuito Exterior de CU.
• Walpole, R., Myers, R., & Myers, S. y. (2007). Probabilidad y Estadística para
Ingeniería y Ciencias. México: Pearson.
Con lo que se debe estimar a 𝑺𝒚𝑼 por medio de 𝑺𝒚𝑺 dado que lo normal es que no
se conozca.
La fórmula general para el cálculo del tamaño de muestra viene dada por
n0
n≥ n
1 − N0
z1−α/2 S2
Donde n0 = c2 , c es la precisión deseada y z1−α/2 es el valor tabulado de la
distribución normal para el nivel de confianza requerido.
En ciertos casos donde la precisión requerida es de carácter relativo, es decir,
dada en porcentajes se tiene que para proporciones el tamaño de muestra se
calcula según:
k0
n≥
k
1 − N0
z1−α/2 PQ
Donde k 0 = , c es la precisión deseada, P es la proporción, Q su
c2
complemento y z1−α/2 es el valor tabulado de la distribución normal para el nivel
de confianza requerido.
Ejemplo 7:
Para efectos de la planeación socio-económica en una gran ciudad del país, es
necesario estimar entre 2.200 hatos, el número de ganado lechero por hato, con
una precisión del 8% y nivel de confianza del 95.5%.
N = 2.200; n = 40
Entonces:
22 ∙ (1.600) 2
k 0 = [( ) − (1 + )] = 496.22
3.682 40
Por tanto:
496.22
n= ≅ 405
496.22
1+
2.200
Ejemplo 8:
Una empresa dedicada al transporte permite que ciertos gastos de sus afiliados
se hagan mediante la utilización de la tarjeta de crédito expedida para pagos en
las bombas de gasolina locales.
La empresa ha expedido 10.050 tarjetas de créditos. Con el objetivo de realizar
una investigación sobre la utilización de la tarjeta y otras características, se toma
una muestra piloto de 90 tarjetas y se encontró que 63 de ellas fueron utilizadas
para cargar servicios durante el mes de referencia.
Por otra parte, el total de los gastos cancelados con las tarjetas es fue de
2.390.000 y la desviación estándar de 4000, se desea estimar el tamaño de la
muestra, con un error de 2% y un nivel de confianza de 95% para estimar
proporción de afiliados que utilizan la tarjeta.
Entonces de los datos dados en el enunciado tenemos que:
63
P= = 0.7; Q = 0.3; z1−α/2 ; c = 0.02
90
1.962 (0.7)(0.3) 2
n0 = [( 2
) (1 + )] = 2.061,21
0.02 90
2.061,21
n= ≅ 1.711
2.061,2
1+
10.050
∑ 𝑁ℎ = 𝑁
ℎ=1
𝑡𝑦 = ∑ 𝑦𝑘 = ∑ ∑ 𝑦𝑘 = ∑ 𝑡𝑦ℎ
𝑘∈𝑈 ℎ=1 𝑘∈𝑈ℎ ℎ=1
1
Donde 𝑦̅ℎ = 𝑁 ∑𝑘∈𝑈ℎ 𝑦𝑘
ℎ
𝐻
𝑁ℎ2 𝑛ℎ 2
𝑉𝑎𝑟(𝑡̂𝑦 ) = ∑ (1 − ) 𝑆𝑦𝑈
𝑛ℎ 𝑁ℎ ℎ
ℎ=1
𝐻
𝑁ℎ2 𝑛ℎ 2
̂ (𝑡̂𝑦 ) = ∑
𝑉𝑎𝑟 (1 − ) 𝑆𝑦𝑆
𝑛ℎ 𝑁ℎ ℎ
ℎ=1
1 𝑛ℎ 2
𝑉𝑎𝑟(𝑦̂̅𝑈ℎ ) = (1 − ) 𝑆𝑦𝑈ℎ
𝑛ℎ 𝑁ℎ
1 𝑛ℎ 2
̂ (𝑦̅̂𝑈ℎ ) =
𝑉𝑎𝑟 (1 − ) 𝑆𝑦𝑆ℎ
𝑛ℎ 𝑁ℎ
4 Resumen
• Bajo el muestreo aleatorio simple sin reemplazo, un intervalo de confianza
para la media viene dado por:
𝑛 𝑆𝑦𝑈 𝑛 𝑆𝑦𝑈
[𝑦̅𝑆 − 𝑧1−𝛼 √(1 − ) , 𝑦̅𝑆 + 𝑧1−𝛼 √(1 − ) ]
2 𝑁 √𝑛 2 𝑁 √𝑛
Con lo que se debe estimar a 𝑺𝒚𝑼 por medio de 𝑺𝒚𝑺 dado que lo normal es
que no se conozca.
• La fórmula general para el cálculo del tamaño de muestra viene dada por
5 Referencias Bibliográficas
• Miranda, I. E., Palacín, F., Sánchez, M. L., Márquez, M., Chía, A. R., Navas, A.
S., y otros. (3ra. Edición 2006). Estadística Descriptiva y Probabilidad. Cádiz:
Servicio de Publicaciones de la Universidad de Cádiz.
• Montgomery, D., & R., R. (2da. Edición 2008). Probabilidad y Estadística
Aplicada a la Ingeniería. México: Limusa Wiley.
• Walpole, R., Myers, R., & Myers, S. y. (2007). Probabilidad y Estadística para
Ingeniería y Ciencias. México: Pearson.
1 Introducción .......................................................................................................................... 3
2 Conceptos Básicos .............................................................................................................. 3
2.1 Características y Parámetros de Interés ................................................. 3
2.2 Muestra Aleatoria ......................................................................................... 5
2.3 Muestras Probabilísticas .............................................................................. 5
2.4 Diseño Muestral............................................................................................... 5
2.5 Mecanismo de Selección.............................................................................6
2.6 Probabilidades de Inclusión ........................................................................6
2.7 Estadística y Estimador ................................................................................. 7
3 Muestreo Aleatoria Simple Sin Reemplazo (MAS) ..................................................... 7
3.1 Estadística y Estimador .................................................................................8
3.2 Mecanismo de Selección ..............................................................................8
3.3 Estimación para el Total de Y y su Varianza en el MAS .................... 10
3.4 Estimación para el Promedio de Y y su varianza en el MAS ............ 12
4 Resumen ............................................................................................................................... 12
5 Referencias Bibliográficas .............................................................................................. 13
1 Introducción
En esta unidad centraremos nuestro interés en la base de la teoría de la
inferencia estadística, el estudio de recolección de muestras y estimación de
parámetros por el muestreo. Es preciso mencionar que solo se hará un breve
repaso de una extensa y cuidadosa teoría, debido a la complejidad y pertinencia
de algunos de sus conceptos. Siendo el caso de las muestras aleatorias simples
el eje sobre el cual desarrollaremos los contenidos temáticos, en busca de su
utilidad final, la estimación de parámetros poblacionales.
2 Conceptos Básicos
Conocida una población o universo de nuestro interés, el cual está conformado
por 𝑁 elementos y que notaremos como 𝑈 etiquetado como sigue 𝑈 = {1,2, … , 𝑁},
se define entonces una característica de interés 𝑦 la cual tiene como naturaleza
ser una observación medida directamente en 𝑈 y no una realización de una 𝑣. 𝑎
como en unidades anteriores, tomará entonces 𝑦 el valor 𝑦𝑘 en el 𝑘-ésimo
elemento.
El objetivo de hacer muestreo será el de estimar una característica de interés
“El objetivo del muestreo es estimar una determinada en un parámetro poblacional a partir de la observación de un
característica de interés determinada en
subconjunto con ciertas características de los elementos del universo. A
continuación mostraremos los parámetros más comúnmente conocidos y de
un parámetro poblacional”
mayor interés.
𝑡𝑦 = ∑ 𝑦𝑘
𝑘=1
2
∑𝑁 ̅𝑈 )2
𝑘=1(𝑦𝑘 − 𝑦
𝑆𝑦𝑈 =
𝑁−1
Ejemplo 1: Suponga que se tiene una población 𝑼 tal que está etiquetada
de la siguiente manera 𝑼 = {𝟏, 𝟐, 𝟑, 𝟒, 𝟓} y se quiere estimar una variable de
interés 𝒚 para cada elemento en el universo entonces:
U yk
1 35
2 36
3 40
4 23
5 37
𝑡𝑦 = ∑ 𝑦𝑘 = 35 + 36 + 40 + 23 + 37 = 171
𝑘=1
2
∑𝑁 ̅𝑈 )2 [(35 − 34.2)2 + ⋯ + (37 − 34.2)2 ]
𝑘=1(𝑦𝑘 − 𝑦
𝑆𝑦𝑈 = = = 34.16
𝑁−1 4
1-2 0.13
1-3 0.20
1-5 0.10
2-3 0.15
2-4 0.04
2-5 0.02
3-4 0.06
3-5 0.07
4-5 0.08
𝜉4 = 0.71795016, 𝜉5 = 0.95200564
𝑈 𝜉𝑘
1 0.28691106
3 0.86655545
4 0.71795016
5 0.95200564
𝑈 𝜉𝑘
1 0.28691106
4 0.71795016
3 0.86655545
5 0.95200564
2 0.97110167
1 4 10 0,4 0,70554751 0
2 4 9 0,44444444 0,53342402 0
3 4 8 0,5 0,57951862 0
4 4 7 0,57142857 0,28956246 1
5 3 6 0,5 0,30194801 1
6 2 5 0,4 0,7747401 0
7 2 4 0,5 0,01401764 1
8 1 3 0,33333333 0,76072359 0
9 1 2 0,5 0,81449002 0
10 1 1 1 0,7090379 1
𝑁2 𝑛 2
𝑉𝑎𝑟(𝑡̂𝑦 ) = (1 − ) 𝑆𝑦𝑈
𝑛 𝑁
𝑁2 𝑛 2
̂ (𝑡̂𝑦 ) =
𝑉𝑎𝑟 (1 − ) 𝑆𝑦𝑆
𝑛 𝑁
𝒌 𝒚𝒌
4 19
5 56
7 70
10 60
2
∑𝑘∈𝑆(𝑦𝑘 − 𝑦̅𝑠 )2
𝑆𝑦𝑆 = = 496.92
𝑛−1
Con lo que:
𝑁2 𝑛 2 102 4
̂ (𝑡̂𝑦 ) =
𝑉𝑎𝑟 (1 − ) 𝑆𝑦𝑆 = (1 − ) ∙ (496.92) = 7453.75
𝑛 𝑁 4 10
• Es necesario brindar una medida del error para determinar la calidad de las
estimaciones, para ello se utiliza el coeficiente de variación estimado 𝒄𝒗𝒆
como sigue:
̂ (𝑡̂𝑦 )
√𝑉𝑎𝑟
√7453.75
𝑐𝑣𝑒 = × 100% = × 100% ≅ 17%
𝑡̂𝑦 512.5
Lo que puede considerarse como una pobre estimación debido a que 𝒄𝒗𝒆 > 𝟓%
se consideran estimaciones de baja calidad, esto puede ser al poco número de
elementos de la población con tamaño de muestra pequeño.
1 1 𝑛 2
̂ (𝑦̅̂) =
𝑉𝑎𝑟 ̂ (𝑡̂𝑦 ) = (1 − ) 𝑆𝑦𝑆
𝑉𝑎𝑟
𝑁 2 𝑛 𝑁
Con igual medida de calidad para el caso del total, debido a que se trata de los
mismos valores.
4 Resumen
• El objetivo de hacer muestreo será el de estimar una característica de
interés determinada en un parámetro poblacional a partir de la observación
de un subconjunto con ciertas características de los elementos del universo.
• El muestreo aleatorio simple tiene como característica el suponer que el
comportamiento de la característica de interés es similar en todos los
individuos de la población, es decir, supone homogeneidad en la población.
Debido a esto el diseño asigna probabilidades de inclusión idénticas a
todos y cada uno de los elementos de la población haciendo de esta su
característica principal.
Reflexión
Cuando una empresa quiere realizar una investigación de mercado el saber
determinar el tamaño de una muestra le permite a la misma reducir el tiempo en
que se realiza una investigación, aparte de que puede ahorrar recursos no solo
económicos si no de personal.
3/10/23, 5:14 Evaluación Inicial: Revisión del intento
Redes Sociales
Pregunta 1 Decimos que una variable aleatoria es discreta, cuando toma un valor
particular y este resulta de ser un valor entero.
Correcta
https://www.centro-virtual.com/campus/mod/quiz/review.php?attempt=3967604&cmid=5009 1/2
3/10/23, 5:14 Evaluación Inicial: Revisión del intento
Pregunta 4 Decimos que una variable aleatoria es continua cuando toma todos los
valores dentro de un intervalo (a,b) ⊆ ℝ
Correcta
Pregunta 5 Es un intervalo tal que al menos uno de sus extremos es una variable
aleatoria:
Correcta
https://www.centro-virtual.com/campus/mod/quiz/review.php?attempt=3967604&cmid=5009 2/2
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
95% (21) ·
Descargar
6K vistas ·
ahora8 páginas 5 de 8 Buscar documento
Evaluación U1 Comenzado el martes, 14 de mayo de 2019, 22:47 Estado Finalizado Finalizado en sábado, 1 de junio de 2019, 01:23 Tiempo empleado 17
días 2 horas Puntos 9,00/10,00 Calific… Descripción completa
Guardar 95% 5% Insertar Compartir Imprimir
Play now
Skip Ad
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 1/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
1/6/2019 Evaluación U1
Redes Soc
de 8
Evaluación U1
b.
c.
d.
https://www.centro-virtual.com/campus/mod/quiz/review.php?attempt=1052117&cmid=5011 1/
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 2/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
de 8
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 3/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
1/6/2019 Evaluación U1
Pregunta 2
Suponga que tiene una población U tal
de 8
que está etiquetada de la siguiente
Correcta
manera U={1,2,3,4,5} y se quiere estimar
una variable de interés y para cada
Puntúa 1,00 sobre 1,00
elemento en el universo entonces:
Seleccione una:
a. Para el total tenemos que:
b. Falso
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 4/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
1/6/2019 Evaluación U1
Pregunta 4
Determina el valor total de una
de 8
característica de interés en una
Correcta
población y se define como sigue:
Seleccione una:
a. Promedio poblacional y
b. Varianza poblacional y
c. Total poblacional y
https://www.centro-virtual.com/campus/mod/quiz/review.php?attempt=1052117&cmid=5011 3/
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 5/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
de 8
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 6/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
1/6/2019 Evaluación U1
Pregunta 5
Si todas las muestras en el conjunto de
de 8
todas las posibles muestras tienen el
Correcta
mismo tamaño de muestra, decimos que
estamos ante un:
Puntúa 1,00 sobre 1,00
Seleccione una:
a. Diseño de muestreo sin reemplazo.
b. Diseño de muestreo con
reemplazo.
c. Diseño de muestreo con tamaño de
muestra fijo.
Un diseño de muestreo se dice de
tamaño de muestra fijo, si todas las
muestras en el conjunto de todas las
posibles muestras tienen el mismo
tamaño de muestra.
https://www.centro-virtual.com/campus/mod/quiz/review.php?attempt=1052117&cmid=5011 4/
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 7/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
1/6/2019 Evaluación U1
Pregunta 6
Suponga que tiene una población U tal
de 8
que está etiquetada de la siguiente
Correcta
manera U={1,2,3,4,5} y se quiere estimar
una variable de interés y para cada
Puntúa 1,00 sobre 1,00
elemento en el universo entonces:
Seleccione una:
a. Para el promedio tenemos que
El valor de ty
https://www.centro-virtual.com/campus/mod/quiz/review.php?attempt=1052117&cmid=5011 5/
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 8/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
de 8
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 9/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
1/6/2019 Evaluación U1
Pregunta 7
Según el segundo video propuesto en
de 8
esta unidad
Correcta
Seleccione una:
a. El error que se ha cometido al
realizar el proceso de estimación por
intervalos.
b. Es lo mismo decir que, habrá un
2,17% de que los hombres se queden
sin agua. Verdadero.
https://www.centro-virtual.com/campus/mod/quiz/review.php?attempt=1052117&cmid=5011 6/
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 10/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
1/6/2019 Evaluación U1
Pregunta 9
Atendiendo al vídeo propuesto:
de 8
Correcta
Seleccione una:
a. Que pueden ser discretas y
continuas.
b. Que es un experimento aleatorio y
que tiene un resultado.
Verdadero. Lo que define a una variable
aleatoria es que es un experimento
aleatorio y que tiene resultados.
https://www.centro-virtual.com/campus/mod/quiz/review.php?attempt=1052117&cmid=5011 7/
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 11/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
de 8
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 12/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
1/6/2019 Evaluación U1
Pregunta 10
La función de distribución conjunta de
de 8
un par de variables aleatorias dado (X,Y),
Incorrecta
denotada por F(x,y), se define como
sigue:
Puntúa 0,00 sobre 1,00
Seleccione una:
a.
b.
c.
d.
https://www.centro-virtual.com/campus/mod/quiz/review.php?attempt=1052117&cmid=5011 8/
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 13/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
de 8
Documento 8 páginas
Documento 6 páginas
Documento 8 páginas
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 14/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
de 8
Documento 3 páginas
Documento 13 páginas
Documento 13 páginas
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 15/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
de 8
Documento 9 páginas
Evaluación U1
Yuly Flórez
Aún no hay calificaciones
Documento 8 páginas
Documento 9 páginas
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 16/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
de 8
Documento 8 páginas
Evaluación U1_estadisitica
fabiorock6
Aún no hay calificaciones
Documento 8 páginas
Documento 8 páginas
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 17/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
de 8
Títulos relacionados
Obsequios
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 18/19
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
Idioma: Español
de 8
Copyright © 2023 Scribd Inc.
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 19/19
3/10/23, 5:10 Evaluación U3 Estadística II Asturias | PDF | Errores tipo I y tipo Ii | Hipótesis
100% (21) ·
Descargar
5K vistas·
ahora 6 páginas 5 de 6 Buscar documento
Evaluación U3 Comenzado el sábado, 1 de junio de 2019, 01:38 Estado Finalizado Finalizado en sábado, 1 de junio de 2019, 01:46 Tiempo empleado 8
minutos 20 segundos Puntos 9,00/10,00 C… Descripción completa
Guardar 100% 0% Insertar Compartir Imprimir
Play now
Skip Ad
Lider de Mercado
Equipo especializados en la fabricación de bombas industriales por más de 40 años. Abrir
Netzsch
https://es.scribd.com/document/412089384/Evaluacion-U3-Estadistica-II-Asturias 1/16
3/10/23, 5:10 Evaluación U3 Estadística II Asturias | PDF | Errores tipo I y tipo Ii | Hipótesis
1/6/2019 Evaluación U3
Redes Soc
de 6
Evaluación U3
Seleccione una:
a. El efecto del i - ésimotratamiento
https://www.centro-virtual.com/campus/mod/quiz/review.php?attempt=1067448&cmid=5015 1/
https://es.scribd.com/document/412089384/Evaluacion-U3-Estadistica-II-Asturias 2/16
3/10/23, 5:10 Evaluación U3 Estadística II Asturias | PDF | Errores tipo I y tipo Ii | Hipótesis
de 6
https://es.scribd.com/document/412089384/Evaluacion-U3-Estadistica-II-Asturias 3/16
3/10/23, 5:10 Evaluación U3 Estadística II Asturias | PDF | Errores tipo I y tipo Ii | Hipótesis
1/6/2019 Evaluación U3
Pregunta 2
Según el segundo vídeo propuesto:
de 6
Correcta
¿Qué es el P-valor?
Seleccione una:
a. Nivel más alto de significancia al
cual se puede aceptar la Hipótesis
Alternativa (H1 )
b. Nivel más bajo de significancia al
cual se puede rechazar la Hipótesis
Nula (H 0)
Verdadero . El p-valor es el nivel mas
bajo de significancia al cual se puede
rechazar la hipótesis nula .
d. Tratamientos.
https://es.scribd.com/document/412089384/Evaluacion-U3-Estadistica-II-Asturias 4/16
3/10/23, 5:10 Evaluación U3 Estadística II Asturias | PDF | Errores tipo I y tipo Ii | Hipótesis
1/6/2019 Evaluación U3
Pregunta 4
Es la repetición total o parcial de un
de 6
experimento en dos o más conjuntos de
Correcta
condiciones:
Seleccione una:
a. Unidad experimental.
b. Tratamientos.
c. Replicación.
La replicación es la repetición total o
parcial de un experimento en dos o más
conjuntos de condiciones.
d. Factor.
c. Factor.
d. Replicación.
https://www.centro-virtual.com/campus/mod/quiz/review.php?attempt=1067448&cmid=5015 3/
https://es.scribd.com/document/412089384/Evaluacion-U3-Estadistica-II-Asturias 5/16
3/10/23, 5:10 Evaluación U3 Estadística II Asturias | PDF | Errores tipo I y tipo Ii | Hipótesis
Lider de Mercado
de 6
Equipo especializados en la fabricación de bombas industriales
por más de 40 años.
Netzsch Abrir
https://es.scribd.com/document/412089384/Evaluacion-U3-Estadistica-II-Asturias 6/16
3/10/23, 5:10 Evaluación U3 Estadística II Asturias | PDF | Errores tipo I y tipo Ii | Hipótesis
1/6/2019 Evaluación U3
Pregunta 6
A un nivel de significancia del 5%, si
de 6
tenemos Z = 2’91:
Correcta
Correcta
Seleccione una:
Puntúa 1,00 sobre 1,00
a. Error de tipo I.
Al rechazo de la hipótesis nula cuando
ésta es verdadera se le conoce como
error tipo I, y a la probabilidad de
cometer este primer tipo de error se le
denota por laletra α
https://www.centro-virtual.com/campus/mod/quiz/review.php?attempt=1067448&cmid=5015 4/
https://es.scribd.com/document/412089384/Evaluacion-U3-Estadistica-II-Asturias 7/16
3/10/23, 5:10 Evaluación U3 Estadística II Asturias | PDF | Errores tipo I y tipo Ii | Hipótesis
1/6/2019 Evaluación U3
Pregunta 8
Según el primer vídeo propuesto:
de 6
Correcta
Seleccione una:
a. La probabilidad de cometer el error
de tipo II.
b. La probabilidad de cometer el error
de tipo I.
Verdadero. El nivel de significación
indica la probabilidad de cometer el
error de tipo I
b. Región Crítica.
c. Hipótesis Estadística.
https://www.centro-virtual.com/campus/mod/quiz/review.php?attempt=1067448&cmid=5015 5/
https://es.scribd.com/document/412089384/Evaluacion-U3-Estadistica-II-Asturias 8/16
3/10/23, 5:10 Evaluación U3 Estadística II Asturias | PDF | Errores tipo I y tipo Ii | Hipótesis
de 6
https://es.scribd.com/document/412089384/Evaluacion-U3-Estadistica-II-Asturias 9/16
3/10/23, 5:10 Evaluación U3 Estadística II Asturias | PDF | Errores tipo I y tipo Ii | Hipótesis
1/6/2019 Evaluación U3
Pregunta 10
Es una afirmación o conjetura acerca de
de 6
una distribución de una o más variables
Correcta
aleatorias:
Seleccione una:
a. Hipótesis Simple.
b. Hipótesis Estadística.
La hipótesis estadística es una
afirmación o conjetura acerca de una
distribución de una o más variables
aleatorias.
c. Hipótesis Compuesta.
https://www.centro-virtual.com/campus/mod/quiz/review.php?attempt=1067448&cmid=5015 6/
https://es.scribd.com/document/412089384/Evaluacion-U3-Estadistica-II-Asturias 10/16
3/10/23, 5:10 Evaluación U3 Estadística II Asturias | PDF | Errores tipo I y tipo Ii | Hipótesis
de 6
Documento 6 páginas
Documento 6 páginas
Documento 6 páginas
Evaluación U3
natalia
Aún no hay calificaciones
https://es.scribd.com/document/412089384/Evaluacion-U3-Estadistica-II-Asturias 11/16
3/10/23, 5:10 Evaluación U3 Estadística II Asturias | PDF | Errores tipo I y tipo Ii | Hipótesis
de 6
Lider de
Mercado
Equipo especializados en la
fabricación de bombas
industriales por más de 40
años.
Netzsch
Abrir
Documento 5 páginas
Documento 4 páginas
Documento 4 páginas
https://es.scribd.com/document/412089384/Evaluacion-U3-Estadistica-II-Asturias 12/16
3/10/23, 5:10 Evaluación U3 Estadística II Asturias | PDF | Errores tipo I y tipo Ii | Hipótesis
de 6
Lider de
Mercado
Equipo especializados en la
fabricación de bombas
industriales por más de 40
años.
Netzsch
Abrir
Documento 8 páginas
Evaluacion Un 3
Yuly Flórez
Aún no hay calificaciones
Documento 5 páginas
Documento 4 páginas
Estadística-Inferencial_-Revisión-del-intento(1)00000
Edwin Collaguazo
Aún no hay calificaciones
https://es.scribd.com/document/412089384/Evaluacion-U3-Estadistica-II-Asturias 13/16
3/10/23, 5:10 Evaluación U3 Estadística II Asturias | PDF | Errores tipo I y tipo Ii | Hipótesis
de 6
Lider de
Mercado
Equipo especializados en la
fabricación de bombas
industriales por más de 40
años.
Netzsch
Abrir
Documento 7 páginas
1
Karen Realpe
Aún no hay calificaciones
Documento 7 páginas
Evaluación U3
ruth carreño
Aún no hay calificaciones
Documento 8 páginas
https://es.scribd.com/document/412089384/Evaluacion-U3-Estadistica-II-Asturias 14/16
3/10/23, 5:10 Evaluación U3 Estadística II Asturias | PDF | Errores tipo I y tipo Ii | Hipótesis
de 6
Títulos relacionados
Obsequios
https://es.scribd.com/document/412089384/Evaluacion-U3-Estadistica-II-Asturias 15/16
3/10/23, 5:10 Evaluación U3 Estadística II Asturias | PDF | Errores tipo I y tipo Ii | Hipótesis
Audiolibros • Libros • Documentos • Revistas • Podcasts • Partituras
Idioma: Español
https://es.scribd.com/document/412089384/Evaluacion-U3-Estadistica-II-Asturias 16/16
Buenas noches, adjunto mi respuesta a la pregunta dinamizadora:
Debemos usar la fórmula para estimar una proporción en una población infinita con un
nivel de confianza del 90% y un margen de error del ±6%.
E es el margen de error permitido, que es del ±6% en términos decimales, por lo que E
= 0,06
Reflexión:
Considero que el muestreo es fundamental para todas las investigaciones, en mi carrera por
supuesto también lo es, ya que, a través de él, puedo tener datos confiables y precisos de
elementos más grandes, y de esta manera puedo ahorrar tiempo y costos, definir con estos datos
estadísticos las implicaciones y estrategias a realizar en mis proyectos profesionales.
Referencias bibliográficas