Unidades Completas

•
1 © Asturias Corporación Universitaria

Índice
1 Intervalos de Confianza para la Proporción ................................................................. 3

1.1 Intervalos de Confianza para la Proporción............................................ 3
1.2 Intervalo de Confianza para la Diferencia de Proporciones .............4
2 Intervalo Aproximado para la Media de una Distribución Cualquiera .................4
3 Resumen ................................................................................................................................. 5
4 Referencias Bibliográficas ................................................................................................ 5
ASTURIAS CORPORACIÓN UNIVERSITARIA®

Nota Técnica preparada por Asturias Corporación Universitaria. Su difusión, reproducción o uso
total o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados.
Objetivos
• Aprender a usar el método asintótico para la consecución de intervalos de
confianza para la media.
1 Intervalos de Confianza para la Proporción

En este apartado se hace uso del método asintótico para la consecución de
intervalos de confianza para la media, lo cual implica la aproximación de la
distribución de interés a la normal mediante el resultado que dicta del teorema
del límite central, es decir, para tamaños de muestra grandes cuando se busca
un intervalo para la media de una población, el estimador natural es la media
muestral 𝒙̅.
Cabe resaltar que los intervalos de confianza que presentan los textos básicos de
estadística, construidos con base en la aproximación mediante la normal, tienen
un desempeño pobre, pueden resultar intervalos que no tienen sentido o
intervalos con probabilidad de cobertura por debajo del nivel de confianza
nominal, especialmente cuando las muestras no son muy grandes.
Sin embargo se muestran a continuación algunos de ellos con fines didácticos.
1.1 Intervalos de Confianza para la Proporción
Considérese una muestra aleatoria simple 𝑋 extraída de una población definida

por una variable aleatoria 𝑋, distribuida según una Bernoulli de parámetro 𝑝.
Si la variable aleatoria toma valores 0 y 1, el estimador de máxima verosimilitud
“Si la variable aleatoria toma valores 0 y del parámetro 𝑝 es:
𝑛
1, el estimador de máxima verosimilitud
1
1
del parámetro p es: 𝑝̂ = ∑𝑛𝑖=1 𝑥𝑖 = 𝑥̅ ”
𝑝̂ = ∑ 𝑥𝑖 = 𝑥̅
𝑛 𝑛
𝑖=1
Con los supuestos distribucionales adecuados y utilizando una variación del

Teorema de Levy tenemos que:
𝑝̂ − 𝑝 𝑑
𝜋= → 𝑁(0,1)
√𝑝(1 − 𝑝)
𝑛
Lo que indica que esa cantidad 𝜋 converge en distribución a una normal estándar,
luego de este resultado se puede deducir un intervalo de confianza a través de
una aproximación y el resultado es como sigue:
𝑍1−𝛼
2
𝐼(1−𝛼/2) (𝑝̂ ) = (𝑝̂ ± √𝑝̂ (1 − 𝑝̂ ))
√𝑛

Ejemplo 7. Un gerente de un canal de televisión debe estimar que porcentaje de
hogares tienen más de un televisor. Una muestra aleatoria de 500 hogares revela
que 275 de ellos tiene 2 o más televisores.
¿Cuál es el intervalo de confianza a un nivel de confianza del 90% para estimar la
proporción de hogares que tienen 2 o más televisores? Entonces tenemos que:
𝑝(1 − 𝑝) (0.55) ∙ (0.45)

√ =√ = 0.022
𝑛 500
Ahora el intervalo vendría dado por:

𝐼0.90 = (0.55 ± (1.65) ∙ (0.022)) = (0.55 ± 0.036) = (0.514,0.586)
1.2 Intervalo de Confianza para la Diferencia de Proporciones
Se consideran ahora dos muestras aleatorias simples 𝑋 y 𝑌 de tamaños 𝑛1 y 𝑛2

respectivamente. Además supongamos que son independientes e idénticamente
“A diferencia del epígrafe anterior en
distribuidas Bernoulli de parámetros 𝑝1 ; 𝑝2 .
este caso tenemos dos variables
El interés se centra ahora en encontrar un intervalo de confianza para la
aleatorias”
diferencia de las proporciones. Haciendo uso de los supuestos distribucionales
y de resultados anteriores se llega a que:
𝑑 𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
𝑝̂1 − 𝑝̂ 2 → 𝑁 (𝑝1 − 𝑝2 , √ + )
𝑛1 𝑛2
De donde se deduce el intervalo de confianza desead como sigue:
𝑝̂1 (1 − 𝑝̂1 ) 𝑝̂ 2 (1 − 𝑝̂ 2 )
𝐼(1−𝛼/2) (𝑝1 − 𝑝2 ) = (𝑝̂1 − 𝑝̂ 2 ± 𝑍1−𝛼/2 √ + )
𝑛1 𝑛2
2 Intervalo Aproximado para la Media de una Distribución

Cualquiera
Sea 𝑿 una muestra aleatoria simple de una distribución cualquiera con media 𝝁,
además supongamos que el tamaño de dicha muestra se considera grande para
“En este caso la muestra aleatoria simple
su población en particular, entonces aplicando el teorema del límite central,
tiene una distribución cualquiera”
tenemos que:
𝑥̅ − 𝜇
𝑍=𝑠 ~𝑁(0,1)
⁄ 𝑛
√

Entonces para cualquier valor 𝜶 ∈ (𝟎, 𝟏) podemos encontrar un valor 𝒁𝜶/𝟐 en la
tabla de la normal tal que:
𝑥̅ − 𝜇
𝑃 (−𝑍𝛼/2 < 𝑠 < 𝑍𝛼/2 ) = 1 − 𝛼
⁄ 𝑛
√
Así, despejando a 𝝁 conocido, tenemos que:

𝑆 𝑆
𝑃 (𝑥̅ − 𝑍𝛼/2 < 𝜇 < 𝑥̅ + 𝑍𝛼/2 )=1−𝛼
√𝑛 √𝑛
Es un intervalo de confianza aproximado para el parámetro desconocido 𝝁 pues

contiene a dicho parámetro con probabilidad 𝟏 − 𝜶.
3 Resumen
• Los intervalos de confianza que presentan los textos básicos de estadística,
construidos con base en la aproximación mediante la normal, tienen un
desempeño pobre, pueden resultar intervalos que no tienen sentido o
intervalos con probabilidad de cobertura por debajo del nivel de confianza
nominal, especialmente cuando las muestras no son muy grandes.
• Dentro de los intervalos de confianza para la proporción nos encontramos
con intervalos de confianza para la proporción e intervalos de confianza
para la diferencia de proporciones.
• También debemos tener en cuenta el intervalo aproximado para la media de
una distribución cualquiera, para cuando una muestra aleatoria simple siga
una distribución cualquiera con media µ.
4 Referencias Bibliográficas
• Miranda, I. E., Palacín, F., Sánchez, M. L., Márquez, M., Chía, A. R., Navas, A.
S., y otros. (3ra. Edición 2006). Estadística Descriptiva y Probabilidad. Cádiz:
Servicio de Publicaciones de la Universidad de Cádiz.
• Montgomery, D., & R., R. (2da. Edición 2008). Probabilidad y Estadística
Aplicada a la Ingeniería. México: Limusa Wiley.
• Walpole, R., Myers, R., & Myers, S. y. (2007). Probabilidad y Estadística para
Ingeniería y Ciencias. México: Pearson.

•

Índice
1 Introducción .......................................................................................................................... 3
2 Método de la Variable Pivotal .......................................................................................... 3
2.1 Intervalo Aleatorio .......................................................................................... 3
2.2 Intervalo de Confianza (1 – α) .................................................................... 3
2.3 Límites del Intervalo .....................................................................................4
2.4 Variable Aleatoria Pivotal .............................................................................4
2.5 Método de la Variable Pivotal .....................................................................4
3 Intervalos de Confianza en Poblaciones Normales ...................................................4
3.1 Intervalo de Confianza para la Media, Conocida la Varianza ............ 5
3.2 Intervalo de Confianza para la Media, Desconocida la Varianza......6
3.3 Intervalo de Confianza para la Varianza, Conocida la Media ............ 7
3.4 Intervalo de Confianza para la Varianza, Desconocida la Media ...... 7
3.5 Intervalo de Confianza para la Diferencia de Medias de Muestras
Pareadas ............................................................................................................ 7
Independientes ...............................................................................................8
4 Resumen ............................................................................................................................... 10
5 Referencias Bibliográficas .............................................................................................. 10

Objetivos
• Objetivo 1: Estudiar los intervalos de confianza.
• Objetivo 2: Aprender cómo se hace inferencia sobre los parámetros más
conocidos y comunes.
1 Introducción
En esta unidad de aprendizaje estudiaremos uno de los métodos de estimación
que está tomando mayor importancia en el ámbito de la estadística aplicada.
Nos referimos a los intervalos de confianza, éstos presentan ventajas sobre
otros métodos de estimación que veremos más adelante, debido a que estos
aportan mayor información en magnitud y precisión de las estimaciones,
permitiendo una mejor interpretación de las estimaciones hechas sobre ellas.
Veremos cómo se hace inferencia sobre los parámetros más conocidos y
comunes, así como también las distintas interpretaciones que se presentan en
cada caso
2 Método de la Variable Pivotal

Dada una muestra aleatoria simple proveniente de una variable aleatoria 𝑿 con
“Es un método para calcular intervalos función de densidad o masa de probabilidad 𝒇𝑿 (𝒙; 𝜽), el interés se centrará
de confianza a partir de una función de entonces en encontrar un método para calcular intervalos de confianza a partir
valores muestrales que contenga bajo
de una función de valores muestrales que contenga bajo un nivel de confianza
dado al parámetro, con la condición de que su distribución no contenga al
un nivel de confianza dado al
parámetro.
parámetro”
2.1 Intervalo Aleatorio
Es un intervalo tal que al menos uno de sus extremos es una variable aleatoria.
2.2 Intervalo de Confianza (1 – α)
Dada una muestra aleatoria simple proveniente de una variable aleatoria 𝑋 con
“En el intervalo aleatorio, al menos función de densidad o masa de probabilidad 𝑓𝑋 (𝑥; 𝜃), en la cual dicha distribución
uno de sus extremos es una variable depende de un parámetro desconocido 𝜃, dadas las estadísticas 𝜃(𝑥) y 𝜃 ′ (𝑥) el
aleatoria”
intervalo de confianza de nivel (1 − 𝛼)100%, es tal que:
𝑃[𝜃(𝑥) ≤ 𝜃 ≤ 𝜃 ′ (𝑥)] ≥ 1 − 𝛼

2.3 Límites del Intervalo
En un intervalo aleatorio las estadísticas 𝜃(𝑥) y 𝜃 ′ (𝑥) se denominan limite

“Los límites del intervalo: límite confidencial inferior y limite confidencial superior respectivamente.
confidencial inferior y límite confidencial
superior” 2.4 Variable Aleatoria Pivotal
Dada una muestra aleatoria 𝑥1 , 𝑥2 , … , 𝑥𝑛 de una variable aleatoria 𝑋 con función de

densidad o masa de probabilidad 𝑓𝑋 (𝑥; 𝜃), Sea 𝑄𝑥 = 𝑞(𝜃, 𝑥1 , 𝑥2 , … , 𝑥𝑛 ) una función
de variables aleatoria de valores muestrales y del parámetro 𝜃. 𝑄𝑥
Se denomina variable aleatoria pivotal para el parámetro 𝜃, si la distribución de
𝑄𝑥 no depende de 𝜃.
Ejemplo 1: Sea 𝑥1 , 𝑥2 , … , 𝑥𝑛 una muestra aleatoria de una población normal
𝑥̅ −𝜇
𝑁(𝜇, 𝜎 2 ) la variable aleatoria 𝑧 = 𝜎2 es una cantidad pivotal si 𝜎 2 es conocido,
⁄
entonces tenemos que efectivamente: √𝑛
𝑥̅ − 𝜇
𝑧= ~𝑁(0,1)
𝜎 2⁄
√𝑛
𝜎 2 Es conocido.
Ejemplo 2: Sea 𝑥1 , 𝑥2 , … , 𝑥𝑛 una muestra aleatoria de una población normal
𝑥̅ −𝜇
𝑁(𝜇, 𝜎 2 ); 𝜎 2 conocido, la variable aleatoria 𝑡 = 𝑆 es una cantidad pivotal,
⁄
entonces tenemos que efectivamente, la variable √𝑛 aleatoria 𝑡 depende de los
valores 𝑥1 , 𝑥2 , … , 𝑥𝑛 a través de 𝑥̅ y 𝑆 2 . Además está en función del parámetro 𝜇,
entonces:
𝑥̅ − 𝜇
𝑡= ~𝑡(𝑛−1)
𝑆⁄
√𝑛
2.5 Método de la Variable Pivotal
Sea 𝑄𝑥 una variable pivotal de 𝜃 de una cierta población con función densidad o
masa de probabilidad entonces para un cierto nivel de confianza 1 − 𝛼 ∈ (0,1),
existen constantes 𝑞1 ∧ 𝑞2 que dependen de un nivel de confianza 1 − 𝛼 tal que
𝑃𝜃 [𝑞1 ≤ 𝑄𝑥 ≤ 𝑞2 ] = 1 − 𝛼, si para cada valor muestral 𝑥1 , 𝑥2 , … , 𝑥𝑛 ; 𝑞1 ≤
(1) (2)
𝑄𝑥 (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) ≤ 𝑞2, si y solo si 𝑃[𝜃̂1 < 𝜃̂2 ] = 1 luego el intervalo (𝜃̂𝑛 , 𝜃̂𝑛 ) es un
intervalo de confianza para (1 − 𝛼)100%.
3 Intervalos de Confianza en Poblaciones Normales

Acorde con los objetivos de esta unidad de aprendizaje abordamos ahora el
“Para la obtención de los intervalos de
estudio de la obtención de intervalos de confianza en poblacionales normales
confianza tomamos como base el
método de cantidades pivótales”

debido a la trascendencia que tiene esta distribución de probabilidad en el
estudio y aplicación de la estadística clásica.
Se toma como base el método de cantidades pivótales para la obtención de los
intervalos, como vimos anteriormente, por su facilidad de cálculo tanto en el caso
de una o dos poblaciones que por simplicidad se estudiaran en conjunto.
3.1 Intervalo de Confianza para la Media, Conocida la Varianza
Tomando la siguiente cantidad pivotal:

𝑥̅ − 𝜇
𝑧= ~𝑁(0,1)
𝜎 2⁄
√𝑛
Para cualquier valor de 𝛼 ∈ (0, 1) podemos encontrar un valor 𝑍𝛼/2 en tablas de

probabilidad normal estándar, véase Gráfico 1.
Así, tenemos que un intervalo de confianza para la media 𝜇 de una distribución
“Un intervalo de confianza para la normal con varianza conocida 𝜎 2 está dado por la siguiente expresión:
media µ de una distribución normal 𝜎 𝜎
𝑃 (𝑥̅ − 𝑍1−𝛼 < 𝜇 < 𝑥̅ + 𝑍1−𝛼 )=1−𝛼
2 √𝑛 2 √𝑛
con varianza conocida está dada por la
expresión que se indica”
Gráfico 1: Valores 𝑍𝛼
2
Ejemplo 3. Suponga que la vida promedio útil, medida en horas, de focos de 100
watts producidos por cierta compañía, puede ser modelada mediante una variable
aleatoria con distribución normal de media 𝜇 y varianza 𝜎 2.
Suponga que la desviación estándar 𝜎 es conocida y es igual a 30 horas.
El objetivo es encontrar un intervalo de confianza para la vida promedio útil 𝜇 de
los focos producidos por esta compañía. Para ello se toma una muestra de 20
focos y mediante pruebas de laboratorio se determina la vida útil de cada uno de
ellos. Los resultados 𝑥1 , . . . , 𝑥20 arrojan una media muestral 𝑥̅ de 1050 horas.
Si consideramos un nivel de confianza del 95%, es decir, 𝛼 = 0.05, de la tabla de
“A un nivel de confianza 95% z=1,96” probabilidad normal se encuentra que 𝑍𝛼/2 = 𝑍0.025 = 1.96, y entonces puede ahora
calcularse el intervalo:

𝜎 𝜎 30 30
(𝑥̅ − 𝑍𝛼/2 , 𝑥̅ − 𝑍𝛼/2 ) = (1050 − 1.96 ∙ , 1050 + 1.96 ∙ )
√𝑛 √𝑛 20 20
= (1050 − 13.148, 1050 + 13.148) = (1036.852, 1063.148)
3.2 Intervalo de Confianza para la Media, Desconocida la Varianza

𝑥̅ − 𝜇
𝑡= ~𝑡(𝑛−1)
𝑆⁄
√𝑛
Para cualquier valor de 𝛼 ∈ (0, 1) podemos encontrar un valor 𝑡𝛼/2 en tablas de

“Un intervalo de confianza para la
probabilidad de la distribución 𝑡 de 𝑛 − 1 grados de libertad, véase Gráfico 2. Así
tenemos que un intervalo de confianza para la media 𝜇 de una distribución normal
media µ de una distribución normal
con varianza desconocida 𝜎 2 está dado por la siguiente expresión:
con varianza desconocida está dada
𝑆 𝑆
por la expresión que se indica” 𝑃 (𝑥̅ − 𝑡𝛼/2 < 𝜇 < 𝑥̅ + 𝑡𝛼/2 )= 1−𝛼
√𝑛 √𝑛
Gráfico 2: Valores 𝑡𝛼/2

Ejemplo 4. Un importante empresario de la ciudad desea comprar una empresa
de trasportes de limosinas. La decisión depende si el rendimiento del auto en
consideración es de por lo menos 27.5 millas por galón de gasolina.
Los 36 autos que prueba la compañía del empresario reportan una media de 26.5
millas por galón de gasolina con una desviación estándar de 3.5 millas por galón
de gasolina a un nivel de confianza del 99%, ¿Qué le aconsejaría al empresario?
Entonces, el intervalo se calcula de la siguiente manera:
3.5
𝐼𝛼/2 = (26.5 ± (2.58) ∙ ) = (24.10, 27.11)
√36
Puede estar un 99% seguro que las millas por galón promedio del auto es menor
que el mínimo de 27.5. Se le aconseja que busque otro modelo.

3.3 Intervalo de Confianza para la Varianza, Conocida la Media

𝑛
𝑥𝑖 − 𝜇 2
𝑡 = ∑( ) ~𝜒𝑛2
𝜎
𝑖=1
Tenemos que un intervalo de confianza para la varianza 𝜎 2 de una distribución

“Un intervalo de confianza para la normal con media 𝜇 conocida, está dado por la siguiente expresión:
varianza de una distribución normal 𝑛𝑆 2 𝑛𝑆 2
con media µ conocida está dada por
𝑃( 2 < 𝜎2 < 2 )= 1−𝛼
𝜒𝑛;1−𝛼/2 𝜒𝑛;𝛼/2
la expresión que se indica”
3.4 Intervalo de Confianza para la Varianza, Desconocida la Media

𝑛
𝑥𝑖 − 𝑥̅ 2 2
𝑡 = ∑( ) ~𝜒(𝑛−1)
𝜎
𝑖=1
Tenemos que un intervalo de confianza para la varianza 𝜎 2 de una distribución

“Un intervalo de confianza para la
normal con media 𝜇 desconocida, está dado por la siguiente expresión:
varianza de una distribución normal 𝑛𝑆 2 𝑛𝑆 2
𝑃( 2 < 𝜎2 < 2 )= 1−𝛼
con media µ desconocida está dada 𝜒𝑛−1;1−𝛼/2 𝜒𝑛−1;𝛼/2
por la expresión que se indica”
Ejemplo 5. Se sabe que el peso por comprimido de un cierto preparado
farmacéutico se distribuye según una Normal. Con el objeto de estudiar la
varianza de la distribución, se extrae una muestra aleatoria simple de 6 artículos.
Sabiendo que la varianza muestral es igual a 40, se pretende estimar la varianza
poblacional mediante un intervalo de confianza al 90%.
Donde 𝛼 = 0.01. 𝑛 = 6. 𝑆 2 = 40.
Así: 𝜒5,0.95
2 2
= 11.07; 𝜒5,0.05 = 1.145,
Entonces,
6 ∙ 40 6 ∙ 40
𝐼0.90 = ( , ) = (21.68, 209.61 )
11.07 1.145

Pareadas
Se dice que dos variables aleatorias 𝑋 y 𝑌 son pareadas cuando los datos son
“Dos variables aleatorias son pareadas tomados por parejas de un solo individuo.
cuando los datos son tomados por
parejas de un solo individuo”

En los casos de muestras apareadas, el modo de proceder para obtener un
intervalo de confianza para la diferencia de medias es considerar una única
muestra formada por la diferencia de los pares de valores, 𝐷𝑖 = 𝑌𝑖 − 𝑋𝑖 reduciendo
así el problema a encontrar un intervalo de confianza para la media de una
población
𝑆 𝑆
̅−𝑡1−𝛼/2
𝑃 (𝐷 ̅ −𝑡1−𝛼/2
< 𝜇2 − 𝜇1 < 𝐷 )=1−𝛼
√𝑛 √𝑛

Independientes
Si 𝑋 y 𝑌 son dos muestras aleatorias independientes, es decir, provienen de dos

“Dos muestras aleatorias son independientes poblaciones normales distintas, tomando como cantidad pivote
cuando provienen de dos poblaciones
𝑆12 𝑆22
𝑡 = (𝑛1 − 1) + (𝑛2 − 1) ~𝜒 2
normales distintas”
𝜎12 𝜎22 (𝑛1+𝑛2 −2)
Se puede llegar a las siguientes conclusiones representadas en intervalos de

confianza que se derivan de la cantidad pivotal y se toman como subtemas para
un mejor desarrollo de la teoría y se describen a continuación:
• Intervalo de confianza cuando las varianzas son conocidas
𝑥̅ − 𝑦̅ − (𝜇2 − 𝜇1 )
~𝑁(0,1)
𝜎2 𝜎22
√ 1 +
𝑛1 𝑛2
Tenemos que un intervalo de confianza para la diferencia de medias (𝜇2 − 𝜇1 ) de

dos poblaciones con distribución normal con varianzas 𝜎12 , 𝜎22 conocidas, está
dado por la siguiente expresión:
𝜎12 𝜎22 𝜎2 𝜎 2
𝑃 (𝑥̅ − 𝑦̅ − 𝑧1−𝛼 √ + ≤ 𝜇2 − 𝜇1 ≤ 𝑥̅ − 𝑦̅ + 𝑧1−𝛼 √ 1 + 2 ) = 1 − 𝛼
2 𝑛1 𝑛2 2 𝑛1 𝑛2
Ejemplo 6. Se quiere estudiar la diferencia de las vidas medias de dos tipos de

lámparas. Para ello, se toma una muestra de 150 lámparas de tipo H y otra,
independiente de la anterior, de 200 lámparas de tipo. N, obteniéndose que las
de tipo H tienen una vida media de 1400 horas y una desviación típica de 120, y
que las de tipo N tienen una vida media de 1200 horas y desviación típica 80.
Para estimar la diferencia de medias se construye un intervalo de confianza al 95
%, que viene dado por:

1202 802
𝐼0.95 (1400 − 1200 ± 1.96√ + ) = (177.8,222.2)
150 200
• Intervalo de confianza cuando las varianzas son desconocidas e iguales

−1
𝑥̅ − 𝑦̅ − (𝜇2 − 𝜇1 ) 1 1
(√ + )
𝜎 𝑛1 𝑛2
~𝑡(𝑛1+𝑛2−2)
(𝑛 − 1)𝑆 2 + (𝑛2 − 1)𝑆22
√ 1 2 1
𝜎 (𝑛1 + 𝑛2 − 2)

dos poblaciones con distribución normal con varianzas 𝜎12 , 𝜎22 desconocidas e
iguales, está dado por la siguiente expresión:
(𝑛1 )𝑆12 + (𝑛2 )𝑆22 1 1

𝐼1−𝛼/2 = (𝑥̅ − 𝑦̅ ± 𝑡(𝑛 𝛼 √ ( + ))
1 +𝑛2 −2, 1− 2 ) (𝑛1 + 𝑛2 − 2) 𝑛1 𝑛2
• Intervalo de confianza cuando las varianzas son desconocidas y distintas

Luego de algunos cálculos no concernientes al desarrollo de este curso y
utilizando la aproximación de Welch. Tenemos que se encuentra la siguiente
cantidad:
𝑥̅ − 𝑦̅ − (𝜇2 − 𝜇1 )
~𝑡(𝑎,1−𝛼 )
2
𝑆2 𝑆2
√ 1+ 2
𝑛1 𝑛2
Con factor de corrección 𝑎 tomado como sigue:

2
𝑆2 𝑆2
(𝑛1 + 𝑛2 )
1 2
𝑎= 2 2 −2
1 𝑆2 1 𝑆2
( 1) + ( 2)
𝑛1 + 1 𝑛1 𝑛2 + 1 𝑛2

dos poblaciones con distribución normal con varianzas 𝜎12 , 𝜎22 desconocidas y
distintas, está dado por la siguiente expresión:
𝑆12 𝑆22
𝐼1−𝛼/2 (𝜇2 − 𝜇1 ) = (𝑥̅ − 𝑦̅ ± 𝑡(𝑎, 𝛼 √( + ))
1− )
2 𝑛1 𝑛2

4 Resumen
• Dada una muestra aleatoria simple proveniente de una variable aleatoria 𝑿
con función de densidad o masa de probabilidad 𝒇𝑿 (𝒙; 𝜽), el interés se
centrará en encontrar un método para calcular intervalos de confianza a
partir de una función de valores muestrales que contenga bajo un nivel de
confianza dado, al parámetro, con la condición de que su distribución no
contenga al parámetro.
• Se toma como base el método de cantidades pivótales para la obtención de
los intervalos por su facilidad de cálculo tanto en el caso de una o dos
poblaciones que por simplicidad se estudiaran en conjunto.

—

Índice
1 Propiedades de los Estimadores Puntuales ................................................................. 3

1.1 Insesgamiento ................................................................................................. 3
1.2 Consistencia ..................................................................................................... 3
1.3 Suficiencia ........................................................................................................4
1.4 Eficiencia .........................................................................................................4
2 Distribuciones de Muestrales ........................................................................................... 5
2.1 Distribución de la Media Muestral ............................................................. 5
2.2 Distribución de la Varianza Muestral ........................................................ 5
2.3 Distribución de la Proporción Muestral .................................................... 5
3 Resumen .................................................................................................................................6
4 Referencias Bibliográficas ................................................................................................6

Objetivos
• Objetivo 1: Conocer las distintas propiedades de los estimadores puntuales.
• Objetivo 2: Conocer la distribución asintótica de las estadísticas
muestrales.
1 Propiedades de los Estimadores Puntuales
1.1 Insesgamiento
Un escenario ideal en la estimación puntual es que su estimador en promedio

sea muy parecido al parámetro, luego un estimador se dice insesgado si y solo si
“En la estimación puntual el estimador
se cumple que:
en promedio debería ser muy parecido
al parámetro”
𝐸(𝜃̂) = 𝜃
Observación: Si el valor esperado del estimador no es el parámetro, es decir,

𝐸(𝜃̂) ≠ 𝜃, el estimador no es insesgado o se dice que tiene sesgo.
El sesgo se define como sigue:
𝐵(𝜃̂) = 𝐸(𝜃̂) − 𝜃
De donde también se define una estadística de error muy importante, el error

cuadrático medio, notado como 𝑀𝑆𝐸𝜃 y escrito de la siguiente manera:
2
𝑀𝑆𝐸𝜃 = 𝑉(𝜃̂) + [𝐵(𝜃̂)]
Ejemplo 6: El promedio muestral es un estimador insesgado para la media

poblacional de cualquier distribución con media 𝜇. Entones veamos que 𝐸(𝑥̅ ) = 𝜇,
en efecto:
𝑛 𝑛 𝑛
1 1 1 1
𝐸(𝑥̅ ) = 𝐸 [ ∑ 𝑥𝑖 ] = ∑ 𝐸(𝑥𝑖 ) = ∑ 𝜇 = 𝑛𝜇 = 𝜇
𝑛 𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑖=1
1.2 Consistencia
Cuando el estimador no es insesgado en primera medida, lo que sería lo idóneo,

se requiere al menos que su valor oscile cerca del valor del parámetro para
tamaños de muestra grandes, es decir, un estimador es consistente cuando:
• lim 𝐸(𝜃̂) = 𝜃
𝑛→∞
• lim 𝑉(𝜃̂) = 0
𝑛→∞

Ejemplo 7: Sea 𝑥1 , 𝑥2 , … , 𝑥𝑛 una muestra aleatoria de una población 𝑁(𝜇, 𝜎 2 ), se
1
define la media muestral 𝑥̅ = ∑𝑛𝑖=1 𝑥𝑖 mostremos que este es un estimador
𝑛
consiste para la media 𝜇. Entonces veamos que lim 𝐸(𝑥̅ − 𝜇)2 = 0, en efecto:
𝑛→∞
𝐸(𝑥̅ − 𝜇)2 = 𝐸(𝑥̅ 2 − 2𝑥̅ 𝜇 + 𝜇2 ) = 𝐸(𝑥̅ 2 ) − 2𝜇𝐸(𝑥̅ ) + 𝜇2
Pero
𝑉(𝑥̅ ) = 𝐸 2 (𝑥̅ ) − 𝐸(𝑥̅ 2 ) ⇒ 𝐸(𝑥̅ − 𝜇)2 = 𝑉(𝑥̅ ) + 𝐸 2 (𝑥̅ ) − 2𝜇𝐸(𝑥̅ ) + 𝜇2
Luego
𝜎2 𝜎2
𝐸(𝑥̅ − 𝜇)2 = 𝑉(𝑥̅ ) + 𝐸 2 (𝑥̅ ) − 2𝜇𝐸(𝑥̅ ) + 𝜇2 = + 𝜇2 − 2𝜇2 + 𝜇2 =
𝑛 𝑛
Ahora bien
𝜎2
lim 𝐸(𝑥̅ − 𝜇)2 = lim =0
𝑛→∞ 𝑛→∞ 𝑛
1.3 Suficiencia
Intuitivamente hablando un estimador es suficiente para un parámetro si toda

la información acerca del parámetro está contenida en la muestra.
“Un estimador es suficiente si la
información acerca del parámetro está

Formalmente sería: una estadística 𝜃̂ se dice suficiente para 𝜃 basada en una
muestra aleatoria 𝑥1 , 𝑥2 , … , 𝑥𝑛 de una población con función masa o de densidad
contenida en la muestra”
de probabilidad 𝑓𝑥 (𝑥, 𝜃). Si la distribución condicional de las variables aleatorias
𝑥1 , 𝑥2 , … , 𝑥𝑛 dado 𝜃̂ no depende del parámetro 𝜃, es decir, 𝜃̂ es un estimador
suficiente de 𝜃 si:
𝑓𝑥 (𝑥1 , 𝑥2 , … , 𝑥𝑛 |𝜃̂ = 𝜃) = 𝑔(𝑥̂);
Donde 𝑔(𝑥̂) = (𝑥1 , 𝑥2 , … , 𝑥𝑛 ).
1.4 Eficiencia
La eficiencia es un requisito de precisión, esto es, es más preciso aquel

“El estimador más preciso será aquel estimador que tenga menor varianza ya que tiene la capacidad de producir
que tenga menor varianza” estimaciones más centradas.
Así sean 𝜃̂ y 𝜃̂ ′ dos estimadores insesgados para 𝜃, estimadores basados en una
muestra aleatoria 𝑥1 , 𝑥2 , … , 𝑥𝑛 de una población con función masa o de densidad
de probabilidad 𝑓𝑥 (𝑥, 𝜃), se dice que 𝜃̂ es estimador uniformemente mejor que 𝜃̂ ′
si:
𝑉(𝜃̂) ≤ 𝑉(𝜃̂ ′ )

2 Distribuciones de Muestrales
Es de interés conocer la distribución asintótica de las estadísticas muéstrales
“Permiten estimaciones con mayor para fines de estimaciones de mayor calidad y precisión.
calidad y precisión”
A continuación se muestran algunas de estas, las más comunes e importantes.
2.1 Distribución de la Media Muestral
Sea 𝑥̅ la media muestral proveniente de una muestra aleatoria 𝑥1 , 𝑥2 , … , 𝑥𝑛 de

tamaño 𝑛 entonces para tamaños de muestra grandes:
𝑋~𝑁(𝜇, 𝜎 2 /√𝑛).
Este resultado se deduce del teorema del límite central, además de que por ser
combinaciones lineales de normales se hereda la normalidad.
2.2 Distribución de la Varianza Muestral
Sea 𝑥̅ y 𝑆 2 la media y varianza muestral respectivamente, provenientes de una

muestra aleatoria 𝑥1 , 𝑥2 , … , 𝑥𝑛 de tamaño 𝑛, entonces para tamaños de muestra
grandes:
𝑛−1 2 2(𝑛 − 1) 4
𝐸(𝑆 2 ) = 𝜎 ; 𝑉(𝑆 2 ) = 𝜎
𝑛 𝑛2
De donde se deduce que (omitiendo las demostraciones no pertinentes a este

curso):
(𝑛 − 1)𝑆 2 2
~𝜒(𝑛−1)
𝜎2
2.3 Distribución de la Proporción Muestral
Utilizando las mismas conclusiones a partir del teorema del límite central, como
es de saber para tamaños de muestra considerados grandes, para una población
con función de densidad masa 𝐵𝑒𝑟(𝑝), se tiene que la distribución de la
proporción muestral se puede aproximar mediante una normal, tal que:
𝑝𝑞
𝑝̂ ~𝑁 (𝑝, √ )
𝑛

3 Resumen
• Las propiedades de los estimadores puntuales son: el insesgamiento, la
consistencia, la suficiencia y la eficiencia.
• La distribución asintótica permite realizar estimaciones de mayor calidad
y precisión.
• Las distribuciones de muestrales más comunes son: la distribución de la
media muestral, la distribución de la varianza muestral y la distribución de
la proporción muestral.

—

Índice
1 Introducción .......................................................................................................................... 3
2 Conceptos Básicos .............................................................................................................. 3
2.1 Muestra Aleatoria ............................................................................................ 3
2.2 Parámetro.......................................................................................................... 3
2.3 Estadística.........................................................................................................4
2.4 Estimador ..........................................................................................................4
3 Métodos de Estimación ......................................................................................................4
3.1 Método de los Momentos .............................................................................4
3.2 Método de Máxima Verosimilitud .............................................................. 5
3.3 Método por Analogía......................................................................................6
4 Resumen ................................................................................................................................. 7

Objetivos
• Objetivo 1: Ser capaz de sacar conclusiones a partir de la aplicación de
estadísticas a muestras aleatorias.
• Objetivo 2: Acercar valores estimados a los valores reales de los parámetros
poblacionales a través de métodos de estimación.
1 Introducción
En esta unidad de aprendizaje trataremos el estudio de la rama de la estadística
que se encarga de sacar conclusiones a partir de la aplicación de estadísticas a
muestras aleatorias, las cuales siguen una distribución de probabilidad con
parámetros desconocidos.
Entonces nuestro interés se centra en este caso, en acercar valores estimados a
los valores reales de los parámetros poblacionales por medio de métodos de
estimación, teniendo en cuenta las propiedades de esos en cuanto a calidad y
errores se refiere.
2 Conceptos Básicos
2.1 Muestra Aleatoria
Sea 𝑥1 , 𝑥2 , … , 𝑥𝑛 𝑣. 𝑎 independientes con la misma función de densidad de

probabilidad 𝑓𝑋 (𝑥), se define 𝑥1 , 𝑥2 , … , 𝑥𝑛 como una muestra aleatoria de tamaño
“Se define 𝑥1 , 𝑥2, … , 𝑥𝑛 como una
𝑛.
muestra aleatoria de tamaño n”
Nótese que según esta definición la muestra aleatoria está tomando como
realizaciones de una 𝑣. 𝑎 y no como datos observados de la población como en el
caso del muestreo.
2.2 Parámetro
Es un valor poblacional que caracteriza a una distribución o a una población y

por lo general es desconocido. Los parámetros más usados son:
“El parámetro es un valor poblacional
generalmente desconocido”
• 𝜇 : Media poblacional
• 𝜎 2 : Varianza poblacional
• 𝜌 : Proporción poblacional
• 𝜏 :Total poblacional
• 𝑚á𝑥(𝑥𝑗 ): Máximo poblacional
• min(𝑥𝑗 ): Mínimo poblacional

2.3 Estadística
Es una función de 𝑣. 𝑎 observables que no contienen parámetros desconocidos.
“La estadística no contiene parámetros

Ejemplo1: Sea 𝑥1 , 𝑥2 , … , 𝑥𝑛 una muestra aleatoria de tamaño 𝑛. Entonces:
desconocidos” • La función
𝑛
1
𝑥̅ = ∑ 𝑥𝑖
𝑛
𝑖=1
Es una estadística.
• La función 𝑥̅ + 𝜎 2 no es una estadística, si 𝜎 2 es desconocido.
2.4 Estimador
Es un estadístico de valores muestrales, que se usa para estimar parámetros

poblacionales. Los estimadores más usados son:
“El estimador es un estadístico de
valores muestrales que se usa para • 𝜇̂ = 𝑥̅ : Media muestral

estimar parámetros poblacionales” • 𝜎̂ 2 = 𝑆 2: Varianza muestral
• 𝜌̂: Proporción muestral
• 𝜏̂ :Total muestral
̂ (𝑥𝑗 ): Máximo muestral
• 𝑚á𝑥
̂ (𝑥𝑗 ): Mínimo muestral
• 𝑚í𝑛
Ejemplo 2: Sea 𝑥1 , 𝑥2 , … , 𝑥𝑛 una muestra aleatoria de tamaño 𝑛 perteneciente a
una distribución normal con media desconocida 𝜇 y varianza 𝜎 2.
Entonces si 𝑥1 = 2.1, 𝑥2 = 2.5, 𝑥3 = 3.1, 𝑥4 = 4.1 , 𝑥5 = 2.8 el valor de 𝑥̅ = 2.92 es una
estimación de 𝜇.
3 Métodos de Estimación
3.1 Método de los Momentos
Sea 𝑥1 , 𝑥2 , … , 𝑥𝑛 una muestra aleatoria de tamaño 𝑛 de una población con

distribución 𝑓(𝑥, 𝜃̂), donde 𝜃̂ = (𝜃1 , 𝜃2 , … , 𝜃𝑘 ) es un vector de parámetros.
“Consiste en igualar los momentos
Entonces consiste en igualar los momentos poblacionales respecto al origen, con
poblacionales respecto al origen”
los correspondientes momentos muestrales, esto es:

𝑛
1
𝐸(𝑥) = 𝜇1 (𝜃1 , 𝜃2 , … , 𝜃𝑘 ) = ∑ 𝑥𝑖
𝑛
𝑖=1
𝑛
1
𝐸(𝑥 2 ) = 𝜇2 (𝜃1 , 𝜃2 , … , 𝜃𝑘 ) = ∑ 𝑥𝑖2
𝑛
𝑖=1
⋮
𝑛
1
𝐸(𝑥 𝑘)
= 𝜇𝑘 (𝜃1 , 𝜃2 , … , 𝜃𝑘 ) = ∑ 𝑥𝑖𝑘
𝑛
𝑖=1
̂ = (𝜽𝟏 , 𝜽𝟐 , … , 𝜽𝒌 )
Y se resuelve el sistema para hallar 𝜽
Ejemplo 3: Sea 𝒙𝟏 , 𝒙𝟐 , … , 𝒙𝒏 una muestra aleatoria de tamaño 𝒏 de una población
con distribución normal con media 𝝁 y varianza 𝝈𝟐 hallemos el estimador de 𝝁 por
el método de los momentos. Entonces:
𝑿~𝑵(𝝁, 𝝈𝟐 ), después 𝑬(𝑿) = 𝝁 y 𝑽𝒂𝒓(𝑿) = 𝝈𝟐 además 𝑽𝒂𝒓(𝑿) = 𝑬(𝑿𝟐 ) − [𝑬(𝑿)]𝟐,
así 𝑬(𝑿𝟐 ) = 𝝁𝟐 + 𝝈𝟐 , ahora usando el método de los momentos tenemos que:
𝑛
1
𝐸(𝑋) = 𝜇 = ∑ 𝑥𝑖
𝑛
𝑖=1
𝑛
1
𝐸(𝑋 2)
= 𝜇 + 𝜎 = ∑ 𝑥𝑖2
2 2
𝑛
𝑖=1
Luego
𝑛
1
𝜇̂ = ∑ 𝑥𝑖
𝑛
𝑖=1
𝑛
1
𝜇̂ + 𝜎̂ = ∑ 𝑥𝑖2
2 2
𝑛
𝑖=1
3.2 Método de Máxima Verosimilitud
Sea 𝑥1 , 𝑥2 , … , 𝑥𝑛 , 𝑛 variables aleatorias, la función de verosimilitud se define

como 𝑓𝑥1… ,𝑥𝑛 (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) de las 𝑛 variables aleatorias que dependen del
“La función de verosimilitud se define
parámetro 𝜃. En particular si 𝑥1 , 𝑥2 , … , 𝑥𝑛 es una muestra aleatoria de tamaño 𝑛 la
como 𝑓𝑥1 … ,𝑥𝑛 (𝑥1 , 𝑥2, … , 𝑥𝑛 ) ” función de verosimilitud, notada 𝐿(𝜃, 𝑥̂) se puede escribir como:
𝑛
𝐿(𝜃, 𝑥̂) = 𝑓𝑥1… ,𝑥𝑛 (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) = 𝑓𝑥1 (𝑥1 ) ∙ 𝑓𝑥2 (𝑥2 ) ∙ ⋯ ∙ 𝑓𝑥3 (𝑥3 ) = ∏ 𝑓𝑥𝑖 (𝜃, 𝑥𝑖 )
𝑖=1
Si se tiene una muestra aleatoria 𝑥1 , 𝑥2 , … , 𝑥𝑛 ; el valor de 𝜃̂ que maximiza la

función de verosimilitud. 𝐿(𝜃, 𝑥̂) se denomina estimador máximo verosímil de 𝜃.
El estimador máximo verosímil de 𝜃, es la solución de:

𝜕𝐿(𝜃, 𝑥̂)
=0
𝜕𝜃
Ejemplo 4: Sea 𝑥1 , 𝑥2 , … , 𝑥𝑛 una muestra aleatoria de una población geométrica

de parámetro 𝑝 hallemos el estimador máximo verosímil de 𝑝. Entonces 𝑋~𝑔𝑒𝑜(𝑝)
así:
𝑝𝑞 𝑥 ; 𝑥 = 0,1,2, …
𝑓𝑥 (𝑝, 𝑥) = {
0 𝑐. 𝑐
Entonces la función de verosimilitud viene dada por:

𝑛 𝑛
𝐿(𝑝, 𝑥) = ∏ 𝑓𝑥𝑖 (𝑝, 𝑥𝑖 ) = ∏ 𝑝𝑞 𝑥 = 𝑝𝑞 𝑥1 ∙ 𝑝𝑞 𝑥2 ∙ ⋯ ∙ 𝑝𝑞 𝑥𝑛

𝑖=1 𝑖=1
Así:
𝑛
𝐿(𝑝, 𝑥) = 𝑝 𝑛 𝑞∑𝑖=1 𝑥𝑖
Tomando oportunamente el logaritmo natural tenemos que:

𝑛
ln 𝐿(𝑝, 𝑥) = 𝑛 ∙ ln 𝑝 + ∑ 𝑥𝑖 ln 𝑞
𝑖=1
Derivando con respecto a cero tenemos que:

𝜕 ln 𝐿(𝑝, 𝑥) 𝑛 ∑𝑛𝑖=1 𝑥𝑖
= −
𝜕𝑝 𝑝 1−𝑝
Por tanto la solución vendría dada por:

𝑛
𝜕 ln 𝐿(𝑝, 𝑥) 𝑛 ∑𝑛𝑖=1 𝑥𝑖 𝑛 ∑𝑛𝑖=1 𝑥𝑖
=0⇔ − =0⇔ = ⇔ 𝑛 − 𝑛𝑝̂ = ∑ 𝑥𝑖
𝜕𝑝 𝑝 1−𝑝 𝑝 1−𝑝
𝑖=1
𝑛
𝑛
⇔ 𝑝̂ [𝑛 + ∑ 𝑥𝑖 ] = 𝑛 ⇔ 𝑝̂ =
𝑛 + ∑𝑛𝑖=1 𝑥𝑖
𝑖=1
Finalmente multiplicando por 1⁄𝑛 se sigue que:

1
𝑝̂ =
1 + 𝑥̅
3.3 Método por Analogía
Consta en elegir, luego de indagar, el papel que cumplen los componentes del
“El método por analogía deriva una
parámetro dentro del modelo; derivando una estadística que de manera similar
o análoga realice las mismas funciones en la función empírica.
estadística que de manera análoga
recibe las mismas funciones en la
función empírica”

Ejemplo 5: Se tiene una muestra aleatoria 𝑥1 , 𝑥2 , … , 𝑥𝑛 de tamaño 𝑛 con función
de densidad:
−𝑥𝜃
𝑓𝑥 (𝑥, 𝜃) = {𝜃𝑒 ; 𝑥 > 0; 𝜃 > 0.
0 𝑐. 𝑐
Determinemos 𝜃̂ usando el método por analogía. Entonces tenemos que

1 1
𝐸(𝑋) = 𝜃 ⇒ 𝜃 = 𝐸(𝑋); Nótese que el parámetro 𝜃 es el recíproco del valor esperado,
por tanto su estimador debe ser una función análoga; usando el método por
analogía el estimador viene dado por:
1
𝜃̂𝐴 =
𝑥̅
4 Resumen
• Sea 𝑥1 , 𝑥2 , … , 𝑥𝑛 𝑣. 𝑎 independientes con la misma función de densidad de
probabilidad 𝑓𝑋 (𝑥), se define 𝑥1 , 𝑥2 , … , 𝑥𝑛 como una muestra aleatoria de
tamaño 𝑛.
• El parámetro es un valor poblacional que caracteriza a una distribución o a
una población y por lo general es desconocido.
• La estadística es una función de 𝑣. 𝑎 observables que no contienen
parámetros desconocidos.
• El estimador es un estadístico de valores muestrales, que se usa para
estimar parámetros poblacionales.
• Dentro de los métodos de estimación encontramos e método de los
momentos, el método de máxima verosimilitud y el método por analogía.

•

Índice
1 Introducción .......................................................................................................................... 3
2.1 Unidad Experimental...................................................................................... 3
2.2 Tratamientos .................................................................................................... 3
2.3 Factor ................................................................................................................. 3
2.4 Nivel del factor................................................................................................. 3
2.5 Replicación .......................................................................................................4
2.6 Modelo Asociado a los Datos ......................................................................4
2.7 Modelo de Efectos Fijos................................................................................4
2.8 Modelo de Efectos Aleatorios .....................................................................4
3 Análisis del Modelo de Efectos Fijos .............................................................................4
3.1 Análisis de Varianza de un Solo Factor .................................................... 5
3.2 Descomposición de las Sumas de Cuadrados Total .............................6
3.3 Análisis Estadístico: Diseño Completamente Aleatorizado (DCA).... 7
4 Resumen ............................................................................................................................... 10

Objetivos
• Objetivo 1: Aplicación de la estadística a un número de poblaciones objeto
mayor a dos.
• Objetivo 2: Aplicación de técnicas de descomposición de la variabilidad.
• Objetivo 3: Determinar la existencia o ausencia de diferencias entre las
medias de las poblaciones a través de la metodología del análisis de
varianza.
1 Introducción
En las anteriores unidades de aprendizaje observamos los distintos métodos de
estimación en el caso que se tuvieran dos poblaciones. Esta inferencia basada
tanto en los intervalos de confianza como en las pruebas de hipótesis se limita al
estudio de máximo dos poblaciones.
Sin embargo en la mayoría de los estudios el número de poblaciones objeto es
“Hasta ahora hemos visto la mayor a la cantidad mencionada. Esto hace necesario la aplicación de técnicas
estadística aplicada a un máximo de de descomposición de la variabilidad en función del interés que existe en sus
dos poblaciones, no obstante en la diferencias. Dicho esto es lógico pretender determinar la existencia o ausencia de
diferencias entre las medias de las poblaciones a través de la metodología
mayoría de estudios el número de
del análisis de varianza.
poblaciones es mayor”
2.1 Unidad Experimental
Son los elementos sobre los cuales se hacen las mediciones y a los cuales un
tratamiento puede ser asignado.
2.2 Tratamientos
Son el conjunto de circunstancias creadas para el experimento en respuesta a la

hipótesis de investigación y son el centro de la misma.
2.3 Factor
Es una variable experimental que posee la cualidad de ser controlable y que se

cree influyente en la respuesta.
2.4 Nivel del factor
Es un valor específico de un factor.

2.5 Replicación
Es la repetición total o parcial de un experimento en dos o más conjuntos de

condiciones.
2.6 Modelo Asociado a los Datos
Para efectos didácticos y de eficacia a la hora de describir el modelo se presenta

la siguiente forma de modelo:
𝑖 = 1,2, … , 𝑎
𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖 {
𝑗 = 1, 2, … , 𝑛
Donde 𝑦𝑖𝑗 es la 𝑖𝑗 − é𝑠𝑖𝑚𝑎 observación, 𝜇 es la media general asociada a todas

las observaciones del diseño, 𝜏𝑖 se considera el efecto del 𝑖 − é𝑠𝑖𝑚𝑜 tratamiento y
𝜀𝑖 un componente de error aleatorio.
2.7 Modelo de Efectos Fijos
Es aquel en el cual los tratamientos son fijados de antemano para el estudio de

interés.
“En el modelo de efectos fijos los
tratamientos son fijados de antemano

2.8 Modelo de Efectos Aleatorios
mientras que en el modelo de efectos
aleatorios los tratamientos son escogidos Es aquel en el cual los tratamientos son escogidos de manera aleatoria para el
de manera aleatoria” estudio de interés.
3 Análisis del Modelo de Efectos Fijos

Como notamos en la sección anterior, el análisis de varianza contiene sus bases
en un modelo de regresión donde la variable explicativa es de tipo dicótoma, es
decir, esta variable indica la pertenencia o no pertenencia de la observación al
nivel del factor o tratamiento.
Dicho esto, nuestro interés se centrará entonces no en la estimación de los
“El interés se centra en la existencia de parámetros del modelo, sino más bien, en la existencia de diferencias
diferencias significativas entre
significativas entre estas estimaciones. Siendo el modelo de efectos fijos el más
utilizado, su estudio nos permitirá la fácil compresión y aplicación de los
estimaciones”
siguientes conceptos.
2.1. Descripción de los Componentes del Modelo
Como hemos visto, estos modelos de análisis de varianza se utilizan con el

interés de evidenciar las diferencias entre niveles de un factor. Así, para un
modelo de efectos fijos:
𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖

Con 𝑖 = 1,2,3 y 𝑗 = 1,2, … , 𝑛 reescribimos el modelo como sigue:
𝑦𝑖 = 𝜇 + 𝜏1 𝑥𝑖1 + 𝜏2 𝑥𝑖2 + 𝜏3 𝑥𝑖3 + 𝜀𝑖
Donde las 𝑥′𝑠 se definen de la siguiente manera

1 𝑠𝑖 𝑒𝑙 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑜 𝑗 𝑒𝑠𝑡á 𝑒𝑛 𝑒𝑙 𝑖 − é𝑠𝑖𝑚𝑜 𝑓𝑎𝑐𝑡𝑜𝑟,
𝑥𝑖𝑗 = {
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Ejemplo 1: Suponga que un investigador está interesado en el efecto del nivel de

formación académica en la inversión que hacen los integrantes cabezas de
familia de un hogar en productos tecnológicos. Veamos cómo queda evidenciado
el modelo con base en la siguiente tabla.
Nivel de formación
Bachillerato Pregrado Posgrado
𝑦11 𝑦21 𝑦31

𝑦12 𝑦22
𝑦12
Tabla 1: Tabla ejemplo 1

Entonces el modelo se puede escribir como:
𝑦11 = 𝜇 + 𝜏1 (1) + 𝜏2 (0) + 𝜏3 (0) + 𝜀11
𝑦12 = 𝜇 + 𝜏1 (1) + 𝜏2 (0) + 𝜏3 (0) + 𝜀12
𝑦13 = 𝜇 + 𝜏1 (1) + 𝜏2 (0) + 𝜏3 (0) + 𝜀13
𝑦21 = 𝜇 + 𝜏1 (0) + 𝜏2 (1) + 𝜏3 (0) + 𝜀21
𝑦22 = 𝜇 + 𝜏1 (0) + 𝜏2 (1) + 𝜏3 (0) + 𝜀22
𝑦31 = 𝜇 + 𝜏1 (0) + 𝜏2 (0) + 𝜏3 (1) + 𝜀31
Donde los unos y ceros son los valores de la variable dicótoma que indica la
pertenecía o no al nivel del factor de la observación.
3.1 Análisis de Varianza de un Solo Factor
El objetivo es comparar los efectos medios de los 𝑎 niveles de los tratamientos

“El objetivo del análisis de varianza de un sobre las 𝑛 observaciones de una variable, como se muestra en la siguiente tabla:
solo factor es comparar los efectos
medios de los α niveles de tratamientos
sobre las n observaciones de una
variable”

Tratamiento (Nivel) Observaciones Totales Medias
1 𝑦11 𝑦12 ⋯ 𝑦1𝑛 𝑦1. 𝑦̅𝑖.
2 𝑦21 𝑦22 ⋯ 𝑦2𝑛 𝑦2. 𝑦̅𝑖.
⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮
𝑛 𝑦𝑖1 𝑦𝑖2 ⋯ 𝑦𝑖𝑛 𝑦𝑖. 𝑦̅𝑖.
𝑦.. 𝑦̅..
Tabla 2: Tabla de diseño

Ahora se pueden definir las cantidades del arreglo correspondiente al diseño para
la elaboración de una ANAVA (Análisis de varianza), entonces veamos que:
𝑛
𝑦𝑖. = ∑ 𝑦𝑖𝑗
𝑗=1
Representa el total de las observaciones bajo el 𝑖 − é𝑠𝑖𝑚𝑜 tratamiento. Además se

definen como:
𝑦𝑖.
𝑦̅𝑖. =
𝑛
Que representa el promedio de las observaciones bajo el 𝑖 − é𝑠𝑖𝑚𝑜 tratamiento y

finalmente
𝑎 𝑛
𝑦..
𝑦.. = ∑ ∑ 𝑦𝑖𝑗 ; 𝑦̅.. =
𝑁
𝑖=1 𝑗=1
Donde 𝑦̅.. representa el gran promedio de todas las observaciones o la llamada

media general común a todos los datos en la muestra y 𝑁 = 𝑎𝑛.
El interés se centra entonces en probar la siguiente hipótesis
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑛
𝐻1 : 𝜇𝑖 ≠ 𝜇𝑗 Para algún par (𝑖 ≠ 𝑗)
3.2 Descomposición de las Sumas de Cuadrados Total
El nombre de análisis de varianza, viene del origen etimológico de análisis, que

es soltar o descomponer las cosas para ver cómo funcionan.
Para un mejor entendimiento de cada componente de varianza se examinan por
separado, ya que esta se puede descomponer por tener grupos de observaci ones
pertenecientes a cada tratamiento, lo que da lugar a las diferencias entre los

tratamientos y dentro de los tratamientos como veremos entonces la
descomposición de la variabilidad total queda como sigue.
𝑆𝑆𝑇𝑜𝑡𝑎𝑙 = 𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 + 𝑆𝑆𝐸𝑟𝑟𝑜𝑟
Donde 𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 se le llama comúnmente sumas de cuadrados debido a los

tratamientos y a 𝑆𝑆𝐸𝑟𝑟𝑜𝑟 sumas de cuadrados debido al error. Además estas sumas
se definen como
𝑎 𝑛
2
𝑆𝑆𝑇𝑜𝑡𝑎𝑙 = ∑ ∑(𝑦𝑖𝑗 − 𝑦̅.. )
𝑖=1 𝑗=1
Que se usa como medida de la variabilidad total de las observaciones.

𝑎 𝑛
2
𝑆𝑆𝐸𝑟𝑟𝑜𝑟 = ∑ ∑(𝑦𝑖𝑗 − 𝑦̅𝑖. )
𝑖=1 𝑗=1
Que se usa como medida de la variabilidad debida a los errores y determina así
mismo la cantidad de información que no explica el modelo.
𝑎
𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 = 𝑛 ∑(𝑦̅𝑖. − 𝑦̅.. )2

𝑖=1
Que se usa como medida de la variabilidad debida a los tratamientos y determina

así mismo la cantidad de información que es explicada por el modelo.
3.3 Análisis Estadístico: Diseño Completamente Aleatorizado (DCA)
A continuación el proceso da un paso hacia la investigación de cómo se puede

efectivamente probar la hipótesis de interés 𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑎 . Teniendo en
cuenta las propiedades distribucionales de las sumas de cuadrados, se construye
el estadístico de prueba con base en los datos de la Tabla ANAVA para la
partición de sumas de cuadrados.

Grados de Suma de Cuadrados F
Fuente de variación
libertad Cuadrados Medios calculado
Entre los
tratamientos 𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠
a-1 𝑀𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 𝐹
Error (Dentro de los 𝑆𝑆𝐸 𝑀𝑆0𝑇𝑡𝑜𝑠
=
Tratamientos) N-a 𝑀𝑆𝐸 𝑀𝑆𝐸
𝑆𝑆𝑇𝑜𝑡𝑎𝑙
Total
Tabla 3: Tabla ANAVA para el modelo con un factor del modelo de efectos fijos
Donde
𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠
𝑀𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 =
𝑎−1
Y
𝑆𝑆𝐸
𝑀𝑆𝐸 =
𝑁−𝑎
Se les llama cuadrados medios. Ahora bajo el supuesto de que la hipótesis nula
es cierta, el cociente:
𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 /(𝑎 − 1)
𝐹0 =
𝑆𝑆𝐸 /(𝑁 − 𝑎)
Se distribuye 𝐹 con 𝑎 − 1 y 𝑁 − 𝑎 grados de libertad y es el llamado estadístico

de prueba para la hipótesis de que no existen diferencias significativas en
las medias de los tratamientos. Esta es una prueba a una cola superior y la
decisión es 𝐻0 deberá rechazarse y concluirse que hay diferencias en las medias
de los tratamientos si:
𝐹0 > 𝐹𝛼,𝑎−1,𝑁−𝑎
De manera alternativa como se mostró en la anterior unidad de aprendizaje podrá

utilizarse el criterio del 𝑃- valor para la toma de una decisión.
Nota: El cálculo de la tabla ANAVA y sus respectivos valores están programados
en paquetes de software estadísticos y muestran la partición relacionada en la
Tabla 3. Se recomienda que se estudien algunos de estos software y su salida ya
que para verdaderos estudios el cálculo a mano de estos se hace bastante
tedioso y complicado.
Ejemplo 2: Se quiere determinar si cuatro temperaturas específicas de horneado
afectan la densidad de cierto tipo de ladrillo. Los datos del experimento se
muestran en la siguiente tabla.

Temperatura Densidad
100 21.8 21.9 21.7 21.6
125 21.7 21.4 21.5 21.4
150 21.9 21.8 21.8 21.6
175 21.9 21.7 21.8 21.4

¿Afecta la temperatura de horneado la densidad del ladrillo?
Entonces reescribiendo las expresiones como sigue y haciendo los respectivos
cálculos tenemos que:
Suma de cuadrados total:
𝑎 𝑛
2
𝑦..2 346.92
𝑆𝑆𝑇 = ∑ ∑ 𝑦𝑖𝑗 − = 7521.71 − = 0.884375
𝑁 16
𝑖=1 𝑗=1
Suma de cuadrados de los tratamientos

𝑎
𝑦𝑖2 𝑦..2 346.92
𝑆𝑆𝑇𝑡𝑜𝑠 = ∑ − = 7521.4125 − = 0.186875
𝑛 𝑁 16
𝑖=𝑎
Suma de cuadrados del error

𝑆𝑆𝐸 = 𝑆𝑆𝑇 − 𝑆𝑆𝑇𝑡𝑜𝑠 = 0.2975
Luego podemos calcular la tabla ANAVA como sigue:
Fuente de Grados de Suma de Cuadrados F

variación libertad Cuadrados Medios calculado
Temperaturas 3 0.186875 0.6229 𝐹0 = 2.51

Error 12 0.2975 0.02479
Total 15 0.484375
Tabla 5: Tabla ANAVA para el ejemplo 2

Ahora 𝑭𝟎 = 𝟐. 𝟓𝟏 < 𝟓. 𝟗𝟓 = 𝑭(𝟎.𝟎𝟏,𝟑,𝟏𝟐) luego la decisión es que no se puede
rechazar 𝑯𝟎 en favor de 𝑯𝟏 .

4 Resumen
• Es lógico pretender determinar la existencia o ausencia de diferencias
entre las medias de las poblaciones a través de la metodología del
análisis de varianza.
• Los conceptos básicos involucrados en este estudio son: la unidad
experimental, los tratamientos, el factor, el nivel del factor, la replicación, el
modelo asociados a los datos, el modelo de efectos fijos y el modelo de
efectos aleatorios.
• El análisis de varianza contiene sus bases en un modelo de regresión
donde la variable explicativa es de tipo dicótoma, es decir, esta variable
indica la pertenencia o no pertenecía de la observación al nivel del factor
o tratamiento.

•

Índice
1 Diseños con Datos No Balanceados ............................................................................... 3
2 Los Supuestos del Modelo ................................................................................................ 3
2.1 Supuestos de Normalidad ............................................................................4
2.2 Homogeneidad de Varianza .........................................................................4
2.3 Autocorrelación ...............................................................................................4
3 Resumen ................................................................................................................................. 5

Objetivos
• Objetivo 1: Comprender el significado de los datos no balanceados.
• Objetivo 2: Entender que las variables escogidas son las que tienen que
estar en el modelo, además de los supuestos de normalidad homogeneidad
de varianza y autocorrelación de los errores.
1 Diseños con Datos No Balanceados

Existen algunos casos en que los experimentos con un solo factor contienen
“Diseño no balanceado es cuando nos distinto número de observaciones por cada nivel del factor. Se dice entonces de
encontramos con un solo factor que un diseño no balanceado.
contiene distintos números de Entonces es posible aplicar toda la teoría mostrada anteriormente, teniendo en
observaciones por cada nivel de factor” cuenta el hecho de que existen tamaños de muestra distintos por grupos, las
fórmulas para las sumas de cuadrado queda como sigue. Sea que se hagan 𝒏𝒊
observaciones bajo el tratamiento 𝒊 con (𝒊 = 𝟏, 𝟐, … , 𝒂) y que 𝑵 = ∑𝒂𝒊=𝟏 𝒏𝒊
𝑎 𝑛𝑖
2
𝑦..2
𝑆𝑆𝑇 = ∑ ∑ 𝑦𝑖𝑗 −
𝑁
𝑖=1 𝑗=1
Y
𝑎
𝑦𝑖.2 𝑦..2
𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 = ∑ −
𝑛𝑖 𝑁
𝑖=1
Luego de esto, no se requieren más cambios en el análisis de varianza.
2 Los Supuestos del Modelo

Debido a que la teoría del análisis de varianza se basa en el planteamiento de
“El modelo contiene las variables que
un modelo de regresión lineal, el hecho de que la descomposición de la
varianza por grupos, dentro y entre los tratamientos, explique la variabilidad de
deben estar en el modelo, sin que
las medias de los tratamientos, depende enteramente de que el modelo asociado
sobren o falten”
al diseño cumpla con unos supuestos, en especial el de que el modelo describe
bien a las observaciones del experimento, es decir, que las variables escogidas
son las que tienen que estar en el modelo y no sobran o faltan, además de los
supuestos de normalidad, homogeneidad de varianza y autocorrelación de los
errores.

2.1 Supuestos de Normalidad
El supuesto de normalidad para los errores, como su nombre lo indica, es el

hecho de asumir que los 𝜀𝑖 ~𝑁(𝜇, 𝜎 2 ). Esto implica la herencia del supuesto de
“El supuesto de normalidad es el
normalidad a la variable respuesta por propiedad de linealidad. A continuación
hecho de asumir que 𝜀𝑖 ~𝑁(𝜇, 𝜎 2)” veremos algunos procedimientos para verificar este supuesto.
• Un procedimiento es hacer una gráfica para verificar las desviaciones de la
normal con el llamado 𝑄 − 𝑄 plot, que lo que hace es graficar los cuantiles
de la distribución teórica contra los residuales ordenados. Si se denota una
tendencia lineal, se podría entonces asumir normalidad.
• Otro procedimiento son unas pruebas formales acogidas como estándar
para la verificación del supuesto. Estas pruebas ya vienen programadas en
paquetes de software estadístico, sin embargo existen textos guías que
anexan sus valores tabulados. Debido a la no pertinencia de su aplicación a
éste por ser de tipo introductorio, solo se mencionaran sus nombres. Las
pruebas más conocidas son: Prueba de Kolmogorov Smirnof y la Prueba
de Shapiro Wilks.
2.2 Homogeneidad de Varianza
El supuesto de homogeneidad de varianza indica que la varianza es constante

en todos los errores o lo que es lo mismo que es igual para todos, esto es 𝑉(𝜀𝑖 ) =
“El supuesto de homogeneidad de 𝜎 2. Como en el caso anterior, para la normalidad se listan algunos procedimientos
varianza indica que la varianza es para la verificación del supuesto, haciendo la salvedad de que para su aplicación
constante en todos los errores” lo mejor es recurrir a un paquete estadístico ya que sus cálculos implican algún
grado de dificultad.
• Gráficos se pueden graficar los 𝜀̂ contra los 𝑦̂ para verificar una dispersión
aleatoria arriba y debajo de la línea 𝜀̂ = 0, otro grafico puede ser 𝜀̂ contra
𝑋𝑖 y análogamente al anterior cualquier diferencia en la magnitud de la
dispersión alrededor de cero sugiere varianzas heterogéneans.
• Existen varias pruebas formales que ayudan según su aplicación bajo
ciertas características a la detección de heterocedasticidad en la varianza
algunas de ellas son: Prueba de Bartlett, Prueba de Goldfeld – Quandt,
Prueba de Breusch – Pagan y la Prueba de White.
2.3 Autocorrelación
El supuesto de autocorrelación indica que los errores deben ser

incorrelacionados o no correlacionados entre sí, esto es 𝑪𝒐𝒗(𝜺𝒊, 𝜺𝒋 ) = 𝟎.
“El supuesto de autocorrelación indica que
los errores deben ser incorrelacionados o Existen procedimientos en la teoría de las series temporales que ayudan a
no correlacionados entre sí” determinar el supuesto de correlación serial pero la más conocida y de mayor
aplicación, es la Prueba de Durbin Watson, sin embargo, al igual que en los
anteriores casos, depende de una buena percepción del problema y se
recomienda el uso de un paquete de software estadístico.

3 Resumen
• Existen algunos casos en que los experimentos con un solo factor contienen
distinto número de observaciones por cada nivel del factor. Se dice
entonces de un diseño no balanceado.
• El hecho de que la descomposición de la varianza por grupos explique la
variabilidad de las medias de los tratamientos, depende enteramente de
que el modelo asociado al diseño cumpla con unos supuestos, en especial
el de que el modelo describe bien a las observaciones del experimento, es
decir, que las variables escogidas son las que tienen que estar en el modelo
y no sobran o faltan, además de los supuestos de normalidad,
homogeneidad de varianza y autocorrelación de los errores.

•

Índice
1 Introducción .......................................................................................................................... 3
2.1 Hipótesis Estadística ..................................................................................... 3
2.2 Tipos de Hipótesis ..........................................................................................4
2.2.1 Hipótesis simple ................................................................................4
2.2.2 Hipótesis compuesta .......................................................................4

2.3 Prueba de Hipótesis .......................................................................................4
2.4 Tipos de Errores ..............................................................................................4
2.5 Región Crítica y Nivel de Significación ................................................... 5
3 Pruebas para la Media de una Distribución Normal .................................................. 5
3.1 Prueba de Dos Colas para µ ........................................................................ 7
3.2 Pruebas de Una Cola para µ ........................................................................8
4 Resumen .................................................................................................................................8

Objetivos
• Objetivo 1: Analizar el mínimo nivel de incertidumbre.
• Objetivo 2: Construir estadísticas de pruebas pertenecientes a una
determinada distribución para poder concluir si se rechaza o no cierta
hipótesis de interés.
1 Introducción
En esta unidad de aprendizaje analizaremos uno de los objetivos fundamentales
en un estudio estadístico para determinar el mínimo nivel de incertidumbre a
través de los conceptos básicos y aplicación de pruebas de hipótesis.
Esto se hace con el fin de encontrar herramientas útiles a la hora de tomar
decisiones acerca de una sospecha o duda razonable que se tenga en un
estudio de investigación. Nuestro interés se centrará entonces en la construcción
de estadísticas de prueba pertenecientes a una determinada distribución
para luego compararla con valores de la tabla en una distribución conocida y
mirar si se rechaza o no cierta hipótesis de interés.
En casos donde se tengan experimentos con múltiples resultados basados en
“Cuando se tengan experimentos eventos aleatorios y la finalidad sea la toma de una decisión, es de mayor interés
con múltiples resultados basados en el buen planteamiento de una hipótesis. Con base a esto, la estrategia natural
eventos aleatorios y la finalidad sea
es decidirse por uno de los experimentos en cuestión. Así el establecimiento de la
regla de decisión delimitara la región de rechazo y con ello las probabilidades
la toma de una decisión, conviene el
de errores a la hora de la toma de decisiones.
planteamiento de una hipótesis”
A continuación veremos los conceptos básicos involucrados en el estudio de las
pruebas de hipótesis para entender mejor la aplicación de esta técnica de
inferencia estadística.
2.1 Hipótesis Estadística
Una hipótesis estadística es una afirmación o conjetura acerca de una

“Se trata de una afirmación o conjetura distribución de una o más variables aleatorias.
acerca de una distribución de una o
Ejemplo 1: Si 𝑋 sigue una distribución exponencial de parámetro 𝜆 una hipótesis
más variables aleatorias” podría ser la afirmación “𝜆 = 0.3”, análogamente si 𝑋 sigue una distribución
𝑁(𝜇, 𝜎 2 ) una hipótesis podría ser la afirmación “𝜇 > 1”.

2.2 Tipos de Hipótesis
2.2.1 Hipótesis simple
Una hipótesis se dice simple si se especifica por completo la probabilidad en

cuestión.
2.2.2 Hipótesis compuesta

Una hipótesis se dice compuesta si no se especifica por completo la probabilidad
en cuestión.
Ejemplo 2: Si 𝑋 sigue una distribución exponencial de parámetro 𝜆 una hipótesis
podría ser la afirmación “𝜆 = 0.3” es una hipótesis simple, en contraste si 𝑋 sigue
una distribución 𝑁(𝜇, 𝜎 2 ) una hipótesis podría ser la afirmación “𝜇 > 1” se trata de
una hipótesis compuesta.
En general para la teoría de las pruebas de hipótesis se maneja el siguiente
esquema:
“Esquema para la teoría de las
pruebas de hipótesis” 𝐻0: Hipótesis nula vs 𝐻1: Hipótesis Alternativa

En donde las hipótesis nula y alternativa pueden ser simples o compuestas.
2.3 Prueba de Hipótesis
Una prueba de hipótesis es una regla para decidir si no se rechaza la hipótesis

“La prueba de hipótesis ayuda a nula o se rechaza en favor de la hipótesis alternativa.
decidir si no se rechaza la hipótesis Nótese que no está bien afirmar “se acepta la hipótesis nula” debido a que se
nula o si se rechaza en favor de la hace es una conclusión con base a la información que se extrae de la muestra, en
hipótesis alternativa” consecuencia lo que se tiene es que la muestra seleccionada no arroja
información suficiente para rechazar la hipótesis nula, teniendo en cuenta que
todo depende de la calidad de la muestra y de los errores de muestreo.
2.4 Tipos de Errores
Al realizar una prueba de hipótesis se pueden cometer errores.

• Al rechazo de la hipótesis nula cuando ésta es verdadera se le conoce
como error tipo I, y a la probabilidad de cometer este primer tipo de
error se le denota por la letra 𝛼.
• En cambio, al no rechazo de la hipótesis nula cuando ésta es falsa recibe
el nombre de error tipo II, y a la probabilidad de cometer este segundo
tipo de error se le denota por la letra 𝛽.
Estas definiciones de errores se resumen en la siguiente tabla:

𝐻0 Cierta 𝐻0 Falsa
Error tipo I Decisión correcta
Rechazar 𝐻0 con probabilidad 𝛼
Error tipo II
No rechazar 𝐻0 Decisión correcta con probabilidad 𝛽
Tabla 1: Tipos de errores
2.5 Región Crítica y Nivel de Significación
Se le llama región critica a la región de rechazo de 𝐻0, y a la probabilidad de

“Región crítica es la región de rechazo cometer el error tipo I, esto es 𝛼, se le llama tamaño de la región critica. A esta
de 𝐻0 y el tamaño de la región crítica probabilidad se le conoce también con el nombre de nivel de significancia.
es la probabilidad de cometer el error
tipo I”
3 Pruebas para la Media de una Distribución Normal

Sea 𝒙𝟏 , 𝒙𝟐 , … , 𝒙𝒏 una muestra aleatoria de población media 𝝁 desconocida y
𝝈𝟐
varianza 𝝈𝟐 conocida. Sabemos que 𝒙 ̅ tiene distribución 𝑵(𝝁, ) por tanto:
√𝒏
𝑥̅ − 𝜇
~𝑁(0,1)
𝜎 2⁄
√𝑛
Sea 𝝁𝟎 un número real particular. Deseamos probar las hipótesis 𝑯𝟎 : 𝝁 = 𝝁𝟎

contra 𝑯𝟏 : 𝝁 ≠ 𝝁𝟎 El problema es encontrar una regla para decidir cuándo
rechazar 𝑯𝟎 en favor de 𝑯𝟏 con base en los datos de la muestra 𝒙𝟏 , 𝒙𝟐 , … , 𝒙𝒏 .
Cuando 𝑯𝟐 𝟎 es cierta, esto es, cuando 𝝁 es efectivamente 𝝁𝟎 , tenemos que
𝝈
𝑿~𝑵(𝝁𝟎 , ) y por lo tanto:
√𝒏
𝑥̅ − 𝜇0
~𝑁(0,1)
𝜎 2⁄
√𝑛
̅−𝝁
𝒙
La estadística 𝒁 = 𝝈𝟐 𝟎 es una medida natural de la distancia entre ̅ 𝒙 ,un
⁄
estimador de 𝝁, y su√𝒏 valor esperado 𝝁𝟎 cuando 𝑯𝟎 es cierta. Es entonces
razonable rechazar 𝑯𝟎 cuando la variable 𝒁 sea grande. Es por ello que tomamos
como criterio de decisión rechazar 𝑯𝟎 cuando |𝒁| ≥ 𝒌, para cierta constante 𝒌.
¿Cómo encontramos el número 𝒌? En una tabla de la distribución normal
podemos encontrar un valor 𝒛𝜶/𝟐 tal que 𝑷(|𝒁| ≥ 𝒛𝜶/𝟐 ) = 𝜶, en donde 𝜶 lo
determina la persona que lleva a cabo la prueba de hipótesis, típicamente 𝜶 =
𝟎. 𝟏. Véase el Gráfico 1. Este valor 𝒛𝜶/𝟐 es precisamente la constante 𝒌 buscada
pues con ello se logra que la región de rechazo sea de tamaño 𝜶.

A la variable aleatoria 𝒁 se le llama la estadística de la prueba, y la prueba se
denomina prueba de dos colas pues la región de rechazo consta de las dos colas
de la distribución normal que se muestran en el Gráfico 1.
Llevar a cabo esta prueba de hipótesis consiste en usar los datos de la muestra
para encontrar el valor de 𝒁, |𝒁| ≥ 𝒛𝜶/𝟐 , entonces se rechaza 𝑯𝟎 , en caso contrario
no se rechaza 𝑯𝟎 . Similarmente se definen las pruebas a cola inferior y superior
para valores extremos.
Gráfico 1: Región de rechazo a dos colas
Gráfico 2: Región de rechazo a cola inferior

Gráfico 3: Región de rechazo a cola superior
3.1 Prueba de Dos Colas para µ
Para probar esta hipótesis en primera instancia se tiene en cuenta que existen
dos zonas de rechazo en ambas colas como se muestra en el Gráfico 1 y en
“Suponemos dos zonas de rechazo
segunda instancia se calcula el estadístico de prueba 𝑍 y se compara con los
para probar esta hipótesis”
valores críticos 𝑍 en la tabla, así tenemos que el valor en mención viene dado por:
𝑥̅ − 𝜇𝐻
𝑍= 𝜎
⁄ 𝑛
√
En donde 𝑥̅ es el valor de la media muestral, 𝜇𝐻 es el valor de la media

poblacional bajo la hipótesis nula y 𝜎 2 /√𝑛 es el error estándar de la distribución
muestral.
Cuando se desconoce 𝜎 se utiliza su respectiva estimación, la desviación estándar
muestral 𝑠 y 𝑍 se vuelve:
𝑥̅ − 𝜇𝐻
𝑍= 𝑠
⁄ 𝑛
√
Ejemplo 3: Se supone que una empresa embotelladora de bebidas gaseosas de

que la media poblacional es de 16 onzas y seleccionan un nivel de significancia
del 5%. Debido al planteamiento del problema el conjunto de hipótesis queda
como sigue:
𝐻0 : 𝜇 = 16
𝐻1 : 𝜇 ≠ 16
Si la empresa embotelladora toma una muestra de 𝑛 = 50 botellas con una media

de 𝑥̅ = 16.357 onzas y una desviación estándar de 𝑠 = 0.866 onzas, tenemos que

16.357 − 16
𝑍= = 2.91
0.866
√50
Ahora comparando 𝑍 con los valores críticos de 𝑧 de la tabla que son ±1.96. La
regla de decisión sería: no se rechaza la hipótesis nula sí −1.96 ≤ 𝑍 ≤ 1.96. Se
rechaza si 𝑍 < −1.96 o 𝑍 > 1.96.
Luego como 𝑍 = 2.91 > 1.96 se rechaza la hipótesis nula a un nivel de
significancia del 5% en favor de la hipótesis alternativa.
3.2 Pruebas de Una Cola para µ
En contraste con el anterior caso, en este solo se está interesado en una de las
dos colas de la distribución. Como se muestra en los Gráficos 2 y 3
respectivamente.
Ejemplo 4: En una reunión informativa para una oficina corporativa, el gerente de
un importante hotel, reporto que el número promedio de habitaciones alquiladas
por noche es de por lo menos 212. Uno de los funcionarios corporativos cree que
esta cifra puede estar sobreestimada. Una muestra de 150 noches produce una
media de 201.3 habitaciones y una desviación estándar de 45.5 habitaciones. Si
estos resultados sugieren que el gerente ha inflado su reporte, será amonestado
severamente. A un nivel del 1% ¿Cuál es el destino del gerente?
La afirmación del gerente de que 𝜇 ≥ 212 lleva el signo igual y por tanto se toma
la siguiente hipótesis nula
𝐻0 : 𝜇 ≥ 212 vs 𝐻1 : 𝜇 < 212
Luego
201.3 − 212
𝑍= = −2.88
45.5
√150
La regla de decisión es: No rechazar 𝐻0 sí 𝑍 ≥ −2.33. Rechazar sí 𝑍 < −2.33.

Entonces el valor 𝑍 = −2.88 claramente está en la zona de rechazo lo que indica
que el gerente podría estar en serios problemas.
4 Resumen
• En casos donde se tengan experimentos con múltiples resultados basados
en eventos aleatorios y la finalidad sea la toma de una decisión, es de
mayor interés, el buen planteamiento de una hipótesis.

• Los conceptos básicos involucrados en el estudio de las pruebas de
hipótesis son: la hipótesis estadística, los tipos de hipótesis, la prueba de
hipótesis, los tipos de errores y la región crítica y nivel de significancia.

•

Índice
1 P Valores y su Interpretación ........................................................................................... 3

2 Pruebas para Muestras consideradas Pequeñas ........................................................ 3
3 Pruebas para la Proporción ...............................................................................................4
4 Prueba de Hipótesis en Dos Poblaciones ..................................................................... 5
4.1 Prueba de Hipótesis para la Diferencia de Medias .............................. 5
4.2 Pruebas con Muestras consideras Pequeñas ......................................... 5
4.3 Pruebas de Hipótesis para Muestras Pareadas .....................................6
4.4 Prueba de Diferencias para Dos Proporciones ......................................6
5 Resumen ................................................................................................................................. 7

Objetivos
• Objetivo 1: Conocer la interpretación de p valores.
• Objetivo 2: Estudiar las distintas pruebas de hipótesis en dos poblaciones.
1 P Valores y su Interpretación
El p valor para una prueba es la probabilidad de obtener resultados muestrales a
lo menos tan extremos como los que se obtuvieron dado que la hipótesis nula es
verdadera. Se encuentra de la misma manera que el área de la cola, que va más
allá de valor del estadístico para la muestra.
En la practica el p valor es el nivel más bajo de significancia al cual se puede
“El p valor es el nivel más bajo de rechazar la hipótesis nula. Es el área en la cola que está más allá del valor del
significancia al cual se puede rechazar a estadístico para la prueba.
hipótesis nula” Ejemplo 5: Un jefe de personal a partir de un breve análisis de los registros de
los empleados, cree que puede afirmar que los empleados tienen un promedio de
más de 31000 dólares americanos en sus cuentas de pensión. Al tomar una
muestra de 100 empleados, el jefe de personal encuentra una media de 31366,
con una desviación estándar de 1894. Luego el contraste viene dado por:
𝐻0 : 𝜇 ≤ 31000 vs 𝐻1 : 𝜇 > 31000
Entonces tenemos que:

31366 − 31000
𝑍= = 1.93
1894
√100
Luego calculando el p valor como sigue:

1 − 𝑃(𝑍 ≤ 1.93) = 0.0268
En conclusión
• Si se tomara un nivel de significancia 𝜶 = 𝟎. 𝟎𝟓 , se tiene que 𝟎. 𝟎𝟐𝟔𝟖 <
𝟎. 𝟎𝟓 lo que indica que cae en zona de rechazo de la hipótesis nula.
• Si se tomara un nivel de significancia 𝜶 = 𝟎. 𝟎𝟏 , se tiene que 𝟎. 𝟎𝟐𝟔𝟖 >
𝟎. 𝟎𝟏 lo que indica que cae en zona de no rechazo de la hipótesis nula.
2 Pruebas para Muestras consideradas Pequeñas

Análogo al caso de intervalos de confianza donde las muestras pequeñas de
poblaciones consideradas normales, puede utilizarse la distribución 𝒕, en casos en
que supone 𝒏 < 𝟑𝟎. El estadístico de prueba viene dado por:

𝑥̅ − 𝜇
𝑡= 𝑠 ~𝑡(𝑛−1)
√𝑛
Así, la comparación ahora se hace con un valor 𝒕(𝒏−𝟏) de la tabla a un nivel de

significancia 𝜶 deseado con la misma regla de decisión.
3 Pruebas para la Proporción

Ahora nuestro interés se centra en la estadística que arroja proporciones o
“Nuestro interés se centra en la términos de porcentajes, que son de la mayor importancia en la mayoría de
estadística que arroje proporciones estudios estadísticos.
o términos de porcentajes” De manera análoga a los procedimientos anteriores para la proporción toman
forma la construcción del estadístico de prueba, su cálculo, la comparación con el
valor de la tabla y su respectiva conclusión.
Así, tenemos para este caso entonces:
𝑝 − 𝜋𝐻
𝑍=
𝜎𝑝
En donde 𝒑 es la proporción muestral de las observaciones que se consideran

éxitos, 𝝅𝑯 es el valor planteado como hipótesis para la proporción poblacional, 𝝈𝒑
es el error estándar de la proporción muestral.
Ejemplo 6: El director de mercadeo de una pyme, considera que el 𝟔𝟎% de los
clientes de la firma se han graduado de la universidad, además le interesa
establecer una política respecto a la estructura de precios sobre esta proporción.
Una muestra de 𝟖𝟎𝟎 clientes revela que 492 clientes tienen grado universitario, lo
que indica una proporción muestral del 𝒑 = 𝟎. 𝟔𝟏𝟓. A un nivel del 𝟓% ¿Qué puede
concluir acerca de la proporción de todos los clientes que se han graduado de la
universidad?
𝐻𝑜 : 𝜋 = 0.60 Vs 𝐻1 : 𝜋 ≠ 0.60
El error estándar es
0.60(1 − 0.60)
𝜎𝑝 = √ = 0.017
800
Entonces,
0.615 − 0.60
𝑍= = 0.88
0.017
Luego el 𝒁 = 𝟎. 𝟖𝟖 < 𝟏. 𝟗𝟔 indica que cae en la zona de no rechazo o utilizando el

p valor de 𝟎. 𝟑𝟕𝟖𝟖 < 𝟎. 𝟎𝟓 lo que es claramente menor que 𝜶, esto indica que no

se pude rechazar la hipótesis nula. En conclusión hay que capacitar a una mayor
cantidad de trabajadores.
4 Prueba de Hipótesis en Dos Poblaciones
4.1 Prueba de Hipótesis para la Diferencia de Medias
Es de interés particular el saber si las medias de las poblaciones son

estadísticamente iguales, lo que sería equivalente a probar a que las muestras
“Nos interesa saber si las medias de
provienen de la misma población.
las poblaciones son estadísticamente
Acorde con lo anterior, el procedimiento de prueba de hipótesis mostramos el
iguales”
estadístico de prueba como sigue:
(𝑥̅1 − 𝑥̅ 2 )(𝜇1 − 𝜇2 )
𝑍=
𝑠𝑥̅1 −𝑥̅2
En donde 𝑠𝑥̅1−𝑥̅2 es el error estándar estimado para las diferencias de medias en

las medias muestrales.
Así la regla de decisión es: No rechazar si 𝒁 está entre ±𝟏. 𝟗𝟔. Rechazar si 𝒁 es
menor que 𝟏. 𝟗𝟔 o más que 𝟏. 𝟗𝟔.
4.2 Pruebas con Muestras consideras Pequeñas
Análogamente al caso anterior se presentan los estadísticos para las pruebas, en

el caso de que las muestras sean consideradas pequeñas generalmente 𝑛 ≤ 30,
con la respectiva aproximación a la distribución 𝑡 mostrada para una población.
(𝑥̅1 − 𝑥̅ 2 ) − (𝜇1 − 𝜇2 )
𝑍=
𝑆𝑝2 𝑆𝑝2
√
𝑛1 + 𝑛2
En este caso 𝜎12 = 𝜎22 son desconocidas pero iguales. Además tenemos
(𝑥̅1 − 𝑥̅ 2 ) − (𝜇1 − 𝜇2 )
𝑍=
𝑆12 𝑆22
√
𝑛1 + 𝑛2
En este caso 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐 son desconocidas pero diferentes y la regla de decisión es:
No rechazar si 𝒕 esta entre ±𝟐. 𝟓𝟐𝟖. En otro caso se rechaza.

4.3 Pruebas de Hipótesis para Muestras Pareadas
Para las muestras tomadas de a pares por individuo, se tiene que al igual que en
el caso de una población se calculan las diferencias y se tiene el siguiente
estadístico de prueba:
𝑑̅ − (𝜇1 − 𝜇2 )
𝑡=
𝑆𝑑
√𝑛
En donde 𝑑̅ es la media de las diferencias de las observaciones pareadas y 𝑆𝑑 es

el error estándar de dichas diferencias.
La decisión es: No rechazar si 𝑡 esta entre ±2.145. En otro caso se rechaza.
4.4 Prueba de Diferencias para Dos Proporciones
Como hemos visto a través del desarrollo de la unidad de aprendizaje es de sumo

interés el cálculo de una proporción. De manera similar es de gran interés el
“Es de sumo interés el cálculo de
estadístico que dicte, si existe o no diferencia entre algún par de ellas.
una proporción”
Así siguiendo la lógica de desarrollo de los cálculos en una población, se hace el
cálculo ahora para dos poblaciones tomando como base en el siguiente
estadístico de prueba:
(𝑝1 − 𝑝2 ) − (𝜋1 − 𝜋2 )
𝑍=
𝑆𝑝1−𝑝2
En donde 𝑝1 , 𝑝2 son proporciones de éxitos en las respectivas muestras y 𝑆𝑝1 −𝑝2 es

el error estándar de las diferencias.
La decisión es: No rechazar si 𝑍 está entre ±2.58 . Rechazar en otro caso.
Ejemplo 7: La gerencia de un reconocido club de golf de la ciudad desea ver si el
tiempo promedio que requieren las mujeres para jugar los 18 hoyos del campo es
diferente al de los hombres se mide el tiempo de 50 partidos dobles de hombre y
45 de mujeres dando como resultado la siguiente tabla:
Hombres Mujeres
𝑥̅ = 3.5 ℎ 𝑥̅ = 4.9 ℎ
𝑠 = 0.9 ℎ 𝑠 = 1.5 ℎ

Entonces tenemos que:

(0.9)2 (1.5)2
𝑆𝑥̅1−𝑥̅2 = √ + = 0.257
50 45
Luego:
(3.5 − 4.9) − 0
𝑍= = −5.45
0.257
Debido a que 𝒁 = −𝟓. 𝟒𝟓 < −𝟏. 𝟗𝟔 a un nivel 𝜶 = 𝟎. 𝟎𝟓. Se rechaza la hipótesis

nula.
Ejemplo 8: Un comerciante de menudeo quiere probar la hipótesis de que sus
clientes hombres, quienes compran a crédito, son iguales en proporción a las
mujeres que también compran a crédito. Selecciona una muestra de 100 hombres
y encuentra que 57 de ellos compran a crédito, en contraste solo 52 de las 110
mujeres seleccionadas compran por medio del crédito. Entonces de acuerdo a lo
anterior tenemos que:
(0.57)(0.43) (0.527)(0.473)
𝑆𝑝1−𝑝2 = √ + = 0.069
100 110
Ahora tenemos que:

(0.57 − 0.473) − 0
𝑍= = 1.41
0.069
Con lo que se concluye que, debido a que 𝒁 está entre ±𝟐. 𝟓𝟖 no se puede
rechazar la hipótesis nula con un nivel 𝜶 = 𝟎. 𝟎𝟏 y por tanto el minorista no puede
concluir que las proporciones de compras entre mujeres y hombres son
diferentes.
5 Resumen
• El p valor para una prueba es la probabilidad de obtener resultados
muestrales a lo menos tan extremos como los que se obtuvieron dado que
la hipótesis nula es verdadera.
• Análogo al caso de intervalos de confianza donde las muestras pequ eñas de
poblaciones consideradas normales, puede utilizarse la distribución 𝑡, en
casos en que supone 𝑛 < 30.
• En las pruebas para la proporción, nuestro interés se centra en la
estadística que arroja proporciones o términos de porcentajes, que son de
la mayor importancia en la mayoría de estudios estadísticos.

• Dentro de la prueba de hipótesis en dos poblaciones debemos distinguir
entre: prueba de hipótesis para la diferencia de medias, pruebas con
muestras consideradas pequeñas, Pruebas de hipótesis para muestras
pareadas y Prueba de diferencias para dos proporciones.

•

Índice
1 Introducción .......................................................................................................................... 3
2 Conceptos Básicos (Rincón, 2010) ................................................................................. 3
2.1 Variables Aleatorias ....................................................................................... 3
2.2 Variable Aleatoria Discreta .........................................................................4
2.3 Variable Aleatoria Continua .........................................................................4
2.4 Función de Probabilidad para una Variable Discreta (Rincón, 2010)

..............................................................................................................................4
2.5 Función de Densidad para una Variable Continua ................................4
3 Distribución Conjunta ......................................................................................................... 5
3.1 Función de Densidad para una Variable Continua ................................ 5
3.2 Densidad Conjunta ......................................................................................... 5
3.3 Variables Aleatorias Bidimensionales Discretas ................................... 5
3.4 Función Masa o de Densidad Probabilidad Conjunta ..........................6
3.5 Variables Aleatorias Bidimensionales Continuas ..................................6
4 Distribución Marginal..........................................................................................................8
4.1 Función de Distribución Marginal ..............................................................8
4.2 Función de Densidad Marginal ...................................................................8
5 Resumen ............................................................................................................................... 10

Objetivos
• Objetivo 1: Conocer los conceptos básicos de la teoría de variables
aleatorias.
• Objetivo 2: Estudiar las variables aleatorias bidimensionales.
1 Introducción
Iniciamos esta unidad de aprendizaje con un repaso por los conceptos básicos
de la teoría de variables aleatorias, con el fin de enlazar los contenidos de la
última unidad de aprendizaje vista en el curso de Estadística I.
Siguiendo con la orientación objeto del curso, nuestro interés ahora se centrará
en determinar la forma en cómo se estudian variables aleatorias
bidimensionales y la interacción que consigo lleva su medición. También es de
interés final medir el grado, intensidad y el sentido de asociación entre las
características de interés.
2 Conceptos Básicos (Rincón, 2010)
2.1 Variables Aleatorias
Definido un experimento aleatorio de interés, por ejemplo el lanzamiento de

un dado, los posibles resultados, los números del uno al seis, son en
consecuencia valores numéricos. Sin embargo, se podrían asignar a los
valores pares un criterio de éxito denotado por un número, digamos uno y
en caso contrario un cero.
Este tipo de asignación de los valores numéricos a los sucesos de un
“En una variable aleatoria se puede ver experimento aleatorio determina la base sobre la cual se define una variable
una aplicación 𝑋 del espacio de aleatoria. Así una variable aleatoria se puede ver una aplicación 𝑿 del espacio
de resultados 𝛀 al conjunto de números reales, esto es,
resultados Ω al conjunto de números
reales” 𝑋: Ω → ℝ
A menudo se escribe simplemente 𝑣. 𝑎. en lugar del término variable aleatoria

para efectos de notación.
En general, las variables aleatorias se denotan usando las últimas letras del
alfabeto en mayúsculas, 𝑈, 𝑉, 𝑊, 𝑋, 𝑌, 𝑍 y para un valor cualquiera de ellas se usa la
misma letra pero en minúscula.

2.2 Variable Aleatoria Discreta
Decimos que una variable aleatoria es discreta, cuando toma un valor particular y
“Una variable aleatoria es discreta este resulta de ser un valor entero.
cuando oma un valor particular y este
Ejemplo:
resulta ser un valor entero”
Una variable aleatoria discreta puede ser la edad, debido a que toma valores en el
conjunto {0, 1, 2,….., n} que es un conjunto discreto porque es finito.
2.3 Variable Aleatoria Continua
Decimos que una variable aleatoria es continua cuando toma todos los valores
dentro de un intervalo (a, b) ⊆ ℝ. Esta clasificación de variables aleatorias es
“Una variable aleatoria es continua
limitada ya que existen variables aleatorias que no son absolutamente continuas o
cuando toma todo los valores dentro
absolutamente discretas, es decir, pueden tomar valores de ambos conjuntos
de un intervalo” numéricos.
2.4 Función de Probabilidad para una Variable Discreta (Rincón, 2010)
Dada una variable aleatoria 𝑋 discreta que toma los valores en un conjunto finito
o numerable y con probabilidades no nulas. La función de probabilidad de la
variable 𝑋 denotada por 𝑓(𝑥) ∶ 𝑅 → [0, ∞) se define como sigue:
𝑃(𝑋 = 𝑥) 𝑠𝑖, 𝑥 = 𝑥1 , 𝑥2 , …
𝑓(𝑥) = {
0 𝑐. 𝑜. 𝑐
Acorde con la definición, tenemos ahora las siguientes propiedades de la

función de densidad de probabilidad:
• 0 ≤ 𝑓(𝑥) ≤ 1
• ∑∞
𝑖=1 𝑓(𝑥𝑖 ) = 1
2.5 Función de Densidad para una Variable Continua
Dada una variable aleatoria 𝑋 continua. Decimos que la función integrable y no

negativa 𝑓(𝑥) ∶ ℝ → [0, ∞), es la función de densidad de 𝑋 si para cualquier
intervalo (𝑎, 𝑏) de ℝ se cumple la igualdad
𝑏
𝑃(𝑋 ∈ (𝑎, 𝑏)) = ∫ 𝑓(𝑥) 𝑑𝑥
𝑎
Acorde con la definición, tenemos ahora las siguientes propiedades de la

función de densidad de probabilidad:
• 𝑓(𝑥) ≥ 0, para toda 𝑥 ∈ ℝ.
∞
• ∫−∞ 𝑓(𝑥) 𝑑𝑥 = 1.

3 Distribución Conjunta
Como extensión natural del caso univariado, todo par de variables aleatorias
induce una medida de probabilidad. Esta medida de probabilidad puede
analizarse, de igual forma que en el caso de estudio de una sola variable,
mediante la función de distribución conjunta definida como sigue:
3.1 Función de Densidad para una Variable Continua
La función de distribución conjunta de un par de variables aleatorias dado

“Propiedadesde la función de densidad (𝑋, 𝑌), denotada por 𝑭(𝑥, 𝑦), se define como sigue
para una variable continua” 𝑭(𝑥, 𝑦) = 𝑷(𝑿 ≤ 𝑥, 𝒀 ≤ 𝑦).
El número 𝑭(𝒙, 𝒚) no es más que la probabilidad de que la variable bidimensional

tome valores en los intervalos cruzados (−∞, 𝒙] × (−∞, 𝒚]. A 𝑭(𝒙, 𝒚) se le suele
conocer también como función de distribución bidimensional de 𝑿 e 𝒀.
Las funciones de distribución bidimensionales cumplen propiedades similares a
los escenarios presentados en la teoría univariada, se muestran a continuación
algunas de estas propiedades.
• 𝐥𝐢𝐦 𝑭(𝒙, 𝒚) = 𝟏, ambas variables
𝒙,𝒚→∞
• 𝐥𝐢𝐦 𝑭(𝒙, 𝒚) = 𝟎, alguna de las variables.
𝒙,𝒚→−∞
• 𝑭(𝒙, 𝒚) es no decreciente en cada variable.
• 𝑭(𝒙, 𝒚) es continua por la derecha en cada variable.
• Si 𝒂𝟏 < 𝒃𝟏 𝒚 𝒂𝟐 < 𝒃𝟐 , entonces 𝑭(𝒃𝟏 , 𝒃𝟐 ) − 𝑭(𝒂𝟏 , 𝒃𝟐 ) − 𝑭(𝒃𝟏 , 𝒂𝟐 ) +
𝑭(𝒂𝟏 , 𝒂𝟐 ) ≥ 𝟎.
3.2 Densidad Conjunta
Como en el caso univariado, existen variables aleatorias bidimensionales

asociadas a otra función llamada, función de densidad o masa de probabilidad,
y que consigo lleva una interpretación de la medición de dos características a un
mismo individuo ya sea de manera separada o como las componentes de un
vector en este caso bivariado.
3.3 Variables Aleatorias Bidimensionales Discretas
Un par de variables aleatorias dado (𝑿, 𝒀) se le dice absolutamente discreta si

sus componentes 𝑿 y 𝒀 son variables aleatorias discretas. Entonces al suponer
que 𝑿 y 𝒀 tomen valores 𝒙𝒊 y 𝒚𝒋 con (𝒊, 𝒋 = 𝟏, 𝟐, 𝟑, … ) con sus respectivas
probabilidades inducidas por naturaleza 𝑷(𝑿 = 𝒙𝒊 ) y 𝑷(𝒀 = 𝒚𝒋 ), se podrá definir su
función asociada, función masa o de densidad conjunta para esta variable.

3.4 Función Masa o de Densidad Probabilidad Conjunta
La función masa o de densidad de probabilidad conjunta de un par de

variables aleatorias dado (𝑿, 𝒀), denotada por 𝒇(𝒙, 𝒚), viene dada por:
𝑓(𝑥, 𝑦) = 𝑃(𝑋 = 𝑥, 𝑌 = 𝑦)
Es de notar que al ser función de probabilidad para una variable aleatoria

bidimensional de tipo discreto debe cumplir las siguientes propiedades:
• 𝑓(𝑥, 𝑦) ≥ 0.
• ∑𝑥,𝑦 𝑓(𝑥, 𝑦) = 1.
Ejemplo 1: Considere el par de variables aleatorias dado (𝑿, 𝒀), con función de
densidad dada por la siguiente tabla.
𝑥/𝑦 0 1
−1 0.2 0.1
1 0.5 0.2
Tabla 1: ejemplo 1
De la tabla se deduce que la variable 𝑋 toma valores del conjunto {−1,1}, mientras
que 𝑌 toma valores en {0,1}. Además las probabilidades conjuntas están dadas
por las entradas de la tabla.
Ejemplo: 𝑃(𝑋 = −1, 𝑌 = 0) = 0.2, esto es, la probabilidad de que 𝑋 tome el valor
de −1 y al mismo tiempo 𝑌 tome el valor 0 es 0.2. El resto de la información puede
escribirse de la siguiente manera.
0.2 𝑆𝑖 𝑥 = −1, 𝑦 = 0,
0.1 𝑆𝑖 𝑥 = −1, 𝑦 = 1,
𝑓(𝑥, 𝑦) = 𝑃(𝑋 = 𝑥, 𝑌 = 𝑦) = 0.5 𝑆𝑖 𝑥 = 1, 𝑦 = 0,
0.2 𝑆𝑖 𝑥 = 1, 𝑦 = 1,
{ 0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Como todos estos valores son probabilidades, naturalmente son no

negativos, y todos ellos suman uno.
3.5 Variables Aleatorias Bidimensionales Continuas
Un par de variables aleatorias dadas (𝑿, 𝒀) se le dice absolutamente continua si

existe una función no negativa e integrable 𝒇(𝒙, 𝒚), tal que, para todo (𝒙, 𝒚) ∈ ℝ𝟐
la función de distribución conjunta del par de variables aleatorias (𝑿, 𝒀) puede
expresarse de la siguiente manera

𝑥 𝑦
𝐹(𝑥, 𝑦) = ∫ ∫ 𝑓(𝑢, 𝑣) 𝑑𝑢 𝑑𝑣
−∞ −∞
En consecuencia la función 𝒇(𝒙, 𝒚), se le llama función masa o de densidad

conjunta de 𝑿 y 𝒀.
Luego al determinar la función masa o de densidad de probabilidad del par
de variables aleatorias (𝑿, 𝒀), esta debe cumplir las siguientes propiedades:
• 𝑓(𝑥, 𝑦) ≥ 0.
∞ ∞
• ∫−∞ ∫−∞ 𝑓(𝑥, 𝑦) 𝑑𝑥 𝑑𝑦 = 1.
Ejemplo 2: Dado el par de variables aleatorias (𝑿, 𝒀), con función de densidad
conjunta dada por:
𝑥𝑦
𝑘( + 1) 𝑆𝑖 0 < 𝑥 < 1, −1 < 𝑦 < 1.
𝑓(𝑥, 𝑦) = { 2
0 𝐶𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑐𝑎𝑠𝑜
Calculemos 𝒌 de tal forma que 𝒇(𝒙, 𝒚) sea función de masa o de densidad de

probabilidad, entonces tenemos que verificar que:
• 𝑓(𝑥, 𝑦) ≥ 0, si y sólo si 𝑘 ≥ 0.
∞ ∞
• Como ∫−∞ ∫−∞ 𝑓(𝑥, 𝑦) 𝑑𝑥 𝑑𝑦 = 1.
Así veamos que:

1 1
𝑥𝑦
𝑘∫ ∫ ( + 1) 𝑑𝑦
0 −1 2
1 1 1
𝑦
= 𝑘 ∫ [𝑥 ∫ 𝑑𝑦 + ∫ 𝑑𝑦 ] 𝑑𝑥
0 −1 2 −1
1
𝑦2 1
= 𝑘 ∫ [𝑥 | + 𝑦|1−1 ] 𝑑𝑥
0 4 −1
1 1 1
𝑥 𝑥
= 𝑘 ∫ [ (12 − (−1)2 ) + (1 − (−1))] 𝑑𝑥 = 𝑘 ∫ [ ∙ (0) + (2)] 𝑑𝑥 = 𝑘 ∫ 2𝑑𝑥
0 4 0 4 0
1
= 𝑘 [2 ∫ 𝑑𝑥] = 𝑘[2𝑥|10 ] = 𝑘[2(1 − 0)] = 2𝑘 = 1
0

Por tanto 𝒌 = 𝟏/𝟐 y la función de masa o de densidad conjunta viene dada
por:
𝑥𝑦 + 2
𝑆𝑖 0 < 𝑥 < 1, −1 < 𝑦 < 1.
𝑓(𝑥, 𝑦) = { 4
0 𝐶𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑐𝑎𝑠𝑜
4 Distribución Marginal
En los escenarios donde la función de distribución F(x,y) del par de variables
“Si la función de distribución F(x, y) es aleatorias (X,Y), es dada, se hace posible obtener la función de distribución de
dada, es posible obtener la función de cada una de las variables aleatorias independientes, de la siguiente manera.
distribución de cada una de las
variables aleatorias independientes” 4.1 Función de Distribución Marginal
Dado el par de variables aleatorias (𝑿, 𝒀), con función de distribución 𝑭(𝒙, 𝒚).
Entonces la función:
𝐹(𝑥) = lim 𝐹(𝑥, 𝑦).
𝑦→∞
Se le llama función de distribución marginal de 𝑿. De igual forma es posible

definir la función de distribución marginal de 𝒀 como sigue:
𝐹(𝑦) = lim 𝐹(𝑥, 𝑦).
𝑥→∞
4.2 Función de Densidad Marginal
Dado el par de variables aleatorias (𝑿, 𝒀), absolutamente continuas con función
masa o de densidad de probabilidad 𝒇(𝒙, 𝒚). Entonces la función:
∞
𝑓(𝑥) = ∫−∞ 𝑓(𝑥, 𝑦) 𝑑𝑦.
Se llama función de densidad marginal de 𝑿. De igual forma es posible definir

la función de densidad marginal de 𝒀 como sigue:
∞
𝑓(𝑦) = ∫−∞ 𝑓(𝑥, 𝑦) 𝑑𝑥.
Nota: Si el vector es de tipo discreto solo basta con reemplazar las integrales con
términos de sumatorias para que las definiciones cobren sentido para tal caso.

Ejemplo 3: Para los datos de la tabla del ejemplo 1, tenemos que la marginal de 𝑿
vendría dada por:
𝑥 1 1
𝑃(𝑋 = 𝑥) 0.3 0.7
Tabla 2: Marginal de 𝑥
De manera similar, la marginal de 𝒀 vendría dada por:
𝑦 0 1
𝑃(𝑌 = 𝑦) 0.7 0.3
Tabla 3: Marginal de 𝑦
Ejemplo 4: En concordancia con los datos del ejemplo 2 y a partir de su función
masa o de densidad de probabilidad se tiene que la marginal de 𝑿 vendría dada
por:
1
𝑥𝑦 1 𝑥 1 1 1 𝑥 1
𝑓1 (𝑥) = ∫ ( + ) 𝑑𝑦 = ∫ 𝑦𝑑𝑦 + ∫ 𝑑𝑦 = 𝑦 2 |1−1 + 𝑦|1−1
−1 4 2 4 −1 2 −1 8 2
𝑥 2 1 𝑥 1
= (1 − (−1)2 ) + (1 − (−1)) = ∙ (0) + ∙ (2) = 1
8 2 8 2
Para valores de 𝑿 dentro de su campo de definición. Análogamente para la

marginal de 𝒀 tenemos que:
𝑓2 (𝑦)
1
𝑥𝑦 1
=∫ ( + ) 𝑑𝑥
0 4 2
𝑦 1 1 1 𝑦 1 𝑦 1 𝑦 1 𝑦 4
= ∫ 𝑥𝑑𝑥 + ∫ 𝑑𝑥 = 𝑥 2 |10 + 𝑥|10 = (1 − 0) + (1 − 0) = + = +
4 0 2 0 8 2 8 2 8 2 8 8
𝑦+4
=
8
Para valores de 𝒀 dentro de su campo de definición.

5 Resumen
• La asignación de los valores numéricos a los sucesos de un experimento
aleatorios determina la base sobre la cual se define una variable aleatoria.
• Decimos que una 𝑣. 𝑎. es discreta cuando toma un valor particular y este
resulta ser un valor entero.
• Decimos que una variable aleatoria es continua cuando toma todos los
valores dentro de un intervalo (a, b) ⊆ ℝ.
• La función de probabilidad de la variable 𝑋 denotada por 𝑓(𝑥) ∶ 𝑅 → [0, ∞)
se define como sigue
𝑓(𝑥) = { 𝑃(𝑋 = 𝑥) 𝑠𝑖, 𝑥 = 𝑥1 , 𝑥2 , …

0 𝑐. 𝑜. 𝑐
• Decimos que la función integrable y no negativa 𝑓(𝑥) ∶ ℝ → [0, ∞), es la

función de densidad de 𝑋 si para cualquier intervalo (𝑎, 𝑏) de ℝ se cumple
la igualdad
𝑏
𝑃(𝑋 ∈ (𝑎, 𝑏)) = ∫ 𝑓(𝑥) 𝑑𝑥
𝑎
• Rincón, L. (2010). Curso elemental de Probabilidad y Estadística. México:
Circuito Exterior de CU.

—

Índice
1 Independencia ...................................................................................................................... 3
1.1 Independencia de un par de Variables Aleatorias............................... 3
2 Estadísticos de Asociación ............................................................................................... 3
2.1 Covarianza......................................................................................................... 3
2.2 Coeficiente de Correlación .......................................................................... 5
3 Resumen .................................................................................................................................6

Objetivos
• Objetivo 1: Conocer el concepto de independencia de dos variables
aleatorias.
• Objetivo 2: Estudiar dos de las estadísticas más importantes para el estudio
de variables aleatorias de tipo bidimensional.
1 Independencia
Dado que el interés se centra en el estudio de la relación existente entre dos
variables aleatorias, se hace pertinente el definir el concepto de
independencia de dos variables aleatorias con las herramientas teóricas vistas
hasta aquí.
1.1 Independencia de un par de Variables Aleatorias
Se puede afirmar que en un par de variables aleatorias dado (𝐗, 𝐘), las variables
“Se puede afirmar que en un par de aleatorias 𝐗 e 𝐘 son independientes si cumple que:
variables aleatorias dado (X, Y), las variables
f(x, y) = f(x)f(y).
aleatorias X e Y son independientes si:
f(x, y) = f(x)f(y) ” Independencia heredada estrictamente de la independencia de los eventos que

dan lugar a los valores que toma la variable en su función ya sea de densidad o de
distribución.
Ejemplo 5: Para determinar la independencia del par de variables aleatorias dado
(𝐗, 𝐘) en el ejemplo 2, basta con verificar lo siguiente:
xy + 2 y+4
f(x, y) = ≠ f1 (x)f2 (y) = 1 ∙
4 8
Con lo que se concluye que X y Y no son independientes.
2 Estadísticos de Asociación
Ahora veamos dos de las estadísticas más importantes en el estudio de variables
aleatorias de tipo bidimensional, una interpretación y sentido al número que
arrojan como resultado.
2.1 Covarianza
La covarianza para el par de variables aleatorias dado (𝐗, 𝐘), denotada por
𝐂𝐨𝐯(𝐗, 𝐘), es el número:
Cov(X, Y) = E[(X − E(X))(Y − E(Y))].

Siendo las esperanzas 𝐄(𝐗), 𝐄(𝐘) y 𝐄(𝐗𝐘) finitas, es decir, que existan para las
“La covarianza es útil para detectar si variables aleatorias 𝐗 e 𝐘.
existe relación de tipo lineal entre las La covarianza es útil para detectar si existe relación de tipo lineal entre las
variables y su sentido” variables y su sentido, pero presenta inconvenientes en el escenario donde no
exista algún tipo de relación entre las variables en mención, además de que se
deja influenciar por el efecto de las medidas en que son tomadas las variables y
también por el tamaño de muestra que es tomado por cada una de las variables.
Como consecuencia inmediata de la definición se listan a continuación las
“Propiedades de la covarianza”
propiedades de esta importante estadística.
• Cov(X, Y) = E(XY) − E(X)E(Y).
• Cov(X, Y) = Cov(Y, X).
• Cov(X, X) = Var(X).
• Cov(c, Y) = 0.
• Cov(cX, Y) = cCov(X, Y).
• Cov(X1 + X2 , Y) = Cov(X1 , Y) + Cov(X2 , Y).
• Si X e Y son independientes Cov(X, Y) = 0.
En general, Cov(X, Y) = 0 no implica Independencia entre X y Y.
Ejemplo 6: Para determinar la covarianza del par de variables aleatorias dado
(𝐗, 𝐘) en el ejemplo 2, se emplea el siguiente procedimiento:
• Se calculan los momentos de primer orden con respecto al origen, es decir, los
valores esperados para cada variable:
1 1 1 x2y
E(X) = ∫ ∫ ( + x) dy dx
2 0 −1 2
1 1 x2 1 1
= ∫ [ ∫ ydy + x ∫ dy] dx
2 0 2 −1 −1
1 1 x2
= ∫ [ y 2 |1−1 + xy|1−1 ] dx
2 0 4
1 1 x2
= ∫ [ (12 − (−1)2 ) + x(1 − (−1))] dx
2 0 4
1 1 x2 1 1 1
1 1 1
= ∫ [ ∙ (0) + x ∙ (2)] dx = ∫ 2x dx = ∫ xdx = x 2 |10 = (12 − 02 ) =
2 0 4 2 0 0 2 2 2

E(Y)
1 1 1 xy 2
= ∫ ∫ ( + y) dy dx
2 0 −1 2
1 1 x 1 1
= ∫ [ ∫ y 2 dy + ∫ ydy] dx
2 0 2 −1 −1
1 1 x 1
= ∫ [ y 3 |1−1 + y 2 |1−1 ] dx
2 0 6 2
1 1 x 1
= ∫ [ (13 − (−1)3 ) + (12 − (−1)2 )] dx
2 0 6 2
1 1 x 1 1 1 x 1 1 1 x2 1 1 2 1
= ∫ [ ∙ (2) + ∙ (0)] dx = ∫ [ ] dx = ∫ xdx = |0 = (1 − 02 ) =
2 0 6 2 2 0 3 6 0 62 12 12
• De manera similar se calculan los momentos de segundo orden, que vienen

dados por:
1 1
E(X 2 ) = E(Y 2 ) =
3 3
• Por último se calcula el producto cruzado de las variables aleatorias del par:
E(XY)
1 1 1 x2y2 1 1 x2 1 1
= ∫ ∫ ( + xy) dy dx = ∫ [ ∫ y 2 dy + x ∫ ydy] dx
2 0 −1 2 2 0 2 −1 −1
1 1 x2 x 1 1 x2 x
= ∫ [ y 3 |1−1 + y 2 |1−1 ] dx = ∫ [ (13 − (−1)3 ) + (12 − (−1)2 )] dx
2 0 6 2 2 0 2 2
1 1 x2 x 1 1 1 x3 1 1 3 1
= ∫ [ ∙ (2) + ∙ (0)] dx = ∫ x 2 dx = |0 = (1 − 03 ) =
2 0 2 2 2 0 63 18 18
• Así, aplicando una de las propiedades de la covarianza se tiene que

1 1 1 1
Cov = E(XY) − E(X)E(Y) = −( ∙ )=
18 2 12 72
2.2 Coeficiente de Correlación
El coeficiente de correlación entre el par de variables aleatorias dado (X, Y),

denotado por ρ(X, Y), es el número:

𝐶𝑜𝑣(𝑋, 𝑌)
𝜌(𝑋, 𝑌) =
√𝑉𝑎𝑟(𝑋)𝑉𝑎𝑟(𝑌)
El coeficiente de correlación al ser una medida de asociación en el mismo

“El coeficiente de correlación se encarga sentido que la covarianza se encarga de medir el grado de dependencia lineal
de medir el grado de dependencia lineal entre el par de variables aleatorias dado (𝑿, 𝒀), pero al tratarse su fórmula de una
entre el par de variables aleatorias”
estandarización corrige las falencias de la covarianza en términos de unidades de
variables y tamaño de muestra.
Además es preciso notar que cuando 𝝆(𝑿, 𝒀) = 𝟎 se dice que el par de variables
aleatorias dado (𝑿, 𝒀), están incorrelacionados, cuando |𝝆(𝑿, 𝒀)| = 𝟏 se dice que
el par de variables aleatorias dado (𝑿, 𝒀), están perfectamente correlacionados
positiva o negativamente según el sentido de la relación.
Como consecuencia inmediata de la definición se listan a continuación las
“Propiedades del coeficiente de propiedades de esta importante estadística:
correlación” • 𝜌(𝑋, 𝑌) es un número que está entre [−1,1]
• |𝜌(𝑋, 𝑌)| = 1 si y sólo si, 𝑌 = 𝑎𝑋 + 𝑏, con probabilidad uno.
• Si 𝑋 y 𝑌 son independientes, entonces 𝜌(𝑋, 𝑌) = 0.
• En general, 𝜌(𝑋, 𝑌) = 0. No implica que 𝑋 y 𝑌 son independientes.
• (𝑋, 𝑌) se distribuyen normal, 𝜌(𝑋, 𝑌) = 0. Implica que 𝑋 y 𝑌 son
independientes
Ejemplo 7: Finalmente para determinar el coeficiente de correlación del par de
variables aleatorias dado (𝑿, 𝒀) en el ejemplo 2, se tiene que:
1⁄
𝜌(𝑋, 𝑌) = 72 = 0.0842
√1⁄12 √47⁄144
3 Resumen
• Se puede afirmar que en un par de variables aleatorias dado (𝐗, 𝐘), las
variables aleatorias 𝐗 y 𝐘 son independientes si cumple que 𝐟(𝐱, 𝐲) =
𝐟(𝐱)𝐟(𝐲).
• La covarianza para el par de variables aleatorias dado (𝐗, 𝐘), denotada por
𝐂𝐨𝐯(𝐗, 𝐘), es el número:
Cov(X, Y) = E[(X − E(X))(Y − E(Y))].
• El coeficiente de correlación entre el par de variables aleatorias dado (𝑿, 𝒀),

denotado por 𝝆(𝑿, 𝒀), es el número:

𝐶𝑜𝑣(𝑋, 𝑌)
𝜌(𝑋, 𝑌) =
√𝑉𝑎𝑟(𝑋)𝑉𝑎𝑟(𝑌)
• Rincón, L. (2010). Curso elemental de Probabilidad y Estadística. México:
Circuito Exterior de CU.

•

Índice
1 Intervalos de Confianza y Tamaño de Muestra ........................................................... 3

1.1 Intervalos de Confianza ................................................................................ 3
1.2 Tamaño de Muestra ........................................................................................ 3
2 Muestreo Estratificado ....................................................................................................... 5
2.1 Conceptos Básicos ......................................................................................... 5
3 Muestreo Aleatorio Simple Estratificado ......................................................................6
3.1 Estimaciones para el Total de Y .................................................................6
3.2 Estimaciones para el Promedio de Y ........................................................6
4 Resumen .................................................................................................................................6

Objetivos
• Objetivo 1: Entender los conceptos de intervalos de confianza y tamaño de
muestra.
• Objetivo 2: Conocer el muestreo estratificado y el muestreo aleatorio simple
estratificado.
1 Intervalos de Confianza y Tamaño de Muestra
1.1 Intervalos de Confianza
Bajo el muestreo aleatorio simple sin reemplazo, un intervalo de confianza para

“Fórmulas para el intervalo de confianza la media viene dado por:
y el tamaño de la muestra” 𝑛 𝑆𝑦𝑈 𝑛 𝑆𝑦𝑈
[𝑦̅𝑆 − 𝑧1−𝛼 √(1 − ) , 𝑦̅𝑆 + 𝑧1−𝛼 √(1 − ) ]
2 𝑁 √𝑛 2 𝑁 √𝑛
Con lo que se debe estimar a 𝑺𝒚𝑼 por medio de 𝑺𝒚𝑺 dado que lo normal es que no
se conozca.
1.2 Tamaño de Muestra
La fórmula general para el cálculo del tamaño de muestra viene dada por
n0
n≥ n
1 − N0
z1−α/2 S2
Donde n0 = c2 , c es la precisión deseada y z1−α/2 es el valor tabulado de la
distribución normal para el nivel de confianza requerido.
En ciertos casos donde la precisión requerida es de carácter relativo, es decir,
dada en porcentajes se tiene que para proporciones el tamaño de muestra se
calcula según:
k0
n≥
k
1 − N0
z1−α/2 PQ
Donde k 0 = , c es la precisión deseada, P es la proporción, Q su
c2
complemento y z1−α/2 es el valor tabulado de la distribución normal para el nivel
de confianza requerido.
Ejemplo 7:
Para efectos de la planeación socio-económica en una gran ciudad del país, es
necesario estimar entre 2.200 hatos, el número de ganado lechero por hato, con
una precisión del 8% y nivel de confianza del 95.5%.

De una muestra piloto de tamaño n = 40 se obtuvieron los siguientes resultados,
promedio de ganado por hato, 46; desviación estándar, 40. El interés se centra en
obtener el tamaño de muestra mínimo para la precisión dada.
Así tenemos que:
2
c = 0.08(46) = 3.68; SyS = 1600; α = 95.5%; z1−α = 2; SyS = 40;
2
N = 2.200; n = 40
Entonces:
22 ∙ (1.600) 2
k 0 = [( ) − (1 + )] = 496.22
3.682 40
Por tanto:
496.22
n= ≅ 405
496.22
1+
2.200
Ejemplo 8:
Una empresa dedicada al transporte permite que ciertos gastos de sus afiliados
se hagan mediante la utilización de la tarjeta de crédito expedida para pagos en
las bombas de gasolina locales.
La empresa ha expedido 10.050 tarjetas de créditos. Con el objetivo de realizar
una investigación sobre la utilización de la tarjeta y otras características, se toma
una muestra piloto de 90 tarjetas y se encontró que 63 de ellas fueron utilizadas
para cargar servicios durante el mes de referencia.
Por otra parte, el total de los gastos cancelados con las tarjetas es fue de
2.390.000 y la desviación estándar de 4000, se desea estimar el tamaño de la
muestra, con un error de 2% y un nivel de confianza de 95% para estimar
proporción de afiliados que utilizan la tarjeta.
Entonces de los datos dados en el enunciado tenemos que:
63
P= = 0.7; Q = 0.3; z1−α/2 ; c = 0.02
90
1.962 (0.7)(0.3) 2
n0 = [( 2
) (1 + )] = 2.061,21
0.02 90
2.061,21
n= ≅ 1.711
2.061,2
1+
10.050
Luego se necesitan n = 1.711 tarjetas o afiliados.

2 Muestreo Estratificado
Por razones de la naturaleza de la población, la característica de interés tiende a
tomar valores promedios en distintos subgrupos poblacionales. Esto junto con un
interés particular de investigador, de obtener estimaciones por grupos disyuntos
de la población, además de las razones de costo y comodidad en la recolección,
hacen necesaria la división de la población en subconjuntos llamados estratos
que permitan obtener valores homogéneos y de interés inherentes a la
característica del muestreo aleatorio simple sin reemplazo, caso de nuestro
interés.
2.1 Conceptos Básicos
Se divide la población o universo 𝑼 en 𝑯 subgrupos poblacionales llamados

estratos, así se tienen 𝑼𝒉 estratos separados con 𝒉 = 𝟏, 𝟐, … , 𝑯, son tales que:
• La unión de los estratos es 𝑼, es decir ∪𝑯
𝒉=𝟏 𝑼𝒉 = 𝑼
• La intersección de los estratos es vacía 𝑼𝒉 ∩ 𝑼𝒊 = ∅, 𝒉≠𝒊

Los tamaños de los estratos vienen dados por 𝑵𝑯 así:
𝐻
∑ 𝑁ℎ = 𝑁
ℎ=1
Hecha la división de los estratos nuestro interés se centrara en estimar:

• El total poblacional
𝐻 𝐻
𝑡𝑦 = ∑ 𝑦𝑘 = ∑ ∑ 𝑦𝑘 = ∑ 𝑡𝑦ℎ
𝑘∈𝑈 ℎ=1 𝑘∈𝑈ℎ ℎ=1
Donde 𝑡𝑦ℎ = ∑𝑘∈𝑈ℎ 𝑦𝑘

• La media poblacional
𝐻 𝐻
∑𝑘∈𝑈ℎ 𝑦𝑘 1 1
𝑦̅ = = ∑ ∑ 𝑦𝑘 = ∑ 𝑁ℎ 𝑦̅ℎ
𝑁 𝑁 𝑁
ℎ= 𝑘∈𝑈ℎ ℎ=1
1
Donde 𝑦̅ℎ = 𝑁 ∑𝑘∈𝑈ℎ 𝑦𝑘
ℎ

3 Muestreo Aleatorio Simple Estratificado
3.1 Estimaciones para el Total de Y
Para un diseño de muestreo aleatorio estratificado las expresiones para la

estimación del total y su varianza vienen dadas por:
𝐻 𝐻
𝑁ℎ
𝑡̂𝑦 = ∑ 𝑡̂𝑦ℎ = ∑ ∑ 𝑦𝑘
𝑛ℎ
ℎ=1 ℎ=1 𝑘∈𝑆ℎ
𝐻
𝑁ℎ2 𝑛ℎ 2
𝑉𝑎𝑟(𝑡̂𝑦 ) = ∑ (1 − ) 𝑆𝑦𝑈
𝑛ℎ 𝑁ℎ ℎ
ℎ=1
𝐻
𝑁ℎ2 𝑛ℎ 2
̂ (𝑡̂𝑦 ) = ∑
𝑉𝑎𝑟 (1 − ) 𝑆𝑦𝑆
𝑛ℎ 𝑁ℎ ℎ
ℎ=1
3.2 Estimaciones para el Promedio de Y
Para un diseño de muestreo aleatorio estratificado, las expresiones para la

estimación del promedio de 𝒚 y su varianza vienen dadas por:
1
𝑦̂̅𝑈ℎ = = ∑ 𝑦𝑘
𝑛ℎ
𝑘∈𝑆ℎ
1 𝑛ℎ 2
𝑉𝑎𝑟(𝑦̂̅𝑈ℎ ) = (1 − ) 𝑆𝑦𝑈ℎ
𝑛ℎ 𝑁ℎ
1 𝑛ℎ 2
̂ (𝑦̅̂𝑈ℎ ) =
𝑉𝑎𝑟 (1 − ) 𝑆𝑦𝑆ℎ
𝑛ℎ 𝑁ℎ
4 Resumen
• Bajo el muestreo aleatorio simple sin reemplazo, un intervalo de confianza
para la media viene dado por:
𝑛 𝑆𝑦𝑈 𝑛 𝑆𝑦𝑈
[𝑦̅𝑆 − 𝑧1−𝛼 √(1 − ) , 𝑦̅𝑆 + 𝑧1−𝛼 √(1 − ) ]
2 𝑁 √𝑛 2 𝑁 √𝑛
Con lo que se debe estimar a 𝑺𝒚𝑼 por medio de 𝑺𝒚𝑺 dado que lo normal es
que no se conozca.
• La fórmula general para el cálculo del tamaño de muestra viene dada por

n0
n≥ n
1− 0
N
z1−α/2 S2
Donde n0 = c2 , c es la precisión deseada y z1−α/2 es el valor tabulado de
la distribución normal para el nivel de confianza requerido.
• Por razones de la naturaleza de la población, la característica de interés
tiende a tomar valores promedios en distintos subgrupos poblacionales.
Esto hace necesaria la división de la población en subconjuntos llamados
estratos que permitan obtener valores homogéneos y de interés inherente a
la característica del muestreo aleatorio simple sin reemplazo.

•

Índice
1 Introducción .......................................................................................................................... 3
2.1 Características y Parámetros de Interés ................................................. 3
2.2 Muestra Aleatoria ......................................................................................... 5
2.3 Muestras Probabilísticas .............................................................................. 5
2.4 Diseño Muestral............................................................................................... 5
2.5 Mecanismo de Selección.............................................................................6
2.6 Probabilidades de Inclusión ........................................................................6
2.7 Estadística y Estimador ................................................................................. 7
3 Muestreo Aleatoria Simple Sin Reemplazo (MAS) ..................................................... 7
3.1 Estadística y Estimador .................................................................................8
3.2 Mecanismo de Selección ..............................................................................8
3.3 Estimación para el Total de Y y su Varianza en el MAS .................... 10
3.4 Estimación para el Promedio de Y y su varianza en el MAS ............ 12
4 Resumen ............................................................................................................................... 12

Objetivos
• Objetivo 1: Conocer la base de la teoría de la inferencia estadística, el
estudio de recolección de muestras y la estimación de parámetros por el
muestreo.
• Objetivo 2: Estudiar las muestras aleatorias simples.
1 Introducción
En esta unidad centraremos nuestro interés en la base de la teoría de la
inferencia estadística, el estudio de recolección de muestras y estimación de
parámetros por el muestreo. Es preciso mencionar que solo se hará un breve
repaso de una extensa y cuidadosa teoría, debido a la complejidad y pertinencia
de algunos de sus conceptos. Siendo el caso de las muestras aleatorias simples
el eje sobre el cual desarrollaremos los contenidos temáticos, en busca de su
utilidad final, la estimación de parámetros poblacionales.
Conocida una población o universo de nuestro interés, el cual está conformado
por 𝑁 elementos y que notaremos como 𝑈 etiquetado como sigue 𝑈 = {1,2, … , 𝑁},
se define entonces una característica de interés 𝑦 la cual tiene como naturaleza
ser una observación medida directamente en 𝑈 y no una realización de una 𝑣. 𝑎
como en unidades anteriores, tomará entonces 𝑦 el valor 𝑦𝑘 en el 𝑘-ésimo
elemento.
El objetivo de hacer muestreo será el de estimar una característica de interés
“El objetivo del muestreo es estimar una determinada en un parámetro poblacional a partir de la observación de un
característica de interés determinada en
subconjunto con ciertas características de los elementos del universo. A
continuación mostraremos los parámetros más comúnmente conocidos y de
un parámetro poblacional”
mayor interés.
2.1 Características y Parámetros de Interés
• El total poblacional: Determina el valor total de una característica de

interés en una población, se denota por 𝒕𝒚 y se define como sigue:
𝑁
𝑡𝑦 = ∑ 𝑦𝑘
𝑘=1
• El promedio poblacional: Determina el valor promedio de una de una

̅𝑼 y se define
característica de interés en una población, se denota por 𝒚
como sigue:

𝑁
1 𝑡𝑦
𝑦̅𝑈 = ∑ 𝑦𝑘 =
𝑁 𝑁
𝑘=1
• La varianza poblacional: Determina la dispersión de los valores

observados de la característica de interés con respecto a su valor medio,
determinando la variabilidad existente en la población, se denota por 𝑺𝟐𝒚𝑼 y
se define como sigue:
2
∑𝑁 ̅𝑈 )2
𝑘=1(𝑦𝑘 − 𝑦
𝑆𝑦𝑈 =
𝑁−1
Ejemplo 1: Suponga que se tiene una población 𝑼 tal que está etiquetada
de la siguiente manera 𝑼 = {𝟏, 𝟐, 𝟑, 𝟒, 𝟓} y se quiere estimar una variable de
interés 𝒚 para cada elemento en el universo entonces:
U yk
1 35
2 36
3 40
4 23
5 37

• Para el total tenemos que:
𝑁
𝑡𝑦 = ∑ 𝑦𝑘 = 35 + 36 + 40 + 23 + 37 = 171
𝑘=1
• Para el promedio tenemos que:

𝑁
1 𝑡𝑦 171
𝑦̅𝑈 = ∑ 𝑦𝑘 = = = 34.2
𝑁 𝑁 5
𝑘=1
• Para la varianza tenemos que:
2
∑𝑁 ̅𝑈 )2 [(35 − 34.2)2 + ⋯ + (37 − 34.2)2 ]
𝑘=1(𝑦𝑘 − 𝑦
𝑆𝑦𝑈 = = = 34.16
𝑁−1 4

2.2 Muestra Aleatoria
Es un subconjunto del universo que se extrae mediante un modelo estadístico

“El número de elementos en el modelo de selección, se denotara por 𝑺 y llamaremos 𝒔 a una instancia o realización de
estadístico de selección es llamado ella y queda definida de la siguiente forma:
tamaño de la muestra” 𝑠 = {1, … , 𝑘, … , 𝑛(𝑠)}
El número de elementos en 𝒔 es llamado tamaño de muestra y existen casos

particulares donde no es fijado de antemano, en consecuencia se hace variable.
• Muestra aleatoria sin reemplazo
“Sin reemplazo: si la selección de los
Se dice que una muestra aleatoria es sin reemplazo si la selección de los
elementos que han sido seleccionados
elementos que han sido seleccionados no vuelven a ser parte de la población.
no vuelven a ser parte de la población”
• Muestra aleatoria con reemplazo
Se dice que una muestra aleatoria es con reemplazo si la selección de los
“Con reemplazo: si la selección de los
elementos que han sido seleccionados vuelven a ser parte de la población, es
decir, un elemento puede ser seleccionado más de una vez.
elementos que han sido seleccionados
vuelven a ser parte de la población”

2.3 Muestras Probabilísticas
No toda muestra aleatoria es de tipo probabilística, dando lugar a distintos

tipos de muestreo que dada su metodología de recolección o desconocimiento de
los modelos probabilísticos que garanticen su validez se convierten en
mecanismos sin ninguna significancia a la hora de hacer estimaciones. A
continuación se mencionan los requerimientos que hacen a una muestra aleatoria
una muestra probabilística.
Una muestra es probabilística cuando:
• Se puede definir el conjunto de todas las posibles muestras derivadas del
proceso de selección.
• Es posible conocer de antemano la probabilidad de selección de todas y
cada una de las posibles muestras anteriormente mencionadas.
• El proceso de selección garantiza la existencia de una probabilidad mayor a
cero para cada uno de los elementos del universo.
• El mecanismo aleatorio de selección que se utilice garantiza la igualdad de
probabilidades de selección para cada muestra en el conjunto de todas las
posibles muestras.
2.4 Diseño Muestral
Los componentes básicos de un estudio de muestreo son en primera instancia

“Los componentes básicos de un estudio las probabilidades de selección asignadas a todas y cada una de las muestras
de muestreo son las probabilidades de posibles en el universo y en segunda instancia el procedimiento con el cual se
selección y el procedimiento con el cual
se miden los datos”

miden los datos una vez observados. Así el primer componente se refiere a un
diseño de muestreo y el segundo a un estimador concepto que veremos con más
detalle a lo largo de este curso.
• Diseño de muestreo
Desde un punto de vista teórico estricto, un diseño de muestreo es una función
𝒑(𝒔), que a cada muestra posible le asigna una probabilidad de selección.
• Diseño de muestreo sin reemplazo
Un diseño de muestreo se dice sin reemplazo, si todas las muestras en el
conjunto de todas las posibles muestras son sin reemplazo.
• Diseño de muestreo con reemplazo
Un diseño de muestreo se dice con reemplazo, si todas las muestras en el
conjunto de todas las posibles muestras son con reemplazo.
• Diseños de muestreo con tamaño de muestra fijo
Un diseño de muestreo se dice de tamaño de muestra fijo, si todas las muestras
en el conjunto de todas las posibles muestras tienen el mismo tamaño de
muestra.
2.5 Mecanismo de Selección
Son procedimientos secuenciales ordenados que se utilizan para seleccionar

“Un mecanismo de selección es un muestras probabilísticas.
procedimiento secuencial ordenado
que se utiliza para seleccionar muestras 2.6 Probabilidades de Inclusión

probabilísticas”
Las probabilidades de inclusión de primer orden llamadas 𝝅𝒌 para el elemento
𝒌 se definen como la suma de las probabilidades de selección que contienen al
elemento 𝒌 en particular y de manera análoga se definen las probabilidades de
inclusión de segundo orden para los elementos 𝒌 y 𝒍 en muestras que los
contienen simultáneamente.
Ejemplo 2: Suponga que se tiene un diseño de muestreo genérico 𝒑(∙) tal que a
la población 𝑼 mostrada en el ejemplo 1 asigna probabilidades de selección a
muestras de tamaño 2 como sigue: (Nota: Cuando a un diseño de muestreo se le
cita de forma genérica la notación utilizada es 𝒑(∙), es decir, el (∙) indica un
diseño de muestreo cualquiera aplicado a una muestra 𝒔 en particular):
Muestra de tamaño 2 𝒑(𝒔)
1-2 0.13
1-3 0.20

1-4 0.15
1-5 0.10
2-3 0.15
2-4 0.04
2-5 0.02
3-4 0.06
3-5 0.07
4-5 0.08

Nuestro interés es el de obtener la probabilidad de que el elemento 𝐤 = 𝟏 sea
“Estadística: función que varía en incluido en la muestra, es decir, 𝛑𝟏 entonces será igual a la suma de las
consecuencia de los resultados de un probabilidades de selección de las muestras que contienen a elemento 𝐤 = 𝟏.
experimento aleatorio” 𝜋1 = 0.13 + 0.20 + 0.15 + 0.10 = 0.58
2.7 Estadística y Estimador
Se llama estadística a una función que varía en consecuencia de los resultados

“Estimador: una estadística que se de un experimento aleatorio. Cuando es utilizada para estimar a un parámetro
utiliza para estimar un parámetro” recibe el nombre de estimador y los valores que toman se les llama por
estimaciones.
3 Muestreo Aleatoria Simple Sin Reemplazo (MAS)

En este apartado veremos la forma más simple de hacer muestreo, el muestreo
aleatorio simple tiene como característica el suponer que el comportamiento de
la característica de interés es similar en todos los individuos de la población, es
decir, supone homogeneidad en la población.
Debido a esto el diseño asigna probabilidades de inclusión idénticas a todos y
cada uno de los elementos de la población haciendo de esta su característica
principal.

3.1 Estadística y Estimador
Se dice un muestreo aleatorio simple sin reemplazo a aquel diseño cuyas

posibles muestras de tamaño 𝒏 fijado de antemano tienen la misma probabilidad
de ser seleccionadas. Así:
1
𝑠𝑖 # 𝑠 = 𝑛
𝑝(𝑠) = {(𝑁)
𝑛
0 𝑐 𝑐.
3.2 Mecanismo de Selección
Con el avanzado estado de las máquinas computadoras el proceso de extracción

de una muestra se hizo algo determinante a la hora de un estudio por muestreo,
agilizando cálculos y garantizando los resultados, los mecanismos de selección se
convirtieron en parte inherente del plan de muestreo.
A continuación mostramos dos de las más conocidos y utilizados en a la hora de
extraer una muestra aleatoria simple.
• Método del coordinado negativo
El método se resume en los siguientes pasos
- Genere 𝑵 números aleatorios 𝝃𝒌 de una 𝒗. 𝒂 distribuida Uniforme
(𝟎, 𝟏).
- Asignar cada 𝝃𝒌 a cada elemento de la población.
- Ordenar ascendente o descendentemente con respecto a cada 𝝃𝒌.
- A continuación seleccione los 𝒏 primero o últimos según el
ordenamiento del paso anterior y esta selección se convierte en su
muestra.
Ejemplo 3: Para la población 𝑼 que estamos siguiendo en los ejemplos
anteriores, seleccionemos una muestra de tamaño 2 con el método del
coordinado negativo.
- Se generan 5 números aleatorios 𝝃𝒌 debido a que en nuestro universo
𝑵 = 𝟓.
𝜉1 = 0.28691106, 𝜉2 = 0.97110167, 𝜉3 = 0.86655545,
𝜉4 = 0.71795016, 𝜉5 = 0.95200564
- Se asigna 𝜉𝑘 a cada elemento de la población.
𝑈 𝜉𝑘
1 0.28691106

2 0.97110167
3 0.86655545
4 0.71795016
5 0.95200564
Tabla 3: Ejemplo 3 (a)

- Se ordenan los 𝑘 elementos de 𝑈 en este caso descendentemente
con respecto a 𝜉𝑘 .
𝑈 𝜉𝑘
1 0.28691106
4 0.71795016
3 0.86655545
5 0.95200564
2 0.97110167
Tabla 4: Tabla ejemplo 3 (b)

- Así nuestra muestra de tamaño 2 está conformada como sigue:
𝑠1 = {1,4}
• Método de selección y rechazo

El método se resume en los siguientes pasos:
- Realizar 𝝃𝒌 distribuido uniforme (𝟎, 𝟏)
- Calcular:
𝑛 − 𝑛𝑘
𝑐𝑘 =
𝑁−𝑘+1
Donde 𝒏𝒌 es la cantidad de objetos seleccionados en los 𝒌 − 𝟏 ensayos

anteriores.
- Si 𝝃𝒌 < 𝒄𝒌 , entonces el elemento 𝒌 pertenece a la muestra.
- Detener el proceso cuando 𝒏 = 𝒏𝒌

Ejemplo 4: Se dese extraer una muestra de tamaño 𝒏 = 𝟒 de una población 𝑼
cualquiera de 𝑵 = 𝟏𝟎 , con el mecanismo de selección y rechazo, el proceso se
muestra como sigue en la siguiente tabla:
k Numerador Denominador 𝐶𝑘 𝜉𝑘 Decisión
1 4 10 0,4 0,70554751 0
2 4 9 0,44444444 0,53342402 0
3 4 8 0,5 0,57951862 0
4 4 7 0,57142857 0,28956246 1
5 3 6 0,5 0,30194801 1
6 2 5 0,4 0,7747401 0
7 2 4 0,5 0,01401764 1
8 1 3 0,33333333 0,76072359 0
9 1 2 0,5 0,81449002 0
10 1 1 1 0,7090379 1

Luego la muestra aleatoria está conformada por los elementos:
𝑠1 = {4,5,7,10}
Nótese que como se dio en este ejemplo el método garantiza que los 𝒏 elementos
siempre sean seleccionados, es decir, el método siempre converge.
3.3 Estimación para el Total de Y y su Varianza en el MAS
Las expresiones para la estimación del total y su varianza en el muestreo

aleatorio simple vienen dadas por:
𝑁
𝑡̂𝑦 = ∑ 𝑦𝑘
𝑛
𝑠
𝑁2 𝑛 2
𝑉𝑎𝑟(𝑡̂𝑦 ) = (1 − ) 𝑆𝑦𝑈
𝑛 𝑁
𝑁2 𝑛 2
̂ (𝑡̂𝑦 ) =
𝑉𝑎𝑟 (1 − ) 𝑆𝑦𝑆
𝑛 𝑁

Con 𝑺𝟐𝒚𝑺 y 𝑺𝟐𝒚𝑼 las varianzas muestral y poblacional respectivamente.
Ejemplo 5: Supongamos que para la muestra extraída en el ejemplo 4 tomamos
las mediciones de una variable 𝒚 continua con los valores como sigue:
𝒌 𝒚𝒌
4 19
5 56
7 70
10 60

Entonces nuestro interés será el de estimar el total y con su respectiva varianza
estimada.
• El total vendría dado por:
𝑁 10
𝑡̂𝑦 = ∑ 𝑦𝑘 = ∙ (19 + 56 + 70 + 60) = 512.5
𝑛 4
𝑠
• Para estimar la varianza del estimador tenemos que como se muestra en

ecuación, esta depende de la varianza muestral que se calcula como sigue:
2
∑𝑘∈𝑆(𝑦𝑘 − 𝑦̅𝑠 )2
𝑆𝑦𝑆 = = 496.92
𝑛−1
Con lo que:
𝑁2 𝑛 2 102 4
̂ (𝑡̂𝑦 ) =
𝑉𝑎𝑟 (1 − ) 𝑆𝑦𝑆 = (1 − ) ∙ (496.92) = 7453.75
𝑛 𝑁 4 10
• Es necesario brindar una medida del error para determinar la calidad de las
estimaciones, para ello se utiliza el coeficiente de variación estimado 𝒄𝒗𝒆
como sigue:
̂ (𝑡̂𝑦 )
√𝑉𝑎𝑟
√7453.75
𝑐𝑣𝑒 = × 100% = × 100% ≅ 17%
𝑡̂𝑦 512.5
Lo que puede considerarse como una pobre estimación debido a que 𝒄𝒗𝒆 > 𝟓%
se consideran estimaciones de baja calidad, esto puede ser al poco número de
elementos de la población con tamaño de muestra pequeño.

3.4 Estimación para el Promedio de Y y su varianza en el MAS
Las expresiones para la estimación del promedio y su varianza en el muestreo

aleatorio simple vienen dadas por:
𝑡̂𝑦 ∑𝑆 𝑦𝑘
𝑦̂̅ = = = 𝑦̅𝑆
𝑁 𝑛
1 1 𝑛 2
𝑉𝑎𝑟(𝑦̂̅) = 2
𝑉𝑎𝑟(𝑡̂𝑦 ) = (1 − ) 𝑆𝑦𝑈
𝑁 𝑛 𝑁
1 1 𝑛 2
̂ (𝑦̅̂) =
𝑉𝑎𝑟 ̂ (𝑡̂𝑦 ) = (1 − ) 𝑆𝑦𝑆
𝑉𝑎𝑟
𝑁 2 𝑛 𝑁
Ejemplo 6: Considerando los datos del ejemplo anterior, damos estimaciones

para la media y la varianza estimada de la variable de interés 𝒚.
𝑡̂𝑦 512.5
𝑦̂̅ = = = 𝑦̅𝑆 = 51.25
𝑁 4
Con lo que queda demostrado que el estimador (MAS) 𝒚 ̅𝑺 es el soporte de toda la

inferencia estadística vista desde un punto clásico.
Para la estimación de la varianza tenemos que:
1 1 𝑛 2 1 1 4
̂
𝑉𝑎𝑟(𝑦̅̂) = ̂ (𝑡̂𝑦 ) = (1 − ) 𝑆𝑦𝑆
𝑉𝑎𝑟 = 2 ∙ (7453.75) = (1 − ) (496.92)
𝑁 2 𝑛 𝑁 10 4 10
= 74.5375
Con igual medida de calidad para el caso del total, debido a que se trata de los
mismos valores.
4 Resumen
• El objetivo de hacer muestreo será el de estimar una característica de
interés determinada en un parámetro poblacional a partir de la observación
de un subconjunto con ciertas características de los elementos del universo.
• El muestreo aleatorio simple tiene como característica el suponer que el
comportamiento de la característica de interés es similar en todos los
individuos de la población, es decir, supone homogeneidad en la población.
Debido a esto el diseño asigna probabilidades de inclusión idénticas a
todos y cada uno de los elementos de la población haciendo de esta su
característica principal.


En una corporación financiera de determinada ciudad, se desea saber qué
proporción de sus ahorradores le pagan su sueldo en forma quincenal, algunos
análisis previos muestran que la proporción es del 72%. Si se establece que debe
haber una estimación correcta, con aproximación de + 6% de la proporción
verdadera y una confianza del 90%, ¿Qué tamaño de muestra se necesita,
suponiendo que la población sea infinita o demasiado grande?
n = Tamaño de muestra buscada

Z = Parámetro estadístico que depende el nivel de confianza
p = Probabilidad de que ocurra el evento
q = (1 – p) Probabilidad de que no ocurra el evento
e = Error de estimación
Suponiendo que la población es infinita o demasiado grande, el tamaño de

muestra que se requiere es alrededor de 152, para evaluar la proporción de los
ahorradores que pagan su sueldo en forma quincenal.
Reflexión
Cuando una empresa quiere realizar una investigación de mercado el saber
determinar el tamaño de una muestra le permite a la misma reducir el tiempo en
que se realiza una investigación, aparte de que puede ahorrar recursos no solo
económicos si no de personal.
3/10/23, 5:14 Evaluación Inicial: Revisión del intento
Redes Sociales
    
Estadística Inferencial / Evaluación Inicial
Comenzado el Tuesday, 3 de October de 2023, 05:07

Estado Finalizado
Finalizado en Tuesday, 3 de October de 2023, 05:14
Tiempo 6 minutos 23 segundos
empleado
Calificación 5,00 de 5,00 (100%)
Pregunta 1 Decimos que una variable aleatoria es discreta, cuando toma un valor
particular y este resulta de ser un valor entero.
Correcta
Se puntúa 1,00 sobre 1,00 Seleccione una:

a. Falso
b. Verdadero  Una variable aleatoria es discreta,
cuando toma un valor particular y este
resulta de ser un valor entero.
La respuesta correcta es: Verdadero
Pregunta 2 La regla para decidir si no se rechaza la hipótesis nula o se rechaza en favor

de la hipótesis alternativa se denomina:
Correcta

a. Prueba de Hipótesis.  Una prueba de hipótesis es una regla para
decidir si no se rechaza la hipótesis nula o
se rechaza en favor de la hipótesis
alternativa.
b. Región Crítica.
c. Hipótesis Estadística.
La respuesta correcta es: Prueba de Hipótesis.
https://www.centro-virtual.com/campus/mod/quiz/review.php?attempt=3967604&cmid=5009 1/2
3/10/23, 5:14 Evaluación Inicial: Revisión del intento
Pregunta 3 Es un valor poblacional que caracteriza a una distribución o a una población

y por lo general es desconocido:
Correcta

a. Estadística.
b. Estimador.
c. Parámetro.  El parámetro es un valor poblacional que
caracteriza a una distribución o a una
población y por lo general es
desconocido.
La respuesta correcta es: Parámetro.
Pregunta 4 Decimos que una variable aleatoria es continua cuando toma todos los
valores dentro de un intervalo (a,b) ⊆ ℝ
Correcta

a. Falso
b. Verdadero  Una variable aleatoria es continua
cuando toma todos los valores
dentro de un intervalo (a,b) ⊆ ℝ
Pregunta 5 Es un intervalo tal que al menos uno de sus extremos es una variable
aleatoria:
Correcta

a. Variable aleatoria pivotal.
b. Intervalo aleatorio.  El intervalo aleatorio es un intervalo
tal que al menos uno de sus
extremos es una variable aleatoria.
c. Límites del intervalo.
d. Intervalo de confianza.
La respuesta correcta es: Intervalo aleatorio.
https://www.centro-virtual.com/campus/mod/quiz/review.php?attempt=3967604&cmid=5009 2/2
3/10/23, 5:08 Evaluación U1 Estadística II Asturias | PDF | Muestreo (Estadísticas) | Probabilidades y estadísticas
Lea gratis durante 30

Buscar
días
 95% (21) ·
Descargar
6K vistas ·
ahora8 páginas 5 de 8  Buscar documento 
Evaluación U1 Estadística II Asturias

Cargado por J. E. el Jun 01, 2019
Evaluación U1 Comenzado el martes, 14 de mayo de 2019, 22:47 Estado Finalizado Finalizado en sábado, 1 de junio de 2019, 01:23 Tiempo empleado 17
días 2 horas Puntos 9,00/10,00 Calific… Descripción completa
     
Guardar 95% 5% Insertar Compartir Imprimir
Descargar ahora 5 de 8  Buscar documento 
Play now
Skip Ad
https://es.scribd.com/document/412089286/Evaluacion-U1-Estadistica-II-Asturias 1/19
1/6/2019 Evaluación U1
Redes Soc
de 8      
Evaluación U1
Comenzado el martes, 14 de mayo de 2019, 22:47

Estado Finalizado
Finalizado en sábado, 1 de junio de 2019, 01:23
Tiempo empleado 17 días 2 horas
Puntos 9,00/10,00
Cal if ica ci ón 4, 50 de 5,00 ( 90 %)
Pregunta 1 La función de probabilidad de la variable

X denotada por ƒ (x) : R → (0, ∞) se define
como sigue:
Correcta
Puntúa 1,00 sobre 1,00

Seleccione una:
a.
b.
c.
Esta es la función de probabilidad para

una variable discreta.
d.
La respuesta correcta es:

https://www.centro-virtual.com/campus/mod/quiz/review.php?attempt=1052117&cmid=5011 1/
de 8 
Pregunta 2
Suponga que tiene una población U tal
de 8 
que está etiquetada de la siguiente
Correcta
manera U={1,2,3,4,5} y se quiere estimar
una variable de interés y para cada
elemento en el universo entonces:
Seleccione una:
a. Para el total tenemos que:
b. Para el total tenemos que:
El total determina el valor total de una

característica de interés en una
población, se denota por ty y se define
como sigue: Es por

tanto el sumatorio de los valores de y k
c. Para el total tenemos que:
La respuesta correcta es: Para el total

tenemos que:
Pregunta 3 Decimos que una variable aleatoria es

discreta, cuando toma un valor particular
y este resulta de ser un valor entero.
Correcta

Seleccione una:
a. Verdadero
Una variable aleatoria es discreta,
cuando toma un valor particular y este
resulta de ser un valor entero.
b. Falso


Pregunta 4
Determina el valor total de una
de 8 
Correcta
población y se define como sigue:
Seleccione una:
a. Promedio poblacional y
b. Varianza poblacional y
c. Total poblacional y
El total poblacional determina el valor

total de una característica de interés en
una población, se denota por ty y se
define como sigue:
La respuesta correcta es: Total poblacional y

de 8 
Pregunta 5
Si todas las muestras en el conjunto de
de 8 
todas las posibles muestras tienen el
Correcta
mismo tamaño de muestra, decimos que
estamos ante un:
Seleccione una:
a. Diseño de muestreo sin reemplazo.
b. Diseño de muestreo con
reemplazo.
c. Diseño de muestreo con tamaño de
muestra fijo.
Un diseño de muestreo se dice de
tamaño de muestra fijo, si todas las
muestras en el conjunto de todas las
posibles muestras tienen el mismo
tamaño de muestra.
La respuesta correcta es: Diseño de

muestreo con tamaño de muestra fijo.

Pregunta 6
Suponga que tiene una población U tal
de 8 
que está etiquetada de la siguiente
Correcta
manera U={1,2,3,4,5} y se quiere estimar
una variable de interés y para cada
elemento en el universo entonces:
Seleccione una:
a. Para el promedio tenemos que
b. Para el promedio tenemos que
c. Para el promedio tenemos que
El promedio poblacional determina el

valor promedio de una de una
población, se denota por y se

define como sigue:
El valor de ty
169 es correcto, por tanto = 33.8
La respuesta correcta es: Para el promedio

tenemos que

de 8 
Pregunta 7
Según el segundo video propuesto en
de 8 
esta unidad
Correcta
¿Qué información nos indica el dato de

0,0217?
Seleccione una:
a. El error que se ha cometido al
realizar el proceso de estimación por
intervalos.
b. Es lo mismo decir que, habrá un
2,17% de que los hombres se queden
sin agua. Verdadero.
La respuesta correcta es: Es lo mismo decir

que, habrá un 2,17% de que los hombres se
queden sin agua.
Pregunta 8 Decimos que una variable aleatoria es

continua cuando toma todos los valores
dentro de un intervalo (a,b) ⊆ ℝ
Correcta

Seleccione una:
a. Falso
b. Verdadero
Una variable aleatoria es continua
cuando toma todos los valores dentro
de un intervalo (a,b) ⊆ ℝ

Pregunta 9
Atendiendo al vídeo propuesto:
de 8 
Correcta
¿Qué es lo que define a una variable

aleatoria?
Seleccione una:
a. Que pueden ser discretas y
continuas.
b. Que es un experimento aleatorio y
que tiene un resultado.
Verdadero. Lo que define a una variable
aleatoria es que es un experimento
aleatorio y que tiene resultados.
La respuesta correcta es: Que es un

experimento aleatorio y que tiene un
resultado.

de 8 
Pregunta 10
La función de distribución conjunta de
de 8 
un par de variables aleatorias dado (X,Y),
Incorrecta
denotada por F(x,y), se define como
sigue:
Seleccione una:
a.
b.
Esta es la función de probabilidad para

una variable discreta.
c.
d.
La respuesta correcta es:

Compartir este documento

    
de 8 
También podría gustarte
Documento 8 páginas

J. E.
91% (22)

J. E.
100% (21)
Docdownloader.com PDF Evaluacion u1 Estadistica II Asturias Dd 3fc786bb58cce4b041d9f7ca14abce8a

Ivan Andrés Leon Perez
Aún no hay calificaciones
de 8 
Evaluación Unidad 1 Estadistica Inferencial

ADRIANA MORALES
Evaluacion_ UNIDAD 1_ Distribuciones Conjuntas y Muestreo - Calificacion - 5.00

Carlos Eduardo Cortés
Evaluacion_ UNIDAD 1_ Distribuciones Conjuntas y Muestreo - Calificacion - 5.00

de 8 
Evaluación U1
Yuly Flórez
CUA-ADE-ESII_ UNIDAD 1_ Distribuciones Conjuntas y Muestreo.pdf

yeison estiben
Examen 1 - Estadistica Inferencial

Liliana Caicedo
de 8 
Evaluación U1_estadisitica
fabiorock6
Respuestas examen U1 - Estadísticas ll

Vanessa
Evaluacion_ UNIDAD 2_ Regresión Lineal Simple y Teoría de la Probabilidad calificacion 4.5 9 de 10

de 8 
Títulos relacionados
Documento Documento Documento Documento Documento
Evaluación U2 Evaluación U3 Docdownloader.c Evaluación Evaluacion_

Estadística II… Estadística II… om PDF… Unidad 1… UNIDAD 1_…
Agregado por J. E. Agregado por J. E. Agregado por Ivan… Agregado por ADRIA… Agregado por Carlos…
91% 100% 0 calificaciones 0 calificaciones 0 calificaciones
Acerca de Ayuda Legal Social
Acerca de Scribd Ayuda / Preguntas frecuentes Términos Instagram
Prensa Accesibilidad Privacidad Twitter
Nuestro blog Ayuda para compra Copyright Facebook
¡Únete a nuestro equipo! AdChoices Preferencias de cookies Pinterest
Contáctanos Editores No vender ni compartir mi

información personal
Invita a tus amigos
Obsequios
Scribd para empresas
Obtén nuestras aplicaciones gratuitas
Audiolibros • Libros • Documentos • Revistas • Podcasts • Partituras
Idioma: Español
de 8 
Copyright © 2023 Scribd Inc.
3/10/23, 5:10 Evaluación U3 Estadística II Asturias | PDF | Errores tipo I y tipo Ii | Hipótesis
Lea gratis durante 30

Buscar
días
 100% (21) ·
Descargar
5K vistas·
ahora 6 páginas 5 de 6  Buscar documento 

Cargado por J. E. el Jun 01, 2019
Evaluación U3 Comenzado el sábado, 1 de junio de 2019, 01:38 Estado Finalizado Finalizado en sábado, 1 de junio de 2019, 01:46 Tiempo empleado 8
minutos 20 segundos Puntos 9,00/10,00 C… Descripción completa
     
Guardar 100% 0% Insertar Compartir Imprimir
Descargar ahora 5 de 6  Buscar documento 
Play now
Skip Ad
Lider de Mercado
Equipo especializados en la fabricación de bombas industriales por más de 40 años. Abrir
Netzsch
Redes Soc
de 6      
Evaluación U3
Comenzado el sábado, 1 de junio de 2019, 01:38

Estado Finalizado
Finalizado en sábado, 1 de junio de 2019, 01:46
Tiempo empleado 8 minutos 20 segundos
Puntos 9,00/10,00
C al if ica ci ón 4 ,5 0 de 5,00 ( 90 %)
Pregunta 1 En el modelo asociado a los datos, se

presenta de la siguiente forma el
modelo,
Incorrecta
Seleccione una:
a. El efecto del i - ésimotratamiento
En el modelo asociado a los datos τ

i se
considera el efecto del i-
ésimotratamiento.
b. La media general asociada a todas

las observaciones del diseño.
c. Un componente de error aleatorio.
d. La ij - ésimaobservación.
La respuesta correcta es: Un componente de
error aleatorio.
de 6 
Pregunta 2
Según el segundo vídeo propuesto:
de 6 
Correcta
¿Qué es el P-valor?
Seleccione una:
a. Nivel más alto de significancia al
cual se puede aceptar la Hipótesis
Alternativa (H1 )
b. Nivel más bajo de significancia al
cual se puede rechazar la Hipótesis
Nula (H 0)
Verdadero . El p-valor es el nivel mas
bajo de significancia al cual se puede
rechazar la hipótesis nula .
La respuesta correcta es: Nivel más bajo de

significancia al cual se puede rechazar la
Hipótesis Nula (H 0)
Pregunta 3 Son los elementos sobre los cuales se

hacen las mediciones y a los cuales un
tratamiento puede ser asignado:
Correcta

Seleccione una:
a. Replicación.
b. Factor.
c. Unidad experimental.
La unidad experimental son los
elementos sobre los cuales se hacen
las mediciones y a los cuales un
tratamiento puede ser asignado.
d. Tratamientos.
La respuesta correcta es: Unidad

experimental.
Pregunta 4
Es la repetición total o parcial de un
de 6 
experimento en dos o más conjuntos de
Correcta
condiciones:
Seleccione una:
a. Unidad experimental.
b. Tratamientos.
c. Replicación.
La replicación es la repetición total o
parcial de un experimento en dos o más
conjuntos de condiciones.
d. Factor.
La respuesta correcta es: Replicación.
Pregunta 5 El conjunto de circunstancias creadas

para el experimento en respuesta a la
hipótesis de investigación:
Correcta

Seleccione una:
a. Unidad experimental.
b. Tratamientos.
Los tratamientos son el conjunto de
circunstancias creadas para el
experimento en respuesta a la hipótesis
de investigación y son el centro de la
misma.
c. Factor.
d. Replicación.
La respuesta correcta es: Tratamientos.
Lider de Mercado
de 6 
Equipo especializados en la fabricación de bombas industriales
por más de 40 años.
Netzsch Abrir
Pregunta 6
A un nivel de significancia del 5%, si
de 6 
tenemos Z = 2’91:
Correcta

Seleccione una:
a. No rechazamos la hipótesis nula.
b. Rechazamos la hipótesis nula.
La regla de decisión sería: se rechaza si
Z < -1.96 o Z > 1.96
La respuesta correcta es: Rechazamos la

hipótesis nula.
Pregunta 7 A la probabilidad de rechazar H0 cuando

ésta es verdadera, se denomina:
Correcta
Seleccione una:
a. Error de tipo I.
Al rechazo de la hipótesis nula cuando
ésta es verdadera se le conoce como
error tipo I, y a la probabilidad de
cometer este primer tipo de error se le
denota por laletra α
b. Error de tipo II.
La respuesta correcta es: Error de tipo I.
Pregunta 8
Según el primer vídeo propuesto:
de 6 
Correcta
¿Qué indica el nivel de significación?
Seleccione una:
a. La probabilidad de cometer el error
de tipo II.
b. La probabilidad de cometer el error
de tipo I.
Verdadero. El nivel de significación
indica la probabilidad de cometer el
error de tipo I
La respuesta correcta es: La probabilidad de

cometer el error de tipo I.
Pregunta 9 La regla para decidir si no se rechaza la

hipótesis nula o se rechaza en favor de la
hipótesis alternativa se denomina:
Correcta

Seleccione una:
a. Prueba de Hipótesis.
Una prueba de hipótesis es una regla
para decidir si no se rechaza la
hipótesis nula o se rechaza en favor de
la hipótesis alternativa.
b. Región Crítica.
c. Hipótesis Estadística.
La respuesta correcta es: Prueba de

Hipótesis.
de 6 
Pregunta 10
Es una afirmación o conjetura acerca de
de 6 
una distribución de una o más variables
Correcta
aleatorias:
Seleccione una:
a. Hipótesis Simple.
b. Hipótesis Estadística.
La hipótesis estadística es una
afirmación o conjetura acerca de una
distribución de una o más variables
aleatorias.
c. Hipótesis Compuesta.
La respuesta correcta es: Hipótesis

Estadística.
Compartir este documento

    
de 6 
También podría gustarte
Examen Final Asturias Estadistica II

J. E.
90% (10)
examen unidad 3.pdf

yeison estiben
Evaluación U3
natalia
de 6 
Lider de
Mercado
Equipo especializados en la
fabricación de bombas
industriales por más de 40
años.
Netzsch
Abrir
Evaluacion_ UNIDAD 3_ Pruebas de Hipótesis y Análisis de Varianza - Calificacion - 5.00

Investigación Cuantitativa-Examen Final

Frantus David Castañeda Castrillon
Investigación Cuantitativa-Examen Unidad 1

de 6 
Lider de
Mercado
años.
Netzsch
Abrir
Evaluacion Un 3
Yuly Flórez
Investigación Cualitativa-Examen Unidad 1

Estadística-Inferencial_-Revisión-del-intento(1)00000
Edwin Collaguazo
de 6 
Lider de
Mercado
años.
Netzsch
Abrir
1
Karen Realpe
Evaluación U3
ruth carreño
Examen Unidad 1_Investigacion_Mercado_German_Garcia_Filoth

ggarfi1979
de 6 
Títulos relacionados
Documento Documento Documento Documento Documento
Examen Final examen unidad Evaluación U3 Evaluacion_ Investigación

Asturias… 3.pdf Agregado por natalia UNIDAD 3_… Cuantitativa-…
Agregado por J. E. Agregado por yeison… Agregado por Carlos… Agregado por Frantu…
90% 0 calificaciones 0 calificaciones 0 calificaciones 0 calificaciones
Acerca de Ayuda Legal Social
Acerca de Scribd Ayuda / Preguntas frecuentes Términos Instagram
Prensa Accesibilidad Privacidad Twitter
Nuestro blog Ayuda para compra Copyright Facebook
¡Únete a nuestro equipo! AdChoices Preferencias de cookies Pinterest
Contáctanos Editores No vender ni compartir mi

información personal
Invita a tus amigos
Obsequios
Scribd para empresas
Obtén nuestras aplicaciones gratuitas
Audiolibros • Libros • Documentos • Revistas • Podcasts • Partituras
Idioma: Español
Copyright © 2023 Scribd Inc.

de 6 
Buenas noches, adjunto mi respuesta a la pregunta dinamizadora:
Debemos usar la fórmula para estimar una proporción en una población infinita con un
nivel de confianza del 90% y un margen de error del ±6%.
n es el tamaño de la muestra necesario.
Z es el valor de la distribución normal estándar correspondiente al nivel de confianza

del 90%. En este caso, Z=1,645
p es la proporción estimada previamente de ahorradoras que pagan su sueldo en forma

quincenal, que es del 72% en este caso (0,72).
1−p es el complemento de la proporción estimada, es decir, el porcentaje de

ahorradoras que NO pagan su sueldo en forma quincenal, que es 1− 0,72 = 0,28.
E es el margen de error permitido, que es del ±6% en términos decimales, por lo que E
= 0,06
Por lo tanto, se necesita un tamaño de muestra de aproximadamente 152 ahorradoras

para estimar correctamente la proporción de ahorradoras que pagan su sueldo en forma
quincenal, con un margen de error del ±6% y un nivel de confianza del 90%, asumiendo
que la población es demasiado grande.
Reflexión:
Considero que el muestreo es fundamental para todas las investigaciones, en mi carrera por
supuesto también lo es, ya que, a través de él, puedo tener datos confiables y precisos de
elementos más grandes, y de esta manera puedo ahorrar tiempo y costos, definir con estos datos
estadísticos las implicaciones y estrategias a realizar en mis proyectos profesionales.
Referencias bibliográficas
Teoría del muestreo, sus implicaciones e importancia. Uniasturias. Consultado 02 de octubre de

2023 https://www.centro-
virtual.com/recursos/biblioteca/pdf/estadistica_inferencial/unidad1_pdf3.pdf
Intervalos de confianza y tamaño de la muestra. Uniasturias. Consultado 02 de octubre de 2023
https://www.centro-
virtual.com/recursos/biblioteca/pdf/estadistica_inferencial/unidad2_pdf4.pdf

Unidades Completas

Cargado por

Copyright:

Formatos disponibles

Unidades Completas

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Unidades Completas

Cargado por

Copyright:

Formatos disponibles

•

1 © Asturias Corporación Universitaria

1 Intervalos de Confianza para la Proporción ................................................................. 3

ASTURIAS CORPORACIÓN UNIVERSITARIA®

1 Intervalos de Confianza para la Proporción

1.1 Intervalos de Confianza para la Proporción

Considérese una muestra aleatoria simple 𝑋 extraída de una población definida

Con los supuestos distribucionales adecuados y utilizando una variación del

ASTURIAS CORPORACIÓN UNIVERSITARIA®

𝑝(1 − 𝑝) (0.55) ∙ (0.45)

Ahora el intervalo vendría dado por:

1.2 Intervalo de Confianza para la Diferencia de Proporciones

Se consideran ahora dos muestras aleatorias simples 𝑋 y 𝑌 de tamaños 𝑛1 y 𝑛2

De donde se deduce el intervalo de confianza desead como sigue:

2 Intervalo Aproximado para la Media de una Distribución

ASTURIAS CORPORACIÓN UNIVERSITARIA®

Así, despejando a 𝝁 conocido, tenemos que:

Es un intervalo de confianza aproximado para el parámetro desconocido 𝝁 pues

ASTURIAS CORPORACIÓN UNIVERSITARIA®

1 © Asturias Corporación Universitaria

ASTURIAS CORPORACIÓN UNIVERSITARIA®

2 Método de la Variable Pivotal

2.1 Intervalo Aleatorio

2.2 Intervalo de Confianza (1 – α)

ASTURIAS CORPORACIÓN UNIVERSITARIA®

En un intervalo aleatorio las estadísticas 𝜃(𝑥) y 𝜃 ′ (𝑥) se denominan limite

superior” 2.4 Variable Aleatoria Pivotal

Dada una muestra aleatoria 𝑥1 , 𝑥2 , … , 𝑥𝑛 de una variable aleatoria 𝑋 con función de

2.5 Método de la Variable Pivotal

3 Intervalos de Confianza en Poblaciones Normales

método de cantidades pivótales”

ASTURIAS CORPORACIÓN UNIVERSITARIA®

3.1 Intervalo de Confianza para la Media, Conocida la Varianza

Tomando la siguiente cantidad pivotal:

Para cualquier valor de 𝛼 ∈ (0, 1) podemos encontrar un valor 𝑍𝛼/2 en tablas de

expresión que se indica”

ASTURIAS CORPORACIÓN UNIVERSITARIA®

3.2 Intervalo de Confianza para la Media, Desconocida la Varianza

Tomando la siguiente cantidad pivotal:

Para cualquier valor de 𝛼 ∈ (0, 1) podemos encontrar un valor 𝑡𝛼/2 en tablas de

Gráfico 2: Valores 𝑡𝛼/2

ASTURIAS CORPORACIÓN UNIVERSITARIA®

Tomando la siguiente cantidad pivotal:

Tenemos que un intervalo de confianza para la varianza 𝜎 2 de una distribución

3.4 Intervalo de Confianza para la Varianza, Desconocida la Media

Tomando la siguiente cantidad pivotal:

Tenemos que un intervalo de confianza para la varianza 𝜎 2 de una distribución

3.5 Intervalo de Confianza para la Diferencia de Medias de Muestras

parejas de un solo individuo”

ASTURIAS CORPORACIÓN UNIVERSITARIA®

3.6 Intervalo de Confianza para la Diferencia de Medias de Muestras

Si 𝑋 y 𝑌 son dos muestras aleatorias independientes, es decir, provienen de dos

Se puede llegar a las siguientes conclusiones representadas en intervalos de

Tenemos que un intervalo de confianza para la diferencia de medias (𝜇2 − 𝜇1 ) de

Ejemplo 6. Se quiere estudiar la diferencia de las vidas medias de dos tipos de

ASTURIAS CORPORACIÓN UNIVERSITARIA®

• Intervalo de confianza cuando las varianzas son desconocidas e iguales

Tenemos que un intervalo de confianza para la diferencia de medias (𝜇2 − 𝜇1 ) de

(𝑛1 )𝑆12 + (𝑛2 )𝑆22 1 1