Statistics">
Nothing Special   »   [go: up one dir, main page]

A1 - Mesd - Estadística Inferencial

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 21

ESTADÍSTICA

INFERENCIAL
ACTIVIDAD 1
EJERCICIOS

PROFESOR: CESAR HERNÁNDEZ ÁVILA

NOMBRE: MARIA ELOISA SANCHEZ DÍAZ

MATRÍCULA: 100185754

FECHA: 20 de marzo de 2022


• Con base en el material consultado en la unidad resuelve los ejercicios que se plantean
acerca de los siguientes temas:
➢ Distribuciones muestrales
➢ Teorema del Límite Central (TLC)
Técnicas básicas 1.
Una población consta de cinco números: 2,3,6,8,11. Considere todas las muestras posibles
de tamaño dos que pueden extraerse con reemplazo de esta población. Encontrar:
a. La media de la población
Sustituyendo la ecuación de la media poblacional:
∑ 𝑥%
𝜇=
𝑁

Tenemos que:

2 + 3 + 6 + 8 + 11 30
𝜇= =
5 5
𝜇=6

b. La desviación estándar de la población

Calculando la varianza muestral tenemos que :


∑(𝑥% − 𝜇)0
𝜎0 =
𝑁

0
(2 − 6)0 + (3 − 6)0 + (6 − 6)0 +(8 − 6)0 + (11 − 6)0
𝜎 =
5
0 0 0
(−4) + (−3) + (0) +(2)0 + (5)0
𝜎0 = = 10.8
5

Calculando la desviación estándar poblacional

𝜎 = 6𝜎 0
𝜎 = √10.8
𝜎 = 3.29
c. El valor esperado de la media muestral

Considerando el muestreo con reemplazo con todas las muestras posibles de tamaño dos
que pueden extraerse con reemplazo de esta población utilizaremos la formula:

𝑁 9 = 50 = 25

Desarrollando todas las posibilidades tenemos que:

2,2 3,2 6,2 8,2 11,2


2,3 3,3, 6,3 8,3 11,3,
2,6 3,6 6,6 8,6 11,6
2,8 3,8 6,8 8,8 11,8
2,11 3,11 6,11 8,11 6,11

Calculando la media para cada muestra y la media de las medias muestrales:

𝒙
< 𝒙
< 𝒙
< 𝒙
< 𝒙
<
2,2 2.0 3,2 2.5 6,2 4 8,2 5 11,2 6.5
2,3 2.5 3,3, 3 6,3 4.5 8,3 5.5 11,3, 7
2,6 4.0 3,6 4.5 6,6 6 8,6 7 11,6 8.5
2,8 5.0 3,8 5.5 6,8 7 8,8 8 11,8 9.5
2,11 6.5 3,11 7 6,11 8.5 8,11 9.5 6,11 8.5

??????????
∑ 𝑥̅
𝑥̅ =
𝑛

∑ 𝑥̅ ∑ 2.0 + 2.5. . . +8.5


𝑥̅ = =
𝑛 25

𝑥̅ = 6
d. La desviación estándar (error estándar) de la media muestral

∑(𝑥% − 𝑥̅ )0
𝜎@̅ =
𝑛−1

0
∑(2 − 6)0 + (2.5 − 6)0 +. . . (8.5 − 6)0
𝑠 = = 4.64
24

𝑠 = √4.64 = 2.15

Desviación estándar de la media muestral para una población infinita

𝜎
𝜎@̅ =
√𝑛

2.15
𝜎@̅ = = 0.43
√25
Se seleccionaron muestras aleatorias de tamaño n de poblaciones con las medias y
varianzas dadas aquí. Encuentre la media y desviación estándar de la distribución de
muestreo de la media muestral 𝑥̅ en cada caso:

a. n=36, µ=10, 𝝈𝟐 = 𝟗

𝜇 = 𝜇@ = 10

𝜎 = √9 = 3
Calculando el error estándar de la media de x tenemos que

𝜎
𝜎@̅ =
√𝑛
𝜎 3
𝜎@̅ = = = 0.5
√𝑛 √36

b. n=100, µ=5, 𝝈𝟐 = 𝟒
𝜇 = 𝜇@ = 5

𝜎 = √4 = 2
Calculando el error estándar de la media de x tenemos que

𝜎
𝜎@̅ =
√𝑛
𝜎 2
𝜎@̅ = = = 0.2
√𝑛 √100

c. n=8, µ=120, 𝝈𝟐 = 𝟏
𝜇 = 𝜇@ = 120

𝜎 = √1 = 1
Calculando el error estándar de la media de x tenemos que

𝜎
𝜎@̅ =
√𝑛
𝜎1
𝜎@̅ = = = 0.35
√𝑛 √8
Si las poblaciones muestreadas son normales, ¿cuál es la distribución de muestreo de X
para los incisos a, b y c?

Cuando trabajamos con muestras de tamaño mayor a 30 o bien, muestras de cualquier


tamaño de una distribución normal, la distribución muestral de medias tiende a una
distribución normal con 𝜇 = 𝜇@ y 𝜎@̅ = 𝜎

De acuerdo con el Teorema del Límite Central, si las poblaciones muestreadas no son
normales, ¿qué se puede decir acerca de la distribución muestral de X para los incisos a,
b y c?

Sigue teniendo una tendencia normal por el tamaño de la muestra en a y b

3. Una muestra aleatoria de n observaciones se selecciona de una población con


desviación estándar s = 1 . Calcule el error estándar de la media (SE) para los siguientes
valores de

Calculando el error estándar de la media utilizando la siguiente ecuación

𝜎
𝜎@̅ =
√𝑛

a. n =1 1
𝜎@̅ =
√1 𝝈𝒙< =1.00
b. n = 2 1
𝜎@̅ =
√2 𝝈𝒙< =0.71
c. n = 4 1
𝜎@̅ =
√4 𝝈𝒙< =0.50
d. n = 9 1
𝜎@̅ =
√9 𝝈𝒙< =0.33
e. n = 16 1
𝜎@̅ =
√16 𝝈𝒙< =0.25
f. n = 25 1
𝜎@̅ =
√25 𝝈𝒙< =0.20
g. n = 100 1
𝜎@̅ =
√100 𝝈𝒙< =0.10
4. Se seleccionaron muestras aleatorias de tamaño n de poblaciones binomiales con
parámetros poblacionales p dados aquí. Encuentre la media y la desviación estándar de
H en cada caso:
la distribución de muestreo de la proporción muestral 𝒑

La media poblacional se calcula de la siguiente forma.

𝜇IJ = 𝑝

La desviación estandar de la distribución muestral de la población infinita:

𝑝̅ (1 − 𝑝̅ )
𝜎I̅ = L
𝑛
a. n=100, p=0.3 𝜇IJ = 𝑝 = 0.3 𝜎I̅ = 0.05
0.3(1 − 0.3)
𝜎I̅ = L
100

b. n=400, p=0.1 𝜇IJ = 𝑝 = 0.1 𝜎I̅ = 0.02


0.1(1 − 0.1)
𝜎I̅ = L
400

c. n =250, p=0.6 𝜇IJ = 𝑝 = 0.6 𝜎I̅ = 0.03


0.6(1 − 0.6)
𝜎I̅ = L
250

5. ¿Es adecuado utilizar la distribución normal para aproximar la distribución de muestreo


de P ˆ en las siguientes circunstancias?

Deacuerdo a la teoria: La distribución muestral de la proporción muestral p̅ se puede


aproximar a una distribución normal, si se cumple alguna de las dos condiciones siguientes.
a) 𝑛 ≥ 30
b) 𝑛𝑝̅≥ 5 𝑦 𝑛(1 − 𝑝̅) ≥ 5

Donde 𝑝̅ es la proporción de éxitos en una muestra aleatoria de n observaciones.

a. n = 50, p= 0.05
b. n= 75, p=0.1
c. n =250, p=0.99

Para los 3 incisos se cumple el inciso a), por lo tanto es adecuado


Aplicaciones
1. Enfermedad de Alzheimer.
La duración de la enfermedad de Alzheimer desde el principio de los síntomas hasta
el fallecimiento varía de 3 a 20 años; el promedio es 8 años con una desviación
estándar de 4 años. El administrador de un gran centro médico selecciona al azar, de
la base de datos del centro, los registros médicos de 30 pacientes de Alzheimer ya
fallecidos y anota la duración de la enfermedad para cada unidad en muestra.
Encuentre las probabilidades aproximadas para los siguientes eventos:

a. La duración promedio es menor a 7 años

Contamos con los siguientes datos:


𝜇=8
𝜎=4
𝑛 = 30
𝑥=7

Aplicamos la ecuación para obtener el valor de z:


𝜎 4
𝜎@̅ = = = 0.73
√𝑛 √30
𝑥 − 𝜇@
𝑧= 𝜎
√𝑛

7−8
𝑧= = −1.37
0.73
De la tabla de áreas bajo la curva normal estandarizada tenemos que

Z= -1.37 = 0.4147

𝑃(𝑥̅ < 7) = 0.5 − 0.4147 = 0.0853

Por lo tanto, existe 8.53% de probabilidad de que la duración promedio sea menor a 7
años

b. La duración promedio excede de 7 años

𝑃(𝑥̅ > 7) = 1 − 0.0853 = 0.9147


Por lo tanto, existe 91.47% de probabilidad de que la duración promedio excede de 7 años

c. La duración promedio está a no más de un año de la media poblacional µ = 8

9−8
𝑧= = −1.37
4
√30

De la tabla de áreas bajo la curva normal estandarizada tenemos que

Z= -1.37 = 0.4147

𝑃(7 < 𝑥̅ < 9) = 𝑝(−1.37 < 𝑧 < 1.37) = 0.9147 − 0.0853 = 0.8294

Por lo tanto existe un 82.94% de probabilidad de que la duración promedio esté entre
7 y 9 años

Grafique el error estándar de la media (SE) contra el tamaño muestral n y enlace los
puntos con una curva suave. ¿Cuál es el efecto de aumentar el tamaño de muestra sobre
el error estándar?
𝜇IJ = 𝑝 = 8

𝜎
𝜎@̅ =
√𝑛

n 𝜎@̅
30 2.37
50 0.57
100 0.40
200 0.28
500 0.18
(SE) contra el tamaño muestral n
2.50

2.00

1.50
SE

1.00

0.50

0.00
0 100 200 300 400 500 600
n

Conforme aumenta el tamaño de la muestra, disminuye el error estándar


2. Salarios de profesores. Suponga que los profesores de una universidad en E.U.A.
-con rango de profesor en instituciones públicas que imparten programas
académicos de dos años-, ganan un promedio de 71,802 dólares por año, con una
desviación estándar de 4,000 dólares. En un ejercicio por verificar este nivel de
salario se seleccionó una muestra aleatoria de 60 profesores de una base de datos
del personal académico de todas las instituciones públicas que imparten
programas de dos años en E.U.A.

𝜇 = 71,802
𝜎 = 4,000
𝑛 = 60

a. Describa la distribución de muestreo de la media muestral X

La media de la distribución muestral de la media es

𝜇 = 𝜇@ = 71,802

𝜎 4,000
𝜎@̅ = = = 516.40
√𝑛 √60
b. ¿Dentro de qué límites se esperaría que esté el promedio muestral, con
probabilidad 0.95?

Considerando que

Considerando que debemos conseguir 95%+2.5% =97.5% . 2.5% están distrobuidos


como 𝛼/2,
Revisando la tabla tenemos que z=1.96, por lo tanto el intervalo de confianza se expresa
como
𝐼𝐶XY% (−1.96 < Z < 1.96)

Tomando el dato del inciso a.:


𝜎@̅ = 516.40
Y tomando en cuenta la ecuación
𝑥 − 𝜇@
𝑧= 𝜎
√𝑛

𝑥XY% = 71,802 + (1.96)(516.40) = 72,8144.14


𝑥XY% = 71,802 − (1.96)(516.40) = 70,789.86
c. Calcule la probabilidad de que la media muestral x sea mayor que 73,000 dólares.

Aplicamos la ecuación para obtener el valor de z:

X= 73,000
Tomando el dato del inciso a.:
𝜎@̅ = 516.40

𝑥 − 𝜇@
𝑧= 𝜎
√𝑛

73,000 − 71,802
𝑧= = 2.32
516.40

Revisando tablas tenemos que para el valor de z antes mencionado le corresonde 0.4995

𝑧 = 2.32 = 0.4995

𝑃(𝑥 > 73,000) = 1 − .4995 = 0.50

d. Si una muestra aleatoria en realidad produjo una media muestral de 73,000


dólares, ¿consideraría usted que esto es poco común? ¿Qué conclusión obtendría?

Sería el otro 50% de prbabilidad


3. Requerimiento de Potasio. El requerimiento normal diario de Potasio en seres
humanos está en el intervalo de 2,000 a 6,000 miligramos (mg), con cantidades
más grandes necesarias durante los meses calurosos de verano. La cantidad de
potasio en distintos alimentos varía pero las mediciones indican que el plátano
contiene un nivel alto de potasio, con aproximadamente 422 mg en un plátano de
tamaño mediano. Suponga que la distribución de potasio en plátanos está
distribuida normalmente, con media igual a 422 mg y desviación estándar de 13
mg por plátano. Usted come n = 3 plátanos al día y T es el número total de
miligramos de potasio que recibe de ellos.
𝜇 = 422
𝜎 = 13
𝑛 = 3 𝑝𝑜𝑟 𝑑í𝑎

a. Encuentre la media y la desviación estándar de T .

Considerando los 3 platanos al día:


𝜇 = (3)(422) = 1,266

𝜎 = 61,266 = 35.58

b. Encuentre la probabilidad de que su ingesta diaria de potasio de los tres


plátanos exceda de 1,300 mg. (Sugerencia: Observe que T es la suma de tres
variables aleatorias 1 2 3 X X X , y donde X1 es la cantidad de potasio en el
plátano 1, etc.)

Considerando el excedente de 1,300mg/3 platanos , la ingresta por platano debería ser de


433
𝑥 − 𝜇@
p(x > 433) = P(z < 𝜎 )
√𝑛

433 − 422
p(x > 433) = P(z < ) = 1.47
13
√3
Revisando tablas tenemos que para el valor de z antes mencionado le corresonde 0.4292
𝑧 = 1.47 = 0.4292
Po lo tanto, la probabilidad de que el excedente sea de 1,300mg es de 43%

4. Duración de baterías para automóvil. Un fabricante de baterías para automóvil


afirma que la distribución del tiempo de duración (tiempo de vida) de las baterías
de su mejor marca tiene una media µ = 54 meses y una desviación estándar s = 6
meses. Suponga que un grupo de consumidores decide verificar la afirmación y
para ello compran una muestra de 50 baterías y las somete a prueba para medir
su tiempo de vida.
𝜇 = 54
𝜎=6
𝑛 = 50

a. Suponiendo que la afirmación del fabricante es verdadera, describa la


distribución de muestreo de la media muestral cuando n = 50 baterías.
𝜇 = 𝜇@ = 54

𝜎 6
𝜎@̅ = = = 0.85
√𝑛 √50

b. Suponiendo que la afirmación del fabricante es verdadera, ¿cuál es la


probabilidad de que la muestra de 50 baterías tenga un tiempo de vida de 52
meses o menos?

𝑥 − 𝜇@
𝑧= 𝜎
√𝑛

52 − 54
𝑧= = −2.35
0.85
Revisando tablas tenemos que para el valor de z antes mencionado le corresonde 0.4906

𝑧 = 2.35 = 0.4906

𝑝(𝑥 ≤ 52) = 𝑝(z ≤ −2.35) = 0.5 − 0.4906 = 0.0094

Por lo tanto, la probabilidad de que la muestra tenga un tiempo de vida de 52 meses es de


0.94%
5. Temperatura corporal. Suponga que la temperatura corporal de personas sanas se
distribuye aproximadamente normal con media 37.0 C y desviación estándar de
0.4 C.
𝜇 = 37
𝜎 = 0.4
𝑛 = 130

a. Si 130 personas sanas se seleccionan aleatoriamente, ¿cuál es la probabilidad de que


la temperatura promedio para estas personas sea de 36.80 o menor?

𝜇 = 𝜇@ = 37

𝜎 0.4
𝜎@̅ = = = 0.035
√𝑛 √130

𝑥 − 𝜇@
𝑧= 𝜎
√𝑛

36.8 − 37
𝑧= = 5.7
0.035

En la tabla de z el valor máximo es de 4, por lo que no pude sacar el valor de Z

b. ¿Consideraría una temperatura promedio de 36.80 como poco probable de ocurrir, si


la verdadera temperatura promedio de las personas sanas es de 37 C?

No, ya que la temperatura promedio es de 37ºC


6. Costo de un apartamento. El costo promedio de un apartamento en el desarrollo
Cedar Lakes es de $62,000 usd con una desviación estándar de $4,200 usd.
𝜇 = 62,000
𝜎 = 4,200

a. ¿Cuál es la probabilidad de que un apartamento en este desarrollo cueste al


menos $65,000 usd?

Utilizando la formula de z para una distribución normal:


𝑥 − 𝜇@
𝑧=
𝜎
65,000 − 62,000
𝑧= = 0.714
4200

Revisando tablas tenemos que para el valor de z antes mencionado le corresonde 0.2611

𝑧 = 0.714 = 0.2611

𝑝(𝑥 ≥ 65,000) = 𝑝(z ≥ −0.714) = 0.5 − 0.2611 = 0.2389

Por lo tanto, la probabilidad de que un apartamento en este desarrollo cueste al menos


$65,000 usd es de 23.89%

b. La probabilidad de que el costo promedio de una muestra de dos


apartamentos sea al menos de $65,000 usd es mayor o menor que la
probabilidad de que un apartamento cueste eso? ¿En qué cantidad difiere?
𝜎 4200
𝜎@̅ = = = 29,69.85
√𝑛 √2

65,000 − 62,000
𝑧= = 1.010
29,69.85
Revisando tablas tenemos que para el valor de z antes mencionado le corresonde 0.3437
𝑧 = 1.010 = 0.3437

𝑝(z ≥ −1.01) = 0.5 − 0.3437 = 0.1563

Por lo tanto, la probabilidad de 15.63% es menor

7. Lanzamiento de una moneda. Una moneda justa se lanza n = 80veces. Sea pˆla
proporción muestral de caras (soles). Encuentre P (0.44 <p<0.61)

Tomando en cuenta la proporción de la muestra tenemos que


x
p
?=
n

1
p? = = 0.5
2

n = 80

De acuerdo a la teoría (archivo de la UVM) La desviación estándar de la distribución


muestral de la población para una proporción, se calcula por medio de:

p?(1-p?)
𝜎h = L
n

0.5(1-0.5)
𝜎h = L = 0.56
80

p? − p
𝑧=
𝜎

0.44 − 0.5
𝑧j = = −0.107
0.56

Revisando tablas tenemos que para el valor de z antes mencionado y redondeando le


corresonde 0.0437
0.61 − 0.5
𝑧0 = = 0.196
0.56

Revisando tablas tenemos que para el valor de z antes mencionado y redondeando le


corresonde 0.0792

𝑝(0.44 < 𝑝 < 0.61) = 𝑝(0.61 < 𝑝) − 𝑝(0.44 < p) =

𝑝(z0 -zj ) = 0.196-0.107 = 0.089

7. Herramientas defectuosas. Se ha encontrado que 2% de las herramientas que


produce cierta máquina tienen algún defecto. ¿Cuál es la probabilidad de que en
400 de dichas herramientas,

De acuerdo a la teoría (archivo de la UVM) La desviación estándar de la distribución


muestral de la población para una proporción, se calcula por medio de:

p?(1-p?)
𝜎h = L
n

0.02(1-0.02)
𝜎h = L = 0.007
400
a. 3% o más tengan algún defecto?

p? − p
𝑧=
𝜎
0.03 − 0.02
𝑧k% = = 1.43
0.007

Revisando tablas tenemos que para el valor de z antes mencionado y redondeando le


corresonde 0.4236
𝑧 = 1.43 = 0.4236

𝑝(z ≥ −1.43) = 0.5 − 0.4236 = 0.0764

Por lo tanto la probabilidad de que 3% o más tengan algún defecto es del 7.64%

b. 2% o menos tengan algún defecto?

p? − p
𝑧=
𝜎
0.02 − 0.02
𝑧k% = =0
0.007

Conclusiones

Aprendí que entre más grande sea la muestra , es menor el error estándar de la media.

Tambien que es posible calcular casi con exactitud la probabilidad de muchos fenómenos
aplicados a diferentes áreas. La distribución muestral nos ayuda a medir la probabilidad
de que suceda x por ejemplo. Podemos inferir en el comportamiento de una población a
partir de la media o la varianza de la muestra poblacional.

La direrencia entre un parámetro poblacional es cuando tenemos una muestra finita, y


estadística muestral, cuando tenemos una muestra de una poblacion desconocida.
Bibliografia
a. 07 Intervalo de confianza. (2017, 16 abril). YouTube.

https://www.youtube.com/watch?v=2wugQGs1GNY

b. Devore, J. L. (2016). Probabilidad y estadística para ingeniería y ciencias (9 ed.)


[Versión electrónica]. Recuperado de https://elibro.net/es/lc/uvm/titulos/93280

c. Distribución de la media muestral | | UPV. (2017, 19 octubre). YouTube.

https://www.youtube.com/watch?v=70n-MSUxsUA

d. Llinás, H. (2017). Estadística inferencial [Versión electrónica]. Recuperado de


https://elibro.net/es/lc/uvm/titulos/70060

e. Sweeney, D. J., Anderson, D. R., & Williams, T. (2011). Estadística para negocios y
economía (11 ed.) [Versión electrónica]. Recuperado de
https://elibro.net/es/lc/uvm/titulos/39949

También podría gustarte