Nothing Special   »   [go: up one dir, main page]

Distribución Normal

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 48

Distribución normal

Al finalizar la lectura 1 de este módulo, adelantamos un cuadro en el que nombrábamos algunas de las distribuciones de probabilidad que
estudiaríamos en el módulo. Distinguimos entre variables discretas y continuas. Ahora llegó el momento de estudiar una de las distribuciones de
variables continuas: la distribución normal —que, como ya verás en otro curso superior de estadística— no es la única distribución de variable
continua.

Justamente, su nombre se debe a la normalidad en las mediciones que surgen de la experiencia. Cuando decimos que las estaturas de los deportistas
de un club tienen una distribución aproximadamente normal, significa que la normalidad es que la mayoría se encuentre más cerca del promedio de
estaturas y las que menos se dan son las estaturas más bajas o las más altas.

Esta distribución tiene mucha utilidad, especialmente, en los controles de calidad tanto en empresas industriales como de servicios. ¡Además, la
mayoría de los fenómenos naturales se comportan de esta forma! Te recomiendo el estudio exhaustivo y atento de la distribución normal.

Caso: Consumo de energía eléctrica en una localidad

Video conceptual

Una distribución de variable continua

Aproximación de la binomial a la normal

Aproximación de Poisson a la normal

Revisión del módulo

Referencias
LECCIÓN 1 de 7

Caso: Consumo de energía eléctrica en una localidad

La empresa que suministra Energía Eléctrica a una localidad serrana a unos pocos km de la Ciudad de Córdoba ha publicado, a fines del año anterior, que el consumo por hogar
varía de forma acampanada, con un consumo promedio de 220 KW mensuales y un desvío estándar de 62 KW. La empresa de Energía Provincial tiene que realizar obras de
mantenimiento en esa localidad, pero antes desea estimar —sobre la base del mes relevado— qué porcentaje de familias están comprendidas entre los siguientes consumos:

1 Superior a los 200 KW, pero menores a los 220 KW

2 Menores a 170 kW

3 Mayores a 250 kW

4 Menores a 40 kW

5 Si las familias de la localidad son 15 000, cuántas familias consumen menos de 40 kW

6 Se quiere informar, además, cuál es el consumo a partir del cual encontramos al 20 % de las familias

Estos datos te solicita la empresa, para hacer proyecciones y elaborar un informe sobre el presupuesto para considerar para las obras que se realizarán.
LECCIÓN 2 de 7

Video conceptual

Video 1: Distribución normal. Regla empírica

En este video se explica la regla empírica, es decir que surge de las observaciones realizadas en experimentos en los que interviene la distribución normal. Por esta razón, a
veces los porcentajes varían según la aproximación que se tome. Es el primer paso para comenzar a calcular qué sucede en otros intervalos que no coinciden exactamente con
las desviaciones estándar. Pero es bueno repasarlo.

VIMEO

Verify to continue
We detected a high number of errors from your connection. To
continue, please confirm that you’re a human (and not a
spambot).

I'm not a robot


reCAPTCHA
Privacy - Terms

VC - Herramientas Matemáticas III - Estadística I - Módulo 3 (CANVAS)


VER EN VIMEO 
LECCIÓN 3 de 7

Una distribución de variable continua

Distribución normal

Hasta ahora nos hemos ocupado de distribuciones de variable discreta, es decir, determinábamos la probabilidad de la ocurrencia de un número determinado de aciertos.

Es necesario, ahora, definir una distribución que analice las probabilidades que adopta una variable aleatoria dentro de un intervalo.

La distribución de variable continua que responde a una gran cantidad de situaciones en donde la variable se mide en un intervalo es la distribución normal también denominada
Campana de Gauss, en honor a los trabajos desarrollados por el matemático Carl Gauss (1777‑1855).

Regla empírica

¿Recuerdas este tema ya estudiado en el módulo 1? En aquel momento, solo nos servía para calcular porcentajes del área bajo la curva normal en algunos rangos de datos
singulares: la media ± 1,2 o 3 desviaciones estándar. Repasemos:

μ ± σ: 68 % de las observaciones

μ ± 2σ: 99,5 % de las observaciones

μ ± 3σ : 99,7 % de las observaciones

Entre algunos autores, varían muy poco estos porcentajes. Es por las aproximaciones de los decimales, pero podrás tomar estos como válidos. En el video que sigue, varía un
poco la parte decimal de los porcentajes, pero también pueden tomarse como válidos.

Función de densidad

Ya hemos dicho anteriormente que podemos imaginarnos algunas funciones curvilíneas como idealizaciones de un polígono de frecuencias, asociado a un histograma de
frecuencias.

Las distribuciones de probabilidad de una variable aleatoria continua pueden imaginarse así cuando se aumenta indefinidamente el número de datos y se disminuye
paulatinamente la amplitud de los intervalos de un polígono de frecuencias relativas.

A estas funciones de probabilidad de variables continuas las llamaremos Funciones de Densidad.

Definición:
Una función F(x) se dice que es una función de densidad de una variable aleatoria continua X si se verifican:

1 La función F(x) es positiva o nula en todo el dominio de definición

2 El área limitada por la gráfica de la función y el eje de abscisas son iguales a la unidad.

Existen otras funciones de densidad, pero la más importante es la normal.

Características de la distribución normal

Distribución normal

Figura 1: Distribución de probabilidad normal

Descripción de la figura 1: Se muestra la forma de campana que adopta la distribución normal. En el eje horizontal, van las variables aleatorias continuas (expresadas por
intervalos) y, en el eje vertical, las probabilidades que adoptan dichas variables.

Fuente: elaboración propia.

1 Tiene forma acampanada.

2 Es simétrica respecto al eje vertical que pasa por la abscisa de mayor ordenada.

3 El valor de la abscisa de mayor ordenada coincide con la media y al ser simétrica respecto al eje vertical que pasa por ese punto, coincide con la mediana
y con la moda.
4 Nunca tocan el eje horizontal y teóricamente se extiende desde (-∞ ) a (+∞)

Función de densidad-parámetros

Figura 2: Curva de la distribución de probabilidad normal

Descripción de la figura 2: Se muestra la forma de campana que adopta la distribución normal para resaltar que la rige una función que se llama función de densidad.

Fuente: elaboración propia.

La ecuación a la que responde esta función es la denominada función de densidad de la normal.

No es necesario aprenderse esta fórmula. Pero queremos que observes la función. Algunos de los números que intervienen son π y e, que, como sabes, son números irracionales
y tienen un valor conocido, cada uno de ellos con infinitas cifras decimales.
Por lo que la función de densidad de probabilidades queda supeditada a los valores de µ y σ propios de esta distribución, por lo que estos se constituyen en parámetros de la
distribución normal.

Notación-parámetros

Entonces podemos decir que la distribución normal necesita de la media y de la desviación estándar para quedar definida:

N(µ,σ) se lee distribución normal de media µ y desviación estándar σ.

Por ejemplo: en el caso de la empresa de electricidad provincial, la distribución de probabilidad que define a los consumos de la localidad está definida: N(220; 62), que se lee
distribución normal de media 220 KW y desviación estándar 62 KW.

Más características de la distribución normal

Distribución normal. Área bajo la curva

Figura 3: Distribución de probabilidad normal. Curva de Gauss

Descripción de la figura 3: Se muestra la forma de campana que adopta la distribución normal y se destaca el área por debajo de la curva, la función de densidad. Esta área es
igual a 1 y responde a la integral de la función de densidad F(X).

Fuente: elaboración propia.

La superficie encerrada por la función de densidad y por el eje horizontal es igual a 1. Esto implica que dicha superficie está definida mediante una integral, que es la integral de
la función de densidad, entre los límites -∞ y +∞. Entonces:
Distribución normal. Probabilidad de un intervalo de la variable continua

Figura 4: área correspondiente a un intervalo de la variable aleatoria en una distribución normal

Descripción de la figura 4: Se muestra el área correspondiente, limitada por el intervalo real (a; b), situación que se presenta en la mayoría de los problemas de distribución
normal.

En una variable aleatoria continua, no tiene sentido el estudio de la probabilidad en un valor aislado. Entonces, la probabilidad de x=c (cuando c es un número real cualquiera)
es cero.

P(x=c)=0

Pero sí tiene sentido la probabilidad de que la variable tome valores dentro de un intervalo. Si asociamos la probabilidad de que la variable aleatoria tome un valor comprendido
en un intervalo (a; b), con la integral definida de la función de densidad entre x=a y x=b, nos queda:
No hace falta mostrar la fórmula si sustituimos a F(x) por su función de densidad, pero te imaginarás como queda… No te preocupes porque, para facilitar estos cálculos, existe
la tabla de la distribución de probabilidades de la normal, que utilizaremos más adelante.

Distribución normal estándar

Figura 5: Distribución normal estándar

Descripción de la figura 5: Esta es la distribución normal estándar o tipificada, que se caracteriza por tener una media igual a cero y una desviación estándar igual a 1. La
campana abarca algo más de tres desviaciones estándar a la izquierda y tres a la derecha de la media.

Fuente: elaboración propia.

En un primer paso, nuestro problema será averiguar cuán desviados están de la media los valores que queremos averiguar para resolver nuestro problema. Luego, se calculan las
probabilidades de esa área bajo la curva, limitada por el intervalo que nos interesa.

El área bajo la curva, entre la media y un punto cualquiera, es una función del número de desviaciones estándar que el punto dista de la media.

Quiere decir que, dada una determinada situación para determinar las distintas probabilidades que adopta la variable de acuerdo con el intervalo analizado, solo será necesario
estudiar la distribución normal correspondiente a ese caso; para ello, habría que operar con las correspondientes integrales, pero lo tedioso del proceso hace que se simplifique
todo el cálculo mediante:

1 la estandarización

2 el uso de tablas

A continuación, mostraremos todos estos procesos con ejemplos para una mayor comprensión del tema.

¿Cómo calcular las probabilidades o porcentajes, en cualquier intervalo real?

Entonces, si los extremos del intervalo no coinciden exactamente con 1, 2 o 3 desviaciones estándar, ¿cómo calculamos las probabilidades?

Dijimos que la situación se salva estandarizando nuestro problema a una distribución normal con µ=0 y σ=1. Entre la familia de las distribuciones normales, las que tienen por
media 0 y por desviación típica 1 son, sin duda, las más importantes de todas.

La notación que emplearemos para referirnos a esta normal será N(0,1).

Esta distribución aparece totalmente tabulada y, como veremos más adelante, permitirá el cálculo de cualquier tipo de probabilidad asociada a un área bajo la curva normal.
Entonces:

Primer paso: estandarización de la variable aleatoria.

Segundo paso: buscar en la tabla la variable estandarizada.

Estandarización: La distribución N(0;1). Uso de tablas

Ejemplo 1

Los saldos de las cuentas corrientes de una entidad bancaria varían de forma acampanada con un saldo promedio de $ 5800 y un desvío estándar de $ 1500; indique:

1 ¿Qué porcentaje de cuentas tienen saldos menores a $ 2300?

2 ¿Qué porcentaje de cuentas tienen un saldo entre $ 3000 y $ 9500?

3 Si el Banco tiene 200 000 cuentas corrientes, ¿cuántas superan los $ 10 000 de saldo?

Se trata de una distribución normal. ¿Por qué? Porque lo dice el enunciado del problema. Para poder distinguir el modelo de distribución de probabilidad, en los problemas de
distribución normal, tenemos que contar con los siguientes datos:

Que la distribución es normal o aproximadamente normal o acampanada.


Se tiene que dar la media de la variable aleatoria como dato.

Se tiene que dar la desviación estándar o la varianza de la variable aleatoria como dato.

Más adelante veremos que otros modelos pueden aproximarse por la normal para poder resolverlos. En el problema del ejemplo 1, se dan todos estos datos; por lo tanto,
podemos decir que se trata de: N(5800;1500).

Un bosquejo de la situación se da en el siguiente gráfico.

Figura 6: Comparación entre la distribución normal del ejemplo 1 y la distribución normal estandarizada.

Descripción de la figura 6: Se muestran dos gráficos. El primero responde al problema del ejemplo 1, con su media y sus desviaciones estándar. Más abajo, se ve la
transformación de los valores sobre el eje horizontal, ahora eje z, con una media de cero y una desviación estándar de uno.

Fuente: elaboración propia.

Aclaraciones:

En el eje vertical van los valores de probabilidad de la variable aleatoria. En estos gráficos, se omitieron las escalas, pero deben respetarse las escalas en el eje vertical, porque
es lo que le da la forma a la distribución. Además, queríamos mostrar solo la transformación que se da en el eje horizontal. Pues no interesa en este momento saber cómo llevar
un problema cualquiera a un problema estandarizado o tipificado para poder hacerlo general y así usar una tabla que nos de las probabilidades de los intervalos que buscamos
(área bajo la curva) sin tener que realizar cálculos tediosos mediante integrales.
Resolución del ejemplo 1

Estandarización del ejemplo 1, parte a) y gráfico

a) ¿Qué porcentaje de cuentas tiene saldos menores a $ 2300?

En este ítem se nos pide P(x<2300). Si se pide el porcentaje, recuerda que la tabla es de probabilidades; por lo tanto, tendrás que multiplicar el resultado final por 100. En el
caso de las variables aleatorias continuas, se habla indistintamente de menor o de menor o igual, ya que la probabilidad de que se dé una variable puntual es cero.

Ya analizamos los datos y vemos que responden a una normal: N(5800;1500). En la figura 5, mostramos que, para estandarizar, transformamos la variable aleatoria x en una
variable z, que corresponde a una distribución normal estandarizada en el cual la media vale cero y la desviación estándar uno: N(0;1).

Para poder responder a la primera pregunta, tenemos que calcular el área delimitada por el intervalo (-∞; 2300), es decir, calcular:

P(x<2300): Superficie encerrada por la función y el eje horizontal en ese intervalo.

Matemáticamente se determinaría con ayuda de la integral de la F(x) entre a y b, como explicamos anteriormente. Pero por otra parte estudiamos que:

El área bajo la curva, entre la media y un punto cualquiera, es una función del número de desviaciones estándar que el punto dista de la media.

Entonces comenzamos estandarizando x=2300.

La fórmula que nos devuelve el valor de cuán distante está el x=2300 de la media µ=5800, medida en desviaciones estándar, se llama fórmula de estandarización y es la
siguiente:

Aclaración importante:

z es el valor que se busca en la tabla de la distribución normal y es el valor que indica a cuántas desviaciones estándar nos situamos de la media con
nuestro problema.
Siempre debe expresarse con dos decimales, pues es lo que considera la tabla. Si hay necesidad de aproximar, se redondea la tercera cifra decimal a la
segunda.

Entonces, veamos cuál es nuestra situación:

Figura 7: Sector de la distribución normal estándar a considerar en el ejemplo 1, parte a)

Descripción de la figura 7: Se muestra el área delimitada por la variable aleatoria estandarizada, ahora z. El área marcada es la que nos da la probabilidad solicitada.

Fuente: elaboración propia.

Resolución del ejemplo 1, parte a), mediante tabla

Manejo de la tabla de la distribución normal estándar acumulada

En este curso, vamos a emplear la tabla de la normal acumulada. Esta tabla acumula valores de probabilidad desde -3,5 desviaciones estándar hasta 3,5.
Más allá de estos valores, la probabilidad se considera cero (algunos autores, directamente, consideran desde -3 a +3).

Los valores de z son los que marcan las desviaciones estándar que nuestro problema tiene con respecto a la media

Tabla de la normal estándar acumulada. La tabla es de doble entrada. Solo se busca el valor de z.
En la primera columna, está la parte entera de z con un decimal.

En la primera fila (el encabezado) se busca el segundo decimal.

La celda de la intersección es la probabilidad acumulada desde (-∞) al valor de z buscado (acumula desde la izquierda).

Para ese caso, el contenido de esa celda ya es el resultado porque es el área que representa: P(z<2,33)= P(x<2300) y que ahora buscaremos en la tabla.

En el siguiente gráfico podrás observar el manejo de la tabla acumulada:

Tabla 1: Bosquejo de una tabla de distribución normal estándar acumulada

Descripción de la tabla 1: Observa que, en este bosquejo, los valores de z los tienes que armar entre la primera columna con la primera fila. La probabilidad que indica la celda
es la probabilidad buscada para esta pregunta del ejemplo 1.

Fuente: elaboración propia.


Respondamos ahora a la primera pregunta del ejemplo 1. ¿Qué porcentaje de cuentas tienen saldos menores a $ 2300?

P(z<2,33)=P(x<2300)=0,0099

Significa que el 0,99 % de las cuentas bancarias tienen un saldo menor a $ 2300.

Estandarización del ejemplo 1, parte b) y gráfica

b) ¿Qué porcentaje de cuentas tiene un saldo entre $ 3000 y $ 9500?

Comenzamos estandarizando 3000 y, por otra parte, 9500.

Estandarizamos x=3000, entonces:

que suponíamos que iba a dar negativo, pues está a la izquierda de la media.

Estandarizamos x= 9500

que suponíamos que iba a dar positivo, pues está a la derecha de la media.

Entonces, nuestro problema es calcular la probabilidad: P(-1,87<z<2,47) o lo que es lo mismo P(3000<x<9500)

Grafiquemos nuestro problema:

Figura 8: Sector de la distribución normal estándar a considerar en el ejemplo 1, parte b)


Descripción de figura 8: En el gráfico, se destaca el área bajo la curva normal, que es el resultado para nuestro punto b) del ejemplo 1. Se trata del área de probabilidades
limitado por la curva y por los extremos del intervalo z(-1,87 ; 2,47). Recuerda que los valores de z se corresponden con los valores x=3000 y x=9500 de nuestro problema.

Fuente: elaboración propia.

Resolución del ejemplo 1, parte b), mediante tabla

Buscamos primero la z que es mayor, pues acumula mayor cantidad de probabilidades, para luego restarle las probabilidades correspondientes a la z menor.

Fíjate que en esta tabla tienes que hacer una resta entre áreas. Cuando se quiere calcular la probabilidad en una franja, se resta el área mayor menos el área menor. ¡Esto es
siempre que trabajes con la tabla de la distribución normal estándar acumulada!

Tabla 2: Sección de una tabla de distribución de probabilidades de la normal estándar acumulada para el caso del
ejemplo 1

Descripción de la tabla 2: Es una sección de la tabla de probabilidades acumuladas de la normal estándar en la que se muestra el valor de z calculado. El valor de la celda
intersección representa la probabilidad acumulada, desde la izquierda de la curva (-∞) hasta el sector delimitado por el valor de z=2,47. Entonces, el área encontrada es P(z <
2,47).
Fuente: elaboración propia.

Entonces: P(z<2,47)=0,9932 o lo que es lo mismo: P(x<9500)=0,9932

Ahora busquemos el otro valor de z.

Tabla 3: Sección de una tabla de distribución de probabilidades de la normal estándar acumulada para el caso del
ejemplo 1

Descripción de la Tabla 3: Es una sección de la tabla de probabilidades acumuladas de la normal estándar en la que se muestra el valor de z que buscamos. El valor de la celda
intersección es la probabilidad acumulada del área delimitada por un z menor -1,87. El área encontrada es P(z < -1,87).
Fuente: elaboración propia.

Entonces: P(z<-1,87)=0,0307 o lo que es lo mismo P(x<3000)=0,0307

Por último, restamos el área mayor menos el área menor y nos da la probabilidad de la franja buscada:

P(-1,87<z<2,47) = P(3000<x<9500) = 0

Por lo tanto, el porcentaje de cuentas que tienen un saldo entre $ 3000 y $ 9500 es 96,25 %.

Estandarización del ejemplo 1, parte c) y gráfica

Ya estarás en condiciones de resolver de forma completa la parte c) del ejemplo 1.

c) Si el Banco tiene 200 000 cuentas corrientes, ¿cuántas superan los $ 10 000?

En primer lugar, estandarizamos x=10 000

Figura 9: Sector de la distribución normal estándar a considerar en el ejemplo 1, parte c)


Descripción de la figura 9: En la figura, se destaca el área bajo la curva normal, que es el resultado para nuestro punto c) del ejemplo 1. Se trata del área de probabilidades
limitada por la curva y el intervalo z(2,80; +∞), que —como se observa— es muy pequeño.

Fuente: elaboración propia.

Resolución del ejemplo 1, parte c), mediante tabla

Lo que tenemos que averiguar primero es el valor de probabilidad de z=2,80. Pero ¡cuidado! El valor que nos entrega la tabla es la probabilidad de que z sea menor a 2,80; es
decir, P(z < 2,80), pues la tabla acumula desde la izquierda. Entonces, tendremos que restarle el valor encontrado a 1 para obtener P(z > 2,80).

Recuerda la propiedad sobre el valor del área bajo la curva normal siempre es 1.

Tabla 4: Sección de una tabla de distribución de probabilidades de la normal estándar acumulada para el caso del
ejemplo 1, parte c)

Descripción de la tabla 4: Es una sección de la tabla de probabilidades acumuladas de la normal estándar, en la que se muestra el valor de z que buscamos. El valor de la celda
intersección es la probabilidad acumulada del área delimitada por un z menor 2,80.
Fuente: elaboración propia.

Entonces: P(z<2,80) = 0,9974

Pero nosotros buscamos:

Por lo tanto P(z>2,80)=1-P(z<2,80)=1-0,9974=

Entonces, la probabilidad de encontrar una cuenta con saldo mayor a $ 10 000 es 0,0026. Por lo que el porcentaje de cuentas con saldo mayor a $ 10 000 es de 0,26 %.

Ahora bien, el punto c) pregunta lo siguiente: ¿cuántas cuentas corrientes superan los $ 10 000 sabiendo que el banco tiene 200 000 cuentas corrientes?

Solo tenemos que calcular el 0,26 % de 200 000.

Entonces: 200 000 × 0,0026 = 520 cuentas

Esto es evidente, pues lo que da la tabla es la proporción sobre 1, que es la probabilidad. Si la probabilidad de encontrar una cuenta con un saldo mayor a $ 10 000 es 0,0026, la
probabilidad sobre 200 000 cuentas será 0,0026 × 200000.

Son 520 las cuentas corrientes con un saldo mayor a $ 10 000.

Tablas: tipos y formas de utilizarlas


Cada tipo de tabla que se explica a continuación tiene la tabla para que la utilices cuando la necesites para practicar y para que, también, la puedas descargar.

Recuerda ver qué tabla estás usando. Mi consejo es que aprendas a manejarlas a todas. Para distinguirlas, tienes que fijarte en el pequeño gráfico que hay en la primera hoja de
la tabla, en la parte superior.

Recuerda que solo tienes que saber manejar bien una tabla, aquí te mostramos algunas de las opciones de tablas más utilizadas.

1) Tablas acumuladas con z negativo, cero y positivo.

Estas tablas son las que estamos utilizando en esta lectura y, a nuestro entender, son las más fáciles de utilizar. Pero recuerda que, posiblemente, en el próximo curso de
estadística tengas que saber manejar todas.

Observa que todas las tablas tienen, al comienzo, en la parte superior, un gráfico que muestra el tipo de tabla de la que se trata y qué probabilidades muestra. Las figuras que
muestran las tablas acumuladas en la parte superior son las siguientes:

Figura 10: Gráfico característico que identifica a una tabla de distribución normal acumulada. Parte 1

Descripción de la figura 10: Este gráfico tiene como fin identificar, por medio de un pequeño dibujo que está en la parte superior de la primera página de la tabla (muchas
veces junto a su fórmula), la tabla de distribución normal acumulada. A veces vienen en dos partes, la parte 1 muestra los valores para z negativos y cero, como la que se
presenta aquí.

Fuente: Anderson, Sweeney y Williams, 2008, p. 954.

Figura 11: Figura característica que identifica a una tabla de distribución normal acumulada. Parte 2
Descripción de la figura 11: Este gráfico tiene como fin identificar, por medio de una pequeña figura que está en la parte superior de la primera página de la tabla (muchas
veces junto a su fórmula), la tabla de distribución normal acumulada. A veces, vienen en dos partes. La parte 2 muestran los valores para z positivos y el cero.

Fuente: Anderson, Sweeney y Williams, 2008, p. 955.

A continuación, están las tablas correspondientes.

Lectura obligatoria: Probabilidades acumuladas en la distribución normal estándar

Te facilitamos las tablas de probabilidades acumuladas de la distribución normal parte 1 y parte 2. Están las dos partes de la tabla desde los valores de z negativos (cero) hacia
los positivos. Te serán de utilidad para rendir los exámenes. Puedes bajarlas y fotocopiarlas.

M3_L4 Probabilidades acumuladas en la Distribución Normal estándar.pdf


1004.2 KB

Fuente: Anderson, D. R., Sweeney, D. J. y Williams, T. A. (2008). Apéndice B: Tablas pp. 954 y 955, en Estadística para Administración y Economía. Ciudad de México, MX: Cengage

Learning Editores, S. A.

2) Tablas acumuladas con z positivo


Como la distribución normal es simétrica, muchas veces la tabla de la distribución normal estándar viene por la mitad, es decir, solo desde z=0 hasta, aproximadamente, z=3,5
(según el autor).

Esto es porque los valores se repiten por ser simétrica con respecto al eje por donde pasa la media, mediana y moda. Por lo tanto, a la izquierda y a la derecha, las áreas son
iguales y se repiten.

Por esto mismo, ¡hay que tener cuidado! Esta tabla también acumula desde la izquierda. El primer valor de probabilidad para z=0 es 0,5. Por lo tanto, sus probabilidades
correspondientes van desde 0,5 hasta 1.

La figura que muestran estas tablas en la parte superior es la misma que la de la figura 11.

Lectura obligatoria: Tabla normal N(0;1)

Aquí te facilitamos la tabla de probabilidades acumuladas de la distribución normal estándar, pero solo para valores de z positivos. Esta tabla es muy común; te será de utilidad
para comprender los ejercicios que se realicen con ella. Puedes bajarla y fotocopiarla o también utilizar la parte 2 de la tabla de las probabilidades acumuladas de la distribución
normal que te facilitamos anteriormente, cuyo gráfico se muestra en la figura 3.

M3_L4 Tabla Normal N(0.1).pdf


76.9 KB

Fuente: Sangaku S. L. (2020) La distribución normal o Gaussiana. Recuperado de https://www.sangakoo.com/es/temas/la-distribucion-normal-o-gaussiana

Video 2: Ejercicios con la tabla de distribución normal

Este video muestra de forma muy didáctica cómo utilizar las tablas de la distribución normal acumulada, cuando solo tenemos media tabla, es decir, solo la parte de los z
positivos. Atención que esta tabla es acumulada. También explica el problema inverso

05 Ejercicios con la tabla de distribución normal


Fuente: Píldoras Matemáticas. (2017). Ejercicios con la tabla de Distribución Normal [video de YouTube] Recuperado de https://www.youtube.com/watch?

v=JuLu2PDt3dc&list=PLwCiNw1sXMSBwU_UiiqvIctctvFICYkKC&index=5

3) Tablas cuya área bajo la curva está dada por la franja que delimita z=0 y un z positivo

Además de la tabla acumulada de la normal, te mostraremos el manejo de otra tabla muy utilizada. Es la que está en el texto básico. Esta tabla entrega probabilidades del área
comprendida entre la media, a cualquier valor z positivo. Esta tabla tiene otro manejo. La figura que muestra la tabla en la parte superior es la siguiente:

Figura 12: bosquejo que identifica a un tipo de tabla de distribución normal estándar.

Descripción de la figura 12: Este gráfico tiene como fin identificar, por medio de una pequeña figura que está en la parte superior de la primera página, la tabla de distribución
normal estándar. La parte sombreada indica las probabilidades que entrega la tabla.

Fuente: Levin y Rubin, 2012.

A continuación, está la explicación de cómo se usa esta tabla está en el texto básico de Levin y Rubin, pp. 212 a 217.

Lectura obligatoria: Áreas bajo la curva de la distribución de probabilidad normal estándar, entre la media y valores
positivos de z. AT1 (apéndice de tablas).
Aquí te facilitamos la tabla de probabilidades de la distribución normal estándar. Esta entrega los valores de probabilidad entre la media y los valores positivos de z. Esta tabla
es muy común; te será de utilidad para comprender los ejercicios que se realicen con ella. Puedes bajarla y fotocopiarla. Es la tabla que se explica en el texto básico y muchas
veces es utilizada en lugar de la normal acumulada.

M3_L4 Áreas bajo la curva de la distribución de probabilidad normal estándar, entre la media y valores positivos de
z. AT1 (Apéndice Tablas).pdf
685.3 KB

Fuente: Levin, R. y Rubín, D. (2012). Áreas bajo la curva de la distribución de probabilidad normal estándar, entre la media y valores positivos de z. AT1 (Apéndice Tablas) en
Estadística para Administración y Economía (7.ª edición). Ciudad de México, MX: Pearson.

Problema inverso de la distribución normal

Hasta aquí hemos estudiado ejemplos de cómo calcular probabilidades para determinados valores de z.

Muchas veces nos encontramos con una probabilidad y se necesita hacer lo inverso; es decir, necesitamos calcular z.

Supongamos que necesitamos calcular un valor de z mínimo de manera tal que la probabilidad de obtener un valor de z mayor que el calculado sea de 0,10.

Gráficamente tenemos la siguiente situación:

Figura 13: Gráfico en el que se plantea un problema inverso en la distribución normal

Descripción de la figura 13: En este gráfico, se ve la situación planteada en el llamado problema inverso de cálculo en una distribución normal. Dada el área y la probabilidad,
encontrar el valor de z que limita dicha área.
Fuente: Anderson, Sweeney y Williams, 2008, p. 237.

Para poder resolver este problema, también se usa la tabla de la distribución normal, pero de manera distinta.

Primero es importante interpretar qué se está solicitando.

Si observamos la figura 13, el área a la que se refiere el ejemplo está ubicada en la cola derecha de la distribución normal.

Pero la tabla que venimos utilizando nos da el área que está a la izquierda del valor de z buscado.

No es complicado darse cuenta de que el área que está a la izquierda es la probabilidad de 0,90.

Vamos ahora a recorrer el cuerpo de la tabla, donde están las probabilidades y buscamos la probabilidad acumulada más cercana a 0,9000. Observa en la
porción de la tabla de la normal acumulada que se muestra más abajo, en la tabla 5, que la flecha verde indica cómo se recorre la tabla: de izquierda a
derecha, fila por fila. Es importante comprenderla bien y ver hacia donde aumentan las probabilidades, es lógico que aumenten cuando aumenta z.

Encontramos dos valores de probabilidad muy cercanos a 0,9000: el 0,8997 y el 0,9015.

Tomamos el más cercano que es 0,8997 y nos fijamos el valor de z correspondiente: z=1,28.

Observemos la porción de tabla en la que se encuentran las probabilidades más cercanas a 0,9000.

Tabla 5: Porción de la tabla de la distribución normal en la que se encuentra el valor de probabilidad buscado

Descripción de la tabla 5: Esta es la porción de la tabla de probabilidad acumulada que venimos utilizando en la que se encuentra el valor de probabilidad más cercano a
0,9000. El objetivo es encontrar el valor de z correspondiente.
Fuente: elaboración propia.

Entonces, podemos concluir que el área a la izquierda de 1,28 es, aproximadamente igual a 0,9 o, lo que es lo mismo, el valor z mínimo buscado, que deja un área o una
probabilidad de 0,10 a la derecha es 1,28.

Otra forma de expresarlo es que 0,10 es la probabilidad aproximada de que z sea mayor que 1,28.

Aclaraciones importantes:

1 El valor de z es aproximado. En realidad, para ser más precisos, habría que hacer una interpolación entre los valores de las probabilidades y los valores de
z correspondientes. Así, posiblemente, el valor de z sería un poco mayor a 1,28 en algunos pocos centésimos. A efectos prácticos, se toma la probabilidad
más cercana a la solicitada, como acabamos de hacer.

2 Si las dos probabilidades más cercanas están a la misma distancia de la buscada, se suele agregar un tercer decimal que se obtiene de sumar 0,005 al z
encontrado. Por ejemplo: si la probabilidad a buscar es 0,9299, vemos que en la tabla las probabilidades más cercanas son 0,9292 y 0,9306, que están a la
misma distancia de 0,9299. Entonces, se podría decir que el z correspondiente es z= 1,475. Es lo mismo que hacer un promedio entre los dos z
correspondientes a las dos probabilidades que están a la misma distancia que la buscada.

3 Es importante hacer un bosquejo del problema para poder analizarlo mejor y descubrir qué es lo que tenemos que calcular.

¿Para qué nos sirve el problema inverso?

Para lo mismo que nos sirve el directo. Son muchas las situaciones en las que podemos encontrarnos en la necesidad de aplicarlo.

Ejemplo 2: Contextualicemos el ejercicio que venimos desarrollando.


Supongamos que una fábrica de autopartes fabrica un tipo de pieza cuyo diámetro se distribuye normalmente con una media de 10 mm y una desviación estándar de 0,2 mm. La
fábrica ha tenido rechazos en la última semana del 10 % de las piezas enviadas por tener un diámetro mayor al permitido. ¿Cuántos mm deberán tener como máximo los
diámetros de las piezas para no ser rechazadas? O bien ¿cuál es la menor medida a partir de la cual las piezas son rechazadas?

El problema es el mismo que el del ejemplo 2, solo que ahora lo aplicamos a un caso real.

El 10 % de rechazos se debe al exceso de tamaño de las piezas, por lo que la cola derecha de la distribución normal es el área considerada, ya que la
variable aleatoria continua son las medidas de los diámetros de las piezas y los mayores diámetros están a la derecha del eje x.

Sabemos que z=1,28 es el valor buscado, que deja a su izquierda un 90 % del área bajo la curva normal y un 10 % a su derecha.

Pero el problema nuestro es calcular el valor de la variable aleatoria x, correspondiente a z=1,28. Es decir, algo así como desestandarizar el problema,
llevarlo de la forma estándar a nuestro problema

Sabemos que:

z=(x-μ)/σ

Sustituimos: 1,28=(x-10)/0,2 Despejamos x: 1,28×0,2+10=x Entonces: x=10,256 mm

Observemos los gráficos del problema estandarizado y el real.

Figura 14: Gráficos comparados del ejemplo 2. El estándar y el real.

Descripción de la figura 14: Se muestran los dos gráficos del ejemplo 2. En el primero se ve el problema estandarizado, con el área de 0,10 a la derecha de z=1,28. En el
segundo se muestra el problema real con el área de 0,10 por encima de x=10,256 mm.
Fuente: elaboración propia.

Respuesta: la medida de cada pieza no debe superar los 10,256 mm, para que no se rechace el pedido.

Respuesta: la medida de cada pieza no debe superar los 10,256 mm, para que no se rechace el pedido.

Resolución del caso de consumo de energía eléctrica en una localidad

Resolución del caso: consumo de energía eléctrica en una localidad, ítem a)

Datos del problema: N(220;62)

¿Qué porcentajes de familias están comprendidas entre los siguientes consumos?

a) Superior a los 200 KW, ¿pero menores a los 220 KW?

Estandarizamos 200 KW
Estandarizamos 220 KW. Es justo la media. Si la estandarizamos, nos dará, evidentemente, 0. Entonces su probabilidad acumulada será 0,5.

Es decir P(x<220)=0,5

Buscamos en la tabla de la distribución normal acumulada z=-0,32 y nos da 0,3745.

Por lo tanto: P(x<200)=0,3745

Ahora restamos el área mayor menos el área menor: 0,5 – 0,3745 = 0,1255

Respuesta: el porcentaje de familias que consume entre 200 y 220 KW de energía eléctrica es del 12,55 %.

Resolución del caso: consumo de energía eléctrica en una localidad, ítems b) c) d)

Datos del problema: N(220;62)

b) Menores a 170 kW

Estandarizamos x=170 KW

Buscamos en la tabla de la distribución normal acumulada z=-0,81 y nos da 0,2090.

Por lo tanto: P (x < 170) = 0,2090 . Este es el valor buscado.

Respuesta: el porcentaje de familias que consume menos de 170 KW de energía eléctrica es del 20,90 %

c) Mayores a 250 KW
Estandarizamos x=250

Buscamos en la tabla de la distribución normal acumulada z= 0,48 y nos da 0,6844, entonces .

Pero lo que se solicita es P(x>250) por lo que debemos restar de 1, la probabilidad encontrada.

Entonces: P(x>250)=1-P(x<250)=1-0,6844=0,3

Respuesta: el porcentaje de familias que consume más de 250 KW de energía eléctrica es del 31,56%.

d) Menores a 40 KW

Estandarizamos x=40

Buscamos en la tabla de la distribución normal acumulada z=-2,90 y obtenemos 0,0019, entonces P(x<40)=0,0019.

Respuesta: el porcentaje de familias que consume menos de 40 KW de energía eléctrica es del 0,19%.

Resolución del caso: consumo de energía eléctrica en una localidad, ítem e)

e) Si las familias de la localidad son 15 000, cuántas familias consumen menos de 40 kW.

Solo tenemos que multiplicar 15 000 × 0,0019 que es lo mismo que calcular el 0,19 % de 15 000.

Entonces: 15 000 × 0,0019=28,5. Aproximadamente 29 familias


Respuesta: aproximadamente 29 familias consumen menos de 40 KW de energía eléctrica.

Resolución del caso: consumo de energía eléctrica en una localidad, ítem f)

f) Se quiere informar, además, cuál es el consumo a partir del cual encontramos al 20 % de las familias.

Primero, interpretamos qué nos piden. Con un pequeño bosquejo de la distribución normal, nos damos cuenta de que la variable aleatoria x es consumos
en KW; es más, esto es lo primero de lo que tenemos que darnos cuenta. La media y la desviación estándar están sobre el eje x, y representan consumos.
Por lo tanto, las familias están representadas por el área bajo la curva.

Si observamos la figura 14, del ejemplo 2 ya resuelto, es un caso parecido. El 20 % mayor es el área bajo la curva que se observa en la cola derecha de la
campana.

Entonces, como la tabla acumula desde la izquierda, buscamos la probabilidad más cercana al 80 %, es decir, la probabilidad más cercana a 0,8 (recuerda
que la tabla se recorre de izquierda a derecha, fila por fila). Por lógica el 0,8 tendrá que estar en la segunda parte de la tabla donde los valores de z son
positivos.

Los valores más cercanos encontrados son 0,7995 para z=0,84 y 0,8023 para z=0,85

El valor más cercano a 0,8 es 0,7995, por lo tanto, el z correspondiente es 0,84.

Ahora hacemos la inversa de la estandarización:

Respuesta: existe un 0,20 de probabilidad de que una familia consuma más de 272,08 KW.

O bien: El 20 % de las familias consume más de 272,08 KW

Lectura obligatoria: Variables continuas: la distribución normal


Recomendamos esta ágil lectura a modo de resumen de lo estudiado hasta aquí. También explica cómo utilizar Excel con las distribuciones de probabilidad. Y, en algunos
ejercicios, plantea el problema inverso. Será muy útil para repasar conceptos y realizar los ejercicios. Se recomienda la lectura de las páginas 1-22, inclusive.

M3_L4 Variables continuas la distribución normal.pdf


1.2 MB

Fuente: Wiper, M. (2016). Variables continuas: la distribución normal. Recuperado de

http://halweb.uc3m.es/esp/Personal/personas/mwiper/docencia/Spanish/GC/guardia%20civil/lecture%20notes/class15.pdf

En una distribución normal con una desviación estándar de 5, la probabilidad de que una observación elegida al azar exceda 21 es de 0,14.

a) Calcula la media de la distribución.

b) Calcula el valor por debajo del cual se halla el 4 % de los valores de la distribución.

a) la media es -26,4. b) el valor es 17,5

a) la media es 26,4. b) el valor es 17,5

a) la media es 26,4. b) el valor es 17,65

a) la media es 21. b) el valor es 17,5

a) la media es 21. b) el valor es 17,65

SUBMIT

Herramientas en línea o software libres sobre la distribución normal

En internet tienes muchas herramientas con las que puedes controlar tus ejercicios o ver cómo varían las curvas según la desviación estándar o la media. Es muy interesante
poder interactuar con estos programas.

Además, puedes buscar las áreas bajo la curva con el Microsoft Excel, en la sección de funciones. Hasta puedes llegar a generar una tabla tú mismo.

También la aplicación Geogebra es muy ágil y didáctica para trabajar online para verificar lo que desees, aquí te dejamos la dirección:
https://www.geogebra.org/classic#probability
Otro sitio muy interesante es el de proyecto descartes. Tienes una simulación para construir una tabla de la distribución normal, además de poder interactuar con los valores de z
y las probabilidades correspondientes: https://proyectodescartes.org/miscelanea/materiales_didacticos/Normal(1,0)-JS/index.html
LECCIÓN 4 de 7

Aproximación de la binomial a la normal

Caso: Tasa de actividad CABA

La tasa de actividad (porcentaje de la población de diez años o más que se encuentra económicamente activa) en la Ciudad Autónoma de Buenos Aires es del 50,4 % (Dirección
General de Estadística y Censos-Ministerio de Economía y Finanzas GCBA, s. f., https://bit.ly/3f3i0oK). Una ONG, realiza una selección aleatoria de 1000 de las que están
activas. Desea averiguar los siguientes datos basados en dicha muestra:

1 El número esperado de personas activas

2 ¿cuál es la varianza y la desviación estándar del número de personas activas?

3 ¿cuál es la varianza y la desviación estándar del número de personas activas?

4 ¿Cuál es la probabilidad de que por lo menos 520 personas estén activas?

Aproximación de una distribución binomial a una normal

Cuando en un experimento binomial el número de ensayos n es tan grande que no está en la tabla de la distribución binomial o se hace dificultoso realizar los cálculos, dicha
distribución puede ser resuelta, por aproximación, con la distribución normal. Algunos autores mencionan la condición de que la probabilidad de éxito debe ser cercana a 0,5,
pero no es excluyente.

Condiciones que deben darse para hacer la aproximación

1 En primer lugar, deben darse en el experimento todas las condiciones de la distribución binomial estudiadas en la lectura 2.

2 Recordemos los parámetros de la distribución binomial:

n: número de ensayos

p: probabilidad de éxito

q=1-p: probabilidad de fracaso

Para resolverla por la normal, deben darse las siguientes condiciones:


n.p ≥ 5 y n.q ≥ 5

3 La media de la distribución normal será la media de la distribución binomial:

μ=n.p

4 La desviación estándar de la distribución normal será la desviación estándar de la binomial:

σ=√(n.p.q)

Resolución de una distribución binomial por aproximación con la normal

Recuerda que:

en una distribución de probabilidad continua, las probabilidades se calculan como el área bajo la curva de la función de densidad correspondiente.

También es cierto que en una distribución de probabilidad continua la probabilidad de la variable aleatoria puntual es cero.

Entonces, para aproximar una distribución binomial, que es de variable discreta, a la distribución normal, hay que tener en cuenta el factor de corrección
por continuidad, que es ± 0,5. Este se suma o se resta a la variable aleatoria según el caso.

Lo vamos a explicar de la siguiente forma: cuando se nos pide la probabilidad de 15 éxitos exactamente, el área bajo la curva a integrar (o buscar en la
tabla) comprende el intervalo 14,5 a 15,5 para disminuir el error de aproximación. Recordemos que la binomial es una distribución de variable discreta y
perfectamente puede quererse calcular la probabilidad de una variable aleatoria discreta cualquiera.

Entonces P(x=15) de una distribución binomial con variable discreta, se aproxima mediante el cálculo de P(14,5≤x≤15,5) a una distribución normal con
una variable aleatoria continua.

Para ilustrar estos conceptos presentamos el siguiente ejemplo:

Resumen sobre el factor de corrección por continuidad

Se muestran los cinco casos que pueden darse al resolver una binomial, por aproximación a la normal: supongamos que x=15.

1 x≥15 se calcula el área restando 0,5; es decir, se estandariza x=14,5

2 x>15 se calcula el área sumando 0,5; es decir, se estandariza x=15,5

3 x≤15 se calcula el área sumando 0,5; es decir, se estandariza x=15,5

4 x<15 se calcula el área restando 0,5; es decir, se estandariza x=14,5

x=15 se calcula el área restando y sumando 0,5. Luego, se resta el área mayor menos el área menor. Es decir, se estandariza x=14,5 y x=15,5
5
Ejemplo 3

En un comercio de impresiones gráficas están detectando que, aproximadamente, en el 30 % de las impresiones realizadas con una de sus impresoras hay algún defecto.

Si se realiza una prueba con la impresora que desliza errores y, de todas las impresiones realizadas en una semana, se eligen 80 impresiones aleatoriamente, se quiere
determinar:

1 ¿Cuál es la probabilidad de que en la muestra se encuentren como máximo 20 impresiones con errores?

2 ¿Cuál es la probabilidad de que en la muestra se encuentren por lo menos 50 impresiones con errores?

3 ¿Cuál es la probabilidad de que en la muestra se encuentren exactamente 10 impresiones con errores?

4 Determina el número esperado de impresiones con errores en la distribución.

Resolución del ejemplo 3

En primer lugar, verificamos que se trata de una distribución binomial, Bin (80; 0,30)

n=80 y p=0,30 impresiones con error.

Estudiamos si se cumplen las condiciones n.p ≥ 5 y n.q ≥ 5

n.p = 80 × 0,30 = 24 > 5

n.q = 80 × 0,70 =56 > 5

Se cumplen las condiciones, por lo tanto, podemos hacerla por aproximación a la normal.

Calculamos la media y la desviación estándar:

Decimos que la Bin (80; 0,30) ~ N(24;4,1)


a) P(x≤20) cómo máximo 20, significa que el 20 también se incluye. Pero como se trata de una aproximación se le suma la corrección de continuidad.

Entonces, la probabilidad que calcular es P(x≤20,5)

Entonces, la probabilidad que calcular es P(x≤20,5)

Estandarizamos x=20,5

Buscamos en la tabla de la normal acumulada

P(z≤-0,85)=P(x≤20,5)=0,1977

La probabilidad de que en la muestra se encuentren como máximo 20 impresiones con errores es de 0,1977.

Esta binomial, por Excel, da 0,1978. Como verás, da con muy buena aproximación.

b) P(x≥50)

Calculamos con el factor de corrección de continuidad, pero en este caso se le resta a 50, porque buscamos el área mayor a ese número. Calculamos

Estandarizamos x=49,5

Buscamos en la tabla de la normal acumulada y vemos que z = 6,22 no figura. Si no figura un valor z positivo, es porque a su izquierda la probabilidad es
1. Pues ya por z=3,7 aproximadamente es 1. Recuerda que la tabla acumula desde la izquierda. Pero lo que tenemos que calcular es:

P(z≥6,22)=1-P(z<6,22)=1-1=0

O lo que es lo mismo:

P(x≥49,5)=1-P(x<49,5)=1-1=0

La probabilidad de que en la muestra se encuentren por lo menos 50 impresiones con errores es de 0. Haciendo la binomial en Excel también da cero.
c) P(9,5≤x≤10,5) Acá se piden encontrar exactamente 10 impresiones con errores.

Restamos la probabilidad mayor menos la menor: 0,0005-0=0,0005 = 5 .10-4

Aquí tenemos que hacer algunas aclaraciones: la tabla muestra desde z=-3 porque considera que a la izquierda todas las probabilidades son cero. Pero en
otras tablas los autores inician en -3,5, como, por ejemplo, la tabla que se muestra en el recurso multimedia (Variables continuas: la distribución normal).
Si te fijas en esa tabla, el valor de probabilidad para z=-3,29 es 0,0005, que, en notación científica, es 5 .10-4 .

En este curso dijimos que tomaríamos las probabilidades hasta la cuarta cifra decimal, es por eso por lo que así la hemos considerado en este ejemplo. Pero no está mal si
consideras que el resultado es cero. Si en algún examen o trabajo práctico se te presenta esta situación, considera la respuesta más cercana a cero.

En conclusión, P(9,5≤x≤10,5)=0

La probabilidad de que en la muestra se encuentren exactamente 10 impresiones con errores es de 0.

Haciendo la binomial en Excel da 0,0001, es muy buena la aproximación, aunque tomáramos 0,0005 como resultado de la aproximación.

d) E(x)=n.p=80×0,30=24

El número esperado de impresiones con errores es 24.

Resolución del caso tasa de actividad de CABA

En primer lugar, verificamos que se trata de una distribución binomial, Bin (1000; 0,504) n=1000 y p=0,504 población activa
Estudiemos si se cumplen las condiciones n.p ≥ 5 y n.q ≥ 5

n.p = 1000 × 0,504 = 504 > 5

n.q = 1000 × (1-0,504) =1000 × 0,496 = 496 > 5

Se cumplen las condiciones por lo tanto podemos hacerla por aproximación a la normal.

Calculamos la media y la desviación estándar:

Entonces: Bin(1000; 0,504) ~ N(504;15,81)

1 El número esperado de personas activas:

E(x)=n.p=504

El número esperado de personas activas es de 504.

2 ¿Cuál es la varianza y la desviación estándar del número de personas activas?

La varianza de la distribución es de 249,98 personas.

La desviación estándar de la distribución es de 15,81 personas.

3 ¿Cuál es la probabilidad de que exactamente 520 personas estén activas?

P(519,5≤x≤520,5)

Acá se piden encontrar exactamente 520 personas activas Estandarizamos x=519,5


Estandarizamos x=520,5

Buscamos en la tabla:

Restamos la probabilidad mayor menos la menor: 0,8508 - 0,8365 = 0,0143

La probabilidad de que en la muestra haya exactamente 520 personas activas es de 0,0143.

Haciendo la binomial en Excel da 0,0151. Esta es una aproximación aceptable, la diferencia es 0,0008.

4 ¿Cuál es la probabilidad de que más de 520 personas estén activas?

P(x>520) en la aproximación en este caso le sumamos la corrección por continuidad 0,5 por ser una restricción de mayor solamente. Entonces calculamos:

P(x≥520,5)

Estandarizamos x = 520,5. Cómo ya lo hicimos en el punto c), lo tomamos, z=1,04

P(z<1,04)=0,8508

Pero nosotros buscamos P(z>1,04)


P(z>0,98)=1-P(z<0,98)=1-0,8508=0

O lo que es lo mismo:

P(x≥520,5)=0,1492

La probabilidad de que en la muestra haya por lo menos 520 personas activas es de 0,1492.

Haciendo la binomial en Excel da 0,1486, una diferencia por aproximación muy pequeña de 0,0006.
LECCIÓN 5 de 7

Aproximación de Poisson a la normal

Caso: Peaje a Carlos Paz

En un peaje a la Ciudad de Carlos Paz desde Córdoba, pasan en promedio 70 móviles en una hora. Este promedio fue calculado el último fin de semana largo que tuvo la
provincia. La Agencia Córdoba Turismo se pregunta cuál es la probabilidad de que en una hora tomada al azar se registren, en dicho peaje, menos de 55 móviles el próximo fin
de semana.

Aproximación de la distribución de Poisson a la normal

También podemos aproximar la distribución de Poisson a la Normal cuando λ ≥ 10. Aclaramos que la distribución sigue siendo de Poisson, una distribución de variable
aleatoria discreta con n finito, como en la binomial. Pero, si λ es lo suficientemente grande, la gráfica se va aproximando a una curva normal. Además, la aproximación se hace
por practicidad, ya que los errores por la aproximación son muy pequeños.

Ya dijimos la condición λ≥10. Si la vamos a tratar como una normal, necesitamos la media y la desviación estándar, que son las siguientes:

μ=λ

σ=√λ

Una vez calculados estos parámetros, se procede a la estandarización de la variable aleatoria y a calcular la probabilidad solicitada. Por ejemplo, una Poisson (16) es
aproximadamente una Normal (16, 4).

Por supuesto que, con la planilla Excel u otra aplicación en línea, podemos calcular las probabilidades de los modelos estudiados y eso sería lo más exacto, pero muchas veces
tendremos que realizar los cálculos solo con una calculadora y manualmente, por lo que no está de más saber cómo son los procedimientos de aproximación.

Lectura obligatoria: Aproximaciones de distribuciones de probabilidad: enfoque empírico

Te recomendamos esta lectura como resumen de las aproximaciones estudiadas hasta aquí. Pero lo interesante y novedoso es que este es un enfoque empírico. No hay que
resolver ningún problema. Solo se comparan las transformaciones que se producen en las distintas distribuciones cuando se dan ciertas condiciones y van transformándose en
normal. Es decir, te darás cuenta del porqué pueden utilizarse las aproximaciones con solo observar los gráficos.

Se recomienda la lectura de las páginas 1-7 inclusive, sin incluir el punto 4.

morettini.2013.pdf
p
466.9 KB

Fuente: Morettini, M. (2013). Aproximaciones de distribuciones de probabilidad: enfoque empírico. Recuperado de http://nulan.mdp.edu.ar/2040/1/morettini.2013.pdf

A continuación, resolveremos el caso presentado:

Resolución del caso del peaje a Carlos Paz

Podemos resolver este caso por aproximación de Poisson a la normal. Claramente, es una distribución de Poisson, pero λ > 10 no está en la tabla y los cálculos serían tediosos.

La aproximamos de la siguiente manera:

µ=λ=70 vehículos en una hora

σ=√λ=√70=8,37

Entonces P(λ=70)≈N(70;8,37)

¿Cuál es la probabilidad de que en una hora tomada al azar se registren —en dicho peaje—, como máximo, 55 móviles el próximo fin de semana?

Como lambda está dado en una hora y la variable aleatoria pregunta sobre una hora tomada al azar, no hay que hacer ninguna transformación de lambda.

Entonces se debe calcular: P(x<55) con λ=µ=70 vehículos en una hora.

Estandarizamos x=55:

Buscamos el valor de z en la tabla acumulada de la normal:

P(x<55)=P(z<-1,79)=0,0367
En una hora tomada al azar, la probabilidad de que se registren como máximo 55 vehículos es de 0,0367, en el próximo fin de semana.

En la siguiente actividad debes asociar lo que caracteriza a cada distribución y lo que se requiere para aproximarla a la normal.

Distribución normal

Distribución con forma de


El eje x es asíntota
campana

Aproximación de la binomial
a la normal

n.p≥5 y n.q ≥ 5 µ=n.p

p es cercano a 0,5

Aproximación de Poisson a la
normal

λ ≥ 10 µ=λ=E(x)
σ=√λ
LECCIÓN 6 de 7

Revisión del módulo

Hasta acá aprendimos

Distribuciones de Probabilidad –Variable aleatoria



En esta lectura aprendiste a definir y reconocer en un problema la variable aleatoria y a clasificarla. También a reconocer distribuciones de probabilidades, representarlas gráficamente, conocer
sus características, interpretar en casos prácticos y problemas de la vida profesional. Además, aprendiste a calcular la esperanza y la varianza de una distribución de probabilidades.

Modelos especiales de Distribuciones de Probabilidad de variable discreta:



Binomial
Se presenta un caso especial de distribución de probabilidades, que es el modelo binomial. En este tema reconociste las características que deben darse para que exista una distribución binomial.
Identificaste sus parámetros y aprendiste a calcular la probabilidad de una variable aleatoria en un modelo binomial, por fórmula y por tablas.

Otras distribuciones de variables discretas:



Poisson – Hipergeométrica – Aproximación
Aprendiste a reconocer los modelos de probabilidad de Poisson e Hipergeométrica. Definiste e identificaste las características de cada modelo haciendo hincapié en sus diferencias. Reconociste
sus parámetros y aprendiste a calcular la probabilidad de una variable aleatoria en un modelo de Poisson y en uno Hipergeométrico a través de casos, por fórmula y por tablas. Identificaste una
distribución Binomial como aproximación de Poisson y calculaste probabilidades mediante este modelo.

Distribución normal

En esta lectura, el alumno reconociste las características de una distribución normal con profundidad. Resolviste problemas utilizando diferentes tipos de tablas de la distribución normal.
Conociste la fórmula de estandarización y comprendiste la utilidad de esta distribución en la vida diaria. También, aprendiste a utilizar otros modelos como aproximaciones.
LECCIÓN 7 de 7

Referencias

Anderson, David R., Sweeney, Dennis J. y Williams, Thomas A. (2008). Estadística para Administración y Economía. Ciudad de México, MX: Cengage Learning Editores,
S. A.

Dirección General de Estadística y Censos-Ministerio de Economía y Finanzas GCBA. (s. f.) ETOI. 3.o trimestre de 2019. Recuperado de
https://www.estadisticaciudad.gob.ar/eyc/wp-content/uploads/2019/12/ir_2019_1415.pdf

Levin, R. y Rubin, D. (2012). Estadística para Administración y Economía. Ciudad de México, MX: Pearson.

Morettini, M. (2013). Aproximaciones de distribuciones de probabilidad: enfoque empírico. Recuperado de http://nulan.mdp.edu.ar/2040/1/morettini.2013.pdf

Sangaku S. L. (2020). La distribución normal o Gaussiana. Recuperado de https://www.sangakoo.com/es/temas/la-distribucion-normal-o-gaussiana

Wiper, M. (2016). Variables continuas: la distribución normal. Recuperado de


http://halweb.uc3m.es/esp/Personal/personas/mwiper/docencia/Spanish/GC/guardia%20civil/lecture%20notes/class15.pdf

También podría gustarte