Distribución Normal
Distribución Normal
Distribución Normal
Al finalizar la lectura 1 de este módulo, adelantamos un cuadro en el que nombrábamos algunas de las distribuciones de probabilidad que
estudiaríamos en el módulo. Distinguimos entre variables discretas y continuas. Ahora llegó el momento de estudiar una de las distribuciones de
variables continuas: la distribución normal —que, como ya verás en otro curso superior de estadística— no es la única distribución de variable
continua.
Justamente, su nombre se debe a la normalidad en las mediciones que surgen de la experiencia. Cuando decimos que las estaturas de los deportistas
de un club tienen una distribución aproximadamente normal, significa que la normalidad es que la mayoría se encuentre más cerca del promedio de
estaturas y las que menos se dan son las estaturas más bajas o las más altas.
Esta distribución tiene mucha utilidad, especialmente, en los controles de calidad tanto en empresas industriales como de servicios. ¡Además, la
mayoría de los fenómenos naturales se comportan de esta forma! Te recomiendo el estudio exhaustivo y atento de la distribución normal.
Video conceptual
Referencias
LECCIÓN 1 de 7
La empresa que suministra Energía Eléctrica a una localidad serrana a unos pocos km de la Ciudad de Córdoba ha publicado, a fines del año anterior, que el consumo por hogar
varía de forma acampanada, con un consumo promedio de 220 KW mensuales y un desvío estándar de 62 KW. La empresa de Energía Provincial tiene que realizar obras de
mantenimiento en esa localidad, pero antes desea estimar —sobre la base del mes relevado— qué porcentaje de familias están comprendidas entre los siguientes consumos:
2 Menores a 170 kW
3 Mayores a 250 kW
4 Menores a 40 kW
6 Se quiere informar, además, cuál es el consumo a partir del cual encontramos al 20 % de las familias
Estos datos te solicita la empresa, para hacer proyecciones y elaborar un informe sobre el presupuesto para considerar para las obras que se realizarán.
LECCIÓN 2 de 7
Video conceptual
En este video se explica la regla empírica, es decir que surge de las observaciones realizadas en experimentos en los que interviene la distribución normal. Por esta razón, a
veces los porcentajes varían según la aproximación que se tome. Es el primer paso para comenzar a calcular qué sucede en otros intervalos que no coinciden exactamente con
las desviaciones estándar. Pero es bueno repasarlo.
VIMEO
Verify to continue
We detected a high number of errors from your connection. To
continue, please confirm that you’re a human (and not a
spambot).
Distribución normal
Hasta ahora nos hemos ocupado de distribuciones de variable discreta, es decir, determinábamos la probabilidad de la ocurrencia de un número determinado de aciertos.
Es necesario, ahora, definir una distribución que analice las probabilidades que adopta una variable aleatoria dentro de un intervalo.
La distribución de variable continua que responde a una gran cantidad de situaciones en donde la variable se mide en un intervalo es la distribución normal también denominada
Campana de Gauss, en honor a los trabajos desarrollados por el matemático Carl Gauss (1777‑1855).
Regla empírica
¿Recuerdas este tema ya estudiado en el módulo 1? En aquel momento, solo nos servía para calcular porcentajes del área bajo la curva normal en algunos rangos de datos
singulares: la media ± 1,2 o 3 desviaciones estándar. Repasemos:
μ ± σ: 68 % de las observaciones
Entre algunos autores, varían muy poco estos porcentajes. Es por las aproximaciones de los decimales, pero podrás tomar estos como válidos. En el video que sigue, varía un
poco la parte decimal de los porcentajes, pero también pueden tomarse como válidos.
Función de densidad
Ya hemos dicho anteriormente que podemos imaginarnos algunas funciones curvilíneas como idealizaciones de un polígono de frecuencias, asociado a un histograma de
frecuencias.
Las distribuciones de probabilidad de una variable aleatoria continua pueden imaginarse así cuando se aumenta indefinidamente el número de datos y se disminuye
paulatinamente la amplitud de los intervalos de un polígono de frecuencias relativas.
Definición:
Una función F(x) se dice que es una función de densidad de una variable aleatoria continua X si se verifican:
2 El área limitada por la gráfica de la función y el eje de abscisas son iguales a la unidad.
Distribución normal
Descripción de la figura 1: Se muestra la forma de campana que adopta la distribución normal. En el eje horizontal, van las variables aleatorias continuas (expresadas por
intervalos) y, en el eje vertical, las probabilidades que adoptan dichas variables.
2 Es simétrica respecto al eje vertical que pasa por la abscisa de mayor ordenada.
3 El valor de la abscisa de mayor ordenada coincide con la media y al ser simétrica respecto al eje vertical que pasa por ese punto, coincide con la mediana
y con la moda.
4 Nunca tocan el eje horizontal y teóricamente se extiende desde (-∞ ) a (+∞)
Función de densidad-parámetros
Descripción de la figura 2: Se muestra la forma de campana que adopta la distribución normal para resaltar que la rige una función que se llama función de densidad.
No es necesario aprenderse esta fórmula. Pero queremos que observes la función. Algunos de los números que intervienen son π y e, que, como sabes, son números irracionales
y tienen un valor conocido, cada uno de ellos con infinitas cifras decimales.
Por lo que la función de densidad de probabilidades queda supeditada a los valores de µ y σ propios de esta distribución, por lo que estos se constituyen en parámetros de la
distribución normal.
Notación-parámetros
Entonces podemos decir que la distribución normal necesita de la media y de la desviación estándar para quedar definida:
Por ejemplo: en el caso de la empresa de electricidad provincial, la distribución de probabilidad que define a los consumos de la localidad está definida: N(220; 62), que se lee
distribución normal de media 220 KW y desviación estándar 62 KW.
Descripción de la figura 3: Se muestra la forma de campana que adopta la distribución normal y se destaca el área por debajo de la curva, la función de densidad. Esta área es
igual a 1 y responde a la integral de la función de densidad F(X).
La superficie encerrada por la función de densidad y por el eje horizontal es igual a 1. Esto implica que dicha superficie está definida mediante una integral, que es la integral de
la función de densidad, entre los límites -∞ y +∞. Entonces:
Distribución normal. Probabilidad de un intervalo de la variable continua
Descripción de la figura 4: Se muestra el área correspondiente, limitada por el intervalo real (a; b), situación que se presenta en la mayoría de los problemas de distribución
normal.
En una variable aleatoria continua, no tiene sentido el estudio de la probabilidad en un valor aislado. Entonces, la probabilidad de x=c (cuando c es un número real cualquiera)
es cero.
P(x=c)=0
Pero sí tiene sentido la probabilidad de que la variable tome valores dentro de un intervalo. Si asociamos la probabilidad de que la variable aleatoria tome un valor comprendido
en un intervalo (a; b), con la integral definida de la función de densidad entre x=a y x=b, nos queda:
No hace falta mostrar la fórmula si sustituimos a F(x) por su función de densidad, pero te imaginarás como queda… No te preocupes porque, para facilitar estos cálculos, existe
la tabla de la distribución de probabilidades de la normal, que utilizaremos más adelante.
Descripción de la figura 5: Esta es la distribución normal estándar o tipificada, que se caracteriza por tener una media igual a cero y una desviación estándar igual a 1. La
campana abarca algo más de tres desviaciones estándar a la izquierda y tres a la derecha de la media.
En un primer paso, nuestro problema será averiguar cuán desviados están de la media los valores que queremos averiguar para resolver nuestro problema. Luego, se calculan las
probabilidades de esa área bajo la curva, limitada por el intervalo que nos interesa.
El área bajo la curva, entre la media y un punto cualquiera, es una función del número de desviaciones estándar que el punto dista de la media.
Quiere decir que, dada una determinada situación para determinar las distintas probabilidades que adopta la variable de acuerdo con el intervalo analizado, solo será necesario
estudiar la distribución normal correspondiente a ese caso; para ello, habría que operar con las correspondientes integrales, pero lo tedioso del proceso hace que se simplifique
todo el cálculo mediante:
1 la estandarización
2 el uso de tablas
A continuación, mostraremos todos estos procesos con ejemplos para una mayor comprensión del tema.
Entonces, si los extremos del intervalo no coinciden exactamente con 1, 2 o 3 desviaciones estándar, ¿cómo calculamos las probabilidades?
Dijimos que la situación se salva estandarizando nuestro problema a una distribución normal con µ=0 y σ=1. Entre la familia de las distribuciones normales, las que tienen por
media 0 y por desviación típica 1 son, sin duda, las más importantes de todas.
Esta distribución aparece totalmente tabulada y, como veremos más adelante, permitirá el cálculo de cualquier tipo de probabilidad asociada a un área bajo la curva normal.
Entonces:
Ejemplo 1
Los saldos de las cuentas corrientes de una entidad bancaria varían de forma acampanada con un saldo promedio de $ 5800 y un desvío estándar de $ 1500; indique:
3 Si el Banco tiene 200 000 cuentas corrientes, ¿cuántas superan los $ 10 000 de saldo?
Se trata de una distribución normal. ¿Por qué? Porque lo dice el enunciado del problema. Para poder distinguir el modelo de distribución de probabilidad, en los problemas de
distribución normal, tenemos que contar con los siguientes datos:
Se tiene que dar la desviación estándar o la varianza de la variable aleatoria como dato.
Más adelante veremos que otros modelos pueden aproximarse por la normal para poder resolverlos. En el problema del ejemplo 1, se dan todos estos datos; por lo tanto,
podemos decir que se trata de: N(5800;1500).
Figura 6: Comparación entre la distribución normal del ejemplo 1 y la distribución normal estandarizada.
Descripción de la figura 6: Se muestran dos gráficos. El primero responde al problema del ejemplo 1, con su media y sus desviaciones estándar. Más abajo, se ve la
transformación de los valores sobre el eje horizontal, ahora eje z, con una media de cero y una desviación estándar de uno.
Aclaraciones:
En el eje vertical van los valores de probabilidad de la variable aleatoria. En estos gráficos, se omitieron las escalas, pero deben respetarse las escalas en el eje vertical, porque
es lo que le da la forma a la distribución. Además, queríamos mostrar solo la transformación que se da en el eje horizontal. Pues no interesa en este momento saber cómo llevar
un problema cualquiera a un problema estandarizado o tipificado para poder hacerlo general y así usar una tabla que nos de las probabilidades de los intervalos que buscamos
(área bajo la curva) sin tener que realizar cálculos tediosos mediante integrales.
Resolución del ejemplo 1
En este ítem se nos pide P(x<2300). Si se pide el porcentaje, recuerda que la tabla es de probabilidades; por lo tanto, tendrás que multiplicar el resultado final por 100. En el
caso de las variables aleatorias continuas, se habla indistintamente de menor o de menor o igual, ya que la probabilidad de que se dé una variable puntual es cero.
Ya analizamos los datos y vemos que responden a una normal: N(5800;1500). En la figura 5, mostramos que, para estandarizar, transformamos la variable aleatoria x en una
variable z, que corresponde a una distribución normal estandarizada en el cual la media vale cero y la desviación estándar uno: N(0;1).
Para poder responder a la primera pregunta, tenemos que calcular el área delimitada por el intervalo (-∞; 2300), es decir, calcular:
Matemáticamente se determinaría con ayuda de la integral de la F(x) entre a y b, como explicamos anteriormente. Pero por otra parte estudiamos que:
El área bajo la curva, entre la media y un punto cualquiera, es una función del número de desviaciones estándar que el punto dista de la media.
La fórmula que nos devuelve el valor de cuán distante está el x=2300 de la media µ=5800, medida en desviaciones estándar, se llama fórmula de estandarización y es la
siguiente:
Aclaración importante:
z es el valor que se busca en la tabla de la distribución normal y es el valor que indica a cuántas desviaciones estándar nos situamos de la media con
nuestro problema.
Siempre debe expresarse con dos decimales, pues es lo que considera la tabla. Si hay necesidad de aproximar, se redondea la tercera cifra decimal a la
segunda.
Descripción de la figura 7: Se muestra el área delimitada por la variable aleatoria estandarizada, ahora z. El área marcada es la que nos da la probabilidad solicitada.
En este curso, vamos a emplear la tabla de la normal acumulada. Esta tabla acumula valores de probabilidad desde -3,5 desviaciones estándar hasta 3,5.
Más allá de estos valores, la probabilidad se considera cero (algunos autores, directamente, consideran desde -3 a +3).
Los valores de z son los que marcan las desviaciones estándar que nuestro problema tiene con respecto a la media
Tabla de la normal estándar acumulada. La tabla es de doble entrada. Solo se busca el valor de z.
En la primera columna, está la parte entera de z con un decimal.
La celda de la intersección es la probabilidad acumulada desde (-∞) al valor de z buscado (acumula desde la izquierda).
Para ese caso, el contenido de esa celda ya es el resultado porque es el área que representa: P(z<2,33)= P(x<2300) y que ahora buscaremos en la tabla.
Descripción de la tabla 1: Observa que, en este bosquejo, los valores de z los tienes que armar entre la primera columna con la primera fila. La probabilidad que indica la celda
es la probabilidad buscada para esta pregunta del ejemplo 1.
P(z<2,33)=P(x<2300)=0,0099
Significa que el 0,99 % de las cuentas bancarias tienen un saldo menor a $ 2300.
que suponíamos que iba a dar negativo, pues está a la izquierda de la media.
Estandarizamos x= 9500
que suponíamos que iba a dar positivo, pues está a la derecha de la media.
Buscamos primero la z que es mayor, pues acumula mayor cantidad de probabilidades, para luego restarle las probabilidades correspondientes a la z menor.
Fíjate que en esta tabla tienes que hacer una resta entre áreas. Cuando se quiere calcular la probabilidad en una franja, se resta el área mayor menos el área menor. ¡Esto es
siempre que trabajes con la tabla de la distribución normal estándar acumulada!
Tabla 2: Sección de una tabla de distribución de probabilidades de la normal estándar acumulada para el caso del
ejemplo 1
Descripción de la tabla 2: Es una sección de la tabla de probabilidades acumuladas de la normal estándar en la que se muestra el valor de z calculado. El valor de la celda
intersección representa la probabilidad acumulada, desde la izquierda de la curva (-∞) hasta el sector delimitado por el valor de z=2,47. Entonces, el área encontrada es P(z <
2,47).
Fuente: elaboración propia.
Tabla 3: Sección de una tabla de distribución de probabilidades de la normal estándar acumulada para el caso del
ejemplo 1
Descripción de la Tabla 3: Es una sección de la tabla de probabilidades acumuladas de la normal estándar en la que se muestra el valor de z que buscamos. El valor de la celda
intersección es la probabilidad acumulada del área delimitada por un z menor -1,87. El área encontrada es P(z < -1,87).
Fuente: elaboración propia.
Por último, restamos el área mayor menos el área menor y nos da la probabilidad de la franja buscada:
P(-1,87<z<2,47) = P(3000<x<9500) = 0
Por lo tanto, el porcentaje de cuentas que tienen un saldo entre $ 3000 y $ 9500 es 96,25 %.
c) Si el Banco tiene 200 000 cuentas corrientes, ¿cuántas superan los $ 10 000?
Lo que tenemos que averiguar primero es el valor de probabilidad de z=2,80. Pero ¡cuidado! El valor que nos entrega la tabla es la probabilidad de que z sea menor a 2,80; es
decir, P(z < 2,80), pues la tabla acumula desde la izquierda. Entonces, tendremos que restarle el valor encontrado a 1 para obtener P(z > 2,80).
Recuerda la propiedad sobre el valor del área bajo la curva normal siempre es 1.
Tabla 4: Sección de una tabla de distribución de probabilidades de la normal estándar acumulada para el caso del
ejemplo 1, parte c)
Descripción de la tabla 4: Es una sección de la tabla de probabilidades acumuladas de la normal estándar, en la que se muestra el valor de z que buscamos. El valor de la celda
intersección es la probabilidad acumulada del área delimitada por un z menor 2,80.
Fuente: elaboración propia.
Entonces, la probabilidad de encontrar una cuenta con saldo mayor a $ 10 000 es 0,0026. Por lo que el porcentaje de cuentas con saldo mayor a $ 10 000 es de 0,26 %.
Ahora bien, el punto c) pregunta lo siguiente: ¿cuántas cuentas corrientes superan los $ 10 000 sabiendo que el banco tiene 200 000 cuentas corrientes?
Esto es evidente, pues lo que da la tabla es la proporción sobre 1, que es la probabilidad. Si la probabilidad de encontrar una cuenta con un saldo mayor a $ 10 000 es 0,0026, la
probabilidad sobre 200 000 cuentas será 0,0026 × 200000.
Recuerda ver qué tabla estás usando. Mi consejo es que aprendas a manejarlas a todas. Para distinguirlas, tienes que fijarte en el pequeño gráfico que hay en la primera hoja de
la tabla, en la parte superior.
Recuerda que solo tienes que saber manejar bien una tabla, aquí te mostramos algunas de las opciones de tablas más utilizadas.
Estas tablas son las que estamos utilizando en esta lectura y, a nuestro entender, son las más fáciles de utilizar. Pero recuerda que, posiblemente, en el próximo curso de
estadística tengas que saber manejar todas.
Observa que todas las tablas tienen, al comienzo, en la parte superior, un gráfico que muestra el tipo de tabla de la que se trata y qué probabilidades muestra. Las figuras que
muestran las tablas acumuladas en la parte superior son las siguientes:
Figura 10: Gráfico característico que identifica a una tabla de distribución normal acumulada. Parte 1
Descripción de la figura 10: Este gráfico tiene como fin identificar, por medio de un pequeño dibujo que está en la parte superior de la primera página de la tabla (muchas
veces junto a su fórmula), la tabla de distribución normal acumulada. A veces vienen en dos partes, la parte 1 muestra los valores para z negativos y cero, como la que se
presenta aquí.
Figura 11: Figura característica que identifica a una tabla de distribución normal acumulada. Parte 2
Descripción de la figura 11: Este gráfico tiene como fin identificar, por medio de una pequeña figura que está en la parte superior de la primera página de la tabla (muchas
veces junto a su fórmula), la tabla de distribución normal acumulada. A veces, vienen en dos partes. La parte 2 muestran los valores para z positivos y el cero.
Te facilitamos las tablas de probabilidades acumuladas de la distribución normal parte 1 y parte 2. Están las dos partes de la tabla desde los valores de z negativos (cero) hacia
los positivos. Te serán de utilidad para rendir los exámenes. Puedes bajarlas y fotocopiarlas.
Fuente: Anderson, D. R., Sweeney, D. J. y Williams, T. A. (2008). Apéndice B: Tablas pp. 954 y 955, en Estadística para Administración y Economía. Ciudad de México, MX: Cengage
Learning Editores, S. A.
Esto es porque los valores se repiten por ser simétrica con respecto al eje por donde pasa la media, mediana y moda. Por lo tanto, a la izquierda y a la derecha, las áreas son
iguales y se repiten.
Por esto mismo, ¡hay que tener cuidado! Esta tabla también acumula desde la izquierda. El primer valor de probabilidad para z=0 es 0,5. Por lo tanto, sus probabilidades
correspondientes van desde 0,5 hasta 1.
La figura que muestran estas tablas en la parte superior es la misma que la de la figura 11.
Aquí te facilitamos la tabla de probabilidades acumuladas de la distribución normal estándar, pero solo para valores de z positivos. Esta tabla es muy común; te será de utilidad
para comprender los ejercicios que se realicen con ella. Puedes bajarla y fotocopiarla o también utilizar la parte 2 de la tabla de las probabilidades acumuladas de la distribución
normal que te facilitamos anteriormente, cuyo gráfico se muestra en la figura 3.
Este video muestra de forma muy didáctica cómo utilizar las tablas de la distribución normal acumulada, cuando solo tenemos media tabla, es decir, solo la parte de los z
positivos. Atención que esta tabla es acumulada. También explica el problema inverso
v=JuLu2PDt3dc&list=PLwCiNw1sXMSBwU_UiiqvIctctvFICYkKC&index=5
3) Tablas cuya área bajo la curva está dada por la franja que delimita z=0 y un z positivo
Además de la tabla acumulada de la normal, te mostraremos el manejo de otra tabla muy utilizada. Es la que está en el texto básico. Esta tabla entrega probabilidades del área
comprendida entre la media, a cualquier valor z positivo. Esta tabla tiene otro manejo. La figura que muestra la tabla en la parte superior es la siguiente:
Figura 12: bosquejo que identifica a un tipo de tabla de distribución normal estándar.
Descripción de la figura 12: Este gráfico tiene como fin identificar, por medio de una pequeña figura que está en la parte superior de la primera página, la tabla de distribución
normal estándar. La parte sombreada indica las probabilidades que entrega la tabla.
A continuación, está la explicación de cómo se usa esta tabla está en el texto básico de Levin y Rubin, pp. 212 a 217.
Lectura obligatoria: Áreas bajo la curva de la distribución de probabilidad normal estándar, entre la media y valores
positivos de z. AT1 (apéndice de tablas).
Aquí te facilitamos la tabla de probabilidades de la distribución normal estándar. Esta entrega los valores de probabilidad entre la media y los valores positivos de z. Esta tabla
es muy común; te será de utilidad para comprender los ejercicios que se realicen con ella. Puedes bajarla y fotocopiarla. Es la tabla que se explica en el texto básico y muchas
veces es utilizada en lugar de la normal acumulada.
M3_L4 Áreas bajo la curva de la distribución de probabilidad normal estándar, entre la media y valores positivos de
z. AT1 (Apéndice Tablas).pdf
685.3 KB
Fuente: Levin, R. y Rubín, D. (2012). Áreas bajo la curva de la distribución de probabilidad normal estándar, entre la media y valores positivos de z. AT1 (Apéndice Tablas) en
Estadística para Administración y Economía (7.ª edición). Ciudad de México, MX: Pearson.
Hasta aquí hemos estudiado ejemplos de cómo calcular probabilidades para determinados valores de z.
Muchas veces nos encontramos con una probabilidad y se necesita hacer lo inverso; es decir, necesitamos calcular z.
Supongamos que necesitamos calcular un valor de z mínimo de manera tal que la probabilidad de obtener un valor de z mayor que el calculado sea de 0,10.
Descripción de la figura 13: En este gráfico, se ve la situación planteada en el llamado problema inverso de cálculo en una distribución normal. Dada el área y la probabilidad,
encontrar el valor de z que limita dicha área.
Fuente: Anderson, Sweeney y Williams, 2008, p. 237.
Para poder resolver este problema, también se usa la tabla de la distribución normal, pero de manera distinta.
Si observamos la figura 13, el área a la que se refiere el ejemplo está ubicada en la cola derecha de la distribución normal.
Pero la tabla que venimos utilizando nos da el área que está a la izquierda del valor de z buscado.
No es complicado darse cuenta de que el área que está a la izquierda es la probabilidad de 0,90.
Vamos ahora a recorrer el cuerpo de la tabla, donde están las probabilidades y buscamos la probabilidad acumulada más cercana a 0,9000. Observa en la
porción de la tabla de la normal acumulada que se muestra más abajo, en la tabla 5, que la flecha verde indica cómo se recorre la tabla: de izquierda a
derecha, fila por fila. Es importante comprenderla bien y ver hacia donde aumentan las probabilidades, es lógico que aumenten cuando aumenta z.
Tomamos el más cercano que es 0,8997 y nos fijamos el valor de z correspondiente: z=1,28.
Observemos la porción de tabla en la que se encuentran las probabilidades más cercanas a 0,9000.
Tabla 5: Porción de la tabla de la distribución normal en la que se encuentra el valor de probabilidad buscado
Descripción de la tabla 5: Esta es la porción de la tabla de probabilidad acumulada que venimos utilizando en la que se encuentra el valor de probabilidad más cercano a
0,9000. El objetivo es encontrar el valor de z correspondiente.
Fuente: elaboración propia.
Entonces, podemos concluir que el área a la izquierda de 1,28 es, aproximadamente igual a 0,9 o, lo que es lo mismo, el valor z mínimo buscado, que deja un área o una
probabilidad de 0,10 a la derecha es 1,28.
Otra forma de expresarlo es que 0,10 es la probabilidad aproximada de que z sea mayor que 1,28.
Aclaraciones importantes:
1 El valor de z es aproximado. En realidad, para ser más precisos, habría que hacer una interpolación entre los valores de las probabilidades y los valores de
z correspondientes. Así, posiblemente, el valor de z sería un poco mayor a 1,28 en algunos pocos centésimos. A efectos prácticos, se toma la probabilidad
más cercana a la solicitada, como acabamos de hacer.
2 Si las dos probabilidades más cercanas están a la misma distancia de la buscada, se suele agregar un tercer decimal que se obtiene de sumar 0,005 al z
encontrado. Por ejemplo: si la probabilidad a buscar es 0,9299, vemos que en la tabla las probabilidades más cercanas son 0,9292 y 0,9306, que están a la
misma distancia de 0,9299. Entonces, se podría decir que el z correspondiente es z= 1,475. Es lo mismo que hacer un promedio entre los dos z
correspondientes a las dos probabilidades que están a la misma distancia que la buscada.
3 Es importante hacer un bosquejo del problema para poder analizarlo mejor y descubrir qué es lo que tenemos que calcular.
Para lo mismo que nos sirve el directo. Son muchas las situaciones en las que podemos encontrarnos en la necesidad de aplicarlo.
El problema es el mismo que el del ejemplo 2, solo que ahora lo aplicamos a un caso real.
El 10 % de rechazos se debe al exceso de tamaño de las piezas, por lo que la cola derecha de la distribución normal es el área considerada, ya que la
variable aleatoria continua son las medidas de los diámetros de las piezas y los mayores diámetros están a la derecha del eje x.
Sabemos que z=1,28 es el valor buscado, que deja a su izquierda un 90 % del área bajo la curva normal y un 10 % a su derecha.
Pero el problema nuestro es calcular el valor de la variable aleatoria x, correspondiente a z=1,28. Es decir, algo así como desestandarizar el problema,
llevarlo de la forma estándar a nuestro problema
Sabemos que:
z=(x-μ)/σ
Descripción de la figura 14: Se muestran los dos gráficos del ejemplo 2. En el primero se ve el problema estandarizado, con el área de 0,10 a la derecha de z=1,28. En el
segundo se muestra el problema real con el área de 0,10 por encima de x=10,256 mm.
Fuente: elaboración propia.
Respuesta: la medida de cada pieza no debe superar los 10,256 mm, para que no se rechace el pedido.
Respuesta: la medida de cada pieza no debe superar los 10,256 mm, para que no se rechace el pedido.
Estandarizamos 200 KW
Estandarizamos 220 KW. Es justo la media. Si la estandarizamos, nos dará, evidentemente, 0. Entonces su probabilidad acumulada será 0,5.
Es decir P(x<220)=0,5
Ahora restamos el área mayor menos el área menor: 0,5 – 0,3745 = 0,1255
Respuesta: el porcentaje de familias que consume entre 200 y 220 KW de energía eléctrica es del 12,55 %.
b) Menores a 170 kW
Estandarizamos x=170 KW
Respuesta: el porcentaje de familias que consume menos de 170 KW de energía eléctrica es del 20,90 %
c) Mayores a 250 KW
Estandarizamos x=250
Pero lo que se solicita es P(x>250) por lo que debemos restar de 1, la probabilidad encontrada.
Entonces: P(x>250)=1-P(x<250)=1-0,6844=0,3
Respuesta: el porcentaje de familias que consume más de 250 KW de energía eléctrica es del 31,56%.
d) Menores a 40 KW
Estandarizamos x=40
Buscamos en la tabla de la distribución normal acumulada z=-2,90 y obtenemos 0,0019, entonces P(x<40)=0,0019.
Respuesta: el porcentaje de familias que consume menos de 40 KW de energía eléctrica es del 0,19%.
e) Si las familias de la localidad son 15 000, cuántas familias consumen menos de 40 kW.
Solo tenemos que multiplicar 15 000 × 0,0019 que es lo mismo que calcular el 0,19 % de 15 000.
f) Se quiere informar, además, cuál es el consumo a partir del cual encontramos al 20 % de las familias.
Primero, interpretamos qué nos piden. Con un pequeño bosquejo de la distribución normal, nos damos cuenta de que la variable aleatoria x es consumos
en KW; es más, esto es lo primero de lo que tenemos que darnos cuenta. La media y la desviación estándar están sobre el eje x, y representan consumos.
Por lo tanto, las familias están representadas por el área bajo la curva.
Si observamos la figura 14, del ejemplo 2 ya resuelto, es un caso parecido. El 20 % mayor es el área bajo la curva que se observa en la cola derecha de la
campana.
Entonces, como la tabla acumula desde la izquierda, buscamos la probabilidad más cercana al 80 %, es decir, la probabilidad más cercana a 0,8 (recuerda
que la tabla se recorre de izquierda a derecha, fila por fila). Por lógica el 0,8 tendrá que estar en la segunda parte de la tabla donde los valores de z son
positivos.
Los valores más cercanos encontrados son 0,7995 para z=0,84 y 0,8023 para z=0,85
Respuesta: existe un 0,20 de probabilidad de que una familia consuma más de 272,08 KW.
http://halweb.uc3m.es/esp/Personal/personas/mwiper/docencia/Spanish/GC/guardia%20civil/lecture%20notes/class15.pdf
En una distribución normal con una desviación estándar de 5, la probabilidad de que una observación elegida al azar exceda 21 es de 0,14.
b) Calcula el valor por debajo del cual se halla el 4 % de los valores de la distribución.
SUBMIT
En internet tienes muchas herramientas con las que puedes controlar tus ejercicios o ver cómo varían las curvas según la desviación estándar o la media. Es muy interesante
poder interactuar con estos programas.
Además, puedes buscar las áreas bajo la curva con el Microsoft Excel, en la sección de funciones. Hasta puedes llegar a generar una tabla tú mismo.
También la aplicación Geogebra es muy ágil y didáctica para trabajar online para verificar lo que desees, aquí te dejamos la dirección:
https://www.geogebra.org/classic#probability
Otro sitio muy interesante es el de proyecto descartes. Tienes una simulación para construir una tabla de la distribución normal, además de poder interactuar con los valores de z
y las probabilidades correspondientes: https://proyectodescartes.org/miscelanea/materiales_didacticos/Normal(1,0)-JS/index.html
LECCIÓN 4 de 7
La tasa de actividad (porcentaje de la población de diez años o más que se encuentra económicamente activa) en la Ciudad Autónoma de Buenos Aires es del 50,4 % (Dirección
General de Estadística y Censos-Ministerio de Economía y Finanzas GCBA, s. f., https://bit.ly/3f3i0oK). Una ONG, realiza una selección aleatoria de 1000 de las que están
activas. Desea averiguar los siguientes datos basados en dicha muestra:
Cuando en un experimento binomial el número de ensayos n es tan grande que no está en la tabla de la distribución binomial o se hace dificultoso realizar los cálculos, dicha
distribución puede ser resuelta, por aproximación, con la distribución normal. Algunos autores mencionan la condición de que la probabilidad de éxito debe ser cercana a 0,5,
pero no es excluyente.
1 En primer lugar, deben darse en el experimento todas las condiciones de la distribución binomial estudiadas en la lectura 2.
n: número de ensayos
p: probabilidad de éxito
μ=n.p
σ=√(n.p.q)
Recuerda que:
en una distribución de probabilidad continua, las probabilidades se calculan como el área bajo la curva de la función de densidad correspondiente.
También es cierto que en una distribución de probabilidad continua la probabilidad de la variable aleatoria puntual es cero.
Entonces, para aproximar una distribución binomial, que es de variable discreta, a la distribución normal, hay que tener en cuenta el factor de corrección
por continuidad, que es ± 0,5. Este se suma o se resta a la variable aleatoria según el caso.
Lo vamos a explicar de la siguiente forma: cuando se nos pide la probabilidad de 15 éxitos exactamente, el área bajo la curva a integrar (o buscar en la
tabla) comprende el intervalo 14,5 a 15,5 para disminuir el error de aproximación. Recordemos que la binomial es una distribución de variable discreta y
perfectamente puede quererse calcular la probabilidad de una variable aleatoria discreta cualquiera.
Entonces P(x=15) de una distribución binomial con variable discreta, se aproxima mediante el cálculo de P(14,5≤x≤15,5) a una distribución normal con
una variable aleatoria continua.
Se muestran los cinco casos que pueden darse al resolver una binomial, por aproximación a la normal: supongamos que x=15.
x=15 se calcula el área restando y sumando 0,5. Luego, se resta el área mayor menos el área menor. Es decir, se estandariza x=14,5 y x=15,5
5
Ejemplo 3
En un comercio de impresiones gráficas están detectando que, aproximadamente, en el 30 % de las impresiones realizadas con una de sus impresoras hay algún defecto.
Si se realiza una prueba con la impresora que desliza errores y, de todas las impresiones realizadas en una semana, se eligen 80 impresiones aleatoriamente, se quiere
determinar:
1 ¿Cuál es la probabilidad de que en la muestra se encuentren como máximo 20 impresiones con errores?
2 ¿Cuál es la probabilidad de que en la muestra se encuentren por lo menos 50 impresiones con errores?
En primer lugar, verificamos que se trata de una distribución binomial, Bin (80; 0,30)
Se cumplen las condiciones, por lo tanto, podemos hacerla por aproximación a la normal.
Estandarizamos x=20,5
P(z≤-0,85)=P(x≤20,5)=0,1977
La probabilidad de que en la muestra se encuentren como máximo 20 impresiones con errores es de 0,1977.
Esta binomial, por Excel, da 0,1978. Como verás, da con muy buena aproximación.
b) P(x≥50)
Calculamos con el factor de corrección de continuidad, pero en este caso se le resta a 50, porque buscamos el área mayor a ese número. Calculamos
Estandarizamos x=49,5
Buscamos en la tabla de la normal acumulada y vemos que z = 6,22 no figura. Si no figura un valor z positivo, es porque a su izquierda la probabilidad es
1. Pues ya por z=3,7 aproximadamente es 1. Recuerda que la tabla acumula desde la izquierda. Pero lo que tenemos que calcular es:
P(z≥6,22)=1-P(z<6,22)=1-1=0
O lo que es lo mismo:
P(x≥49,5)=1-P(x<49,5)=1-1=0
La probabilidad de que en la muestra se encuentren por lo menos 50 impresiones con errores es de 0. Haciendo la binomial en Excel también da cero.
c) P(9,5≤x≤10,5) Acá se piden encontrar exactamente 10 impresiones con errores.
Aquí tenemos que hacer algunas aclaraciones: la tabla muestra desde z=-3 porque considera que a la izquierda todas las probabilidades son cero. Pero en
otras tablas los autores inician en -3,5, como, por ejemplo, la tabla que se muestra en el recurso multimedia (Variables continuas: la distribución normal).
Si te fijas en esa tabla, el valor de probabilidad para z=-3,29 es 0,0005, que, en notación científica, es 5 .10-4 .
En este curso dijimos que tomaríamos las probabilidades hasta la cuarta cifra decimal, es por eso por lo que así la hemos considerado en este ejemplo. Pero no está mal si
consideras que el resultado es cero. Si en algún examen o trabajo práctico se te presenta esta situación, considera la respuesta más cercana a cero.
En conclusión, P(9,5≤x≤10,5)=0
Haciendo la binomial en Excel da 0,0001, es muy buena la aproximación, aunque tomáramos 0,0005 como resultado de la aproximación.
d) E(x)=n.p=80×0,30=24
En primer lugar, verificamos que se trata de una distribución binomial, Bin (1000; 0,504) n=1000 y p=0,504 población activa
Estudiemos si se cumplen las condiciones n.p ≥ 5 y n.q ≥ 5
Se cumplen las condiciones por lo tanto podemos hacerla por aproximación a la normal.
E(x)=n.p=504
P(519,5≤x≤520,5)
Buscamos en la tabla:
Haciendo la binomial en Excel da 0,0151. Esta es una aproximación aceptable, la diferencia es 0,0008.
P(x>520) en la aproximación en este caso le sumamos la corrección por continuidad 0,5 por ser una restricción de mayor solamente. Entonces calculamos:
P(x≥520,5)
P(z<1,04)=0,8508
O lo que es lo mismo:
P(x≥520,5)=0,1492
La probabilidad de que en la muestra haya por lo menos 520 personas activas es de 0,1492.
Haciendo la binomial en Excel da 0,1486, una diferencia por aproximación muy pequeña de 0,0006.
LECCIÓN 5 de 7
En un peaje a la Ciudad de Carlos Paz desde Córdoba, pasan en promedio 70 móviles en una hora. Este promedio fue calculado el último fin de semana largo que tuvo la
provincia. La Agencia Córdoba Turismo se pregunta cuál es la probabilidad de que en una hora tomada al azar se registren, en dicho peaje, menos de 55 móviles el próximo fin
de semana.
También podemos aproximar la distribución de Poisson a la Normal cuando λ ≥ 10. Aclaramos que la distribución sigue siendo de Poisson, una distribución de variable
aleatoria discreta con n finito, como en la binomial. Pero, si λ es lo suficientemente grande, la gráfica se va aproximando a una curva normal. Además, la aproximación se hace
por practicidad, ya que los errores por la aproximación son muy pequeños.
Ya dijimos la condición λ≥10. Si la vamos a tratar como una normal, necesitamos la media y la desviación estándar, que son las siguientes:
μ=λ
σ=√λ
Una vez calculados estos parámetros, se procede a la estandarización de la variable aleatoria y a calcular la probabilidad solicitada. Por ejemplo, una Poisson (16) es
aproximadamente una Normal (16, 4).
Por supuesto que, con la planilla Excel u otra aplicación en línea, podemos calcular las probabilidades de los modelos estudiados y eso sería lo más exacto, pero muchas veces
tendremos que realizar los cálculos solo con una calculadora y manualmente, por lo que no está de más saber cómo son los procedimientos de aproximación.
Te recomendamos esta lectura como resumen de las aproximaciones estudiadas hasta aquí. Pero lo interesante y novedoso es que este es un enfoque empírico. No hay que
resolver ningún problema. Solo se comparan las transformaciones que se producen en las distintas distribuciones cuando se dan ciertas condiciones y van transformándose en
normal. Es decir, te darás cuenta del porqué pueden utilizarse las aproximaciones con solo observar los gráficos.
morettini.2013.pdf
p
466.9 KB
Fuente: Morettini, M. (2013). Aproximaciones de distribuciones de probabilidad: enfoque empírico. Recuperado de http://nulan.mdp.edu.ar/2040/1/morettini.2013.pdf
Podemos resolver este caso por aproximación de Poisson a la normal. Claramente, es una distribución de Poisson, pero λ > 10 no está en la tabla y los cálculos serían tediosos.
σ=√λ=√70=8,37
Entonces P(λ=70)≈N(70;8,37)
¿Cuál es la probabilidad de que en una hora tomada al azar se registren —en dicho peaje—, como máximo, 55 móviles el próximo fin de semana?
Como lambda está dado en una hora y la variable aleatoria pregunta sobre una hora tomada al azar, no hay que hacer ninguna transformación de lambda.
Estandarizamos x=55:
P(x<55)=P(z<-1,79)=0,0367
En una hora tomada al azar, la probabilidad de que se registren como máximo 55 vehículos es de 0,0367, en el próximo fin de semana.
En la siguiente actividad debes asociar lo que caracteriza a cada distribución y lo que se requiere para aproximarla a la normal.
Distribución normal
Aproximación de la binomial
a la normal
p es cercano a 0,5
Aproximación de Poisson a la
normal
λ ≥ 10 µ=λ=E(x)
σ=√λ
LECCIÓN 6 de 7
Distribución normal
–
En esta lectura, el alumno reconociste las características de una distribución normal con profundidad. Resolviste problemas utilizando diferentes tipos de tablas de la distribución normal.
Conociste la fórmula de estandarización y comprendiste la utilidad de esta distribución en la vida diaria. También, aprendiste a utilizar otros modelos como aproximaciones.
LECCIÓN 7 de 7
Referencias
Anderson, David R., Sweeney, Dennis J. y Williams, Thomas A. (2008). Estadística para Administración y Economía. Ciudad de México, MX: Cengage Learning Editores,
S. A.
Dirección General de Estadística y Censos-Ministerio de Economía y Finanzas GCBA. (s. f.) ETOI. 3.o trimestre de 2019. Recuperado de
https://www.estadisticaciudad.gob.ar/eyc/wp-content/uploads/2019/12/ir_2019_1415.pdf
Levin, R. y Rubin, D. (2012). Estadística para Administración y Economía. Ciudad de México, MX: Pearson.