Mathematics">
Nothing Special   »   [go: up one dir, main page]

Probabilidad 2019

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 49

Probabilidad y Distribuciones de probabilidad

 El cálculo de probabilidades suministra las


reglas para el estudio de los experimentos
aleatorios o de azar, constituyendo la base
para la estadística inductiva o inferencial.
Experimentos aleatorios y no aleatorios

Se denominan experimentos deterministas aquellos que realizados de la


misma forma y con las mismas condiciones iniciales, ofrecen siempre el
mismo resultado.

v = (2 g h)½

Un experimento en el que no se puede predecir el resultado final, se


denomina experimento aleatorio.
Este es el caso cuando en lanza un dado y se observa el resultado.
Experimentos y sucesos aleatorios

Diremos que un experimento es aleatorio si se verifican las


siguientes condiciones:
1. Se puede repetir indefinidamente, siempre en las mismas
condiciones;

2. Antes de realizarlo, no se puede predecir el resultado que se


va a obtener;

3. El resultado que se obtenga, e, pertenece a un conjunto


conocido previamente de resultados posibles.

A este conjunto, de resultados posibles, lo denominaremos espacio


muestral y lo denotaremos mediante la letra S.
Espacio muestral y suceso

Los resultados de una prueba constituyen los elementos del espacio


muestral S y se denominan sucesos elementales ei con i=1,…..,n

S = { e1, e2,……….en}

Cualquier subconjunto de S será denominado suceso aleatorio

En el experimento de lanzar un dado, el espacio muestral incluye los


siguientes resultados

S = { 1, 2,3,4,5,6} A y B son sucesos aleatorios

Cualquier subconjunto de S será denominado suceso aleatorio

Ej. A = { Par} , B= { 1,5}

Como podemos calcular P (A) ?


Noción frecuentista de probabilidad

En los experimentos aleatorios se comprueba que cuando el número de experimentos


aumenta, las frecuencias relativas con que ocurre cierto suceso A, fr(A),

fr(A) = número de veces que ocurre A / n(nº total de pruebas)

tiende a converger a un valor que denominamos probabilidad de A. A este enfoque se


denomina noción frecuentista de probabilidad.

P[A] = lim n∞ fr(A)

La noción frecuentista de probabilidad no puede usarse en la práctica como definición


de la probabilidad por que:

• Requiere un nº ∞ de experimentos
• Hay experimentos que no pueden realizarse en la práctica
Probabilidad de Laplace

Se calcula la probabilidad de un suceso aleatorio A, según la regla de


Laplace como el cociente entre el número de casos favorables a A (nA =
nº de veces que se “presenta el suceso A”), y el de todos los posibles
resultados de experimento (n):

P[A] = n / n
A

Esta definición exige que todos los resultados sean igualmente probables

P (Par) = P(A) = 3/6


Definición Axiomática de Probabilidad

 Ax-1. La probabilidad es una función definida sobre A y que sólo toma


valores positivos comprendidos entre 0 y 1.

0≤P[A]≤1

 Ax-2. La probabilidad del suceso seguro es 1 P[E] = 1

 Ax-3. La probabilidad de la unión numerable de sucesos disjuntos es la


suma de sus probabilidades : A1,A2,...,An,... ∈A
Cálculo de Probabilidades

Sean A y B dos sucesos aleatorios de probabilidades no nula, P[A] y


P[B] > 0.
Se define la probabilidad de la unión de A y B como a P (AỤB) y se
calcula como

P (AỤB) = P (A)+ P(B) - P(A∩B)

Esta expresión evalúa la probabilidad que ocurra A o B o ambos


Probabilidad condicionada

Sea B S un suceso aleatorio de probabilidad no nula, P[B] > 0.


Para cualquier otro suceso A incluido S, llamamos probabilidad
condicionada de A a B (A dado B) a la cantidad que representamos
mediante

P[A|B] = P (A∩B) /P(B)

Esta expresión evalúa como el conocimiento de la ocurrencia de B


modifica la probabilidad del suceso A
Probabilidad condicionada e independencia de sucesos

Independencia

Según la definición de probabilidad condicionada, se puede escribir la


probabilidad de la intersección de dos sucesos como

P (A∩B)= P(A) P(B/A)= P(B) P (A/B)

Si son independientes A y B entonces

P (A∩B)= P(A) P(B)


Probabilidad condicionada e independencia
de sucesos

Problema 1:

Demostrar que los sucesos DESNUTRIDO (D) Y PARASITADO (P) no


son independientes

Estado Nutricional

Parasitosis Sobrepeso Eutrófico Desnutrido Total

Parasitados 8 82 11 101

No Parasitados 9 45 5 59

Total 17 127 16 160


Probabilidad condicionada e independencia
de sucesos

Problema 1:

P(D) =DESNUTRIDO
P (P) = PARASITADO

P(D) = nD/n = 16/160 P (P) = nP/n = 101/160

Si P (D∩P) ≠ P(P) P(D) P y D son dependientes, en caso

contrario son independientes.

P (D∩P)=nD∩P/n=11/160

Como 11/160 ≠ 16/160x 101/160 D y P son dependientes


Teoremas fundamentales del cálculo de probabilidades

Teorema de la probabilidad compuesta, teorema de la probabilidad

total y teorema de Bayes.

Reglas de cálculo de probabilidades básicas

 Unión

P[AUB] = P(A)+P(B)-P(A∩B)

 Probabilidad del suceso contrario (complementario)

P[A´] = 1 − P[A]

 Probabilidad condicionada del suceso contrario:

P( A / B)  1  P( A / B)
S

Teoremas fundamentales del cálculo de probabilidades


 Teorema de la probabilidad total.

Sea A1,A2, . . . ,An es un


S
sistema exhaustivo y excluyente

 S
n
Ai  A j 
P(B)= P (A1 B)  1P (A2 B)  ......  P (A3 B) =

Para todo B , P[B] = ∑ P[B|Ai ] · P[Ai]

 S
Teorema de Bayes

Sea A1,A2, . . . ,An un sistema exhaustivo y excluyente de sucesos.

Sea B E un suceso del que conocemos todas las cantidades P[B|Ai ],


S
i = 1, . . . , n, a las que denominamos verosimilitudes. entonces se verifica:

 SP[Aj/B] = P[B/Aj] P (Aj) / P(B)


Teorema de Bayes
Teorema de Bayes

Problema 2:
Se dispone de la siguiente información obtenida a partir de un estudio de
“cohorte”, llevado a cabo durante 5 años, con individuos mayores de 60
años, con el fin de evaluar la aparición de cataratas.
Cuadro Nº V.2
Grupo de Edad Nº de Nº de Individuos
Individuos con catarata
60 – 64 (A1) 2250 54
65 – 69 (A2) 1400 65
70 – 74 (A3) 1000 88
> 75 (A4) 350 54
Totales 5000 261

d) La probabilidad que un individuo de esta población sufra de cataratas en los próximos 5


años=P(C)

e) Si a un individuo al cual se le diagnosticó catarata, a que grupo de edad tiene mayor


probabilidad de pertenecer (Probabilidades a posteriori) = P(Ai\C)
Teorema de Bayes

La probabilidad que un individuo de esta población sufra de cataratas en los próximos 5 años=P(C)

Solución

C= sufre de catarata Ai= grupo etario Ai


Datos:
P(A1)= 2250/5000= 0,45 P(A2)=0,28 P(A3)=0,20 P(A4)=0,07

P(C/A1)= 54/2250= 0,024 P(C /A2)=0,046 P(C/A3)=0,088 P(C/A4)=0,154

La probabilidad pedida resulta (aplicando el teorema de la probabilidad total)

P(C)= P(CΩA1)+ P(CΩA2)+ P(CΩA3)+ P(CΩA4)

= P(C/A1) P(A1)+ P(C/A2) P(A2)+ P(C/A3) P(A3)+ P(C/A4) P(A4)

= 0,45x0,024+ 0,28x0,046+0,20x0,088+ 0,07x0,154 =0,052


Teorema de Bayes

Si a un individuo al cual se le diagnosticó catarata, a que grupo de edad tiene mayor


probabilidad de pertenecer (Probabilidades a posteriori) = P(Ai\C)

Para responder a esta pregunta hay que calcular P(Ai/C) para cada grupo etario
(aplicando el teorema de Bayes)

P(A1/C)= P(A1) P(A1/C) / P(C) = 0,45x0,024 / 0,052 = 0,21

P(A2/C)= P(A2) P(A2/C) / P(C) = 0,28x0,046 / 0,052 = 0,247

P(A3/C)= P(A3) P(A3/C) / P(C) = 0,20x0,088 / 0,052 = 0,338

P(A4/C)= P(A4) P(A4/C) / P(C) = 0,07x0,154 / 0,052 = 0,207

e
Distribuciones de probabilidad

Distribuciones de variables aleatoria discreta

 Binomial

 Poisson

 Hipergeométrica

Experimento Bernoulli

Consiste en un experimento aleatorio único que se considera un éxito si


se da el resultado de interés y de fracaso en caso contrario

p= prob éxito q= prob fracaso

Se podría definir este experimento mediante una v.a. discreta X que toma
el valor X = 0 si es fracaso y X = 1 en caso contrario, y que se denota
X~Ber (p)
Distribuciones de probabilidad

Distribución Binomial

 Es una de las distribuciones de probabilidad de variable discreta más


útiles que permite describir una variedad de procesos de interés

 Sus áreas de aplicación incluyen el control de calidad,


mercadotecnia, medicina, encuestas de opinión, etc.

 Para explicitarlo debemos considerar un experimento consistente en


una serie de pruebas, cuyo resultado puede clasificarse de "éxito" o
"fracaso" en función de la aparición o no de un evento o suceso de
interés cuya probabilidad es p ( éxito)
Distribución binomial

 Nuestro interés se centra en determinar la probabilidad de obtener r éxitos


en n prueba

Para calcularlo utilizaremos la siguiente expresión

P ( X  r )  nCr. p r q nr

El producto pr qn-r corresponde a la probabilidad de obtener exactamente r


éxitos , en n pruebas en una sucesión particular, mientras que el término nCr
indica cuantas sucesiones o arreglos de los r éxitos en n pruebas son posibles.
Por lo tanto, dados el número de pruebas n y la probabilidad de éxito p, se
puede determinar la probabilidad de obtener r= 0, 1, 2, ..... n éxitos utilizando la
expresión anterior.
Distribuciones binomial

Los problemas a resolver pueden plantear las siguientes situaciones para un


experimento consistente en n pruebas

1. P(r=2)  nC 2. p 2 q n  2

2. P(r≤3)= P(r=0)+P(r=1)+P(r=2)+P(r=3) (acumulada hasta 3)

3. P(r≥ 8)= P(r=8)+P(r=9)+……..+P(r=n) =1-[P(r=0)+P(r=1)+……+P(r=7) ]

4. P(3≤r≤5)= P(r=3)+P(r=4)+P(r=5)

Cada uno de estos puntos pueden ser resueltos :


- manualmente
- mediante la tabla de distribución binomial
- Utilizando el programa STATGRAPICHS
Distribuciones binomial

 Veamos las respuestas para n=10 y p=0,50 (probabilidad de cara en el


lanzamiento de una moneda )

1. P(r=2)= 10C2 (0,50)2 (0,5) 10-2=8 =45 (0,50) 10=0.0439

En la tabla se selecciona n=10 y la columna de p=0,5

Para cada valor de r de 0 a 10 la tabla da valores de probabilidades


acumuladas, de modo que para r=2 el valor 0,0547 es en realidad
P(r≤2)=P(r=0)+P(r=1)+P(r=2)

Que puede ser escrita como

P(r≤2)=P(r ≤ 1)+P(r=2) de donde resulta

P(r=2)= P(r≤2)-P(r ≤ 1)= 0,0547-0,0107=0,044


Distribuciones binomial

P(r≤3)= P(r=0)+P(r=1)+P(r=2)+P(r=3) (acumulada hasta 3)

= 0,1719

P(r≥ 8)= P(r=8)+P(r=9)+P(r=10) =1-[P(r=0)+P(r=1)+……+P(r=7) ]

= 1- P(r ≤7) = 1-0,9453=0,0547

P(3≤r≤5)= P(r=3)+P(r=4)+P(r=5)=P(r≤5)-P(r≤2)

=0,6230-0,0547=0,5683

La resolución de este problema utilizando el STATGRAPICHS se


explicará en clase
Distribuciones binomial

- mediante la tabla de distribución binomial

tablaspedro.pdf
Distribuciones binomial

Problema 3: Hallar la probabilidad de contestar correctamente :


-exactamente 6
- y al menos 6 de las 10 preguntas de un examen falso, verdadero.

 a) mediante el uso de la formula de la distribución binomial



 b) con el uso de la tabla binomial
Distribuciones binomial
 Problema 4 : Un laboratorio afirma que una droga causa de efectos secundarios
en una proporción de 3 de cada 100 pacientes. Para contrastar esta afirmación,
otro laboratorio elige al azar a 5 pacientes a los que aplica la droga. ¿Cuál es la
probabilidad de los siguientes sucesos?
 1. Ningún paciente tenga efectos secundarios.
 2.Al menos dos tengan efectos secundarios.
 3.¿Cuál es el número medio de pacientes que espera laboratorio que sufran
efectos secundarios si elige 100 pacientes al azar?

 Problema 5: En unas pruebas de alcoholemia se ha observado que el 5% de los


conductores controlados dan positivo en la prueba y que el 10% de los
conductores controlados no llevan puesto el cinturón de seguridad.
 También se ha observado que las dos infracciones son independientes.
 Un inspector de transito efectúa un control de cinco conductores al azar.
Distribuciones binomial

Determinar :
 1. la probabilidad a de que exactamente tres conductores hayan
cometido alguna de las dos infracciones
 2. probabilidad de que al menos uno de los conductores controlados
haya cometido alguna de las dos infracciones.

utilizando

 a) la formula de la distribución binomial

 b) con el uso de la tabla binomial


Distribuciones de probabilidad
Distribución de Poisson

Se refiere a eventos aleatorios ocurren de manera independiente con


una velocidad constante en el tiempo o en el espacio (en un continuo).

Ejemplos: número de llamadas telefónicas recibidas en una central,


número de glóbulos rojos o blancos por cuadrícula en una cámara de
recuento, demanda de servicios médicos en una institución de salud,
número de colonias en un cultivo, etc.

Puede considerarse como una forma límite de la distribución binomial


cuando n   y p  0, es decir muestras grandes y sucesos raros

La probabilidad se calcula como:


P (X=r) = e-λ λr /r!
Distribución de Poisson

 Uso de tablas

 Medidas de tendencia central y de dispersión para la distribución

=np= 2 = np =  =número promedio o esperado de éxitos por

intervalo

Las suposiciones o hipótesis en que se basa este modelo son:

 Los n ensayos son independientes.


 La probabilidad del evento es pequeña y constante dentro del intervalo
 La media de la distribución  =  = np es relativamente pequeña
comparada con el número de acontecimientos posibles dentro del
intervalo.
Distribución de Poisson

 Uso de tablas

tablaspedro.pdf
Distribución de Poisson

 Problema 6: Tres de cada 10000 pacientes a los que se les suministra


un medicamento sufren reacciones alérgicas cutáneas

 ¿Cuál es la probabilidad que dos pacientes sufran reacciones?.

 ¿Cuál es la probabilidad que como máximo tres personas sufran


reacciones ?
Distribuciones de probabilidad
Distribución hipergeométrica

En el control de calidad de productos e insumos, en la mayoría de los


casos una inspección del lote completo resulta poco práctica ya sea
por razones de costo, tiempo o porque el ensayo a que debe ser
sometido el elemento para verificar su calidad es de tipo destructivo.

En lugar de eso, se inspecciona una parte o muestra del lote y la


decisión de rechazar o aceptar el mismo se realiza en función de los
resultados obtenidos para dicha muestra.

 muestreo se realiza sin reemplazamiento


 La probabilidad de éxito no es constante
Distribución hipergeométrica

El cálculo de obtener r piezas que no cumplen con los requisitos de


calidad, cuando se extrae una muestra de tamaño n, a partir de un lote
con un total de piezas igual a N en el que se postula la existencia de
un total de R piezas defectuosas se realiza utilizando la ecuación :

( N  R ) C ( n  r )*. RCr
PH (n / N , R, p)  NCn

Distribuciones binomial e Hipergeométrica se ocupan de lo mismo


Lo que cambia es la forma como se obtienen los datos
Distribución hipergeométrica

Problema 7: En una caja que contiene 50 frascos de suero control


liofilizado, de los cuales se postula que hay 2 con cierre no hermético, se
elige al azar una muestra de 10 frascos.

 ¿Cual es la probabilidad de encontrar uno fallado?


 ¿Cual es la probabilidad de encontrar a lo sumo 2 con fallas?
Distribución hipergeométrica

PH (1 / 50,2,10)  ( 48) C ( 9 )*.2 C1


50C10  0,3167

PH (0 / 50,2,10)  ( 48) C (10 )*.2 C 0


50C 10  0,649

PH (2 / 50,2,10)  ( 48) C ( 8 )*.2 C 2


50C10  0,0339
Distribución hipergeométrica

 De acuerdo a las probabilidades obtenidas el resultado que


se va a presentar con mayor frecuencia es el de ningún
frascos con cierre no hermético en la muestra de control
 La presentación de dos frascos con cierre no hermético es
el de menor probabilidad y no debería presentarse en un
único muestreo (no es imposible, pero es muy poco
probable)
Distribuciones de probabilidad de variables continuas
Distribución Normal

 Es la más importante y la de mayor uso

Es importante en la estadística por tres razones principales:

a) hay muchos fenómenos en los que intervienen variables aleatorias continuas


que siguen la distribución normal,

b) la distribución normal se puede utilizar como una aproximación a diversas


distribuciones de probabilidad de variables discretas, y con ello, evitar la
realización de cálculos tediosos

c) la distribución normal constituye la base de la inferencia estadística clásica


Distribución normal

Fig. IV.1

-  Z=1.28 +

(t  ) 2
x 1

2 2
P(X x) =F (x; ,) = 1
e dt
2  
Distribución normal

 El cálculo de P (Xx) = P (Zz) equivale a determinar el área delimitada por


la curva normal (0,1) y los valores de abscisas -  y Z.

Calculándose Z = (X- ) /  (*)

Problema Nº 11: Las concentraciones de fluoruros en el agua de consumo


presentado en el Cuadro II.3 distribuye normal con parámetros =0.76 mg/l y
=0.335 mg/l y estamos interesados en calcular la probabilidad que la concentración
sea inferior o igual una valor particular X1= 1.19 mg/l.

 Para el calculo de esta probabilidad se debe proceder de la siguiente manera:


- Obtener el valor de Z1 correspondiente a X1 = 1,19 por medio de la ecuación (*)
- evaluar la probabilidad como el área entre -∞ y el valor de Z1= 1,28 calculado
Distribución normal
 Dicha probabilidad se ubica en la tabla, descomponiendo el valor Z1 = 1.28 en dos
partes, una que corresponde al primer dígito y la primera cifra decimal, es decir 1.2
y la otra que corresponde a la segunda cifra decimal expresada como 0.08.
En la intersección de la fila correspondiente al valor 1,2 y la columna 0.08 se obtiene el valor
de la probabilidad entre -∞ y el valor de z=1,28

 P (X≤ 1.19) = P(Z ≤ 1.28) = 0.89


Fig. IV.2

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.5000 0.4960 .......... ............ ........... ............ ............ ........... ........... 0.4641

.......... ........... ........... ............ ............ ............ .......... ............ ............. ............ .........

1.2 ........... ........... ............ ............ ............ .......... ............ ............. 0.1003 .........
Distribución normal

 Uso de tabla

tablaspedro.pdf
Distribución normal

Problema 12: Los valores de colesterol en una determinada población


tienen una distribución normal X ~N(160 mg/100ml , 20 mg/100 ml).

Calcular la probabilidad que una persona seleccionada al azar en dicha


población tenga un nivel de colesterol:

 menor a 200 mg/100 ml


 mayor de 225 mg/100 ml
 entre 150 y 220 mg/100 ml
Distribución normal

 menor a 200 mg/100 ml

P (X200) = P (Z 2)= 0,977

 mayor de 225 mg/100 ml

P (X≥225) = P (Z≥ 3,25)= 1-0,9994= 0,0006

 entre 150 y 220 mg/100 ml

P (150X200) = P (-0,50Z 3)= (0,6912+0,9986)-1=0,6898


Distribución normal
Problema Nº 13: Cuando se quiere calcular la probabilidad que la
media de los valores de colesterol en una muestra de 4
observaciones sea mayor a 200 mg/100 ml

( X  )
Z 
n

X
Se calcula un valor de

y se obtiene el valor la probabilidad como

 P ( ≥200) = P (Z≥6)= 0,99997=0,00003 (3 en cada 100000)


Aproximaciones de las distribuciones de probabilidad
de variables discreta mediante la distribución normal
 Aproximación normal a la Binomial
( X  ) ( X  np )
Se tiene que calcular Z mediante Z 

npq

Problema 14: En un examen realizado para determinar la fórmula leucocitaria


diferencial se observan 100 glóbulos blancos seleccionados aleatoriamente
clasificándolos en 5 categorías: 1) basófilos 2) eosinófilos 3) monocitos,4)linfocitos
y 5) neutrófilos.

Asumiendo que un individuo sano tiene las siguientes proporciones en cada una de
las categorías : 1) basófilos (0.5 %) 2) eosinófilos (1.5 %) (3) monocitos, (4.0 %)
4) linfocitos (34.0 %) y 5) neutrófilos (60.0 %) .
Aproximación normal a la binomial

 Un exceso en el nº de linfocitos es consistente con varias formas de infecciones


virales, tales como una hepatitis. Cual es la probabilidad que un individuo sano
tenga 40 o más linfocitos?
 Un exceso en el nº de eosinófilos es muchas veces síntoma de una violenta
reacción alérgica. Cual es la probabilidad exacta que un individuo sano tenga 5 o
más eosinófilos?
 Cuantos linfocitos tendrían que aparecer en una prueba diferencial para
considerar que los valores de referencia han sido superados?
 Un exceso de neutrófilos es consistente con varios tipos de infecciones
bacterianas. Suponga que un adulto tiene x neutrófilos. Que tan grande deberá
ser este valor si la probabilidad que un individuo normal supere dicho valor es
menor o igual 0.05
Aproximación normal a la binomial

Problema 15: Hallar la probabilidad de que un estudiante en un examen


falso-verdadero conteste correctamente:

 a) 12 o más de un total de 20,


 b) 24 o más de un total de 40 preguntas.
Aproximaciones de las distribuciones de probabilidad
de variables discreta mediante la distribución normal
 Aproximación a distribución de Poisson

Se tiene que calcular Z mediante


( x  )
Z

Ejemplo: Considere la distribución del nº de colonias en una caja de Petri de
área A.
Asumiendo que la probabilidad de observar x colonias se calcula
exactamente utilizando las distribución de Poisson con parámetro  =10,
(10 colonias / 100 cm2).

Calcular :
 la probabilidad de observar 20 o mas colonias en dicha superficie?
 que tan usual puede considerarse el resultado obtenido?

También podría gustarte