Nothing Special   »   [go: up one dir, main page]

Apuntes Estadistica P2

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 48

____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos

65



DISTRIBUCIONES DE PROBABILIDAD
FUNDAMENTALES





















Para qu?
Para conocer y explotar el hecho de que la mayora de los fenmenos,
bien responden a determinados patrones, que denominamos
distribuciones de probabilidad fundamentales o bien es posible,
mediante artificio matemtico, reducirlos a dichas distribuciones, lo
que nos permite predecir sucesos, establecer comparaciones entre ellos
y dar un paso decisivo (ms bien un autntico salto cualitativo) en el
proceso de toma de decisiones.





Teodoro
Rodriguez
Digitally signed
by Teodoro
Rodriguez
DN: cn=Teodoro
Rodriguez,
o=Colegio
Marista Cristo
Rey, c=US
Date: 2002.08.24
08:54:24 +02'00'
Signature
Not Verified
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos

Distribuciones de Probabilidad fundamentales

Variable aleatoria

Definicin: Sea E el espacio muestral asociado a un experimento aleatorio. Se
denomina variable aleatoria a toda aplicacin del espacio muestral E en un
subconjunto de los nmeros reales.
i i
x s
S E X

:

Definicin: Una variable aleatoria se dir discreta, si toma un nmero finito o infinito
numerable de valores.
Definicin: Una variable aleatoria se dir continua, si toma infinitos valores en un
intervalo de la recta real.

Funcin de densidad de probabilidad y funcin de distribucin de probabilidad

Definicin: Funcin de Distribucin
Dada una variable aleatoria , se define la funcin de distribucin de como sigue:
= x x P x F ) ( ) (
Es decir, la funcin de distribucin asigna a cada nmero real x la probabilidad
acumulada hasta dicho valor.
Propiedades:
i. 0F(x)1 , es decir, la grfica de una funcin de distribucin est
siempre en la franja (0,1)
x
ii. ) ( ) ( ) ( a F b F b a P b a =
iii. La funcin de distribucin es continua por la derecha en todo punto. No
puede afirmarse lo mismo respecto a la izquierda, ya que para una variable
discreta, se trata de una funcin escalonada.

Definicin: Funcin de Densidad (Variable Discreta)
Sea una variable discreta que puede tomar los valores x
1
,.......,x
n
; se denomina
funcin de densidad o cuanta a la funcin f(x) que asigna a cada valor de la variable,
la probabilidad de que ocurra:
) ( ) (
i i
x P x f = =
Propiedades:
i.
i i
x x f 1 ) ( 0
ii.

=
=
n
i
i
x f
1
) ( 1
66
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
67
1 iii. Si x recorre un infinito numerable

=
=
1
) (
i
i
x f

Definicin: Funcin de Densidad (Variable Continua)
Se dice que f(x) es una funcin de densidad de probabilidad o simplemente una
funcin de densidad de la variable aleatoria continua, si se verifica:


= < =
b
a
dx x f b x a P dx x f x x f ) ( ) ( ; 1 ) ( ; 0 ) (


En la igualdad anterior, es indistinto usar < o ya que el valor de la integral no
vara.

Relacin entre funcin de densidad y distribucin

- Variable discreta
Dada f(x
i
), funcin de densidad, puede obtenerse la funcin de distribucin
como sigue:

=
=
j
i
i j
x f x F
1
) ( ) (
Anlogamente, si F(x
j
) es conocida, puede obtenerse la funcin de densidad
como sigue:
) ( ) ( ) (
1
=
j j j
x F x F x f
- Variable continua
Conocida f(x) funcin de densidad, puede obtenerse la funcin de
distribucin F(x) como sigue:


=
x
dx x f x F ) ( ) (
Anlogamente, si F(x) es conocida, puede obtenerse f(x) haciendo:
) ( ' ) ( x F x f =

Teorema de Chebyshev
Hemos visto anteriormente que la varianza es una medida de la desviacin de los
datos con respecto a la media.
Chebyshev, matemtico ruso, enunci y demostr un teorema que da una estimacin
de la probabilidad de que una variable aleatoria se desve de la media menos de k
desviaciones tpicas. Se enuncia como:
| |
2
1
1
k
k k P + > <
Y es vlido para variables discretas y continuas.

____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos

Parmetros de una variable aleatoria discreta

Definicin: Se denomina media o Esperanza Matemtica de la variable aleatoria X, y
se denota como E(X) o al sumatorio:

=
= + + =
n
i
i i n n
p x p x p x
1
1 1
.........
Definicin: La varianza de una variable aleatoria X, se denota como y su clculo
responde a la expresin:
2

i
n
i
i n n
p x p x p x ) ( ) ( ........ ) (
1
1 1
=
= + + =
Definicin: La desviacin tpica de la variable X, se denota como y se calcula
como:

=
= =
n
i
i i
p x
1
) (
NOTA: En las tres definiciones anteriores, p
i
es la probabilidad de que ocurra el
suceso x
i,
, como por otra parte resulta fcil imaginar.

Variable aleatoria continua. Diferencias

Si la variable aleatoria es continua, la funcin de distribucin como tal no tiene
sentido y usamos en su sustitucin la denominada funcin de densidad, que
representa la distribucin de probabilidad de una variable continua.

Una funcin y=f(x) es la funcin de densidad de una variable aleatoria continua X, si
cumple:
- x x f 0 ) (
- El rea total encerrada bajo la grfica es la unidad
- La probabilidad de que la variable tome valores en el intervalo (x
i
,x
j
) es
precisamente el rea bajo la curva en dicho intervalo.

An as, es posible definir una funcin de distribucin de variable continua:

Definicin: Una funcin F(x) se llama funcin de distribucin de una variable
continua X, si:
- F(x) es una funcin de densidad de la variable X
-
i
x x x F < = 0 ) ( siendo x
i
el menor valor de X
- siendo x
j
x x x F > = 1 ) (
j
el mayor valor de X


68
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos

Distribucin Binomial

Definicin: Un experimento aleatorio se dir que sigue una distribucin Binomial o
de Bernouilli, si:
- En cada ensayo slo es posible obtener dos resultados; el suceso A, que
denominamos xito y su complementario, A , que denominamos fracaso.
- El resultado obtenido en cada ensayo, es independiente de los obtenidos
anteriormente.
- Las probabilidades de A y A son constantes, y se verifica que P(A)=p,
P( )=q y p+q=1 A
- En cada experimento se realizan n pruebas idnticas.

Definicin: La variable X, que muestra el nmero de xitos obtenidos en cada
prueba del experimento, se denomina Variable Aleatoria Binomial.

Supongamos que realizamos n pruebas de un experimento que sigue el modelo
binomial y deseamos conocer la probabilidad de obtener r xitos en esas n pruebas.
Es decir, consideramos el suceso B, caracterizado por la aparicin de r xitos y n-r
fracasos.
Al tratarse de sucesos independientes, y teniendo en cuenta que P(A)=p y P( )=q,
podramos afirmar que P(B)=p
r
q
n-r
.
A
Ahora bien, esos xitos y fracasos, pueden obtenerse en cualquier orden, por lo que
el nmero de sucesos con r xitos y n-r fracasos, son exactamente las permutaciones
de n elementos con r repeticiones del suceso A y n-r repeticiones del suceso , es
decir:
A
|
|
.
|

\
|
= =

r
n
C
r n r
n
PR
r
n
r n r
n
)! ( !
!
,

De manera que la probabilidad de obtener r xitos, ser exactamente:

r n r
q p
r
n
r X P

|
|
.
|

\
|
= = ) (

De donde, generalizando, la funcin de distribucin de la Binomial B(n,p) ser:

>

|
|
.
|

\
|
=
<
=

=

n x si
n x si q p
j
n
x P
x si
x F
i
h
j
i
j n j
j
i
i
1
0 ) (
0 0
) (
0





69
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos

Los parmetros de una distribucin binomial, pueden calcularse de forma abreviada a
partir de n y p como:
q p n
q p n
p n

=
=
=


Distribucin Normal

Definicin: Diremos que una variable aleatoria X sigue una distribucin normal de
media y desviacin tpica si se cumplen las siguientes condiciones:
- El recorrido de X es todo
- La funcin de distribucin tiene la siguiente forma funcional

2
1
2
1
) (
|
.
|

\
|


x
e x f
- La distribucin se designar entonces por N(,), siendo la media de la
distribucin y su desviacin tpica.

Propiedades : Pueden establecerse a partir de la observacin de su grfica





) (
0
x f
|
|
.
|

\
|

2
1
,





0
x +



-
- ) ( ) (
0
x f x f + =
- La grfica es simtrica respecto
del eje x=
- Mx f(x)=f()=
2
1


- x
1
=(-) y x
2
=(+) son puntos
de inflexin
- OX es asntota horizontal
- El rea encerrada bajo la curva es
la unidad. 0
x

Distribucin normal estndar:
Es la usada para tabulacin, est definida de forma que =0 y =1. La funcin de
distribucin resultante, es:
2

2
1
) (
x
e x f

=



70
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos

Casustica del manejo de tablas de la distribucin normal.
- P(Xx)- Valor en tablas
- P(X>x)=1-P(Xx)
- P(X<-x)=P(X>x)=1-P(Xx)
- P(X>-x)=1-P(X-x)=1-P(X x)=1-(1-P(X<x))=P(X<x)=P(X x)
- P(x
1
X x
2
)=P(X x
2
)-P(Xx
1
)

Tipificacin de la variable

Si manejamos una distribucin normal cualquiera N(,) y necesitamos calcular
determinadas probabilidades, no encontraremos los valores en las tablas de la
distribucin normal N(0,1). Para hacer posible la bsqueda, usamos un
procedimiento que se conoce con el nombre de tipificacin y que bsicamente
consiste en un cambio de variable de la forma


=
x
z , lo que nos permite calcular
la probabilidad buscada sin ms que localizar en las tablas el valor de z.

Aproximacin Binomial-Normal

Si se verifican las desigualdades np 5, y nq , distribucin binomial B(n,p)
puede aproximarse a la distribucin normal N(,) donde :
5
npq p n = =


Teorema de la adicin para la distribucin binomial o de Bernouilli

Dadas las variables ) , ( ., ),........ , ( ), , (
2 2 1 1
p n B p n B p n B
k k
, la variable
k
+ + + = .......
2 1
, se distribuye tambin segn una binomial, tal que
) ...... (
2 1 k
n n n B + + +

Distribuciones discretas de Probabilidad

Distribucin de Poisson

Se dice que la variable tiene una distribucin de Poisson de parmetro y se
denota ) ( P si es una variable discreta que puede tomar valores de 0 a con
probabilidad

) (
x
x
e x P


= =
71
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
- Las demostraciones y operatividad de esta distribucin, necesitan el
apoyo terico de los desarrollos en serie de McLaurin, de manera que
admitiremos como ciertas las propiedades que citamos a continuacin:

- Esperanza matemtica = ) ( E
- Varianza =
- Desviacin tpica + =


Teorema de la adicin de la distribucin de Poisson

La suma de variables de Poisson independientes es una variable de Poisson, de
parmetro igual a la suma de los parmetros de las variables que se suman.

Distribucin de Poisson como lmite de la binomial
Supongamos que ) , ( p n B y calculemos qu pasa con la probabilidad de cada valor
de al tender n a infinito.
Intentamos calcular

=
n
x P ) ( lim
; hacemos np= , de donde tendremos
n
q
n
p

= = 1 ;
Dado que en principio nuestra variable es binomial, sabemos que :
( )
( )






=

|
.
|

\
|
|
.
|

\
|
=
(
(

|
|
.
|

\
|
=
|
|
.
|

\
|
= =

n n
n
n
n
n
x n
x n n n
n
n n x
x n n n
x
n
ndo desarrolla q p
x
n
x P
x
n
x
x
x n x
x n x

1 lim
1 lim
.
!
lim
)) 1 ( ( )......... 1 (
lim
1
!
) 1 ....( )......... 1 (
lim
lim ) ( lim


Si calculamos cada uno de estos lmites por separado, tendremos:

=
n
x x
x x
! !
lim



=

=

n
n
x n n n
x
1
)) 1 ( )........( 1 (
lim

72
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos

=
|
|
|
.
|

\
|

+ = |
.
|

\
|



n n
e
n
n
n
n

1
1 lim 1 lim


= = |
.
|

\
|

n
n
x
x
1 1 1 lim


luego:

=
|
|
.
|

\
|

n
x
e q p
x
n
x
x n x
!
lim


- Ello demuestra que la distribucin de Poisson es una buena aproximacin de
la binomial, cuando n es grande y p=/n tiende a 0.
Por esto ltimo, la distribucin de Poisson, recibe en ocasiones el nombre de
Distribucin de los sucesos raros.
- Lo habitual es considerar como buena la aproximacin de Poisson cuando
p 0,1 y np 5.

Distribucin Multinomial

La distribucin binomial nos permite resolver tan slo aquellos problemas de pruebas
sucesivas cuyos resultados pueden clasificarse en xito/fracaso. Existen, sin
embargo, problemas en que los resultados pueden ser de ndole diversa y es
necesario tener ms categoras de clasificacin.
La distribucin que estudia este tipo de problemas se denomina Multinomial y se
obtiene como sigue:
- Supongamos un experimento aleatorio en el que son posibles los resultados
A
1
,...A
k
.
- Sea p
j
la probabilidad de obtener el resultado A
j
en una prueba y supongamos
que se realizan pruebas independientes.
- De forma trivial, podemos asociar a este experimento una variable aleatoria
k-dimensional (
1,

2,......

k
) donde
i
indica el nmero de veces que el suceso
A
i
ocurri en las n pruebas.
- Diremos que esta variable k-dimensional es multinomial, si:
n
x
n
x x
n
k k
x x x n siendo p p p
x x x
n
x x x P
n
+ + + = = = = = ..... , ......
! !..... !
!
) , ,......... , (
2 1 2 1
2 1
2 2 1 1
2 1

- Esta distribucin se denomina multinomial de parmetros n,p
1
,p
2
,......p
k
y sus
estadsticos son:
i) Esperanza matemtica
) ,.... , ( ) ,.... (
2 1 2 , 1 k k
np np np E =
ii) Varianza
73
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
k i p np
i i i
,.... 2 , 1 ) 1 ( ) ( = =
iii) Covarianza
j i j i j i
p np S = ) , (
,


Distribucin Hipergeomtrica

Supongamos un experimento que se realiza N veces y cuyos resultados son tales que
k pueden ser considerados como xito y N-k como fracaso.
Consideremos que tomamos una muestra de tamao n de entre los N resultados del
experimento. La variable nmero de xitos, de entre estos n resultados, se
denomina Variable Hipergeomtrica de parmetros N,n,k , si la probabilidad de
obtener x xitos es:
n x
n
N
x n
k N
x
k
x P ,....., 2 , 1 , 0 ; ) ( =
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
= =
y lo denotamos como h(N,n,k).
Los parmetros caractersticos, sern:
- Esperanza matemtica
N
nk
E = ) (
- Varianza
|
.
|

\
|

=
N
k
N
k
n
N
n N
1
1



Distribuciones continuas de Probabilidad

Teoremas fundamentales respecto a la distribucin Normal

Teorema 1 (Suma)
Si
K
,........ ,
2 1
N
j j j
) , (
son variables aleatorias independientes, con distribuciones
k j ,.... 1 = , entonces la variable suma
k
....
2 1
+ + = es
tambin una variable de distribucin normal, siendo su media
k
+ + + = .....
2 1

y su desviacin tpica
2 2
2
2
1
......
k
+ + + =
Teorema 2 (Promedio de distribuciones)
Si
K
,........ ,
2 1
son variables aleatorias independientes e igualmente distribuidas
segn N(,), la variable
74
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
k
k

+ + +
=
....
2 1

es decir, la media de las variables, se distribuye segn una normal ) , (
k
N


NOTA: Ambos Teoremas son fundamentales en toda la Inferencia Estadstica, tanto
en el estudio de intervalos de confianza, como en el Contraste de Hiptesis.

Distribucin de Pearson

Se define como la suma de cuadrados de variables N(0,1) independientes. El nmero
de variables normales cuyo cuadrado se suma se denomina "nmero de grados de
libertad de la ".
Es decir, si ) 1 , 0 ( ,..... ,
2 1
N
k
independientes, definimos
2 2
2
2
1
2
.....
k n
+ + + =
Enunciamos a continuacin las principales caractersticas de la distribucin, sin
incluir demostraciones, para las cuales la funcin de Euler es necesaria
constantemente, complicando en exceso el razonamiento.

- Esperanza matemtica: =n= Nmero de grados de libertad.
- Desviacin Tpica: n 2 =
- Aproximacin a la normal:

=
n
n n N
n
) 2 , (
2
lim
; siendo buena la
aproximacin cuando n>30

Distribucin t-STUDENT

Denominada as porque su descubridor, Gosset, firmaba con dicho seudnimo sus
trabajos.
Sean
n
,.....
2 1
, ,
0
n+1 variables aleatorias independientes, todas ellas con
distribuciones N(0,).La variable:



( )
2 2
2
2
1
......
1
n
n
n
t

+ + +
=
se denomina t-Student con n grados de libertad.
Puede demostrarse que si n , entonces t
n
N(0,1), siendo la
75
aproximacin tanto mejor cuanto mayor sea el nmero de grados de libertad.
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
La aproximacin es aceptablemente buena con tal que n>30, motivo por el
cual, las tablas t-Student llegan slo a 30 grados de libertad.

Distribucin F de Snedecor

Es una distribucin de probabilidad llamada tras la inicial de Fisher, descubridor de
la denominada z de Fisher, precursora de la variable F descrita como .
z
e
2
= F
Sean ,....
2 n m
' ...... ' , ' , ,
2 1 1
n+m variables aleatorias independientes e
igualmente distribuidas segn N(0,).
Se define entonces la variable F con (m,n) grados de libertad, como:
( )
( )
2 2
1
2 2
1
,
' ......... '
1
........
1
n
m
n m
n
m
F


+ +
+ +
=

Distribucin Uniforme

Se dice que la variable es uniforme en el intervalo (a,b) y se denota ) , ( b a U , si
su funcin de densidad es constante en el intervalo (a,b) y 0 en el resto de su
recorrido.
Al ser constante en (a,b) y tratarse de una funcin de densidad, ha de
verificarse que:



= = =
b
a
a b
k kdx dx x f
1
1 1 ) (
La funcin de densidad de la variable ) , ( b a U , quedar como:

=
b x si
b x a si
a b
a x si
x f
0
1
0
) (
Sus parmetros fundamentales, sern:
Esperanza matemtica:
2
b a +
=
Varianza: ) (
12
1
a b =
Desviacin tpica: ) (
6
3
a b =



76
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
77

Distribuciones de Probabilidad. Problemas

General

1. La distribucin de probabilidad de una variable aleatoria discreta X, viene dada
por
x
i
-2 -1 0 1 2
P(x=x
i
) 0.08 0.32 0.05 m 0.32
Calclense f(1), f(2), f(2), f(3) y m

2. Halla la funcin de probabilidad del experimento que consiste en lanzar dos
dados y anotar la suma de las puntuaciones obtenidas.

3. En el experimento anterior, halla la funcin de distribucin y represntala
grficamente.

4. Halla la media, la varianza y la desviacin tpica de una variable aleatoria X que
tiene como funcin de probabilidad:
x
i
0 1 2 3
f(x
i
) 0.2 0.3 0.1 0.4

5. En una urna hay 4 bolas rojas y 2 negras. El experimento consiste en extraer 5
bolas con devolucin o reemplazamiento. Halla la funcin de probabilidad y la
funcin de distribucin de la variable "nmero de bolas negras".


Distribucin Binomial

1. La probabilidad de que una pieza fabricada por una empresa sea defectuosa
es 0,1. Halla la probabilidad de que en una muestra de 100 piezas, se
encuentren 3 defectuosas.

2. La probabilidad de que un estudiante de Matemticas obtenga ttulo es de 0,2.
Halla la probabilidad de que de un grupo de seis estudiantes, al menos 2
acaben la carrera.

3. Halla la media, la varianza y la desviacin tpica de la distribucin binomial
B(150; 0,3 )



____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
78
4. Una moneda est trucada, de forma que la probabilidad de obtener cara es
4/7. Se lanza la moneda 10 veces. Calclese:
a) Probabilidad de obtener 7 caras
b) Probabilidad de obtener, como mximo 4 cruces.

5. Un dado numerado del 1 al 6, est trucado de forma que la probabilidad de
obtener nmero par es 11/24. Se lanza el dado 12 veces. Calclese:
a) Probabilidad de obtener 6 nmeros pares
b) Probabilidad de obtener 12 nmeros pares

6. La probabilidad de que un tirador haga blanco en un disparo, es de 0,2, halla
la probabilidad de que en una serie de cinco disparos:
a) No haga ningn blanco
b) Haga cinco blancos
c) Haga ms de 3 blancos.

Distribucin Normal

7. En una distribucin normal N(0,1), calcula:
a) P(x0,7)
b) P(x>0,55)
c) P(0,4x0,7)
d) P(x0,83)
e) P(x>-0,45)
f) P(-0,5x7)

8. Dada una distribucin N(7; 2,5), calcula:
a) P(x4)
b) P(x8)
c) P(5x7)
d) P(5x9)

9. Dada la distribucin B(150, 0,2)
a) Comprueba si puede ajustarse a una normal
b) Transfrmala en una distribucin normal si la respuesta a la primera pregunta
es positiva.

10. Se lanza una moneda de curso legal 100 veces, calclese la probabilidad de:
a) Obtener ms de 55 caras
b) Obtener menos de 25 caras


____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
79
11. En la distribucin N(0,1), calcula el valor de k en los casos siguientes,
sabiendo que k0:
a) P(zk)=0.9066
b) P(zk)=0.6368
c) P(zk)=0.0014

12. La duracin media de una picadora de cocina es de 4 aos, con una
desviacin tpica de 0,3 aos. Si la vida de la picadora se distribuye
normalmente, halla la probabilidad de que al comprar una unidad sta dure
ms de 6 aos.

13. El peso de los individuos de una poblacin americana, se distribuye
normalmente con una media de 90 Kg. y una desviacin tpica de 20 Kg.
Calclese el porcentaje de individuos cuyo peso est comprendido entre 70 y
75 Kg.

14. Una mquina que expende bebidas, est programada de forma que descarga
una media de 200 cm. por vaso. Si la cantidad de lquido dispensado est
distribuida normalmente con una desviacin tpica de de 15 cm, calclese
a) Porcentaje de vasos que llenar con ms de 220 cm
b) Si usamos seis vasos de 220 cm, cul es la probabilidad de que se derrame
lquido exctamente en 2 vasos?

15. Se sabe que la nota de determinado examen, est distribuida segn una
normal, sabemos que el 17 % tiene una nota superior a 6 puntos, mientras que
el 17 % tiene una nota inferior a 4 puntos. Calclese:
a) Porcentaje de estudiantes con nota comprendida entre 4 y 6
b) Nota media del examen.

16. De un estudio de nieblas ocurridas durante el mes de marzo en un aeropuerto
durante 50 aos, se han obtenido los siguientes resultados: 25 aos sin
nieblas, 15 con una niebla, 6 aos con dos nieblas, tres aos con 3 nieblas y
un ao con cuatro nieblas. Determinar la distribucin de Poisson que
representara el fenmeno y calcular las probabilidades tericas que
corresponderan a cada suceso.
17. En una estacin de montaa, se han observado 20 das con altura de nieve
mayor que h, durante un perodo de 10 aos. Suponiendo que es aplicable la
distribucin de Poisson, calcular la probabilidad de superar dicho valor h:

a) Menos de cinco veces en los prximos 2 aos
b) Ms de tres veces en el prximo ao


____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos

PAFNUTI LVOVICH CHEBYSHEV

En 1847, Pafnuty Chebyshev fue nombrado profesor
de la Universidad de San Petersburgo. Fue tambin
asociado forneo al Institut de France en 1874, as
como miembro de la Royal Society.
80
Es especialmente famoso por sus trabajos sobre
nmeros primos y escribi en 1849 un Tratado sobre
la Teora de la Congruencia.
Realiz importantes aportaciones al Clculo Integral.
Mostr tambin inters por la Mecnica y la
conversin del movimiento rotatorio en movimiento
rectilneo, mediante acoplamiento mecnico.
Escribi papeles acerca de numerosos temas, de entre
los que resultan especialmente destacables aquellos
que versaban sobre la Teora de la Probabilidad,
Formas Cuadrticas, Funciones Ortogonales, Teora
de Integrales y Clculo de Volmenes Genricos.























____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
81


TEORA DE MUESTRAS


















Para qu?
Para conocer caractersticas de una poblacin a partir de un
grupo pequeo de elementos de la misma. Para conocer los
errores que podemos cometer cuando aventuramos
caractersticas de la poblacin a partir las muestras de la
misma.





____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
82


Teora de muestras

Existen situaciones de estudio cientfico en las que resulta prcticamente imposible
tomar datos de todos los elementos de la poblacin. En tales situaciones, por
cuestiones de tiempo y economa, se reduce el estudio a determinados subconjuntos
de la poblacin, que denominamos MUESTRAS.

Es a partir de ellas que intentamos obtener conclusiones vlidas para toda la
poblacin.

La inferencia estadstica es la disciplina que intenta regular las condiciones en que
los parmetros muestrales pueden considerarse vlidos para la poblacin completa y
en qu medida cometemos errores al hacer tal apuesta de simplificacin.

Tipos de muestreo

Muestreo Probabilstico

Caracterizado porque conocemos apriorsticamente la probabilidad de que
un elemento de la poblacin pase a formar parte de la muestra.
Puede ser llevado a cabo de dos formas diferentes:
a) Con reemplazamiento: cuando el elemento escogido puede ser elegido de
nuevo al reincorporarse a la poblacin tras el proceso de extraccin.
b) Sin reemplazamiento: cuando el elemento escogido se retira
definitivamente de la poblacin

Aparte de esta caracterizacin por el modo concreto en que se lleva a cabo la
seleccin de elementos de la muestra, podemos definir diferentes tipos de muestreo
probabilstico.

c) Aleatorio Simple: Diremos que un muestreo es Aleatorio Simple, si todas
las posibles muestras de determinado tamao extradas de una poblacin,
tienen las mismas probabilidades de ser seleccionadas.
d) Sistemtico: Consiste en establecer una rutina de extraccin para los
elementos de la muestra de tamao n, estableciendo previamente n grupos
en la poblacin
e) Estratificado: Consiste en dividir la poblacin en grupos homogneos o
estratos, dentro de los cuales se realiza un muestreo aleatorio simple.
f) Por Conglomerados: En una primera etapa, consiste en seleccionar grupos
de caractersticas comunes, que llamaremos conglomerados, dentro de la
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
83
poblacin. Posteriormente estableceremos nuevos conglomerados dentro
de cada conglomerado inicial, y elegiremos individuos dentro de stos
ltimos.

Muestreo no Probabilstico

Se trata en definitiva de un tipo de muestreo "a ojo", de escaso valor
estadstico, aunque con la suficiente intuicin puedan mostrarse acertados en
algn tipo de cuestin. Son, en general, poco recomendables.



Distribucin terica muestral

Para disear estrategias de muestreo, supondremos que la poblacin sigue cierta
distribucin conocida, lo que permitir establecer una distribucin terica para la
muestra.

Muestra Aleatoria. Estadstico

Cuando tenemos en consideracin una determinada poblacin para su estudio,
supondremos que vendr determinada en todos sus valores por una variable aleatoria,
que se comportar de acuerdo con determinado proceso probabilstico, generalmente
binomial o normal.

- Si denotamos por X la variable aleatoria correspondiente a la
caracterstica que se pretende estudiar, consideramos que las n observaciones
x
1
,....x
n
que se hacen de la poblacin, son n valores de n variables X
1
,.......X
n

independientes, que siguen la misma distribucin de la variable X.
- Cualquier funcin que se obtenga mediante operaciones a partir de
X
1
,......X
n
, se denominar Estadstico Muestral.

Propiedades esenciales deseables en un estimador

1. Se dice que un estimador H es insesgado para el parmetro poblacional , si se
verifica que E(H)= , lo que se lee como: "La Esperanza Matemtica de H es ".
Siendo la esperanza matemtica y la media, conceptos idnticos.

2. Dados dos estimadores H
1
y H
2
del parmetro , ambos insesgados, diremos que
H
1
es ms eficiente que H
2
si se verifica que (H
1
)<(H
2
)

- En definitiva, si un estimador es insesgado, se centra en el parmetro
poblacional y si adems es el ms eficiente de todos los posibles, ser el que
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
en las diferentes muestras, tome valores menos dispersos respecto a dicho
parmetro.

- An contando con un estimador insesgado, al usarlo sobre una
muestra concreta, obtenemos una Estimacin Puntual, que probablemente no
coincida exctamente con el parmetro poblacional.

- Por este motivo, las estimaciones suelen expresarse indicando un
intervalo de confianza en el que se espera que se encuentre el parmetro
poblacional. Dicho intervalo se denomina "Intervalo de Confianza".

- Dado un estimador, los valores que ste toma para las diferentes
muestras seguirn una distribucin que depender del valor real del parmetro
de la poblacin. Estudiando tal distribucin pueden calcularse los valores
H
1
y H
2
del estimador H, tales que :

| | = < < 1
2 1
H H P , siendo un valor fijado de antemano.
- El valor 1- se denomina Nivel de Confianza y el intervalo (H
1
,H
2
)se
denomina intervalo de confianza al (1-)%.

- As las cosas, puede afirmarse que el valor del parmetro poblacional
, se encontrar entre los valores 1 y 2 de H con una probabilidad de 1- y
que tal afirmacin, ser falsa en el % de los casos.

- Admitiendo que lo ideal sera cerrar al mximo el intervalo de
confianza, debe puntualizarse que ello slo es posible aumentando (tambin
denominado nivel de significacin) es decir, el riesgo de error, o bien
aumentando el tamao de la muestra en detrimento de la economa.

Inferencia Estadstica

Es la disciplina que estudia los mtodos que permiten obtener conclusiones sobre
algunas caractersticas de la poblacin, a partir de la informacin contenida en una
muestra.

- De forma bsica, la inferencia estadstica usa dos tcnicas
fundamentales; la primera es denominada "Estimacin de parmetros" y la
segunda "Contraste de Hiptesis".

- Para estudiar un parmetro poblacional en el que estamos interesados
definimos un estimador, que como vimos, no es otra cosa que un operador
84
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
85
que acta sobre los datos de la muestra. El resultado de dicho estimador es lo
que denominamos "Estimacin".


- Por ejemplo, al estimar la media de una poblacin, podemos
usar como estimador la media muestral de manera que la media de la
muestra, sera una estimacin de la media poblacional.

- No es de esperar que un estimador calcule sin error el
parmetro en estudio; al estimar corremos un cierto riesgo de error en
aras de una mayor economa de tiempo o de medios.

- Tambin es competencia de la Teora de la Estimacin el
determinar la forma en que debe usarse la misma y como cuantificar
los riesgos de error.




























____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos

Teora de Muestras. Problemas

1. En una clase de 25 alumnos extraemos muestras de tamao 4. Cuntas
muestras diferentes podemos hacer?.Cul es la probabilidad de que 4
alumnos concretos formen parte de la misma muestra?

2. Disea formas de extraer, mediante muestreo sistemtico, muestras de
tamao 10 de una poblacin de tamao 100.

3. Queremos investigar sobre la utilizacin del transporte pblico en
determinada ciudad. Qu plan de muestreo se te ocurrira proponer?

4. Se desea estimar el tiempo medio de desplazamiento de los alumnos de un
colegio desde casa a clase y viceversa. Cmo escogeras la muestra? Qu
plan de extensin se te ocurrira proponer si quisieras extender el estudio a los
20 centros de la ciudad?

5. Una fbrica de tornillos fabrica 3 tipos fundamentales de ellos, 2,5x16,
2,5x24 y 4x60. Su produccin diaria es de 500.000, 300.000 y 200.000
unidades diarias respectivamente. Qu tipo de muestreo sera conveniente
utilizar?,Cmo se seleccionara la muestra?.

6. Idea una plan para elegir una muestra del 10% del alumnado de tu centro:
a) Mediante tablas de nmeros aleatorios
b) Mediante papeletas en una urna
c) Mediante ordenador
d) Mediante muestreo sistemtico.

7. En la siguiente poblacin formada por las estaturas en centmetros:
170,175,168,182, trtese de calcular la distribucin de la media muestral en
muestras sin repeticin de tamao 3.
a) Calcula la media poblacional
b) Calcula la varianza poblacional
c) Cuntas muestras hay de tamao 3 sin elementos repetidos?
d) Escribe todas las muestras posibles
e) Calcula la media de cada muestra y construye la correspondiente
distribucin de medias muestrales.
f) Calcula ) ( ) ( x V y x E y comprueba las relaciones tericas con la media y
varianzas poblacionales.

86
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
8. Supongamos que los paquetes de pipas de girasol envasados por una
mquina siguen una distribucin normal de media 50 gr. y desviacin 2,5 gr.
Para hacer un control de calidad, se toman 100 paquetes en una muestra y se
pesan. Cul ser la probabilidad de que la media muestral tome el valor de
256 gr.?

9. Sabemos que la proporcin de daltnicos en una distribucin normal, es
aproximadamente del 5%. Si elegimos una muestra de la poblacin de una
ciudad, de 100 elementos, Cul es la probabilidad de obtener un 7% de
daltnicos?.
10. Los resultados de un experimento de engorde de doradas en piscifactora,
usando dos piensos compuestos de diferente composicin, fue la siguiente:
A 300 425 400 375 515 423 289 420 450 453
B 400 450 475 384 500 425 375 395 415 422

a) Represntese la distribucin de frecuencias de la variable diferencia de
peso en gramos. Calculese la media
b) Suponiendo que dicha diferencia tenga una distribucin N(0,1) Cul es
la probabilidad de obtener unas diferencias superiores a la media de las
obtenidas realmente?
c) A la vista de los resultados obtenidos, podemos concluir que existen
diferencias significativas entre los dos piensos?




















87
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos

RONALD AYLMER FISHER

Era un estadstico de Cambridge que, all por los
aos 20, se dio cuenta de un pequeo pero
fundamental detalle: por ms que nos
emperamos, nunca obtendramos toda la
informacin que quisiramos de un sistema dado.
O, dicho de otra manera, toda la informacin que
uno puede obtener de un sistema fsico es la
denominada "informacin Fisher", que, a pesar de
no ser toda la que posee dicho sistema, nos sirve
para decretar una ley sobre su funcionamiento.
Lgicamente, nunca llegamos a saber de dnde
viene esa ley y mucho menos por qu diablos
funciona. Sin embargo, en esta disparidad se basan
desde el electromagnetismo a la gravedad,
pasando por la Fsica de partculas, los gases y,
por supuesto, el inicio del Universo, el espacio/tiempo y para no alargar demasiado la
lista, nosotros mismos.

No se sabe si Fisher lleg a su revolucionaria conclusin tras una profunda reflexin
sobre la innata tendencia al error de la naturaleza humana, aunque casi seguro, fue su
reconocida experiencia como estadstico la que le puso sobre la pista de este dato
esencial. Fuera por el camino que fuese, Fisher se dio cuenta que todo fenmeno,
todo sistema, todo acontecimiento en la naturaleza posee un volumen determinado de
informacin y nuestro esfuerzo por adquirirlo es propenso al fallo. Para empezar, los
equipos de medicin y observacin siempre tienen errores, a los que se suman los
inherentes al sistema observado, como pueden ser fases caticas transitorias
inducidas por cambios internos o externos o, algo de sobras conocido, alteraciones
causadas por el propio hecho de la observacin. En otras palabras, la naturaleza no
parece muy inclinada a dejarnos saber todo lo que ella sabe y nosotros slo
alcanzamos a saber una parte, por grande que sea, de todo ese saber.









88
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
89



TEORA DE LA ESTIMACIN























Para qu?
Para ahorrar trabajo, tiempo y dinero en la toma de decisiones,
manejando un puado de datos (una muestra) en lugar de la poblacin
completa; para establecer los criterios mediante los que el estudio de
la muestra puede reproducir el comportamiento de la poblacin, con
un grado de exactitud determinado de antemano. Para comenzar a
Hacer Estadstica (as, con maysculas).





____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
Teora de la estimacin

Estimadores para la media y la varianza

Sea una poblacin P de la que extraemos muestras de tamao n, cuya composicin
viene dada como x
1
,x
2
,.....x
n.
Supongamos que la media poblacional es y que la
varianza poblacional es . Intentamos conseguir estimadores insesgados de la media
y varianza poblacionales.

En las condiciones anteriores, la esperanza matemtica de la media muestral, ser:
= = + + + =
|
|
.
|

\
| + + +
= . .
1
)) ( ...... ) ( ) ( (
1 .....
) (
2 1
2 1
n
n
x E x E x E
n n
x x x
E x E
n
n

x
1,
x
2
........x
n
, son valores elegidos al azar de la poblacin, cuya media es , ya que
cada una de las variables x
i
, sigue la misma distribucin de la poblacin.

As pues, la media muestral es un estimador insesgado de la media poblacional.

Respecto a la varianza de la variable media muestral:
| | | |
n n
x x
n
VARIANZA PROPS
n
x x x
x
n
x

1
) ( ...... ) (

1
..
.....
) (
1
2 1

= = + + = =
(

+ + +
=

Es decir, la varianza de la variable media muestral, viene dada por la varianza
poblacional dividida por el tamao de la muestra.

Al ser un estimador insesgado de , la distribucin est centrada en y al ser su
varianza
n
2

, cuanto mayor sea el tamao de la muestra, menor ser su varianza y


mayor su eficacia.
x

Si el parmetro que intentamos estimar es la varianza, dada una muestra de tamao n,
su varianza ser
2
(

i
) x x
s
n

= ; si elegimos muestras al azar, s es una variable
aleatoria, para la que podemos calcular la esperanza matemtica.

Realizando algunas transformaciones elementales en la frmula de s, obtenemos:
2
2
2
) (
) (



= x
n
x
s
i

y calculando su esperanza matemtica, tendremos:

90
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
| |
n
n
n n
x E
n
x E
x
n
x
E s E
i i
) 1 (
) (
) (
) (
) (
) (
2
2

=

=
(


En el razonamiento anterior, se tuvo en cuenta que | |
n
x E

) (
2

= , como se
demostr en el prrafo precedente.

Por el resultado obtenido, puede concluirse que la varianza muestral no es un
estimador insesgado de la varianza poblacional.
Sin embargo, manipulando ligeramente la expresin obtenida, si calculamos:

) 1 (
.
1
) (
1
) (
1 1

=
(

n
n
n
n
s E
n
n
s E
n
n
n
ns
E
de donde podemos concluir que el parmetro
1

n
ns
s es un estimador insesgado de la
varianza poblacional.

Denominamos CUASIVARIANZA a dicho parmetro y lo definimos como:
=
1
) (
1


=
n
x x
n
ns
i

Teorema Central del Lmite
Se trata de uno de los teoremas ms importantes de la estadstica; fue enunciado en
su versin inicial por Moivre y posteriormente enunciado y demostrado por diversos
autores. Nosotros veremos, sin demostracin, la versin de Levy-Lindenberg.
Este teorema, permite utilizar la distribucin normal para dar estimaciones de la
media muestral, incluso cuando la poblacin de origen no es normal.
Teorema:
Sean las variables
n

,....... 2 , 1
, independientes, igualmente distribuidas con media y
desviacin tpica 0 finita. Entonces, la distribucin de la variable
n
n

....
2 1
+
=
+
, tiende, cuando n , a una distribucin normal de media y
desviacin tpica
n

.

Conclusiones:
1-

=
n
n
N x ) , ( )

F ( lim


2-Si en lugar de consideramos la variable , es
decir, multiplicamos por n la variable original,
tendremos


=

n
n n N x F ) , ( ) ( lim


91
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
Intervalos de confianza para la media

Caso 1. Poblacin normal con conocida
Sabemos, por lo visto anteriormente, que x es un estimador insesgado de y si la
poblacin de origen es normal, se verifica adems que:
| | o Tipificand N
n
x
n
N x ); 1 , 0 ( ) , (


Por lo tanto, dado un determinado nivel de confianza, (1-), puede obtenerse en las
tablas de la distribucin N(0,1) el valor de
2

tal que
(

> <
2 2

P =1-
lo que equivale, deshaciendo la tipificacin a



=
(

+ < < 1 . .
2 2
n
x
n
P (1)
De ello, puede deducirse que :


=
(

+ < < 1 . .
2 2
n
x
n
x P (2)
La expresin (1) no tiene utilidad alguna, ya que la media poblacional es
desconocida; la expresin (2), por el contrario, da lugar a la formulacin del
intervalo de confianza para la media poblacional
|
|
.
|

\
|
+
n
x
n
x


,
2 2

Para un problema concreto, x es la media de una muestra seleccionada al azar y los
extremos del intervalo, sern dos nmeros enteros entre los que afirmaremos se
encuentra la media poblacional, con una confianza del (1-)%.

-Debe entenderse que esta construccin del intervalo, no significa que
el parmetro poblacional "caiga" entre sus valores extremos, ya que
la media poblacional es, en este caso, un parmetro desconocido que
intentamos estimar, pero que en ningn caso calculamos. La
interpretacin correcta, nos indicara que si tomsemos muchas
muestras, y calculsemos el intervalo de confianza en todas ellas, el
(1-)% de los mismos, contendra a en su interior, mientras que el
% restante, no lo hara.




92
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
Caso 2. Poblacin cualquiera con conocida
En este caso particular, tomaremos muestras de tamao n>30 y mediante la
aplicacin del Teorema Central del Lmite (en adelante TCL), aplicaremos el mismo
intervalo anterior

Caso 3. Poblacin normal con desconocida
Podemos demostrar, aunque no lo hacemos por exceder dicha demostracin el
carcter de iniciacin de este curso, que la variable auxiliar o estadstico
n
s
x
.


sigue una distribucin t-Student con n-1 grados de libertad, con lo que, fijado un
nivel de confianza 1-, puede obtenerse en las tablas de dicha distribucin, el valor
, tal que :
2


=
(

<

< 1
2 2
t n
s
x
t P
Lo que facilita la formulacin del intervalo de confianza para la media poblacional

|
|
.
|

\
|
+
n
s
t x
n
s
t x

2 2

al (1-)%
En este caso, el valor de desconocido, se estima mediante el estimador insesgado
que hemos denominado Cuasivarianza, definido anteriormente.


Caso 4. Poblacin cualquiera con desconocida
En la prctica, suele usarse el intervalo del caso 1, estimando mediante s si n>30 y
el intervalo del caso 3, si n<30.

Intervalos de confianza para la diferencia de medias

Caso 1. Poblaciones normales con
1
y
2
conocidas
En este caso, consideramos dos poblaciones normales de varianzas conocidas e
intentamos compararlas, dando un intervalo de confianza para la diferencia de
medias
1
-
2;
para ello, seleccionamos muestras de tamaos n
1
y n
2
de las
respectivas poblaciones.

Aprovechando el resultado obtenido para los parmetros de la suma de poblaciones
normales, afirmaremos que:
93
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
|
|
|
.
|

\
|
+
n n
N x x
2
2
1
2
1
2 1
2 1 , ) (


Operando como en casos anteriores y sirvindonos de las tablas de la distribucin
normal para el clculo de , llegamos a la expresin del intervalo de confianza al
(1-)% para la diferencia de media, que resulta ser:
|
|
.
|

\
|
+ + +
2
2
2
1
2
1
2
2
1
2
2
2
1
2
1
2
2
1
,
n n
x x
n n
x x




Caso 2. Poblaciones cualesquiera con
1
y
2
conocidas

Bastar con tomar muestras tales que n
1
>30 y n
2
>30 y aplicar el mismo intervalo de
confianza del caso anterior.

Caso3. Poblaciones normales con
1
y
2
desconocidas

Usaremos el mismo intervalo del Caso 1, estimando
1
y
2
mediante s
1
y s
2

(desviaciones tpicas muestrales)

Caso 4. Poblaciones normales con
1
y
2
desconocidas pero iguales

Admitiremos, sin demostrar, que estimando
1
y
2
mediante s
1
y s
2 ,
llegamos al
intervalo de confianza siguiente, usando una t-Student con n
1
+n
2
-2 grados de
libertad.
|
|
.
|

\
|
+
+
+
+ +
+
+

2 1 2 1
2
2 2
2
1 1
2
2 1
2 1 2 1
2
2 2
2
1 1
2
2 1
1 1
2
. ,
1 1
2
.
n n n n
s n s n
t x x
n n n n
s n s n
t x x



Intervalos de confianza para la varianza

Puede demostrarse que la variable auxiliar

ns
, se distribuye segn una de
Pearson con n-1 grados de libertad. Ello permite establecer el intervalo de confianza
al (1-)% para la varianza poblacional, como sigue:
2 2
1
2 2

,
ns ns

| |
|
|
\ .

siendo
2
2

y
2
1


2
los valores obtenidos en las tablas de la con n-1 grados de
libertad, que dejan a su izquierda y derecha, respectivamente, un rea igual a y
2

94
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
2
1

.

95









/2 1- 1-/2


2

2

2
2
1




Naturalmente, por mtodos similares, pueden obtenerse intervalos de confianza para
otros muchos parmetros estadsticos.
























____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
96

Teora de la estimacin. Problemas.

1. Supongamos una poblacin formada por los siguientes pesos expresados en
kilogramos: 65, 70, 75, 90. Calclense media y desviacin tpica poblacionales.
Supongamos que de dicha poblacin extraemos muestras con reemplazamiento
de tamao 2. Cuntas muestras diferentes pueden extraerse? Cules son?,
construye la lista completa de las mismas y la distribucin de las
correspondientes medias y desviaciones tpicas muestrales.
Con todos los datos disponibles, concluye si la media muestral y la desviacin
tpica muestral, son estimadores insesgados de los correspondientes parmetros
poblacionales.

2. Utilizando los datos del ejercicio anterior, determnese si la moda muestral es un
estimador insesgado de la media poblacional.

3. Calcular la cuasivarianza de la siguiente muestra de tamao 6:
23, 56, 45, 32, 43, 28.

4. Supongamos que la desviacin de una poblacin normal de dimetros de
arandelas es 0,1 mm. Obtnganse intervalos de confianza para la media de la
poblacin, con niveles de confianza 0.90, 0.95 y 0,99, suponiendo un tamao de
muestra 20.
Cmo vara el intervalo de confianza en funcin del nivel de confianza?

5. En las mismas hiptesis del problema anterior, determnense intervalos de
confianza para la media poblacional, con muestras de tamao 10, 20 y
30,suponiendo en todo caso, un nivel de confianza de 0,95. Cmo vara el
intervalo de confianza con respecto al tamao de la muestra?.

6. Constryase un intervalo de confianza al nivel de significacin 0,01 para la
media de una poblacin normal, sabiendo que la varianza poblacional es 10.000 y
suponiendo un tamao de muestra n=20.

7. Obtngase un intervalo de confianza al nivel de significacin 0,05 para la media
poblacional correspondiente a los saldos bancarios medios de determinada
sucursal, en millones de pesetas. Se tom la siguiente muestra aleatoria de
tamao 6:
2, 0, 4, 1, -2, 4

8. La probabilidad de que una variable N(0,1) est comprendida entre l (ele) y l es
0,90. Calclese l.
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
97

9. En una multinacional de servicios, se modifica la aplicacin informtica de
gestin.
Los tiempos en horas que tardaron 15 trabajadores en adaptarse al nuevo sistema,
fueron los siguientes:
3.3, 2.9, 4.3, 2.6, 3.2, 4.1, 4.9, 2.8, 5.5, 5.3, 3.6, 3, 3.5, 2.9, 4.7.
Determnese un intervalo de confianza al 95% para el verdadero tiempo de
adaptacin. El responsable de implantacin del nuevo sistema, considera que el
tiempo medio de adaptacin es superior a las cinco horas qu podemos decir de
tal aseveracin?

10. Un fabricante de bateras de coche, afirma que duran cuatro aos con una
desviacin de 1 ao. Se tiene una muestra de 5 bateras que duraron
respectivamente 3, 5, 5.8, 6.4, y 8 aos. Determnese un intervalo de confianza
al 99% para s e indquese si es vlida la afirmacin del fabricante.

11. Una mquina llena paquetes de harina. El supervisor del proyecto, desea
conocer con un error de estimacin mximo de 2 y un nivel de confianza del
90% una medida estimada del peso. Como la varianza es desconocida, se
procedi a la estimacin de una muestra piloto, que dio los siguientes
resultado en gramos:
247, 253, 248, 245, 258, 249, 254, 249. Calclese dicho intervalo de confianza
y dimensinese la muestra para poder alcanzar el error de estimacin preciso.
Nota: El error de estimacin no es otra cosa que la semilongitud del intervalo
de confianza.

12. Una muestra aleatoria de 100 vecinos de determinada ciudad, indica que
caminan diariamente una media de 0,9 Km con una desviacin de 0,7.
Calclese un intervalo de confianza al 90% para la media de kilmetros
caminados a diario por los habitantes de dicha ciudad. interprtese el
resultado.

13. Para realizar el control de calidad de un proceso de fabricacin de tornillos, se
toman muestras de tamao 10 y se mide la longitud de cada unidad. Se requiere
que la longitud del tornillo fabricado no difiera de 24 mm en ms de 0,3 mm;
estando ste ltimo desvo garantizado de antemano.

Para ver si el proceso cumple las especificaciones, obtenemos un valor de
media muestral de 24,5 mm. A partir de este valor, intntese contrastar la
hiptesis =24, frente a la alternativa 24.

14. Se mide una muestra de 9 carretes de hilo que presentaron una resistencia
media de 4,40 Kg. y una desviacin de 1,15. Suponiendo que la resistencia a
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
98
la tensin es una variable normal, deberamos hacer caso al fabricante
cuando afirma que la resistencia de sus hilos es de 4,5 Kg?

15. Las calificaciones obtenidas por diez alumnos de un colectivo que realiz un
examen, fueron las siguientes:
4.3, 5.7, 6.8, 3, 2, 7, 6, 3, 3, 9.
Trtese de contrastar la hiptesis La media del examen fue 6 frente a la
alternativa la media del examen fue distinta de seis
16. Supongamos una poblacin formada por las cantidades de camarones, en
kilogramos, vendidas en una lonja portuaria: 650,700,750,900. Calclense:
a) Media y Varianza poblacionales
b) Lista de muestras con reemplazamiento de tamao 2
c) Distribucin de las medias muestrales
d) Esperanza matemtica de las medias muestrales
e) Determnese si la esperanza matemtica de las medias muestrales, es un buen
estimador (INSESGADO) de la media poblacional.
f) Realcese el mismo tratamiento con las varianzas muestrales y determnese si
la varianza muestral es estimador INSESGADO de la varianza poblacional.
g) Realcese el mismo tratamiento con las cuasi-varianzas muestrales y
determnese si la cuasi-varianza muestral es estimador INSESGADO de la
varianza poblacional.

17. Utilizando el dataje del ejercicio n11, determnese si la moda muestral es un
estimador insesgado de la moda poblacional.

18. Calcular la cuasi-varianza de la siguiente muestra de tamao 6: 23, 56, 45, 32,
43, 28.

19. Supongamos que la desviacin de los dimetros de los tornillos fabricados por
una mquina es 0,1 mm. Obtngase un intervalo de confianza para la media de
dicha poblacin, basado en una muestra de tamao 20, al nivel de confianza del
90%.

20. Calclese, en las mismas condiciones anteriores, el intervalo de confianza del
95% y estdiese como cambia la longitud del intervalo con respecto al nivel de
confianza.

21. En condiciones anlogas al ejercicio anterior, calclese el intervalo de
confianza al 95 % para una muestra de tamao 30 y estdiese cmo vara la
longitud del intervalo con respecto al tamao de la muestra.

22. Calclese un intervalo de confianza al nivel de significacin 0,01 para la media
de una poblacin normal, sabiendo que la varianza poblacional es 100 y tomando
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
99
una muestra aleatoria simple de tamao 30.

23. Calclese un intervalo de confianza para la media de una poblacin cualquiera
de la que se desconocen tanto media como desviacin tpica, y de la que se
extrajo una muestra piloto formada por los siguientes elementos: 2,0,4,1,-1,-2,4.


































____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos

WILLIAM SEALEY GOSSET
100
Canterbury en el ao
c en Winchester, en donde ms tarde fue profesor, y
n 1899 se inici en trabajos en el departamento de

Fue el hijo mayor del coronel Frederic Gosset, R.E. Naci en
de 1876 y falleci el 16 de octubre de 1937.
Se edu
en el New College de Oxford en donde estudi qumica y
matemticas.

E
fermentacin de la compaa cervecera de los Sres. Guinness
en Dublin. No se sabe con exactitud en qu momento empez
a interesarse Gosset en la estadstica, sin embargo en esa
poca se empezaron a usar mtodos cientficos y determinaciones de laboratorio para
tcnicas de fermentacin, por lo que es muy posible que siendo Gosset el de mayor
inclinacin matemtica del departamento de fermentacin, recibiera las preguntas
que le hacan sus colegas sobre los mtodos estadsticos en uso y sobre la masa de
datos que se recolectaban -los cuales requeran anlisis-. Quiz esto lo motiv a
estudiar la materia ms a fondo. Su principal herramienta y con la que inici sus
estudios fueron los libros "Teora de errores de observaciones" de G.B.Airy y "El
mtodo de mnimos cuadrados" de M. Merriman. Se sabe que ya en 1903 l
calculaba el error probable. Las circunstancias en las que se llevan a cabo los
procesos de fermentacin en la produccin de cerveza, con materiales variables,
susceptibilidad a cambio de temperaturas y necesariamente series pequeas de
experimentos, son tales que pronto demostraron a Gosset las limitaciones de la teora
de muestras grandes y le enfatizaron la necesidad de un mtodo correcto para el
tratamiento de muestras pequeas.

No fue entonces accidente, sino ms bien las circunstancias de su trabajo, las que
dirigieron a Gosset hacia este problema, y lo condujeron al descubrimiento de la
distribucin de la desviacin estndar muestral, lo cual dio origen a lo que en su
forma moderna se conoce como la prueba t. Durante mucho tiempo despus de su
descubrimiento, el uso de esta prueba no se conoci ampliamente fuera de la
compaa Cervecera Guinness, en donde se le ha usado intensamente desde entonces.

En al menos una ocasin le fue ofrecida una posicin acadmica en la que tal vez
hubiera sido un buen profesor, pero es muy poco probable que su trabajo de
investigacin hubiera florecido en circunstancias acadmicas; su mente funcionaba
de forma diferente.

Egon Pearson, quien tuvo la fortuna de conocerlo escribi:

____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
101
"Todos los que lo conocieron estarn de acuerdo en que posea ms de las
caractersticas del estadstico perfecto que cualquier otro hombre de su tiempo. Ellos
tambin coincidirn en el balance esencial y tolerancia de su punto de vista, y en ese
algo que lo hizo durante su vida la misma persona amistosa, confiable, callada y sin
malicia, que trabaj no para su reputacin personal, sino porque sinti que haba un
trabajo que hacer y por lo tanto vala la pena hacerlo bien".




































____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
102

CONTRASTE DE HIPTESIS



























Para qu?
Para, siguiendo con el proceso de ahorro mediante el estudio de
muestras, establecer los criterios matemticos que nos permiten
predecir y asegurar caractersticas de la poblacin; para asegurar que
otra muestra procede o no de la misma poblacin, para determinar si
un medicamento o una dieta funcionan, para aprender a interpretar las
estadsticas hechas por otros y decidir si "son de fiar"




____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos

Contraste de Hiptesis

Hiptesis estadsticas. Definiciones

Como se indic anteriormente, el mtodo de Contraste de Hiptesis no es ms que
otra de las metodologas empleadas dentro de la Inferencia Estadstica.

Planteamiento del problema

General: Se trata de tomar decisiones y conocer caractersticas de la poblacin a
partir de datos obtenidos en el estudio de una muestra. Para ello, realizamos
suposiciones acerca de la poblacin en estudio; tales supuestos, que finalmente
pueden resultar ciertos o falsos, se denominan Hiptesis Estadsticas.
-Para plantear este tipo de problemas, se establece una hiptesis principal, H
0
,
que denominamos Nula y consideramos en principio cierta, para comenzar a
trabajar; establecemos adems otra hiptesis, que denominamos Alternativa,
denotamos como H
1
, y consideramos en principio falsa.
-El problema consiste en obtener un criterio de decisin que permita
determinar si se acepta H
0
, o si por el contrario, debe rechazarse y aceptar H
1
.
-Si planteamos H
0
en trminos de igualdad, es decir, la enunciamos como:
"Parmetro estadstico x=B"
deberemos realizar un test bilateral o de dos colas, mientras que si la
planteamos en trminos de mayora / minora, es decir:
"Parmetro estadstico x>B (<B)"
el test a utilizar, deber ser unilateral o de una cola.

Casustica: En la utilizacin de esta metodologa que describimos, pueden
presentarse 4 casos:
1-Aceptar H
0
siendo cierta
2-Aceptar H
0
siendo falsa ERROR TIPO II
3-Rechazar H
0
siendo cierta ERROR TIPO I
4-Rechazar H
0
siendo falsa

En los casos 1 y 4, la decisin que tomamos es la correcta, en los casos 2 y 3,
obviamente, tomamos la decisin errnea. Los errores cometidos se denominan
como se indica al margen.





103
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
En realidad, desconocemos lo que ocurre realmente con H
0
, es precisamente para ello
que realizamos el test. En sentido estricto, no sabremos nunca con exactitud, en cual
de los 4 casos posibles nos encontramos, tratamos de minimizar las probabilidades
de cometer error o al menos, cuantificar claramente dicha probabilidad.

Para limitar el error tipo I, fijamos un nivel de significacin al test, que definimos
precisamente como "probabilidad de error tipo I" y denotamos como .
Dicho nivel de significacin, se fija como viene siendo habitual, con anterioridad a la
realizacin del test y dependiendo de la importancia del problema.
Los valores habituales, son =0,05 y =0,01.
Para limitar el error tipo II, es necesario estudiar las denominadas curvas
caractersticas o curvas de potencia del test, pero ello es algo que sobrepasa con
mucho el propsito de este curso, y no lo realizaremos.

En definitiva, el problema se plantea y resuelve como sigue:
*Se trata de estimar un parmetro poblacional, a partir de los datos contenidos
en una muestra.
1. Definimos un estimador
2. Enunciamos H
0
y H
1

3. Fijamos el nivel de significacin del test ()
4. Obtenemos las regiones R
a
(Aceptacin) y R
c
(Rechazo)
5. Adoptamos el siguiente criterio de decisin:
0
0
.... Re
....
H chazamos R
H Aceptamos R
c
a



Contraste de hiptesis para la media

Caso 1. Poblacin con conocida o n 30
Descripcin: Suponemos una poblacin de conocida, para la que deseamos
contrastar la hiptesis = x .
-Disponemos de una muestra de tamao n
-H
0
: = x ; H
1
: x
Consideraciones: Sabemos que la distribucin de las medias muestrales , de
muestras de tamao n, procedentes de una poblacin normal de media y
desviacin tpica , es una normal
|
.
|

\
|
n
N

, .
x
Procedimiento:
Definimos el estimador ) 1 , 0 ( N
n
x
z



104
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
Fijamos
Obtenemos en tablas N(0,1), los valores de
2

y -
2

, tales que


=
(
(
(

<

< 1
2 2
n
x
P
Definimos R
a
= |
.
|

2 2
,


\
|

Usamos la siguiente regla de decisin:
Si z R se acepta H
a
0
nivel 100(1-)%; caso contrario, rechazamos H
0

Caso 2. Poblacin con desconocida pero con n 30
En este caso y gracias al TCL, podemos utilizar el contraste anterior, sustituyendo
por la desviacin tpica muestral s.


Caso3. Poblacin con desconocida y n < 30

Descripcin: Suponemos una poblacin de desconocida, para la que deseamos
contrastar la hiptesis =x.
-Disponemos de una muestra de tamao n<30
-H
0
: = x ; H
1
: x
Consideraciones: Sabemos que el estadstico
1

n
s
x

1 n
t ; es decir, sigue una
distribucin t de Student con n-1 grados de libertad.

Procedimiento:
Definimos el estimador z=
1

n
s
x
1

n
t
Fijamos el nivel de significacin
Obtenemos de la tabla t-Student los valores
2

t y -
2

t (importante recordar
en este paso que la bsqueda debe hacerse teniendo en cuenta que usamos n-1
grados de libertad), tales que:


=
(
(
(

<

< 1
1
2 2
t
n
s
x
t P
105
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
Definimos el intervalo R
a=
|
.
|

\
|

2 2
,

t t

Usamos la siguiente regla de decisin:
Si zR
a
aceptamos H
0
al nivel (1-)%, caso contrario la rechazamos.

Contraste de hiptesis para la diferencia de medias

Caso1. Varianzas conocidas

Descripcin: Tenemos dos poblaciones de varianzas conocidas y , cuyas
medias queremos comparar.
2
1

2
2

Seleccionamos muestras de tamaos n


1
y n
2

H
0
:
1
-
2=
d H
1
:
1
-
2
d
Consideraciones:Si hacemos d=0, H
0
quedar como
1
=
2,
lo que significa que este
mismo test, podr usarse para comprobar si dos muestras proceden de
poblaciones con la misma media.

Procedimiento:
Definimos el estadstico z= ) 1 , 0 (
2
2
2
1
2
1
2 1
N
n n
d x x

+



Fijamos



Obtenemos de la tabla N(0,1) los valores
2 2
y


Definimos R
a=
|
.
|
\

2 2
,

|


Adoptamos la misma regla de decisin que en los casos anteriores.

Caso 2. Varianzas desconocidas pero n
1
30, n
2
30

En este caso y gracias al TCL, podemos utilizar el contraste anterior, estimando
1
y

2
por las desviacines tpicas muestrales s
1
y s
2
.

Caso3. Varianzas desconocidas pero iguales
(Caso menos frecuente)
Descripcin y Consideraciones: Idem a los casos anteriores.



106
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
Procedimiento:
Definimos el estadstico
2
2 1
2 1
2 1
1 1
+

+

=
n n
t
n n
s
d x x
t
siendo
2
) 1 ( ) 1 (
2 1
2
2 2
2
1 1
+
+
=
n n
s n s n
s
Fijamos
Usando las tablas de la t-Student con n
1
+n
2
-2 grados de libertad,
determinamos los valores
2

t y
2

t .
Definimos R
a= |
.
|
\
|

2 2
,

t t
Aplicamos la misma regla de decisin que en los casos anteriores.


Contrastes unilaterales

Hasta ahora, hemos usado contrastes en los que se utilizaban las dos colas de la
distribucin. Existen, sin embargo, problemas en los que es suficiente utilizar una
sola cola de la misma; aquellos, por ejemplo, en los que queremos determinar si la
media de determinada poblacin es mayor que determinado valor o si determinado
producto, tiene un rendimiento mayor que otro dado.
En este tipo de test, se asigna el nivel de significacin a una de las colas de la
distribucin del estadstico utilizado; es decir, si el estadstico zN(0,1) y =0,05, se
determina el valor
05 . 0
que deja a su derecha un rea bajo la curva normal igual a
0,05.
Si el estadstico z<
05 . 0
, aceptamos H
0
al 95%; caso contrario, rechazamos H
0
y
aceptamos H
1
.
Los estadsticos a usar en tests unilaterales, son idnticos a los definidos para tests
bilaterales.


Contrastes relacionados con la de Pearson

Caso 1.Contraste de la bondad de un ajuste

Descripcin:El problema que se trata de resolver consiste en decidir si una muestra
obtenida al azar, procede de una poblacin con cierta distribucin.
H
0
=La poblacin tiene una distribucin determinada
H
1
=La poblacin no tiene tal distribucin

107
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
Procedimiento:
Bajo la hiptesis H
0
, se calculan las frecuencias esperadas para la muestra y
se designan por e
i.
Dichas frecuencias deben compararse con las realmente observadas,
designadas por o
i.
Si las diferencias entre e
i
y o
i
son grandes o significativas, se rechaza H
0
y
se concluye que la poblacin no responde al modelo de probabilidad
propuesto.
El estadstico que suele usarse para este contraste es:
( )
i
i i
k
i
e
e o
2
1
2

=

=

para el que puede demostrarse que se distribuye segn una con k-1 grados
de libertad, siendo k el nmero que indica la cantidad tanto de observaciones
como de estimaciones, si no es necesario estimar ningn parmetro
poblacional para obtener la coleccin e
2

i,
o con k-r-1 grados de libertad, si es
necesario estimar r parmetros para obtener dicha coleccin.
Una vez fijado el valor de y los grados de libertad correspondientes,
determinamos en las tablas de la , el valor de que deja a su derecha una
probabilidad igual a .
2
t

Por ltimo, se adopta la siguiente regla de decisin:


Se aceptan H
2 2
>
t
0
y el ajuste
Se rechazan H
2 2
<
t
0
y el ajuste

Caso 2. Contrastes de homogeneidad

Descripcin: El problema que se trata de resolver, consiste en determinar si dividida
la poblacin en subgrupos y clasificados los mismos segn determinada variable
estadstica (aquella que analizamos) en una tabla de contingencia, todos ellos
responden a dicha variable con homogeneidad ( o en definitiva, todos ellos proceden
de la misma poblacin).

Procedimiento:

Formulamos las siguientes hiptesis:
H
0
: Los resultados son homogneos
H
1
: Los resultados no son homogneos
A partir de H
0
y tomando como referencia los valores y/o proporciones
totales, se calculan las frecuencias esperadas para los diferentes grupos.

Se define el estadstico:
108
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos


=
j i
ij
ij ij
e
e o
,
2
2
) (

y se calcula su valor para la tabla de contingencia dada.
Fijamos el nivel de significacin
Si la tabla de contingencia tiene k filas y h columnas, la terica que debe
usarse, tiene (k-1)(h-1) grados de libertad, representando dicho nmero, el
nmero de valores esperados que es necesario calcular, para obtener la
coleccin e
ij
El hecho de usar (k-1) y (h-1) se debe a que el ltimo valor de cada fila o
columna, puede calcularse por simple diferencia con los totales respectivos.
Como en casos anteriores, adoptamos la siguiente regla de decisin:
Se aceptan H
2 2
>
t
0
y la homogeneidad
Se rechazan H
2 2
<
t
0
y la homogeneidad



























109
____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
110

Contraste de Hiptesis. Problemas


1. Para realizar el control de calidad de un proceso de fabricacin de tornillos,
se toman muestras de tamao 10 y se mide la longitud de cada unidad. Se
requiere que la longitud del tornillo fabricado no se desve de 24 mm ms de
0,3 mm, estando ste ltimo desvo patrn garantizado de antemano.
Para ver si el proceso cumple las especificaciones, obtenemos un valor para la
media muestral de 24,5 mm; a partir de este valor, intntese contrastar la
hiptesis =24 frente a la alternativa 24

2. Se mide una muestra de carrete de hilo, que presenta una resistencia media de
4,40 Kg. y una desviacin de 1,15. Suponiendo que la resistencia a la tensin
sea una variable normal Debemos hacer caso al fabricante cuando afirma
que su producto tiene una resistencia de 4,5 Kg. ?

3. Las calificaciones obtenidas por diez alumnos de un colectivo que realiz un
examen, fueron las siguientes: 4.3; 5.7; 6.8; 3; 2; 7; 6; 3; 3; 9.
Trtese de contrastar al hiptesis: "La media del examen fue 6", frente a la
alternativa "La media del examen fue distinta de 6".

4. Trtese de comprobar, al nivel de significacin 0,05 si la siguiente
distribucin de pesos procede de una poblacin normal:

Peso 57-60 60-63 63-66 66-69 69-72 72-75 Total
O
i
4 11 23 27 21 9 95


5. Uno de los experimentos ms clebres de Mendel, el cruce de guisantes
verdes y guisantes amarillos, dio como resultado una distribucin del 75% de
guisantes amarillos y 25% de guisantes verdes. En una toma de muestras de
956 unidades, se obtuvieron 246 verdes. Est este resultado de acuerdo con
la hiptesis de Mendel?








____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
111
6. Diez personas fueron sometidas a un examen pormenorizado de Estadstica,
de tipo test, antes y despus de recibir un curso sobre tal materia. Los
resultados obtenidos fueron los siguientes:

Persona 1 2 3 4 5 6 7 8 9 10
Antes 6 7 5.5 4.6 3.3 8.3 9 5 7 3
Despus 6.5 7.3 9 4 6 6 9.2 6.1 4 6

Proporcionan los resultados una base suficiente para afirmar con =0.05, que
el curso fue efectivo?

7. En un centro de investigacin pesquera, se investiga sobre la dieta ms
adecuada para los alevines de Rodaballo. Para ello, se eligieron 24 alevines
de caractersticas similares, y se repartieron en dos piscinas con alimentacin
diferenciada. Se citan los pesos ganados en tres meses.

A 0.95 1.27 1.60 1.40 1.50 1.30 0.97 1.47 1.56 1.34 1.35 1.00
B 1.02 1.45 1.26 1.80 1.30 1.54 1.07 1.90 1.75 1.22 1.65 1.50

Puede asegurarse a la vista de los resultados y con un nivel de significacin
=0.01 que una de las dietas de alimentacin de los rodaballos produce un
engorde significativamente mayor que la otra?




















____________________Introduccin a los mtodos estadsticos, numricos y probabilsticos
112

EGON SHARPE PEARSON

Egon Pearson, hijo nico del famoso matemtico Karl
Pearson, no est reputado como un creador o un
descubridor dentro del campo de la Estadstica. Vivi la
totalidad de su vida a la sombra (indeseada por l, por otra
parte) de la fama de su padre.
Sin embargo, su contribucin a la Teora de la Estimacin,
es de una importancia radical y comnmente reconocida.
Fue junto con Newman que desarroll la Tcnica de
Contraste de Hiptesis, recibida en principio con
animadversin por Fisher, pero finalmente aceptada de
forma global.
Durante la Segunda Guerra Mundial, trabaj en Mtodos
Estadsticos para el Control de Calidad, contribuyendo en gran medida a la creacin
de una nueva disciplina en el campo del control de operaciones.

También podría gustarte