Statistics">
Nothing Special   »   [go: up one dir, main page]

Tema 5 Estadistica

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 28

Estadística Aplicada

Tema 5: Introducción a la inferencia


estadística
1. Planteamiento y objetivos

2. Estadísticos y distribución muestral

3. Estimadores puntuales

4. Estimadores por intervalos

5. Contrastes de hipótesis

Lecturas recomendadas:
 Capítulos 20 y 21 del libro de Peña y Romo (1997)
Estadística Aplicada

5.1 Planteamientos y objetivos

Estadística Descriptiva: la edad media de una muestra de 20 votantes del


PP es de 55 con desviación típica 5.

Modelo Probabilístico: La edad de un votante del PP sigue una distribución


normal N(m,s2)

Inferencia:
• Predecimos que m = 55.
• Rechazamos la posibilidad de que m < 50.
Estadística Aplicada

5.2 Estadísticos y distribución muestral

Distintas muestras tienen distintas


medias. Antes de sacar la muestra,
la media es una variable.

La media y varianza de la media son

Si N es suficientemente grande, la
distribución de la media es normal

Para ver cómo varia la media de distintas muestras:


http://www.est.uc3m.es/amalonso/esp/Ejemplo%20Muestreo.xls
http://www.stat.tamu.edu/~west/ph/sampledist.html
Estadística Aplicada

5.3 Estimadores puntuales

Usamos X como estimador de la media poblacional m.

Dada una muestra, x es una estimación de m.

Buenas propiedades estadísticas:


Insesgadez,
Eficiencia
Máxima verosímilitud, etc.

Igualmente S2 es un estimador (razonable) de s2.

Dada una muestra, s2 es una estimación de s2.


Estadística Aplicada

5.4 Estimadores por intervalos

Queremos calcular un intervalo donde estamos bastante seguros de que esté m.

Intervalo ancho muy impreciso

Intervalo pequeño más probabilidad de cometer un error.

Método probabilístico de construcción de un intervalo de confianza:


• Elegir un nivel de confianza, por ejemplo 95% (ó 90% ó 99%)
• Elegir variables L(X1,…,XN), U(X1,…,XN) tales que P(L < m < U) = 95%

• Dados los datos de la muestra, un intervalo de 95% de confianza es


(L(x1,…,xN), U(x1,…,xN))
Estadística Aplicada

Interpretación

Si construimos muchos intervalos con el mismo método y el mismo nivel


de confianza de 95%, esperamos que el 95% de estos intervalos
contendrán el parámetro que queremos estimar.

Si hemos construido un intervalo de 95% de confianza, no es correcto


afirmar que la probabilidad de que m esté dentro del intervalo es de 95%.

¿Y cuál es esa probabilidad?

Para ilustrar la proporción de intervalos que contienen al valor verdadero:


http://www.est.uc3m.es/amalonso/esp/intervalosconfianza.xls
http://www.ruf.rice.edu/~lane/stat_sim/conf_interval/index.html
Estadística Aplicada

Un intervalo de 95% de confianza para la media de


una población normal (varianza conocida)

Dada una muestra, x1,…xN, un intervalo de 95% de confianza para m es

¿De dónde viene el 1,96?


¿Cómo sería un intervalo de
90% (y del 99%) de confianza?
Estadística Aplicada

Ejemplos
En una muestra de 20 extremeños, su sueldo medio era de € 2000
mensuales. Suponiendo que la desviación típica de los sueldos en
Extremadura es de € 500, hallar un intervalo de 95% de confianza
para el sueldo medio en Extremadura.

En una muestra de 10 estudiantes de ciencias políticas, la altura


media era de 170cm. Suponiendo que la desviación típica de las
alturas es de 5cm, hallar un intervalo de 99% de confianza para la
altura media.
Estadística Aplicada

¿Hay una manera más rápida de Computación en Excel


hacer este cálculo?
Estadística Aplicada

En Excel 2010 se utiliza INTERVALO.CONFIANZA.NORM()

Sólo tenemos que restar y sumar el valor de la media para


calcular el intervalo.
Estadística Aplicada

Un intervalo de 95% de confianza para una


proporción

Dada una muestra de tamaño N con proporción muestral , un intervalo de 95% de


confianza para p es
Estadística Aplicada

Ejemplos

En una muestra aleatoria de 100 votantes, 45 de ellos votaron al PSOE en las


últimas elecciones. Usar esta información para estimar la proporción de los
votantes en España que votaron al PSOE. Dar una estimación puntual y un
intervalo de confianza de 95%.

20 personas en una muestra de 30 norteamericanos están a favor de la


legalización de la mariguana. Estimar la proporción de la población americana que
esté a favor y dar un intervalo de 90%.
Estadística Aplicada

Computación en Excel

¿Podemos utilizar INTERVALO.CONFIANZA.NORM?


Estadística Aplicada

¡Si! … pero tiene “truco”

Ahora la desviación estándar es √ (p^ x (1-p^)).

Restando y sumando el resultado de 0,45, obtenemos el resultado.


Estadística Aplicada

Ejemplo: (Pregunta de Examen)


Los datos proviene del “último” barómetro del CIS. Las valoraciones siguen
distribuciones normales con desviaciones típicas iguales a las que aparecen en la
tabla.

Hallar intervalos de confianza al


95% para las verdaderas
valoraciones medias de Alfredo
Pérez Rubalcaba y de Mariano
Rajoy.

¿Es razonable suponer que las


valoraciones medias son iguales?

Comentar su respuesta.
Estadística Aplicada

Ejemplo: (Pregunta de Examen)


La siguiente tabla proviene del barómetro del CIS de abril de 2011.

Hallar un intervalo de 95% de confianza para la proporción de personas en


España que piensan que la situación económica ahora es igual o mejor que hace
un año.
Estadística Aplicada

Ejemplo: (Pregunta de Examen)


La siguiente noticia apareció en La Razón, el 9 de diciembre de 2009.

Una encuesta sostiene por primera vez que los catalanes quieren la
independencia
Un 50'3% de los catalanes votarían a favor de la independencia de Cataluña y sólo un 17,8% votaría en
contra en el caso de que esta comunidad celebrase un referéndum democrático de autodeterminación,
según un estudio de la Universitat Oberta de Catalunya (UOC) dirigido por Miquel Strubell.

El estudio se ha realizado mediante encuesta telefónica a 2.614 personas, de entre 15 y 74 años que
residen en Cataluña, y basándose en una muestra aleatoria estratificada en seis veguerías. Ésta es la primera
vez que un sondeo de estas características apunta a una victoria soberanista, aunque condicionada a la
participación.

Preguntadas por la decisión que tomarían en el caso de que en Cataluña se celebrase un referéndum de
autodeterminación, un 50,3% de las personas entrevistadas votarían a favor de esta consulta, mientras que un
24,6% se abstendrían, un 17,8% votaría en contra y un 7,2% no sabe o no contesta.

A pesar de estas cifras, un 58,1% de los encuestados cree que Cataluña no llegará a ser independiente,
frente al 31,1% que lo ven posible.

Utilizando los datos de la encuesta, calcular un intervalo de 95% de confianza para la verdadera proporción
de catalanes que votarían a favor de la independencia.
Estadística Aplicada

Ejemplo: (Pregunta de Examen)


La siguiente tabla proviene del Barómetro del Real Instituto Elcano (BRIE) de marzo-
abril 2012. Los resultados provienen de una muestra de 1000 españoles adultos.

Calcular un intervalo de 95% de confianza para la verdadera proporción de los


españoles que piensan que la nacionalización de Repsol-YPF por Argentina es
una situación nada grave.
Estadística Aplicada

Material Adicional
Estadística Aplicada

Un intervalo de 95% de confianza para la media de


una población normal (varianza desconocida)

Hasta ahora, hemos supuesto que la varianza es conocida para construir el


intervalo de confianza. En la práctica, este supuesto puede ser incorrecto.

¿Qué hacemos?

Si la muestra es grande (> 30), podemos construir el intervalo como


anteriormente, sustituyendo la desviación muestral, s2, por la poblacional
que desconocemos.
Estadística Aplicada

Si la muestra es más pequeña utilizamos un intervalo basado en


La distribución t de Student.

¿Qué es t?

Parece un más difícil construirlo pero en Excel 2010 … se puede hacer


de manera fácil.
Estadística Aplicada

Ejemplo

Se tienen datos sobre la duración de las sentencias de 19 criminales


convictos de homicidios en España. La media y desviación típica de las
sentencias son de 72,7 y 10,2 meses respectivamente.

Calcular un intervalo de 95% para la duración media de las sentencias por


homicidio en España.
Estadística Aplicada

Usamos la función INTERVALO.CONFIANZA.T

El intervalo es de 66,98 a 78,42 meses.

Con los datos originales es aún más fácil construir un intervalo de confianza …
Estadística Aplicada

Ejemplo

Se ha diseñado una encuesta para estimar el sueldo medio anual de los


banqueros en España. Una muestra de 10 ejecutivos proporcionaron los
siguientes resultados (en miles de euros).

1200, 1000, 1500, 800, 750, 2400, 1000, 1600, 700, 600

Hallar un intervalo de 95% de confianza para el verdadero sueldo medio de


los banqueros en España.
Estadística Aplicada

Utilizamos la opción de Estadística


Descriptiva en Data Analysis de Excel.

Columna1

Media 1155,00
Error típico 173,92
Mediana 1000,00
Moda 1000,00
Desviación estándar 549,97
Varianza de la muestra 302472,22
Curtosis 1,95
Coeficiente de asimetría 1,40
Rango 1800,00
Mínimo 600,00
Máximo 2400,00 Simplemente restamos y sumamos para
Suma 11550,00 calcular el intervalo.
Cuenta 10,00
(€761570, €1548430)
Nivel de
confianza(95,0%) 393,43 761,57 1548,43
Estadística Aplicada

Un intervalo de 95% de confianza para la diferencia


de las medias de dos poblaciones normales
(datos emparejados)
Año ¿Qué son datos emparejados?
Banquero 2012 2013
1 1300 1200
2 1100 1000
3 1200 1500
Ejemplo
4 900 800 Tenemos los datos de los sueldos de los
5 800 750 mismos banqueros tanto en el año 2012
como en el año 2013. Queremos estimar el
6 2000 2400
crecimiento en el sueldo medio de los
7 1100 1000 banqueros en los dos años.
8 1500 1600
9 700 700
10 500 600
Estadística Aplicada

Año
Banquero 2012 2013 Diferencia
1 1300 1200 -100
2 1100 1000 -100 Calculamos los sueldos medios en cada año
3 1200 1500 300 y calculamos la diferencia:
4 900 800 -100
1155-1110 = 45
5 800 750 -50
6 2000 2400 400
o calculamos los cambios en sueldo y
7 1100 1000 -100
sacamos la media de las diferencias:
8 1500 1600 100
9 700 700 0
(-100 -100 + 300 + … + 100)/10 = 45
10 500 600 100
1110 1155 45

Una estimación razonable del crecimiento del sueldo de los banqueros es €45000.
¿Cómo sacamos un intervalo de confianza?
Estadística Aplicada

Banquero Diferencia
1 -100 Consideramos sólo la muestra de diferencias.
2 -100
3 300 Ya tenemos sólo una muestra y podemos
4 -100 calcular un intervalo de confianza basado en
5 -50 la distribución t de Student
6 400
7 -100 Columna1
8 100
9 0 Media 45,00
10 100 Error típico 56,98
45 Mediana -25,00
Moda -100,00
El intervalo es de 45 ± 128,91 miles de euros, Desviación estándar 180,20
es decir (- € 83910, €173910).
Varianza de la muestra 32472,22
Suma 450,00
Parece verosímil que no haya cambiado el
Cuenta 10,00
verdadero sueldo medio.
Nivel de confianza(95,0%) 128,91

También podría gustarte