Estadistica Basica UnADM
Estadistica Basica UnADM
Estadistica Basica UnADM
Programa desarrollado
Primer cuatrimestre
Programa de la asignatura:
Estadstica bsica
Clave:
ESAD
Noviembre, 2010
Estadstica bsica
Programa desarrollado
ndice
I.
A. Ficha de identificacin
B. Descripcin
C. Propsito
II.
Competencia a desarrollar
III.
Temario
IV.
Metodologa de trabajo
V.
Evaluacin
VI.
Material de apoyo
VII.
21
34
Estadstica bsica
Programa desarrollado
Tronco comn
Estadstica bsica
Seriacin:
Sin seriacin
Cuatrimestre:
Horas contempladas:
Primero
90
B. Descripcin
En un mundo cada vez ms competitivo, tanto en las reas comerciales, financieras,
tecnolgicas y cientficas, y donde invariablemente el flujo de informacin es mayor a cada
momento, se hace indispensable no slo la correcta descripcin de los datos sino tambin su
anlisis e interpretacin. Es aqu donde la estadstica juega un papel preponderante, al ser una
de las herramientas ms poderosas para comprender la variabilidad inherente a los datos
observados y se constituye como la mejor herramienta para la toma de decisiones.
La diversidad de conocimientos, habilidades, actitudes, creencias y valores, requeridos en cada
una de las carreras que ofrece la ESAD, hace necesaria la conformacin de un tronco bsico
que, por un lado, garantice la formacin integral en los atributos generales deseables de los
estudiantes, y por el otro, derive, de manera natural, en los atributos particulares necesarios
para cada disciplina de estudio.
El tronco bsico se conforma de varias asignaturas comunes que promueven, por un lado, la
formacin integral de los estudiantes, integrando asignaturas de distintas reas del
conocimiento, y por otro lado, desarrollan en el estudiante competencias transversales
necesarias para la investigacin, el anlisis crtico, el manejo y la sistematizacin de
informacin y datos, as como una serie de valores que le permitan conducirse con tica y
responsabilidad durante su trayectoria acadmica y su desempeo profesional.
Las materias que forman el tronco bsico son: Contexto socioeconmico de Mxico, Desarrollo
humano, Estadstica bsica y Fundamentos de investigacin; estas materias a simple vista
parecen desarticuladas, pero se interrelacionan para contribuir a la formacin integral de los
estudiantes.
Estadstica bsica
Programa desarrollado
En relacin al tronco bsico la asignatura Estadstica bsica tiene varios propsitos, pues
pretende despertar en el estudiante el inters por la investigacin para la toma de decisiones, la
solucin de problemas y el anlisis de situaciones y eventos relacionados con el entorno
acadmico, profesional, personal y social, rigindose en todo momento por un cdigo de tica
profesional y personal.
Los propsitos de la asignatura en relacin al tronco bsico son que los estudiantes:
1. Adquieran la capacidad de lectura e interpretacin de tablas y grficos estadsticos que
con frecuencia aparecen en diferentes medios.
2. Lleguen a comprender y apreciar el papel de la estadstica en la sociedad, incluyendo
sus diferentes campos de aplicacin y el modo en que la estadstica ha contribuido a su
desarrollo.
3. Identifiquen, dentro del contexto socioeconmico mexicano, la importancia y utilidad de
los anlisis estadsticos para la toma de decisiones.
4. Se conduzcan de manera tica y responsable en el manejo y anlisis de la informacin.
De manera particular, la materia pone especial nfasis en el enfoque prctico del material y los
contenidos que se presentan, tratando siempre de relacionar los conceptos, tcnicas y casos de
estudio con el quehacer cotidiano de las diferentes disciplinas, esperando despertar en los
estudiantes el deseo de adentrarse cada vez ms a la teora de la probabilidad y estadstica, al
ver lo importante que resulta su utilizacin en las diferentes reas de trabajo.
La asignatura consta de cuatro unidades. En la primera unidad se estudian los fundamentos de
la estadstica, en la segunda las tcnicas para representacin grfica y numrica de datos, en la
tercera se abordan los conceptos bsicos de la teora de probabilidad como una medida del
riesgo frente a la incertidumbre en experimentos aleatorios y la ltima unidad presenta el
concepto de variables aleatorias y los modelos de probabilidad Binomial, Poisson y Normal.
C. Propsito
La asignatura tiene como propsito introducir al estudiante con los conceptos y tcnicas bsicas
de la estadstica aplicada a la licenciatura e ingeniera. El curso tiene un nivel matemtico
elemental, con la intencin de que el estudiante comprenda la metodologa y su aplicacin, y no
tanto la teora matemtica detrs de ella.
Estadstica bsica
Programa desarrollado
III. Temario
1. Fundamentos de la estadstica
1.1. Introduccin a la estadstica
1.1.1. Divisin de la estadstica
1.2.
1.2.1.
1.2.2.
1.2.3.
1.2.4.
1.2.5.
1.2.6.
1.2.7.
1.3.
Muestreo aleatorio
1.3.1. Conceptos bsicos de muestreo aleatorio
1.3.2. Metodologa del muestreo aleatorio simple
2. Representacin numrica y grfica de datos
2.1.
2.1.1.
2.1.2.
2.1.3.
2.1.4.
2.1.5.
2.1.6.
2.1.7.
2.2.
2.2.1.
2.2.2.
2.2.3.
Estadstica bsica
Programa desarrollado
3.2.
3.2.1.
3.2.2.
3.2.3.
Medidas de dispersin
Recorrido
Varianza
Desviacin tpica o estndar
Estadstica bsica
Programa desarrollado
V. Evaluacin
En el marco del Programa de la ESAD, la evaluacin se conceptualiza como un proceso
participativo, sistemtico y ordenado que inicia desde el momento en que el estudiante ingresa
al aula virtual. Por lo que se le considera desde un enfoque integral y continuo.
Por lo anterior, para aprobar la asignatura, se espera la participacin responsable y activa del
estudiante as como una comunicacin estrecha con su facilitador para que pueda evaluar
objetivamente su desempeo. Para lo cual es necesaria la recoleccin de evidencias que
permitan apreciar el proceso de aprendizaje de contenidos: declarativos, procedimentales y
actitudinales.
Estadstica bsica
Programa desarrollado
Esquema de Evaluacin
Foros y base de datos
10%
Taller y tareas
30%
Evidencias
40%
Autorreflexiones
10%
E-portafolio. 50%
Examen final
10%
Calificacin Final
100%
Cabe sealar que para aprobar la asignatura, se debe de obtener la calificacin mnima
indicada por la ESAD.
Bibliografa complementaria:
Wackerly Dennis D., Mendenhall William III, Scheaffer, Richard L. (2010). Estadstica
Matemtica con Aplicaciones. Sptima Edicin. Mxico: Cengage Learning.
Ferris Ritchey. (2008). Estadstica aplicada a las ciencias sociales. Segunda Edicin.
Mxico: Mc Graw Hill.
Douglas L., William M., Samuel W. (2008). Estadstica aplicada a los negocios y la
economa. Decimotercera Edicin. Mxico: Mc Graw Hill.
Castillo Manrique, Isabel (2006). Estadstica descriptiva y clculo de probabilidades,
Primera Edicin. Pearson Education de Mxico.
Estadstica bsica
Programa desarrollado
Competencia especfica
Aplica la metodologa estadstica para obtener informacin de una muestra aleatoria simple,
identificando los elementos que intervienen en un problema estadstico.
Introduccin
La palabra estadstica a menudo te remite a grficas y tablas; cifras relativas a nacimientos,
muertes, impuestos, demografa, ingresos, deudas, crditos, etc. No obstante, para aprovechar
las herramientas de anlisis estadstico, es necesario comprender qu representa cada
concepto y la metodologa mediante la cual se obtiene un dato estadstico.
Estadstica bsica
Programa desarrollado
10
Estadstica bsica
Programa desarrollado
11
Estadstica bsica
Programa desarrollado
1.2.4. Muestreo
Es el proceso de recabar los datos que se desean analizar, obtenidos de una proporcin
reducida y representativa de la poblacin.
1.2.5. Dato
El dato es cada uno de los valores que se han obtenido al realizar un estudio estadstico. Por
ejemplo: Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara,
cruz.
1.2.6. Variable
Se llama variable a una caracterstica que se observa en una poblacin o muestra, y a la cual
se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo.
Las variables se pueden clasificar en cuantitativas y cualitativas:
12
Estadstica bsica
Programa desarrollado
13
Estadstica bsica
Programa desarrollado
14
Estadstica bsica
Programa desarrollado
15
Estadstica bsica
Programa desarrollado
que no existe ninguna duda para generalizar tales resultados, pero tambin implica
estudiar a la totalidad de los casos de la poblacin.
Para evitar un costo muy alto se busca un porcentaje de confianza menor, comnmente
es un 95%. El nivel de confianza es la probabilidad que establecemos (sin hacer ningn
clculo) para poder acertar al valor verdadero de la poblacin. Este dato se obtiene a
partir de la distribucin normal estndar (esto se considerar en la unidad 4).
Porcentaje de error: Este error es una distancia alrededor del valor que deseamos
estimar y nos da un margen de aproximacin. Al igual que en el caso de la confianza, si
se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del
mismo tamao que la poblacin, por lo que conviene correr un cierto riesgo de
equivocarse. Comnmente se aceptan entre el 4% y el 6% como error, tomando en
cuenta de que no son complementarios la confianza y el error.
4.
n es el tamao de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
E es la precisin o error
Ejemplo:
Educacin Superior Abierta y a Distancia Primer cuatrimestre
16
Estadstica bsica
Programa desarrollado
n es el tamao de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamao de la poblacin
E es la precisin o error
Ejemplo:
En un lote de 25,000 cajas de medicina, se desea verificar que la proporcin de los
ingredientes activos sea el adecuado. Se debe determinar el tamao de la muestra para
un nivel de confianza del 95% con un error del 5%. Supongamos que la variabilidad
p=q=0.5.
Solucin:
Para el nivel de confianza sea igual al 95%, tenemos que p(Z)=0.95 si Z=1.96.
Sustituyendo:
17
Estadstica bsica
Programa desarrollado
5.
18
Estadstica bsica
Programa desarrollado
3
4
5
6
7
8
9
64
29
79
93
58
67
32
74
46
34
39
39
64
7
1
29
24
73
34
52
72
83
34
77
64
88
56
88
74
46
23
66
88
18
48
98
38
1
93
33
51
28
24
25
44
92
5
30
30
25
23
31
61
79
16
22
91
81
29
25
58
68
74
65
17
99
69
51
29
39
En la figura anterior tenemos una tabla de nmeros aleatorios tomados de este documento
(http://halweb.uc3m.es/esp/Personal/personas/aarribas/esp/docs/NumerosAleatorios.pdf),
seleccionemos una fila al azar, suponga la fila 5, y separamos los nmeros de 2 en 2,
tendramos entonces la siguiente serie de 7 nmeros: 65 03 83 69 67 67 43 54 49 27 82 50 15
06 etc. Esto significa que nuestra muestra aleatoria deber contener esos individuos, en el caso
de 67 que se repite, solo lo consideramos una vez y pasamos al siguiente nmero. (En algunas
calculadoras existe la funcin RAN# que nos proporciona tambin nmeros aleatorios, en esta
basta con poner en la calculadora el nmero de muestras + (Tecla SHIFT) + RAN# y cada vez
que presionemos la tecla (=) nos dar un numero aleatorio, si solo queremos la parte entera,
ignoramos al decimal). Tendramos la siguiente tabla:
19
Estadstica bsica
Programa desarrollado
Nmero aleatorio
65
03
83
69
67
43
54
49
27
82
Individuo de la muestra
93
68
56
69
61
34
23
17
45
52
Por lo que nuestra muestra quedara con los valores 93, 68, 56, 69, 61, 34, 23, 17 ,45 , 52.
20
Estadstica bsica
Programa desarrollado
5. Jordi Casal, Enric Mateu (2003). Tipos de muestreo en: Revista Epidem. Med. Prev. 1:
3-7. Consultado el 01 de marzo de 2010 en:
http://minnie.uab.es/~veteri/21216/TiposMuestreo1.pdf
6. Larios Osorio, Vctor (1999). Unidad 5. Teora de muestreo. Consultado el 12 de marzo
de 2010 en: http://www.uaq.mx/matematicas/estadisticas/xu5.html
7. Lind, Douglas; William Marchal y Samuel Wathen (2008). Estadstica aplicada a los
negocios y la economa. Decimotercera edicin. Mxico: McGraw-Hill.
8. Montgomery, Douglas C. y George C. Runger (1996). Probabilidad y Estadstica
aplicadas a la ingeniera. Cuarta edicin. Mxico: McGraw-Hill.
9. Ritchey, Ferris (2008). Estadstica para las ciencias sociales. Segunda edicin. Mxico:
McGraw-Hill.
10. Ruiz Muoz, David (2004). Manual de estadstica. Consultado el 09 de marzo de 2010
en: http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm
11. Wackerly, Dennis D.; William Mendenhall III y Richard L. Scheaffer (2010). Estadstica
Matemtica con Aplicaciones. Sptima edicin. Mxico: Cengage Learning.
12. Walpole Ronald E.; Raymond H. Myers, et al. (2007). Probabilidad y Estadstica para
Ingeniera y ciencias. Octava Edicin. Mxico: Pearson Educacin.
Competencia especfica
Utiliza las tcnicas de representacin numrica y grfica para representar informacin a travs
de la organizacin de los datos obtenidos de una muestra o poblacin.
Introduccin
En la unidad anterior vimos que existen dos grandes divisiones de la estadstica: la que se
dedica a la recoleccin, presentacin y categorizacin de datos, llamada estadstica descriptiva,
y la que se dedica a realizar hiptesis en base a dichos datos, llamada inferencial. Tambin
Educacin Superior Abierta y a Distancia Primer cuatrimestre
21
Estadstica bsica
Programa desarrollado
aprendimos a determinar el espacio de estudio, es decir la poblacin, y las variables que se van
a estudiar de acuerdo al problema planteado.
En esta unidad estudiaremos la Estadstica Descriptiva, y dentro de ella aprenderemos cmo
organizar y presentar los datos que se obtienen de las muestras tomadas de nuestras
poblaciones. Antes de comenzar con los temas, veamos de dnde y cmo se obtienen los
datos que vamos a organizar.
Cuando se realiza un trabajo que requiere de la estadstica, las personas que realizan el trabajo
disean sus instrumentos para recolectar la informacin y obtener los datos que necesitan.
Existen muchos mtodos para recolectar informacin, pero los ms frecuentes son:
Censos
Es una tcnica de recoleccin de datos que se aplica a la totalidad de los elementos que
componen la poblacin o universo que se estudia. Un censo debe cumplir dos condiciones:
Universalidad: esto es, se debe tomar en cuanta a todos los elementos de la poblacin.
Simultaneidad: debe realizarse dentro de un periodo de tiempo limitado.
Encuesta
Esta tcnica se utiliza para recolectar informacin de una muestra de la poblacin. Consiste en
presentar un conjunto de preguntas abiertas (preguntas que no tienen respuestas
predeterminadas) o cerradas (preguntas que cuentan con una serie de respuestas
establecidas).
Experimento
Otra de las tcnicas ms recurridas en estadstica para recolectar informacin son los
experimentos, veamos en qu consisten.
Un experimento es una prueba que se realiza para determinar las caractersticas o
comportamientos de una cosa. Por ejemplo, experimentar mediante el sentido del gusto, qu
alimentos nos parecen ms salados.
Un experimento, tambin se define como el proceso que se realiza para verificar una serie
de hiptesis relacionadas con un determinado fenmeno, en el cual se determinan las
caractersticas o comportamientos del fenmeno que se analiza. Por ejemplo, un experimento
para determinar la velocidad de la luz en el vaco; donde se est determinando la velocidad de
la luz.
La diferencia entre la primera y la segunda definicin es que en la segunda se parte de una
hiptesis mientras que en la primera no necesariamente.
Educacin Superior Abierta y a Distancia Primer cuatrimestre
22
Estadstica bsica
Programa desarrollado
En el primer ejemplo, experimento los sabores de los alimentos sin antes predecir cul pienso
que me sabr ms salado. En el segundo ejemplo, mi hiptesis, a partir de estudios anteriores,
es que la velocidad de la luz en el vaco es de 300 000 km/seg.
Mi experimento verifica si esta hiptesis es cierta o no y en l cabe un margen de error
experimental.
2.1.1. Frecuencias
Dentro de los conceptos bsicos para la organizacin de datos estn los que conciernen a la
frecuencia:
Frecuencia: es el nmero de veces que se repite un dato, tambin se le conoce como
frecuencia absoluta.
Frecuencia acumulada: es la suma de las frecuencias absolutas de las variables hasta
el rengln i. Tambin es conocida como frecuencia absoluta acumulada.
Frecuencia relativa: es el resultado de dividir la frecuencia entre el nmero total de
datos (N). Este dato tambin puede verse como un porcentaje.
Frecuencia relativa acumulada: es la suma de las frecuencias relativas hasta el
rengln i.
Podemos encontrar las frecuencias organizadas en tablas que estudiaremos ms adelante. Por
ahora veamos cmo se representan los tipos de frecuencia que vimos anteriormente,
supongamos que tenemos la siguiente distribucin de datos:
18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7, 23, 18, 47, 52, 41, 52, 18,
23, 52, 7, 18, 52, 23.
No. De
Datos
Frecuenci
Frecuencia
Otra forma
Frecuencia
Frecuencia
23
Estadstica bsica
Programa desarrollado
rengln
(i)
obtenidos de
la variable
f1= 2
18
f2= 6
23
f3= 8
41
f4= 4
47
f5= 7
52
f6= 5
Total
a
fi
Acumulada
Fi
para obtener
Fi
Relativa
hi
f1=F1= 2
f1 = F1=2
f1+f2= F2=
8
f1+f2+f3=
F3=16
f1+f2+f3+f4
= F4=20
f1+f2+f3+f4
+f5= F5=27
f1+f2+f3+f4
+f5+f6=
F6=32
F1+f2=F2=
8
F2+f3=F3=
16
F3+f4=F4=
20
F4+f5=F5=
27
h1=f1/N=0.06
25
h2=f2/N=0.18
75
h3=f3/N=0.25
00
h4=f4/N=0.12
50
h5=f5/N=0.21
87
F5+f6=F6=
32
h6=f6/N=0.15
63
N=32
Relativa acumulada
Hi
h1=H1=0.0625
h1+h2=H2=0.2500
h1+h2+h3=H3=0.5000
h1+h2+h3+h4=H4=0.6250
h1+h2+h3+h4+h5=H5=0.8430
h1+h2+h3+h4+h5+h6=H6=1.0
000
1.0000
2.1.2. Intervalos
Intervalo o rango: Conjunto de nmeros comprendidos entre otros dos nmeros dados,
conocidos estos ltimos como lmites del intervalo.
Amplitud del intervalo: Es la diferencia del lmite superior menos el lmite inferior (Ls Li).
Fronteras de clase: Son los puntos medios entre los lmites de intervalos consecutivos.
Las fronteras de clase se utilizan para recuperar los datos entre el lmite superior de un
intervalo y el lmite inferior del siguiente.
Marca de clase: Es el punto medio del intervalo y es el resultado de la suma de
los lmites inferior y superior del intervalo dividido entre 2. A la marca de clase
tambin se le denomina punto medio de clase.
Ejemplo de intervalos
Veamos cmo se representan los conceptos relacionados con los intervalos.
Dados los nmeros 15 y 25, tendramos que:
El intervalo corresponde a todos los nmeros que se encuentran entre el 15 y el
25. El intervalo de clase sera: 15-25
24
Estadstica bsica
Programa desarrollado
Es recomendable que la marca del intervalo coincida con alguno de los datos.
Esto no es necesario y no siempre se logra, sobre todo cuando los intervalos
tienen la misma amplitud.
2.1.3. Construccin de intervalos de clase
La formacin de clases o intervalos de clase, que se representa con (k), dependen,
generalmente, del tamao del rango de la poblacin o muestra. Lo que se debe hacer para
determinar los intervalos de clase es lo siguiente:
1. Calcular el rango:
Para esto, se identifica el nmero mayor (Xn) y el nmero menor (X1) en los datos. El rango es
el resultado de la resta, esto es:
Educacin Superior Abierta y a Distancia Primer cuatrimestre
25
Estadstica bsica
Programa desarrollado
R= Xn X1
Por ejemplo:
Si en una serie de datos que van desde el 18 hasta el 56, tendramos lo siguiente:
Xn= 56 y X1= 18, por lo tanto:
R= Xn X1= 56 18= 38
2. Determinar el nmero de intervalos que se desea tener:
No existe una regla para determinar el nmero de intervalos, pero generalmente se suelen
crear entre 5 y 20 intervalos. La decisin la toma el investigador.
Siguiendo con nuestro ejemplo, diramos que vamos a construir 7 intervalos.
Entonces decimos que K=7.
3. Dividir el rango entre el nmero de intervalos que se desea tener:
Recordemos que lo recomendable es elegir un nmero entre 5 y 20 para los intervalos.
Dividimos entre uno menos de los intervalos deseados porque con el nmero de datos se
acumula un intervalo ms.
Esta ser la amplitud de los intervalos. Cuando no es un nmero entero, se escoge el entero
ms cercano, como en este caso, tomamos el rango igual a 5.
Cuando la cantidad de datos es tal que no alcanza para acumular un intervalo ms, entonces
se divide entre el nmero de intervalos que se quieren.
4. Se forman los intervalos:
Los intervalos se forman comenzando un nmero antes del primer dato:
INTERVALOS:
17 a 22
(se cuenta 5 desde 18 hasta 22)
23 a 28
29 a 34
35 a 40
41 a 46
47 a 52
53 a 58
Nota: No importa que el ltimo intervalo exceda el ltimo dato.
Educacin Superior Abierta y a Distancia Primer cuatrimestre
26
Estadstica bsica
Programa desarrollado
27
Estadstica bsica
Programa desarrollado
2.1.5
20.4
21.2
22.1
23.9
25.3
26.9
27.7
Tablas de frecuencias
Esta nos aporta mayor informacin pues est formada por categoras de la variable que se est
midiendo y su frecuencia (es decir, el nmero de ocurrencias de un valor dado).
Ejemplo:
suponga que un experimento da los siguientes valores medidos:
1,2,2,2,1,1,5,4,3,2,2,1,3,4,5,6,2,3,4,5,5,4,3,3,2
Procedemos entonces a agrupar por categoras, segn la frecuencia o nmero de veces que
aparece cada medicin:
Valor de la
Variable medida
1
2
3
4
5
6
Frecuencia
4
7
5
4
5
1
28
Estadstica bsica
Programa desarrollado
Frecuencia
9600
7100
3900
1500
1600
Ejemplo:
Suponga que se miden el nmero de cirugas realizadas por edades en una muestra de 100
personas, encontrndose lo siguiente:
Edades / No. de cirugas Menos de 2 cirugas Ms de 2 cirugas
0-10
1
0
11-20
2
2
21-30
6
4
31-40
11
7
41-50
17
6
Ms de 50
30
14
Una tabla cualquiera puede ser vista como una tabla de doble entrada, en la cual las variables
relacionadas son los rangos contra el valor de las variables en dicho rango.
Por ejemplo:
Educacin Superior Abierta y a Distancia Primer cuatrimestre
29
Estadstica bsica
Programa desarrollado
Temperatura
(C)
36
44
67
2.2.1. Histograma
Histograma es la representacin grfica de una variable continua. Se elabora en un sistema de
coordenadas rectangulares.
30
Estadstica bsica
Programa desarrollado
no por el rea de la barra. Esta grfica muestra las discontinuidades en las mediciones por
medio de espacios vacios entre las barras.
La grfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas:
Barras verticales:
Barras horizontales:
Un histograma y una grfica de barras son muy semejantes, la diferencia radica en que el
histograma no presenta separacin entre las barras.
31
Estadstica bsica
Programa desarrollado
Ejemplo:
Considere la siguiente tabla de datos.
Medicin en
cm
30
30.1
30.2
30.3
30.4
30.5
30.6
30.7
30.8
30.9
Frecuencia
3
7
12
18
23
21
17
11
5
1
Frecuencia
acumulada
3
10
22
40
63
84
101
112
117
118
Porcentaje
3%
6%
10%
15%
19%
18%
14%
9%
4%
1%
32
Estadstica bsica
Programa desarrollado
En esta figura se muestra el histograma de las mediciones en cm vs. frecuencia, note como el
ancho de las clases es el mismo.
33
Estadstica bsica
Programa desarrollado
Competencia especfica
Utiliza las medidas de tendencia central y dispersin para describir un conjunto de datos
mediante la representacin numrica y grfica de la informacin obtenida en una muestra o
poblacin.
Introduccin
Educacin Superior Abierta y a Distancia Primer cuatrimestre
34
Estadstica bsica
Programa desarrollado
Para cualquier conjunto de datos estudiados es importante tener informacin resumida de sus
caractersticas. Esta informacin nos indica cmo se comporta la poblacin de datos que
tenemos. Para resumir la informacin se utilizan dos tipos de valores que en lugar de
representar cada dato, representan conjuntos de datos. Estos dos tipos de indicadores
estadsticos son: las medidas de tendencia central, que nos muestran hacia qu valores se
agrupan o acumulan los datos, y las medidas de dispersin, que, de forma contraria a las
anteriores, muestran cmo se dispersan o separan los datos.
3.1. Medidas de tendencia central
Las medidas de tendencia central son los valores que representan un conjunto de datos de
forma tal que nos ayudan a saber dnde estn acumulados los datos pero sin indicar como se
distribuyen. Se llaman as porque tienden a ubicarse en la parte central del conjunto de datos.
Las medidas de tendencia central ms comunes son: la media aritmtica, comnmente
conocida como media o promedio, la mediana y la moda.
3.1.1. Media aritmtica
La media aritmtica o, simplemente, media, se denota por o por la letra segn se calcule en
una muestra o en la poblacin, respectivamente. La media es resultado de dividir la suma de
todos los valores (xi) entre el nmero total de datos (N).
La frmula para calcular la media de una distribucin de datos, vara de acuerdo a la manera
cmo los tenemos organizados.
Frmula para calcular la media en datos no agrupados
Los datos no agrupados son aquellos datos que organizamos en una tabla de datos, es decir,
cada valor se representa de manera individual. Las frmulas para calcular la media son:
En una poblacin
En una muestra
35
Estadstica bsica
Programa desarrollado
En estas frmulas la diferencia radica en que, el total de la poblacin se representa con la letra
N y el total de la muestra se representa con la letra n.
Frmula para calcular la media en datos agrupados por frecuencias simples
Los datos agrupados en frecuencias son aquellos que organizamos en una tabla de
frecuencias, es decir, las tablas que contienen, en una columna, el valor de la variable (xi) y, en
otra columna, la frecuencia (fi) o el nmero de veces que se repite cada valor en una serie de
datos.
Las frmulas para calcular la media con los datos organizados de esta manera son:
En una poblacin
En una muestra
En una poblacin
En una muestra
36
Estadstica bsica
Programa desarrollado
3.1.2. Mediana
La mediana es el valor que divide a la mitad la serie de datos que se tienen. Es decir, la
mediana queda en medio de todos los datos cuando los acomodas ya sea en orden creciente o
decreciente, entonces, el nmero de datos que queda a la izquierda de la mediana es igual al
nmero de datos que queda a la derecha.
Si n es impar hay un dato que queda en medio de todos, ste ser igual a la mediana. Si n es
par hay dos datos que quedan en medio de todos, en este caso la mediana es el promedio de
esos dos datos, es decir, su suma dividida entre dos.
Para cuando la cantidad de valores de la distribucin es impar:
1. Ordenamos los valores de menor a mayor.
2. Buscamos el valor del centro.
Por ejemplo:
Supongamos que tenemos los siguientes valores:
2, 4, 0, 8, 6, 4, 7, 1, 1, 0, 8, 6, 9
1. Ordenamos:
0, 0, 1, 1, 2, 4, 4, 6, 6, 7, 8, 8, 9
37
Estadstica bsica
Programa desarrollado
En donde:
Li = Lmite inferior del rengln en donde debe estar la mediana
Fi-1 = Frecuencia acumulada anterior al rengln de la mediana
fi = frecuencia del rengln de la mediana
ai = tamao del intervalo
3.1.3. Moda
La moda es el valor del dato que ms veces se repite, esto es, el valor cuya frecuencia absoluta
es mayor, y se denota como Mo. Algunas veces el valor que ms se repite puede no ser nico,
es decir, puede haber dos o ms datos que aparezcan con la misma frecuencia absoluta,
siendo sta la mayor. En esas ocasiones podemos hablar de poblaciones o muestras
bimodales si existen dos modas o multimodales si existen ms de dos.
Por ejemplo si tomamos una muestra de hombres y mujeres y medimos sus estaturas
tendremos dos modas.
Educacin Superior Abierta y a Distancia Primer cuatrimestre
38
Estadstica bsica
Programa desarrollado
En donde:
Li = Lmite inferior del rengln en donde debe estar la moda
fi = frecuencia del rengln de la moda
fi+1 = Frecuencia ulterior al rengln de la moda
fi-1 = Frecuencia anterior al rengln de la moda
ai = tamao del intervalo
3.2. Medidas de dispersin
A diferencia de las medidas de tendencia central, que miden acumulaciones, mediante un solo
punto, las medidas de dispersin miden el grado de separacin o alejamiento que tiene una
variable estadstica en torno a una medida de posicin o tendencia central. Dicho grado de
separacin nos indica lo representativa que es la medida de posicin con respecto al conjunto
total de datos. A mayor dispersin menor representatividad de la medida de posicin y
viceversa.
Las medidas de dispersin ms comunes son: el recorrido, la varianza y la desviacin estndar.
3.2.1. Recorrido
El recorrido representa la distancia que hay entre el primero y el ltimo valor de la variable,
tambin se le conoce como rango y se denota por Re.
La frmula para calcularlo es:
Donde:
Educacin Superior Abierta y a Distancia Primer cuatrimestre
39
Estadstica bsica
Programa desarrollado
40
Estadstica bsica
Programa desarrollado
La desviacin tpica muestra qu tan alejado est un dato del valor de la media aritmtica, es
decir, la diferencia que hay entre un dato y la media aritmtica. Se denota como S o, segn se
calcule en una muestra o en toda la poblacin, respectivamente.
Se define como la raz cuadrada positiva de la varianza. Se expresa mediante las siguientes
frmulas:
En datos no agrupados:
En una poblacin:
En una muestra:
En una muestra:
Educacin Superior Abierta y a Distancia Primer cuatrimestre
41
Estadstica bsica
Programa desarrollado
Referencias:
1. Montgomery, Douglas C. y George C. Runger (1996). Probabilidad y Estadstica
aplicadas a la ingeniera. Cuarta edicin. Mxico: McGraw-Hill.
2. Walpole, Ronald E., Raymond H. Myers et al. (2007). Probabilidad y Estadstica para
Ingeniera y ciencias. Octava edicin. Mxico: Pearson Educacin.
3. Medidas de tendencia central y dispersin. Consultado el 27 de abril de 2010 en:
http://bibliotecavirtual.lasalleurubamba.edu.pe/Estadistica/res/pdf/estadisticadescriptivav
ariables2.pdf
4. Estadstica y probabilidad. Consultado el 27 de abril de 2010 en:
http://www.vitutor.com/estadistica.html
Educacin Superior Abierta y a Distancia Primer cuatrimestre
42
Estadstica bsica
Programa desarrollado
43