Modulo de Estadistica
Modulo de Estadistica
Modulo de Estadistica
Página 1 de 142
ESTADISTICA 1
Página 2 de 142
ESTADISTICA 1
TABLA DE CONTENIDO
OBJETIVO .....................................................................................................................................................................5
1. CONCEPTOS ESTADISTICOS......................................................................................................................................6
INTRODUCCION ...............................................................................................................................................................6
OBJETIVOS ......................................................................................................................................................................6
CONCEPTOS ESTADISTICOS ...........................................................................................................................................6
CONCEPTOS MATEMÁTICOS PARA ESTADÍSTICA............................................................................................................8
INVESTIGACIÓN Y ESTADÍSTICA ......................................................................................................................................9
ETAPAS DE UNA INVESTIGACIÓN ESTADÍSTICA...............................................................................................................9
2. ESTADISTICAS PRIMARIAS ......................................................................................................................................13
INTRODUCCIÓN .............................................................................................................................................................13
OBJETIVO.......................................................................................................................................................................13
ESTADÍSTICAS CON UNA VARIABLE ...............................................................................................................................13
FRECUENCIA ABSOLUTA F .............................................................................................................................................18
FRECUENCIA RELATIVA FR .............................................................................................................................................19
OTRAS ESTADISTICAS ...................................................................................................................................................21
GRAFICAS PRIMARIAS ...................................................................................................................................................24
GRÁFICO DE SECTORES ................................................................................................................................................28
3. ESTADISTICAS SECUNDARIAS.................................................................................................................................34
INTRODUCCIÓN .............................................................................................................................................................34
OBJETIVO.......................................................................................................................................................................34
DISTRIBUCIÓN DE FRECUENCIAS ..................................................................................................................................34
GRAFICAS SECUNDARIAS..............................................................................................................................................37
4. MEDIDAS DE TENDENCIA CENTRAL .........................................................................................................................51
INTRODUCCIÓN .............................................................................................................................................................51
OBJETIVO.......................................................................................................................................................................51
DATOS NO AGRUPADOS ................................................................................................................................................52
MEDIA PARA DATOS NO AGRUPADOS............................................................................................................................53
DATOS AGRUPADOS ......................................................................................................................................................55
LA MEDIA PARA DATOS AGRUPADOS.............................................................................................................................56
LA MEDIA PARA DATOS AGRUPADOS.............................................................................................................................58
MEDIA GEOMÉTRICA......................................................................................................................................................61
MEDIA ARMONICA H .......................................................................................................................................................63
MEDIA CUADRATICA C ...................................................................................................................................................65
MEDIA GEOMETRICA, ARMONICA Y CUDRATICA ............................................................................................................66
LA MEDIANA PARA DATOS NO AGRUPADOS ..................................................................................................................67
LA MEDIANA PARA DATOS AGRUPADOS ........................................................................................................................69
LOS CUARTILES Q..........................................................................................................................................................72
LOS DECILES D ..............................................................................................................................................................76
LOS CENTILES O PERCENTILES .....................................................................................................................................80
LA MODA PARA DATOS NO AGRUPADOS........................................................................................................................83
LA MODA PARA DATOS AGRUPADOS .............................................................................................................................85
5. MEDIDAS DE DISPERSION........................................................................................................................................88
Página 3 de 142
ESTADISTICA 1
INTRODUCCIÓN .............................................................................................................................................................88
OBJETIVO.......................................................................................................................................................................88
LA DESVIACION MEDIA PARA DATOS NO AGRUPADOS ..................................................................................................88
LA DESVIACION MEDIA PARA DATOS AGRUPADOS........................................................................................................92
LA VARIANZA PARA DATOS NO AGRUPADOS .................................................................................................................94
LA VARIANZA PARA AGRUPADOS...................................................................................................................................96
LA DESVIACIÓN TÍPICA PARA DATOS NO AGRUPADOS ..................................................................................................98
LA DESVIACIÓN TÍPICA PARA DATOS AGRUPADOS .....................................................................................................100
6. TEORIA DE LA PROBABILIDAD...............................................................................................................................103
INTRODUCCION ...........................................................................................................................................................103
OBJETIVOS ..................................................................................................................................................................103
CONJUNTOS ................................................................................................................................................................103
DIVISION DE CONJUNTOS ............................................................................................................................................104
ESPECIFICACION DE CONJUNTOS ...............................................................................................................................104
OPERACIONES ENTRE CONJUNTOS ............................................................................................................................105
TECNICAS DE CONTAR ................................................................................................................................................107
CONJUNTOS ................................................................................................................................................................113
CONCEPTO DE PROBABILIDAD ....................................................................................................................................114
PROBABIBILIDADES .....................................................................................................................................................117
7. DISTRIBUCION DE PROBABILIDADES ESPECIALES ................................................................................................122
INTRODUCCION ...........................................................................................................................................................122
OBJETIVOS ..................................................................................................................................................................122
DISTRIBUCIÓN BINOMIAL .............................................................................................................................................122
USO DE LA TABLA BINOMIAL. .......................................................................................................................................125
DISTRIBUCIÓN DE POISSON.........................................................................................................................................126
USO DE LA TABLA.DE POISSON....................................................................................................................................127
PROBABILIDADES ESPECIALES ...................................................................................................................................129
DISTRIBUCIÓN NORMAL...............................................................................................................................................130
DISTRIBUCIÓN NORMAL ESTANDARIZADA...................................................................................................................132
USO DE LA TABLA Y ÁREA BAJO LA CURVA NORMAL....................................................................................................133
RELACION ENTRE DISTRIBUCIONES ESPECIALES .......................................................................................................139
DISTRIBUCION NORMAL...............................................................................................................................................140
BIBLIOGRAFIA ..........................................................................................................................................................142
Página 4 de 142
ESTADISTICA 1
OBJETIVO
Página 5 de 142
ESTADISTICA 1
1. CONCEPTOS ESTADISTICOS
INTRODUCCION
Durante todos los tiempos la estadística se ha constituido en una herramienta necesaria en el proceso de
investigación para la recopilación, manejo, interpretación, análisis y publicación de datos en los diferentes
medios comunicación y campos de investigación relacionados con fenómenos naturales y sociales. En
nuestros días la mayoría de las asignaturas en los diferentes programas utilizan procesos estadísticos con el
fin de mejorar cada una de las investigaciones para finalizar en descripciones o pronósticos con sus
correspondientes conclusiones, que ayude a una mayor comprensión en cada una de las áreas de estudio. El
fin primordial de la estadística es, suministrar información acerca de una determinada población por medio de
diferentes muestras que se han tomado de ella, para poder obtener conclusiones generales de una población
sobre un determinado fenómeno transcurrido en el tiempo y espacio.
OBJETIVOS
CONCEPTOS ESTADISTICOS
ESTADÍSTICA. Es una ciencia que pertenece al conjunto de las matemáticas que permite recolectar, ordenar,
clasificar, analizar, interpretar y concluir con los datos proporcionados por medio de la investigación científica,
permitiendo conocer, a través de ellos con precisión los caracteres de los fenómenos y problemas observados
en una determinada asignatura.
Página 6 de 142
ESTADISTICA 1
POBLACIÓN. Es un conjunto de individuos u objetos que tienen la misma característica, que además sirve
como fuente de información. Una población es finita cuando se puede contar con facilidad, si esto no sucede
se llama población infinita. Si la población es bastante grande y se puede contar recibe el nombre de
población infinita.
MUESTRA. Es un subconjunto de la población que se toma para analizar los elementos seleccionados
aleatoriamente y debe ser representativa de la población.
DATOS. Es la medida, valores o características que posee cada uno de los elementos pertenecientes a una
muestra o la población.
ESTADÍSTICAS. Es el ordenamiento sistemático de los datos procesados ya sea en forma de tablas o figuras
con nombres específicos. Las estadísticas se dividen en primarias y secundarias. Las primarias son aquellos
datos obtenidos por observación directa en cambio las secundarias son datos obtenidos de las primarias o en
forma indirecta de publicaciones y puede ser parcial o total. Tanto en las primarias y secundarias si se
considera el tiempo puede ser periódicas y no periódicas.
VARIABLE. Es un símbolo tal como X, Y, Z,..., que puede tomar una característica cualquiera de un objeto, la
característica puede ser cuantitativo o cualitativo.
Variable cualitativa. Denominada así, cuando a una variable se le asigna las cualidades que posee un
objeto o elemento de estudio. Un elemento de una población de estudio puede ser: Negro, blanco, alto,
bajo, pequeño, bonito, casado, divorciado, médico, ingeniero, etc.
Variable cuantitativa. Denominada así, cuando a una variable se le asigna cantidades numéricas que
pueden ser discretas y continuas.
Variables discretas. Son aquellas que solo pueden tomar valores enteros y positivos, que son producto
de conteo. Los números utilizados para contar corresponden al conjunto de los naturales: 1, 2, 3, 4, ..., N
Variables continuas. Son aquellas variables que tiene un campo de variación o conjunto de valores que
puede ser los números reales que pertenece a un intervalo y además son producto de mediciones tanto en
longitud, masa y tiempo con sus correspondientes múltiplos y submúltiplos.
ESTADÍGRAFO. Es la descripción numérica de una característica correspondiente a una muestra tales como
la media, o promedio, varianza, desviación Standard, etc. Los estadígrafos también se llaman estadísticos
muestrales.
ESTADÍSTICA DESCRIPTIVA. También es llamada estadística deductiva, que consiste en reunir, representar
y resumir datos que han sido recogidos mediante diferentes técnicas y son presentados mediante tablas,
cuadros y figuras con nombres específicos, dando información clara y comprensible al lector en forma de
descripción.
Página 7 de 142
ESTADISTICA 1
Como la estadística pertenece a la rama de las matemáticas y además permite recolectar o medir, ordenar,
clasificar, analizar, interpretar y concluir con datos proporcionados mediante una investigación científica es
necesario tener claro ciertos conceptos matemáticos y entre ellos están:
MEDIR. Consiste en comparar una cantidad cualquiera de una magnitud con otra cantidad de la misma
magnitud, que se toma por unidad. En el proceso de medición, el resultado expresado por un número indica la
relación que hay entre una cantidad cualquiera y la unidad de la misma especie expresando las veces que
contiene a la unidad. Al tomar la estatura de un estudiante se puede tomar como unidad patrón el metro o el
centímetro y un resultado puede ser 1.68 m o 168 Cm.
APROXIMACIÓN AL MEDIR. Es la fracción menor que se aprecia al medir, para obtener buena aproximación
es indispensable la precisión en los aparatos y al realizar la medición. Al medir la estatura y obtener una
buena aproximación de hasta milímetros (mm), se necesita una cinta que esté fraccionada en milímetros y
realizar una buena lectura.
Con una cifra decimal será: 1.6 m debido a que la segunda cifra decimal es mayor que 5, si fuera menor
sería 1.5 m.
Con dos cifras decimales será: 1.58 m debido a que la tercera cifra decimal es menor que 5, si fuera
mayor que 5 sería 1.59m.
Con tres cifras decimales será: 1.582, cuando la cuarta cifra decimal es menor que 5, de lo contrario sería
1.583 m.
Cuando la cifra posterior a la que se quiere aproximar es igual a 5, entonces se aproxima al número más
cercano.
PRECISIÓN. Consiste en el cuidado que se debe tener al medir o al hacer la lectura instrumental; para que
todo esto sea efectivo los instrumentos deben estar en buen estado. Para obtener una buena precisión
además de lo anterior es necesario que al medir se repita varias veces y tomar el valor medio.
Los absolutos se obtienen de la relación entre la suma de las desviaciones y el tamaño de la muestra.
Página 8 de 142
ESTADISTICA 1
Los errores relativos se obtiene de la relación entre el error absoluto y la media aritmética que determina
el error cometido en la unidad de la magnitud medida.
CIFRAS SIGNIFICATIVAS. Corresponde al número de dígitos seguros más los dígitos inseguros o inciertos,
generalmente el inseguro o incierto es el último número. Si la estatura es de 1.63m, quien mide está seguro de
los números 1 y 6 más no del 3, que bien puede ser 2 o 4.
INVESTIGACIÓN Y ESTADÍSTICA
La investigación estadística es un proceso sistemático, dirigido y organizado que tiene como objetivo
fundamental la recopilación o búsqueda de conocimiento sobre una población mediante una muestra
utilizando el método científico para beneficio de la humanidad.
DOCUMENTAL. Recibe su nombre por el aprendizaje de nuevos hechos a través del estudio de documentos
y registros. Entre las diferentes fuentes documentales pueden están: las fuentes estadísticas, históricas,
bibliotecas oficiales y privadas, documentos personales e informes.
OBSERVACIONAL. Constituye el estudio de un fenómeno sin que este sea modificado por el observador y se
subdivide en observacional descriptiva y observacional analítica. Al describir y analizar las características
externas de un objeto de estudio permite elaborar leyes generales, en ciertos casos sin llegar a verificación de
hipótesis. Su propósito es describir, para tomar una decisión y puede aplicar a fenómenos naturales,
problemas sociales, personas, hechos, etc..
EXPERIMENTAL. Esta es parte de la investigación demostrativa que se refiere a lo que será, es decir a una
realidad que no existe en el momento pero que existirá después del experimento. Por medio de la
experimentación se analiza los efectos de la exposición o privación intencionada de un factor bien definido en
parte de los elementos del conjunto de estudio. En este caso se puede tomar dos casos de variables las
independientes y de éstas provienen las dependientes por intermedio de las variables intervinientes en
algunos casos.
La investigación se desarrolla sistemáticamente pasando por las etapas de planeación, proceso metodológico,
ejecución o trabajo de campo, procesamiento de la información, análisis e interpretación de resultados, e
informe final. Cada etapa se subdivide en otras y éstas en otras que están relacionadas entre sí.
PLANEACIÓN. Consiste en la organización detallada de cada una de las actividades necesarias a seguir en el
desarrollo de un trabajo con el fin de alcanzar cada uno de los objetivos y metas propuestas por el
investigador. Además elaborar un calendario de actividades (cronograma de actividades) de cada una de las
Página 9 de 142
ESTADISTICA 1
etapas a desarrollar durante la investigación, asignando responsabilidades a cada uno de los participantes y
distribuyendo el tiempo en forma proporcional en cada una de las etapas del proyecto de trabajo. También se
debe tener en cuenta en la organización del presupuesto que consiste en determinar si se cuenta con los
suficientes recursos financieros, que permita iniciar y terminar la investigación. Para elaborar el presupuesto
se debe tener en cuenta algunos puntos básicos relacionados con:
La organización que incluye asesoría, visitas previas, propaganda, capacitación personal, equipo de
oficina, etc.
Los trabajos de campo en donde hay que tener en cuenta viáticos, recolección y transporte.
La tabulación está relacionado con el material y su proceso de organización. En la publicación o
elaboración del informe final.
JUSTIFICAR LA INVESTIGACIÓN. Esto significa exponer las razones que fundamenten su realización, con
argumentos expresados en términos de la utilidad que pudiera reportar tal investigación a la institución
patrocinadora y a la sociedad en general.
PLANTEAMIENTO DEL PROBLEMA. Consiste en enunciar el problema o los interrogantes que se pretende
esclarecer con la investigación para determinar su validez y aplicabilidad a la situación particular que se esté
manejando, para decidir una solución parcial o integral del problema. En esta fase se debe:
DEFINIR UNA POBLACIÓN DE ESTUDIO. Consiste o hace referencia a delimitar el conjunto que se va a
estudiar especificando si se toma una muestra, población o área geográfica. Cuando se va a tomar una
muestra y se desea generalizar hacia una población de la cual se extrajo la muestra, hay necesidad de definir
el modelo que se va a utilizar. Para recolectar la información generalmente se utiliza la muestra y no la
población debido a que su costo es menor y se puede hacer con mayor rapidez, dando como resultados
semejantes con los de la población. Si se toma una muestra como método de recolección se debe diferenciar
las muestras probabilísticas o aleatorias de las no probabilísticas en donde cada una de ellas presenta
diferentes casos. Las muestras probabilísticas presentan una característica fundamental; afirmando que todos
sus elementos tienen la misma posibilidad de ser seleccionados para pertenecer a una muestra representativa
de una población de estudio, a este tipo de muestreo pertenece.
Etapas de una encuesta.. Una vez formulados los objetivos generales y específicos, para diseñar una
encuesta se debe considerar las siguientes etapas:
Definir el presupuesto
Definir la población o muestra de estudio.
Elaboración del cuestionario.
Trabajo de campo y recolección de información.
Procesamiento de la información.
Análisis e interpretación de resultados.
Informe final.
Cuestionario. El cuestionario de una encuesta como mínimo debe contener un encabezamiento, cuerpo,
instrucciones y observaciones.
Página 11 de 142
ESTADISTICA 1
puede ser manual, mecánico, electrónico o por computadora. Analizar significa descomponer un todo en sus
partes con el fin de aplicar las técnicas para evaluar y verificar si las preguntas, hipótesis y objetivos
formulados en que tanto por ciento fueron alcanzados. Estos análisis pueden ser de forma cuantitativa y
cualitativa.
INFORME DE INVESTIGACIÓN. En esta fase se describe el contenido que deberá llevar el informe, siguiendo
las recomendaciones del Instituto Colombiano de Normas Técnicas (ICONTEC) actualizadas. Se dice que una
investigación termina relativamente cuando se presenta el informe final, o sea, poner al alcance de la
comunidad científica y al público en general los avances realizados durante el proceso de investigación.
TALLER 0.
Expresar con una cifra decimal: 1.56 1.63 1.65 1.49 2.51
Expresar con tres decimales: 1.583 3.495 4.598 4.998 5.099
Expresar con tres decimales; 3.9678 4.9682 7.1067 9.1099
Determinar el número de cifras significativas: 1700, 245000, 3400, 2000000, 0.00003, 0.00125, 0.489,
489.50, 87.8000
Determinar el número de cifras significativas de: 331/24, 1450/53.5, 49/0.366, 2/30, (1.569+1.2)
Se tiene una población de 3728 distribuidos 5 estratos de la siguiente manera (1000, 880, 908, 640, 300),
si se toma una muestra del 10% para su estudio. hallar la muestra para cada estrato en un muestreo
estratificado proporcional.
En el caso anterior realizar el mismo ejercicio para una muestra del: 15% y 20% de la población total.
Para una población de 9540 que está distribuida en 6 estratos de la siguiente manera: 2340, 2090, 1595,
1650, 978, 887. Hallar muestras proporcionales de estudio para: 8, 10, 12, 15, 18 y 20%
El en el ejercicio inmediatamente anterior se desea obtener una muestra de 954 en muestreo estratificado
no proporcional; discuta sus resultados con sus compañeros.
Página 12 de 142
ESTADISTICA 1
2. ESTADISTICAS PRIMARIAS
INTRODUCCIÓN
En estadística como en otras asignaturas, una ayuda para la comprensión de los diferentes temas se utiliza
las tablas, figuras y gráficas en donde las primeras corresponden al ordenamiento de datos o resultados
obtenidos por medio de diferentes procesos ya sea de conteo o de operaciones. Las figuras corresponden a la
representación de los resultados en un plano cartesiano utilizando datos consignados en las tablas y cuyo
propósito es dar a conocer al lector los diferentes grados de variabilidad de cada una de las variables motivo
de análisis o interpretación.
OBJETIVO
Al finalizar esta unidad el estudiante estará en condiciones de analizar las estadísticas primarias con una, dos
y más de dos variables por medio de observaciones directas tomadas del medio, elaborando sus respectivas
tablas y figuras estadísticas.
Esta clase de estadística depende del número de observaciones efectuadas y del número de valores distintos
que toma la variable, considerando éstos factores, las estadísticas de una sola variable se dividen en
observaciones simples, semicompuestas y compuestas.
Observación simple. Este caso se presenta cuando la observación es única y los datos obtenidos son pocos
y se consignan en filas y/o columnas que se pueden ordenar de menor a mayor o de acuerdo como se
obtuvieron los datos, ejemplo los datos que se encuentran en la Tabla 1.
Página 13 de 142
ESTADISTICA 1
Observación semi-compuesta. Este caso hace relación cuando hay varias observaciones y la variable toma
pocos valores pero distintos. Al consultar a 25 estudiantes (observación) sobre el número de hermanos y
hermanas (variable Xi) que ellos tienen, se puede elaborar la Tabla.2
Observación compuesta. Este caso se presenta cuando las observaciones son numerosas y la variable (Xi)
toma diferentes valores, entonces se recurre a agrupar los valores de la variable (X i) en grupos llamados
intervalos de clases y son utilizados para el proceso de cálculo. Ahora, los datos representativos son las
marcas de clase a cambio de los observados. Por ejempo al aplicar una encuesta en 100 casas, para
determinar las edades de los familiares; ver tabla 3
Página 14 de 142
ESTADISTICA 1
44 " 54 48
55 " 65 50
66 " 76 9
77 " 87 2
88 " 98 1
TOTAL n = 560
Intervalos de clase. Son grupos pequeños de datos observados, utilizados para realizar cálculo cuando los
datos son numerosos, su conformación está sometida a diferentes reglas establecidas universalmente. El
propósito es no perder información primaria en el cálculo y expresar correctamente las características de la
variable. Algunos autores acostumbran y recomiendan tomar el número de grupos o intervalos ( i ) entre 5 y
20, otros entre 5 y 15 con el objeto de no distorsionar la información, en éste caso se toma el primer caso.
R = Xmáx - Xmím
R = 175 cm - 147 cm R = 28 cm
La amplitud del grupo o del intervalo de clase ( C ) se encuentra mediante la siguiente expresión: Se desea
hallar la amplitud de los intervalos para i = 5 e i = 20
R
C donde i toma los valores de 5 y 20
i
Para i = 5 Para i = 20
28 28
C 5 . 6 Cm = 6 C 1 . 4 Cm
5 20
Estos dos resultados indican que se tiene 5 grupos o intervalos con amplitud de 5.6 = 6 y para 20 intervalos
con amplitud de 1.4. Entonces la amplitud o tamaño del intervalo de clase que se puede tomar estará
Página 15 de 142
ESTADISTICA 1
comprendido entre 1.4 y 5.6, tomando números enteros 2, 3, 4 y 5. El tamaño del intervalo de clase ( C )
también se puede hallar tomando un promedio entre i = 5 e i = 20 mediante la siguiente expresión:
R
C
8
EJEMPLO: Para hallar la amplitud del intervalo de rango ( R ) 28, según la expresión del promedio será
28
C = 3.5 = 4 Valor que está comprendido entre 1.4 y 5.6 cm.
8
Al tomar el peso a una muestra de 40 estudiantes se obtuvo los datos que están en la Tabla 4, las columnas 1
y 2 los datos se encuentran sin ordenar; en cambio en la Tabla 5 columnas 1 y 2 los datos están ordenados.
Buscando el rango o recorrido: R = 168 - 139 = 29
29 29
C 5 .8 C 1 . 45
5 20
O sea que ( C ) puede tomar valores desde 1.45 hasta 5.8, que tomando números enteros serán 1, 2, 3, 4, 5 y
6 o tomando la expresión que utiliza el promedio se tendrá:
29
C 3 . 63 4
8
Página 16 de 142
ESTADISTICA 1
13 144 33 150
14 151 34 152
15 147 35 158
16 146 36 152
17 168 37 162
18 153 38 166
19 151 39 154
20 152 40 153
Después de calcular la amplitud del intervalo se procede a encontrar y formar los intervalos de clase.
Tomando como punto de partida el mínimo dato observado y sumando horizontalmente el tamaño del intervalo
de clase menos la unidad ( C - 1), así: 139 + (4 -1) = 139 + 3 = 142, verticalmente se suma el verdadero valor
de ( C ), cuyo valor es 4 así: 139 + 4 = 143, hasta llegar al tope del máximo valor, ver Tabla 6 primera
columna. Con los datos ordenados de la Tabla 5 se procede a contabilizar los datos que se encuentran
comprendidos en éstos intervalos; estos resultados están en la columna 2 Tabla 6 que se denomina
frecuencia absoluta fi.
Página 17 de 142
ESTADISTICA 1
20 153 40 168
Límites reales de clase. El límite real inferior de clase se obtiene restando la mitad de la unidad ( 0.5 ). En
datos agrupados el límite real superior de clase se obtiene sumando al límite superior de un intervalo de clase,
la mitad de la unidad ( 0.5 )
Marcas de clase. Cuando los datos son agrupados se acostumbra a buscar el punto medio de un intervalo o
clase que se denomina marcas de clase, esto debido a que los datos reales no se utilizan por ser numerosos.
En la Tabla 6 las marcas de clase Xi se encuentran en la columna 4, resultados que se obtienen de sumar el
límite inferior y superior, su resultado dividido entre 2. En forma general se puede expresar de la siguiente
manera:
Li Ls
Xi
2
FRECUENCIA ABSOLUTA f
Se llama frecuencia absoluta de un dato al número de veces que ha salido ese dato o resultado en una
observacion.
La suma de las frecuencias absolutas de todos los datos que se han obtenido en la encuesta o estudio, ha de
ser igual al número total de datos observados.
EJEMPLO. Vamos a hacer un recuento de datos y ver su frecuencia relativa en el caso siguiente: Hemos
preguntado a los 22 alumnos y alumnas de clase sobre cuál será el resultado del próximo partido entre el
Pasto y el rival BB…., obteniendo estos resultados:
Página 18 de 142
ESTADISTICA 1
Dónde:
Efectuamos el recuento de los datos, anotando el número de veces que ha aparecido cada uno de los
resultados.
Ahora construiríamos una tabla, llamada tabla de frecuencias, en la que pondríamos en la segunda columna
las frecuencias absolutas:
Lo primero que hemos de hacer es comprobar que no nos hemos dejado ningún resultado sin contar: en este
caso hemos preguntado a 22 alumnos de clase, que coincide con el resultado de la suma anterior. Estas
tablas son una forma sencilla de presentar los datos y hacen más fácil interpretar los resultados.
FRECUENCIA RELATIVA fr
Se llama frecuencia relativa de un dato al cociente entre su frecuencia absoluta y el número total de datos. La
suma de todas las frecuencias relativas de los datos de un estudio tiene que ser igual a 1 o al ciento por ciento
Página 19 de 142
ESTADISTICA 1
100%. Para los resultados de la encuesta anterior, escribimos una nueva columna a la derecha de la tabla de
frecuencias en la que vamos calculando cada una de las frecuencias relativas:
fi
fr
N
f
fr i * 100%
N
La suma de las frecuencias absolutas es: 9 + 7 + 6 = 22 La suma de las frecuencias relativas es:
Hay una mayoría que piensan o afirman que ganará el equipo de casa, el resultado es de 1 gol.
EJEMPLO. Veamos ahora otro caso; Hemos hecho una votación entre los 22 alumnos y alumnas para elegir
de entre cuatro candidatos al delegado del curso, obteniéndose los siguientes resultados:
Carlos, Paula, Carmen, Ana, Carmen, Paula, Paula, Carlos, Ana, Paula, Carlos, Paula, Ana, Carmen, Paula,
Carmen, Carlos, Carlos, Paula, Carlos, Paula, Carmen
Página 20 de 142
ESTADISTICA 1
La persona más votada ha sido Paula, por lo tanto será la delegada del curso.
OTRAS ESTADISTICAS
Estadísticas con más de dos variables. Esto se presenta cuando en cada elemento se observan
simultáneamente dos o más variables, obteniéndose valores que están relacionados entre sí. Para llenar la
ficha de los estudiantes del grado 11 de un Instituto A, se tiene en cuenta entre otras variables las siguientes:
la edad, peso y estatura, ver Tabla 13.
Página 21 de 142
ESTADISTICA 1
Estadísticas mixtas. Se presenta cuando se estudia la relación existente entre cualidades y las variables
cuantitativas de un elemento perteneciente a una muestra o población. Por ejemplo, si se desea saber la
relación que existe entre las variables: sexo, edad, peso y estatura en una muestra de estudiantes del grado
11, ver Tabla 14 y 15
Estadísticas sectoriales y temporales. La primera hace referencia a los elementos de una población de
estudio cuando son áreas geográficas o sectores y se quiere conocer algunas cualidades que más se
destacan. La segunda hace relación al tiempo de duración que tiene un determinado evento. Por ejemplo las
áreas urbanas más pobladas de algunas partes del mundo, ver Tabla 16 y 17
Página 22 de 142
ESTADISTICA 1
TABLA 16. LAS 20 MAYORES AGLOMERACIONES URBANAS DE AMÉRICA DEL SUR 2014
Página 23 de 142
ESTADISTICA 1
GRAFICAS PRIMARIAS
Gráfico lineal. Proceso que consiste en representar puntos en un sistema de coordenadas dado por las
parejas de valores que pertenecen a la observación de un elemento de una muestra, que luego son unidos por
medio de líneas rectas. Cuando se utiliza como variable el tiempo, este se ubica en el eje horizontal. Al
consultar sobre el ingreso de estudiantes a la Institución B, se encontró los datos que están en la Tabla 18 y al
llevar al plano se obtiene la Figura 1
700
600
500
INGRESO
400
300
200
100
0
2000 2001 2002 2003 2004 2005 2006 2007 2008
AÑOS
La Figura 1 indica que en el año de 2001 se ha obtenido un ingreso máximo, esto muestra la gráfica con su
punto más alto, en tanto que en el año de 2002 el ingreso es mínimo.
Gráfico de barras vertical simple . Para representar los datos en forma de barras verticales se toma un
ancho proporcional y de acuerdo al número de datos y su altura va de acuerdo al valor de la ordenada, cada
barra representa un valor único observado.
Página 25 de 142
ESTADISTICA 1
700
600
500
INGRESO
400
300
200
100
0
2000 2001 2002 2003 2004 2005 2006 2007 2008
AÑOS
Gráfica de barras horizontal simple. Este tipo de gráficas se utiliza cuando en la base se necesita hacer
explicaciones largas y detalladas, al graficar los datos de la Tabla 12 se obtiene la Figura 3
2008 653
499
2006 451
INGRESO
380
2004 243
253
2002 201
665
2000 355
0 200 400 600 800
AÑOS
Gráfico de barras compuesto. Esta clase de gráficas tiene una similitud con las gráficas de barras simples
verticales y horizontales. Tomando datos de la Tabla 19, se elaboró el gráfico Figura 4
Página 26 de 142
ESTADISTICA 1
G9; 179
2008 G8; 173
G9; 127
2007 G8; 136
G9; 131
2006 G8; 105
G9; 121
2005 G8; 81
AÑOS
G9; 87
2004 G8; 62
G9; 46
2003 G8; 126
G9; 82
2002 G8; 44
G9; 170
2001 G8; 343
G9; 91
2000 G8; 164
Página 27 de 142
ESTADISTICA 1
GRÁFICO DE SECTORES
En este tipo de gráfico, lo que vamos a comparar es la amplitud de los sectores circulares que, para cada uno
de los datos, vamos a dibujar sobre un mismo círculo. Para ello, dibujamos un círculo grande, y lo dividimos en
tantas partes como participantes haya habido en la encuesta o votación: debemos dividir 360º entre el número
total de votantes o encuestados. A continuación, a cada uno de los datos le asignamos tantas partes como
indique su frecuencia relativa (expresada está en forma de fracción), y escribimos un rótulo para cada sector
resultante, indicando a qué dato corresponde. Veámoslo con los ejemplos anteriores.
1. Construimos el gráfico de sectores para los resultados de la encuesta sobre quién va a ganar el partido de
fútbol. Partimos de la tabla de frecuencias:
Dividimos el círculo en 22 partes iguales, cada una de las cuales medirá: 360º/22 = 16,36º
Para cada uno de los datos tomaremos tantas partes como indique su frecuencia relativa. Así, para el 1: 9
partes; para la X: 7 partes; y para el 2: 6 partes. Escribimos un rótulo en cada uno de los sectores resultantes,
con el nombre del dato: 1, X, 2.
2
27% 1
41%
x
32%
Página 28 de 142
ESTADISTICA 1
Y tomamos tantas partes para cada candidato como indique su frecuencia relativa. A continuación escribimos
un rótulo en cada uno de los sectores resultantes, con el nombre de cada candidato:
Ana
14%
Carlos
27%
Carmen
23%
Paula
36%
EJEMPLO. Si se toma los datos de la Tabla 18, que se encuentra 3682 alumnos distribuidos en grados, así:
1234 para el grado 8, 1034 grado 9, 1414 grado 10; construir el gráfico de pastel o circular que consiste en
representar los datos observados o procesados en una circunferencia, con base a 360 grados distribuidos
proporcionalmente al porcentaje de cada uno de los datos. Para este caso se procede a realizar los siguientes
procesos:
Estos resultados se los puede representar en una circunferencia tomando como base a 360 grados, además
con la ayuda de un transportador o del computador se obtiene como resultado la Figura 5.
Página 29 de 142
ESTADISTICA 1
Gráfico piramidal. Este sistema de gráficas se utiliza para representar en una misma figura hasta 3 variables.
En general los gráficos tienen diferentes características, su nombre se debe a la manera como se forma la
gráfica al ubicar los datos. Considerando el ingreso de estudiantes a la Institución Z para los años 2003 a
2007, según sus especialidades en los grados 10 y 11, ver Tabla 23. Que llevando a un plano se obtiene la
Figura 7.
2003
2004
AÑOS
2005
2006
2007
Página 30 de 142
ESTADISTICA 1
TALLER 1.
Con los siguientes datos de y utilizando tablas: ordenar, hallar el valor mínimo, el valor máximo, rango, la
amplitud del intervalo (C), intervalos de clase, límites reales de clase y marcas de clase; gráficos Lineales, de
barras vertical, de barras horizontal simple.
3) 4. En la siguientes tablas, encontrar los valores correspondientes y construir el grafico de lineal y barras.
Página 31 de 142
ESTADISTICA 1
TABLA 1: EDADES
No INTERVALOS LIMITES REALES MARCAS DE CLASE FRECUENCIA ABSOLUTA
Li Ls Lri Lrs X f
1 1 5
2 9 12
3 17 19
4 25 26
5 33 33
6 41 25
7 49 17
8 57 9
TABLA 2: EDADES
No INTERVALOS LIMITES REALES MARCAS DE CLASE FRECUENCIA ABSOLUTA
Li Ls Lri Lrs X f
1 8 5
2 12 8
3 16 11
4 20 17
5 24 13
6 28 9
7 32 6
8 36 3
TABLA 3: EDADES
No INTERVALOS LIMITES REALES MARCAS DE CLASE FRECUENCIA ABSOLUTA
Li Ls Lri Lrs X f
1 14.5 19.5 2
2 19.5 24.5 5
3 8
4 11
5 9
6 6
7 3
8 1
Página 32 de 142
ESTADISTICA 1
TABLA 4: EDADES
No INTERVALOS LIMITES REALES MARCAS DE CLASE FRECUENCIA ABSOLUTA
Li Ls Lri Lrs X f
1 2 4 1
2 3
3 5
4 7
5 9
6 6
7 3
8 1
Página 33 de 142
ESTADISTICA 1
3. ESTADISTICAS SECUNDARIAS
INTRODUCCIÓN
Las estadísticas secundarias se obtienen de las estadísticas primarias o de publicaciones que son el resultado
de un proceso de operaciones matemáticas. Entre las estadísticas secundarias más importantes están la
frecuencia relativa, la frecuencia relativa acumulada, absoluta acumulada y gráficas.
OBJETIVO
Al finalizar esta unidad el estudiante estará en condiciones de realizar operaciones matemáticas con datos de
estadísticas primarias para obtener las diferentes frecuencias para elaborar tablas y gráficas
DISTRIBUCIÓN DE FRECUENCIAS
Este es un método estadístico que permite estudiar el comportamiento de los datos, ordenados en intervalos
de clase o cualidades, indicando el número de datos comprendidos en cada intervalo, con el fin de ayudar a
simplificar o reducir la información obtenida en tablas de frecuencia, que también reciben el nombre de
distribución de frecuencia después de haber realizado la tabulación. Una distribución de frecuencia puede ser
para una o más variables, que se dividen en discretas y continuas.
En temas anteriores se definió la frecuencia absoluta como el número de veces que se repite un mismo valor
de la variable individual mente en un intervalo, muestra o población en este caso esta expresada por ( f i ). En
la Tabla 1 se encuentra el resultado de 102 casas, en donde 79 son padres de familia, 92 madres, 339 hijos y
51 y a otros números que representa la frecuencia absoluta ( fi ), ver segunda columna.
Página 34 de 142
ESTADISTICA 1
Como se mencionó en la anterior unidad anterior, la frecuencia absoluta acumulada es la suma de las
frecuencias de un intervalo de clase con las frecuencias de los intervalos de clases anteriores y se puede
representar en forma general por medio de la siguiente expresión:
fai = Σ fi
Dónde:
Al realizar una encuesta a 102 casas relacionadas con el parentesco y componentes de una familia, se
encontró los datos que se encuentran en la Tabla 1 columna tres. Su proceso para el cálculo es:
En temas anteriores se definió la frecuencia relativa como la partición o fracción de la frecuencia absoluta que
pertenece a un intervalo de clase dividida por el valor total de las frecuencias de las clases o números de
observaciones ( n ), que generalmente se expresa como porcentajes. Una propiedad de la frecuencia relativa
consiste en que, la suma de sus frecuencias parciales es igual a la unidad ( 1 ) o al 100%, según sea el caso.
fi
fr i
n
Dónde:
Página 35 de 142
ESTADISTICA 1
También se puede utilizar la siguiente expresión para encontrar la frecuencia relativa en porcentajes:
fi
fr i * 100
n
Al tomar los datos de la Tabla 1 y calcular la frecuencia relativa se obtiene los resultados de la Tabla 2. El
proceso de cálculo es el siguiente:
fr1 = 79/561 = 0.1408 por 100% = 14.08% El 14.08% son padres de familia.
fr2 = 92/561 = 0.1640 " = 16.40% El 16.40% son madres de familia.
fr3 = 339/561 = 0.6043 " = 60.43% El 60.43% son hijos.
fr4 = 51/561 = 0.0909 " = 9.09% El 9.09% son abuelos, tíos,...
En la unidad anterior se trató el tema sobre la frecuencia relativa acumulada como el proceso consiste en
sumar las frecuencias relativas de los datos de un intervalo de clase ( i ), con las frecuencias relativas de los
intervalos de clase o de datos anteriores y matemáticamente se puede expresar de la siguiente forma: fra i = Σ
fri Tomando los datos de la Tabla 2 se puede elaborar una tabla para las frecuencias relativas acumuladas,
resultados que se encuentran en la Tabla 3. Estos resultados anteriores indican que:
Página 36 de 142
ESTADISTICA 1
EJEMPLO. Teniendo en cuenta los alumnos que han ingresado a la Institución Z, datos que se encuentran en
la Tabla 4 columnas 1 y 3. Una vez realizado el proceso de operaciones sus resultados se encuentran en las
columnas 2, 4, 5, 6 y 7.
Considerando los resultados de la Tabla 4 se puede afirmar, que en el tiempo comprendido entre 1997 y 2014,
han ingresado 5301 estudiantes. Encontrándose el máximo porcentaje entre los años 2005 y 2006 con el
13,49% y el mínimo pertenece a los años de 1997 y 1998 con el 6,70%
GRAFICAS SECUNDARIAS
Estas gráficas son aquellas que se pueden elaborar a partir de las estadísticas secundarias, o sea, con datos
procesados a partir de las estadísticas primarias. Las gráficas secundarias más utilizadas están el histograma,
polígono de frecuencias y ojivas o polígono de frecuencias acumuladas.
Página 37 de 142
ESTADISTICA 1
Para construir un histograma de frecuencias se ubica las marcas de clase sobre el eje horizontal, luego se
levantan líneas verticales de altura igual al valor de la frecuencia perteneciente a cada intervalo, asegurándose
de que el valor de la marca de clase esté en la mitad de la parte superior del rectángulo. Siguiendo todas las
recomendaciones anteriores y tomando una proporcionalidad para elaborar gráficas se obtiene un histograma
de frecuencias, para este caso utilizando los datos de la Tabla 4 columnas 1 y 3 lográndose obtener la gráfica
que se encuentra en la Figura 1 conformada por una serie de rectángulos de alturas iguales al valor de la
frecuencia absoluta (fi).
Polígono de frecuencias. Es un polígono de línea trazado sobre las marcas de clase, que se obtiene uniendo
los puntos medios de las partes altas de los rectángulos en el histograma. También se forma el polígono de
frecuencia al unir las parejas ordenadas (Xi, fi).de la marca de clase y su correspondiente frecuencia.
Las parejas ordenadas (Xi, fi) se encuentran en la Tabla 5 columnas 2 y 3 y su gráfica está en la Figura 2
Página 38 de 142
ESTADISTICA 1
Polígono de frecuencias
Ojivas o polígono de frecuencias acumuladas. Cuando se utilizan las frecuencias acumuladas ya sean
absolutas, relativas y relativas porcentuales con el fin de hacer su representación gráfica se obtiene un
polígono de frecuencias acumuladas. Las ojivas, llevan su nombre según sea la frecuencia, puede ser inferior
a (IA) y superior a (SA) que depende de cómo se acumulan cada una de las frecuencias.
Página 39 de 142
ESTADISTICA 1
TABLA 6. DATOS
EDAD PESO ESTATURA EDAD PESO ESTATURA
AÑOS Kg Cm AÑOS Kg Cm
20 45.5 142 18 46.0 146
17 57.2 154 22 56.3 151
20 41.2 151 18 60.0 157
16 47.0 150 18 60.0 160
15 55.0 156 16 51.4 149
17 54.6 157 17 46.3 141
16 55.0 157 16 40.0 149
17 59.2 170 17 47.0 149
16 45.6 149 17 48.4 157
19 65.0 155 16 55.0 157
19 60.0 157 15 38.0 150
15 47.0 157 15 43.0 148
16 41.2 148 15 46.0 151
18 64.4 162 16 43.0 141
18 40.0 152 20 52.0 152
23 57.5 151 17 71.0 148
18 44.0 156 18 40.0 153
16 46.4 148 18 47.0 146
14 47.7 148 19 48.3 155
16 45.0 146 17 51.5 158
N = 40 N = 40 N = 40
Tomando los datos de la Tabla 5 se puede elaborar ojivas, pero antes de todo hay que encontrar sus
correspondientes frecuencias acumuladas que se encuentran en la Tabla 7 ver Figura 3. Acumulando las
frecuencias superiores a (SA), ver Tabla 8 y su gráfica se halla en la Figura 4
FRECUENCIA ACUMULADA
45
40 39 40
35 36
30 31
25 23
20
15
12
10
5 6
0 0 1
Inferior Inferior Inferior Inferior Inferior Inferior Inferior Inferior Inferior
A 38 A 42 A 46 A 50 A 54 A 58 A 62 A 66 A 70
FIGURA 3. Ojiva IA
Página 41 de 142
ESTADISTICA 1
FRECUENCIA ACUMULADA 45
40 40 39
35 36
30 31
25
23
20
15
12
10
5 6
0 1 0
Superior Superior Superior Superior Superior Superior Superior Superior Superior
A 70 A 66 A 62 A 58 A 54 A 50 A 46 A 42 A 38
FIGURA 4 Ojiva SA
TALLER 2.
Con los datos observados realizar y discutir con sus compañeros los resultados finales en los siguientes
procedimientos:
Frecuencias absolutas
Frecuencias absolutas acumuladas
Frecuencias relativas
Frecuencia relativa acumulada
Histograma de frecuencias
Polígono de frecuencias
Ojivas (IA) (SA)
Realizar sus interpretaciones en cada caso.
1. Pesos expresados en Kg
53, 54, 66, 62, 52, 58, 52, 50, 57, 56, 54, 58, 56, 39, 54, 42, 55, 47, 61, 48, 52, 51, 53, 68, 46, 47, 51, 44,
50, 55, 52, 63, 43, 59, 42, 60, 53, 44, 53, 49, 52, 50, 57, 56, 54, 58, 56, 39, 54, 42, 55, 47, 53, 54, 66, 62,
52, 58, 52, 50, 57, 52, 58, 52, 50, 57, 56, 54, 58, 56, 39, 54, 42, 55, 47, 61, 48, 52, 51, 53, 68, 46,. 51, 53,
40, 45, 42, 44, 59, 55, 48, 46, 53, 57, 50, 58, 49, 43, 41, 54, 59, 48, 51, 56, 60, 42, 51, 42, 44, 59, 55, 48,
46, 53, 57, 50, 58, 49, 43, 41, 54, 59, 48, 51, 56, 53, 50, 49, 45, 47, 42, 45, 60, 42, 51, 40, 45, 60, 42, 51,
42, 44, 59, 55, 48, 46, 53, 57, 50, 58, 49, 43, 41, 54, 59, 48, 51, 56, 53, 50, 49, 45, 42, 44, 59, 55, 48, 46
2. Con los siguientes datos consignar los valores adecuados en las tablas de acuerdo a la variable
correspondiente; trabajar como datos no agrupados:
Página 42 de 142
ESTADISTICA 1
n=
Página 43 de 142
ESTADISTICA 1
n=
n=
n= Suma =
Página 44 de 142
ESTADISTICA 1
n= Suma =
n= Suma =
3. Con los siguientes datos consignar los valores adecuados en las tablas de acuerdo a la variable
correspondiente; trabajar como datos agrupados:
RECOLECTAR INFORMACION
Recolectar información a 40 estudiantes de la institución a la que usted pertenece; para llenar la tabla
siguiente:
Página 45 de 142
ESTADISTICA 1
PROCESAR INFORMACIÓN
Página 47 de 142
ESTADISTICA 1
39
40
n= n= n=
AGRUPACION DE DATOS
n=
n=
Página 48 de 142
ESTADISTICA 1
n=
n= Suma =
n= Suma =
Página 49 de 142
ESTADISTICA 1
n= Suma =
Página 50 de 142
ESTADISTICA 1
4. MEDIDAS DE TENDENCIA
C E N T RA L
INTRODUCCIÓN
Las medidas de tendencia central son valores que están comprendidos entre dos extremos, uno inferior y otro
superior y es aplicable a una determinada variable tema de estudio o investigación. Dentro de los valores
mínimo y máximo están:
OBJETIVO
Al finalizar ésta unidad el alumno estará en condiciones de calcular la media aritmética, mediana, moda y otras
medidas tanto para datos agrupados y no agrupados utilizando las estadísticas primarias y secundarias.
Página 51 de 142
ESTADISTICA 1
DATOS NO AGRUPADOS
En esta clase de estadística depende del número de observaciones efectuadas y del número de valores
distintos que toma la variable, considerando éstos factores, las estadísticas de una sola variable se dividen en
observaciones simples y semi-compuestas.
Observación simple. Este caso se presenta cuando la observación es única y los datos obtenidos se
consignan en filas y/o columnas ordenando de menor a mayor o de acuerdo como se obtuvieron los datos.
Tomando los puntajes obtenidas por un estudiante (observación) en un semestre que corresponde a la
variable Xi, datos que se encuentran en la Tabla 1.
Observación semi-compuesta. Este caso hace relación cuando las observaciones son varias y la variable
toma pocos valores y distintos. Los valores obtenidos se ubican en dos columnas, en la primera los valores de
la variable y en la segunda la frecuencia o número de veces que cada valor aparece repetido. Al consultar a
25 estudiantes (observación) sobre el número de hermanos y hermanas (variable X i) que ellos tienen, se
puede elaborar la Tabla 2:
Algunos autores consideran datos no agrupados cuando no hay intervalos de clase ni marcas de clase o
puntos medios. Los datos utilizados en los diferentes cálculos son los realmente observados, éstos poseen
frecuencia fi igual a la unidad fi = 1 o mayor que la unidad fi > 1.
X
X i
_
X = Media aritmética
Xi = Datos observados
n. = Número de observaciones.
Si se desea saber la edad media de un grupo de 18 estudiantes que tienen las siguientes edades:
20, 17, 20, 16, 15, 17, 16, 19, 19, 15, 16, 18, 18, 23, 18 ,16, 17 y 16,
20+17+20+16+15+17+16+19+19+15+16+18+18+23+18+16+17+16 = 316
X
X i
=
316
= 17.6
n 18
En el segundo caso, el proceso se puede hacer menos extenso y su resultado será el mismo.
X
fX i i
X
fX i i
=
316
= 17.6
n 18
Con la siguiente tabla de datos se puede hallar el valor de la media para cada una de las variables.
Página 53 de 142
ESTADISTICA 1
n= fX
i i =
X
fXi i
n
Página 54 de 142
ESTADISTICA 1
n= fX i i =
X
fX i i
n
n= fX i i =
X
fX i i
n
DATOS AGRUPADOS
Es una observación compuesta en donde las observaciones son numerosas y la variable (Xi) toma diferentes
valores, entonces se recurre a agrupar los valores de la variable (X i) en grupos pequeños llamados intervalos
de clases y son utilizados para el proceso de cálculo. Ahora, los datos representativos son las marcas de clase
a cambio de los observados y datos que reciben el nombre, de datos agrupados. Un grupo de estudiantes de
una institución educativa de una ciudad Z aplicaron una encuesta a una muestra de 100 casas, para
Página 55 de 142
ESTADISTICA 1
determinar las edades de los componentes familiares; el trabajo produjo resultados numerosos por lo cual se
procedió a agrupar datos y elaborar la Tabla 7
La media aritmética o simplemente la media de un conjunto de datos, se calcula como la suma de los valores
de la observación de una muestra, población o censo dividida por el número de datos u observaciones de una
muestra o población. La media aritmética puede ser desarrollada tanto para datos agrupados y no agrupados.
Se consideran datos agrupados aquellos que se encuentran en tablas de frecuencias expresados en intervalos
de clase y se toma como representativo de ellos las marcas de clase (X i) o puntos medios de cada intervalo y
no sus valores reales.
X
X i f
* i
n
Encontrar la media de las edades utilizando la expresión para datos agrupados, en estos casos se debe
encontrar primeramente sus intervalos de clase siguiendo los pasos que se describen a continuación, su
resultado se encuentra en la Tabla 8
Página 56 de 142
ESTADISTICA 1
R 9
c 1 .8
i 5
R 9
c 0.45
i 20
O sea, que la amplitud del intervalo estará comprendido entre 0.45 y 1.8, que bien pueden ser 1 y 2
aproximando. En éste caso se tomará c = 2
Tercero. Elaborar tablas con sus intervalos, productos de frecuencia y marcas de clase, ver Tabla 9
X
X i f
* i
694
17.35
n 40
X = 17 años cumplidos
Página 57 de 142
ESTADISTICA 1
TALLER 3:
Recolectar información a 40 estudiantes de la institución a la que usted pertenece; para llenar la tabla
siguiente.
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
PROCESAR INFORMACIÓN
Página 59 de 142
ESTADISTICA 1
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
n= n= n=
n= f =
X i
*
X
fX
i i
n
Página 60 de 142
ESTADISTICA 1
n= =
X i
*
f
X
fX i i
n
n=
X i
*
f=
X
fX i i
n
MEDIA GEOMÉTRICA
Además de las anteriores existen otras medidas de tendencia central que se utilizan en ciertas ocasiones tanto
en el comercio y la economía, entre las más importantes están la media geométrica, armónica y otras.
Página 61 de 142
ESTADISTICA 1
Método para datos no agrupados. La media geométrica de n observaciones se define como la raíz de índice
n del producto de todas las observaciones se simboliza con la letra G y su expresión es la siguiente:
G n X1 * X2 * X3 *...* Xn
Dónde:
G = Media geométrica.
n = Número de observaciones.
X1, X2, X3, ..., Valor de cada observación.
EJEMPLO. Si se tiene cinco puntajes 65, 70, 80, 50 y 85 significa que el número de observaciones es cinco
(n=5), por lo tanto la media geométrica será:
1
LogG Log ( X 1 * X 2 * X 3 * ... * X n )
n
1 1 1
LogG Log (65 * 70 * 80 * .50 * 85) Log (1547000000 ) (9.189490314 ) 1.037898063
5 5 5
G = Antilog( 1.037898063 )
G = 68.84 = 69
Comparando los dos resultados, se tiene: 69 < 70; En forma general se puede afirmar que:
GX
Método para datos agrupados. Si los valores X1, X2, X3, X4, ..., Xn, se representan con sus correspondientes
frecuencias f1, f2, f3, f4, ..., fn y además con intervalos de clase, entonces para hallar la media geométrica G se
utiliza la siguiente expresión:
Página 62 de 142
ESTADISTICA 1
f1 f2 f3
G X1 * X 2 * X 3 ...Xn fn
Hallar la media geométrica, en donde Xi pertenece a las marcas de clase y fi a la frecuencia absoluta, además
utilizando los datos de la Tabla.1. Tomando el resultado de la columna 3 se puede llevar a la expresión para
calcular G, así:
Xi * fi 694
X 17.35 Entonces:
n 40
G< X o sea 17.24 < 17.35
Para el cálculo de G por medio de logaritmos se utiliza la siguiente expresión:
1
G Anti log(
n
( f i * LogX i ))
TABLA 15: DATOS POTENCIA
Marcas de clase Frecuencia absoluta Producto Potencia
Xi fi Xi* fi (xi)fi
14.5 6 87 9294114.39
16.5 18 297 8.21695665 E21
18.5 11 203.5 8.68738387 E13
20.5 3 61.5 8615.125
22.5 2 45 506.25
TOTAL n = 40 694 2.8935743 E49
MEDIA ARMONICA H
Cuando se utiliza el recíproco de la media aritmética de los recíprocos de los valores se denomina media
armónica y se utiliza cuando se desea hallar la media de datos inversamente proporcionales entre sí, ya sea
para datos no agrupados y agrupados.
Método para datos no agrupados. Para este caso se utiliza la siguiente expresión matemática:
Página 63 de 142
ESTADISTICA 1
n
H
1
X
i
Dónde:
n = Número de observaciones.
Xi = Datos observados.
Se desea hallar la media armónica para los puntajes de 50, 65, 70, 80 y 85, en este caso n = 5.
n 5 5
H 67.626 67.63
1 1 1 1 1 1 0.073935035
X
50 65 70 80 85
i
H G X
Método para datos agrupados. Cuando se utiliza datos agrupados o sea aquellos que están expresados por
medio de una distribución de frecuencias e intervalos de clase y se desea hallar la media armónica se utiliza la
siguiente expresión:
n
H
f
X i
i
Dónde:
Tomando los datos de la Tabla 16 se puede hallar la media armónica. Utilizando el resultado de las columnas
2 y 3 con el número de observaciones n = 40 de la Tabla 16 y reemplazando se tiene:
n 40
H 16.92
f 2.3345
Xi
i
Página 64 de 142
ESTADISTICA 1
EJEMPLO. Se necesita repellar 7440 metros cuadrados en una determinada construcción, varios obreros
realizan 3720 metros cuadrados, con un rendimiento de 100 metros por día; si el trabajo se necesita lo más
rápido posible, entonces los 372 metros cuadrados restantes los mismos trabajadores realizan 120 metros
cuadrados por día. El maestro de obra desea saber cuál es el promedio de metro cuadrado por día.
3720 días
t1 37.2 días
100
320días
t2 31 días
120
t = t1 + t2
t = 37. 2 + 31 = 68.2 días
Para hallar el promedio de metros cuadrados realizados por día se utiliza la media armónica, así:
2 24000
H 109.090 m.cuadrados / dia
1 1 220
100 120
H = 109.090 metros cuadrados/día Comprobando para el total de metros cuadrados = t*H se obtiene:= 68.2
días*109.090m/día = 744m
MEDIA CUADRATICA C
Esta media se define como la raíz cuadrada de la media aritmética de los cuadrados de la variable, la media
cuadrática se puede calcular tanto para datos no agrupados y agrupados.
Página 65 de 142
ESTADISTICA 1
2
2 2 2
X 1 X 2 X 3 ... X n
2
Xi
C =
n n
Dónde:
C = Media cuadrática.
n = Número de observaciones.
Xi = Observaciones.
Para hallar la media cuadrática de los valores siguientes 3, 4, 5, -6, -1, -3 y 2 se procede así:
Generalmente se utiliza la media cuadrática cuando se desea hallar la media de valores positivos y negativos;
se presenta cuando se trabaja con las desviaciones, debido a que se pueden dar valores positivos y negativos
que al sumar dan como resultado igual cero.
Método para datos agrupados. Si se utiliza datos agrupados como se ha descrito anteriormente, la media
cuadrática se la expresa por medio de la siguiente expresión matemática:
2 2 2 2
X
2
X 1 * f1 X 2 * f 2 X 3 * f 3 ... X n * f n i * fi
C =
n n
TALLER 4
Con los datos observados que se presentan a continuación realizar y discutir con sus compañeros los
resultados finales y hacer sus correspondientes interpretaciones en cada uno de los siguientes casos:
Página 66 de 142
ESTADISTICA 1
TALLER 5
Si todos los valores de una determinada variable son ordenados en sentido creciente o decreciente; se dice
que la mediana es aquella observación, dato o valor que ocupa el punto central o divide a una muestra en dos
partes iguales. La mediana se la puede calcular tanto para datos no agrupados como para agrupados.
MEDIANA PARA DATOS NO AGRUPADOS. En este caso los datos no se encuentran expresados mediante
una distribución de frecuencias, se puede ordenar con facilidad en forma creciente o decreciente las
observaciones que pueden dar dos casos, uno para datos impares y otro para los pares.
EJEMPLO Considerando que un estudiante tiene los siguientes puntajes en una determinada actividad: 40,
80, 90, 70 y 100; hallar el puntaje mediano
Al ordenar los datos en forma creciente o decreciente se puede tomar la mediana como el dato central que
divide a la muestra en dos partes iguales, que en este caso el valor que ocupa el tercer lugar con un valor de
80 es la mediana. Este resultado se puede encontrar mediante:
n 1
PMe
2
EJEMPLO Considerando los datos de la tabla en donde n es igual a los cinco puntajes, se tendrá el siguiente
resultado:
n 1 5 1
PMe =3
2 2
Página 67 de 142
ESTADISTICA 1
El número 3 indica la posición de la mediana, que se halla en tercer lugar a partir de izquierda hacia la
derecha o de derecha hacia la izquierda y pertenece a la puntuación mediana, Me = 80
EJEMPLO. Tomando otro caso, en donde se supone que un estudiante llegó a obtener los puntajes que van
de 1 a 100, éstas son: 100, 90, 80, 60, 40 y 70. En este caso los datos son pares, entonces la mediana se la
puede encontrar por medio de una fórmula, que con anterioridad se ha ordenado los datos. Para hallar la
mediana se calcula la posición de esta, así:
n 1 6 1
PMe = =3.5
2 2
Esto indica que el valor de la mediana estará entre el tercero y cuarto lugar, que de acuerdo a la tabla anterior
corresponde a los puntajes de 70. y 80., conociendo éstos datos se procede a encontrar el valor de la
mediana:
70 80 150
Me = = 75
2 2
Me = 75 Puntaje mediano.
14 17 51 151
15 15 53 153
16 14 54 152
17 17 55 157
18 16 44 159
19 15 46 160
20 16 47 143
TALLER 6
MÉDIANA PARA DATOS AGRUPADOS. Si los datos son numerosos y están expresados mediante
intervalos de clase junto con una distribución de frecuencias, la mediana se puede calcular matemáticamente
por medio de:
n
c( faa )
Me Lri 2
fme
Dónde:
Me = Mediana.
Página 69 de 142
ESTADISTICA 1
c = Amplitud de intervalo.
n/2 = Posición de la mediana.
n = Número de observaciones.
fme = Frecuencia de la clase mediana.
Lri = Límite real inferior de la clase mediana.
faa = Frecuencia acumulada del intervalo anterior.
EJEMPLO. En una encuesta realizada por unos estudiantes sobre los componentes familiares en 102 casas
resultaron los intervalos que se encuentran en la tabla siguiente y de ella se tiene:
n = 561
PMe = 561/2 = 280.5
PMe = 280.5 posición de la mediana.
De acuerdo a la posición de la mediana, ésta se encontrará entre las frecuencias acumuladas 267 y 389, que
pertenecen al intervalo 21.5 y 32.5, de donde:
Lri = 21.5
faa = 267
fme = 122
c = 11
n
c( faa )
Me Lri 2
fme
Página 70 de 142
ESTADISTICA 1
Este resultado indica que el 50% de 561 personas tiene edad menor a 22.71 años y el otro 50% corresponde a
edades mayores a 22.71 años y menores de 98
n=
n
c( faa )
Me Lri 2
fme
n=
n
c( faa )
Me Lri 2
fme
Página 71 de 142
ESTADISTICA 1
n=
n
c( faa )
Me Lri 2
fme
TALLER 7
LOS CUARTILES Q
Cuando los datos se dividen en cuatro partes iguales y se toma una de ellas se denomina cuartil y se
representa por Q1, Q2 y Q3 en donde cada fracción contiene un 25% del total de las observaciones.
n* j
c( faa )
Qj Lri 4
fqj
Qj = Identifica al cuartil 1, 2, 3
j = Índice que identifica al cuartil 1, 2, 3
Lri = Límite real inferior de la clase cuartílica.
fQj = Frecuencia de la clase cuartílica.
c = Amplitud del intervalo de clase.
faa = Frecuencia acumulada del intervalo anterior.
j*n/4 = Posición del cuartil.
Página 72 de 142
ESTADISTICA 1
j* n 1 40
PQ 1 * 10
4 4
Posición cuartil uno Q1, que se halla entre las frecuencias acumuladas 7 y 13 que pertenecen al intervalo 46.5
y 50.5
Lri = 46.5
faa = 7
PQ1 = 10
fQ1 = 6
c=4
40 *1
4( 7)
Q 1 46 . 5 4 46 . 5 2 48 . 5 Kg
6
Este resultado indica que el 25% de los estudiantes tienen un peso que está comprendido entre 39 y 48.5 Kg.
CALCULAR Q2 CUANDO J = 2.
2 * 40 2 40
P Q2 * 20
4 4
Posición cuartil Q2, éste se encontrará entre las frecuencias acumuladas 13 y 26, que pertenecen al intervalo
50.5 y 54.5
Página 73 de 142
ESTADISTICA 1
Lri = 50.5
faa = 13
fq2 = 13
PQ2 = 20
c=4
40 * 2
4( 13 )
Q 2 50 . 5 4 50 . 5 2 . 54 52 . 65 Kg
13
Este resultado indica que el 50% de los estudiantes tienen un peso que está comprendido entre 39 y 52.65 Kg
3 * 40 3 40
P Q3 * 30
4 4
Posición cuartil Q3, se halla entre las frecuencias acumuladas 26 y 33, que pertenece al intervalo 54.5 y 58.5
Lri = 54.5
faa =26
fQ3 =7
PQ3 =30
c=4
40 * 3
4( 26 )
Q 3 54 . 5 4 54 . 5 2 . 79 56 . 78 Kg
7
Este resultado indica que el 75% de los estudiantes tienen un peso que está comprendido entre 39 y 56.78 Kg.
n=
Página 74 de 142
ESTADISTICA 1
n* j
c( faa )
Qj Lri 4
fqj
TABLA 29: FRECUENCIA ABSOLUTA ACUMULADA PARA LOS CUARTILES DEL PESO
Intervalo de clase Limite real de clase Frecuencia absoluta Frecuencia
Li Ls Lri Lrs f acumulada fa
n=
n* j
c( faa )
Qj Lri 4
fqj
n=
n* j
c( faa )
Qj Lri 4
fqj
Página 75 de 142
ESTADISTICA 1
TALLER 8
LOS DECILES D
Si los valores que conforman una distribución se los divide en diez partes iguales en donde, cada uno de ellos
se denomina decíl que se simboliza por D1, D2, D3, ...., D9 cada fracción representa el 10% de las
observaciones. Para el cálculo de los deciles el proceso es similar al de cuartiles y su expresión matemática
es:
n* j
c( faa )
Dj Lri 10
f Dj
Dónde:
Para hallar los deciles D2, D4, D6, D8 según la Tabla anterior
Página 76 de 142
ESTADISTICA 1
j* n
PDj
10
2 * 40 2 40
P D2 * 8
10 10
Posición decil D2, éste se halla entre las frecuencias acumuladas 7 y 13 que pertenecen al intervalo 46.5 y
50.5
Lri = 46.5
faa = 7
PD2 = 10
fD2 = 6
c=4
40 * 2
4( 7)
D 2 46 . 5 10 47 . 17 Kg
6
Este resultado indica que el 20% de los estudiantes tienen un peso que está comprendido entre 39 y 47.17 Kg
HALLAR D4 CUANDO J = 4
4 * 40 4 * 40
P D4 16
10 10
Posición decíl D4, éste se halla entre las frecuencias acumuladas 13 y 26, que pertenece al intervalo 50.5 y
54.5
Lri = 50.5
faa = 13
fD2 = 13
PD2 = 16
c=4
40 * 4
4( 13 )
D 4 50 . 5 10 51 . 42 Kg
13
Este resultado indica que el 40% de los estudiantes tienen un peso que está comprendido entre 39 y 51.42 Kg
Página 77 de 142
ESTADISTICA 1
EL DECÍL D6 CUANDO J = 6
6 * 40 6 40
P D6 * 24
10 10
Posición decíl D6, éste se hallará entre las frecuencias acumuladas 13 y 26, que pertenece al intervalo 50.5 y
54.5
Lri = 50.5
faa = 13
fD6 = 13
PD6 = 24
c=4
40 * 6
4( 13 )
D 6 50 .5 10 53 .88 Kg
13
Este resultado indica que el 60% de los estudiantes tienen un peso que está comprendido entre 39 y 53.88 Kg
EL DECÍL D8 CUANDO J = 8
8 * 40 8 40
P D8 * 32
10 10
Posición decíl D8, éste se halla entre las frecuencias acumuladas 26 y 33, que tiene por intervalo 54.5 y 58.5
Lri = 54.5
faa = 26
fD6 = 7
PD6 = 32
c=4
Reemplazando en su expresión se obtendrá el decíl
40 * 8
4( 26 )
D 8 54 . 5 10 57 . 93 Kg
7
Este resultado indica que el 80% de los estudiantes tienen un peso que está comprendido entre 39 y 57.93 Kg.
Página 78 de 142
ESTADISTICA 1
n=
n* j
c( faa)
Dj Lri 10
fDj
TABLA 33: FRECUENCIA ABSOLUTA ACUMULADA PARA LOS DECILES DEL PESO
Intervalo de clase Limite real de clase Frecuencia absoluta Frecuencia
Li Ls Lri Lrs f acumulada fa
n=
n* j
c( faa)
Dj Lri 10
fDj
Página 79 de 142
ESTADISTICA 1
n=
n* j
c( faa)
Dj Lri 10
fDj
TALLER 9
Si los valores que conforman una distribución se dividen en cien partes iguales y a cada una se denomina
centíl, su símbolo es C1, C2, C3, C99, cada fracción contiene el 1% de las observaciones. El cálculo de los
centiles es similar al de deciles y su expresión es:
n* j
c( faa )
Cj Lri 100
f Cj
Dónde:
Hallar los centiles C20, C40, C60 y C80 para los datos de la Tabla anterior.
j* n 20 * 40
P C20 8
4 100
Al reemplazar en su ecuación correspondiente se obtendrá los siguientes resultados:
40 * 20
4( 7)
C 20 46 . 5 100 47 . 17 Kg equivale al 20%
7
40 40
4( * 13 )
C 40 50 . 5 100 51 . 42 Kg equivale al 40%
6
40 60
4( * 13 )
C 60 50 . 5 100 53 . 88 Kg equivale al 60%
13
40 * 80
4( 26 )
C 80 54 . 5 100 57 . 93 Kg equivale al 80%
7
Los resultados de los centiles C20, C40, C60 y C80 son iguales al de los deciles D2, D4, D6 y D8.
n=
Página 81 de 142
ESTADISTICA 1
n* j
c( faa )
Cj Lri 100
f Cj
TABLA 37: FRECUENCIA ABSOLUTA ACUMULADA PARA LOS CENTILES DEL PESO
Intervalo de clase Limite real de clase Frecuencia absoluta Frecuencia
Li Ls Lri Lrs f acumulada fa
n=
n* j
c( faa )
Cj Lri 100
f Cj
n=
Página 82 de 142
ESTADISTICA 1
n* j
c( faa )
Cj Lri 100
f Cj
TALLER 10
La moda es una medida de tendencia central que pertenece al valor que más se repite o que tiene mayor
frecuencia en un grupo de observaciones o datos y su cálculo se hace tanto para datos no agrupados y
agrupados.
MODA PARA DATOS NO AGRUPADOS. En este caso la moda puede existir o no, si existe no puede ser
única. Cuando una información estadística posee una sola moda se llama unimodal, si tiene dos se denomina
bimodal.
EJEMPLO. Suponiendo que un estudiante A obtuvo cuatro valoraciones, en donde sus puntajes son: 65, 70,
80 y 90, de acuerdo al concepto de moda ésta no existe ya que todos los valores de las observaciones tienen
la misma frecuencia igual a la unidad, ver la tabla siguiente.
Un segundo estudiante B realizó seis valoraciones y sus puntajes se encuentran en la tabla siguiente, en
donde el puntaje modal, indica que existen dos modas identificadas con los puntajes de 65 y 80, denominada
bimodal.
Página 83 de 142
ESTADISTICA 1
Hallar la moda para datos no agrupados relacionados con la edad, peso y estatura
Mo =
Mo =
Página 84 de 142
ESTADISTICA 1
Mo =
TALLER 11
MODA PARA DATOS AGRUPADOS. Para el cálculo de la moda en datos agrupados o que se encuentran en
una tabla de distribución de frecuencias con intervalos de clase, se utiliza la siguiente expresión matemática:
da
Mo Lri *c
da dp
EJEMPLO. Tomando los datos de la tabla siguiente se puede calcular la edad modal. En ésta tabla la
frecuencia modal es la de mayor valor y permite calcular la moda de esta información estadística:
Dónde:
Lri = 10.5
da = fmo - fa = 157 - 110 = 47
da = 47
dp = fmo - fp = 157 - 122 = 35
dp = 35
c = 11
Página 85 de 142
ESTADISTICA 1
Reemplazando los datos de la tabla en la expresión correspondiente se tendrá el valor de la moda para esta
información estadística.
47 517
Mo 10 . 5 * 11 10 . 5 10 . 5 6 . 305 16 . 80
47 35 82
Mo = 16.80 Clase modal.
Este resultado indica que aproximadamente, la edad que más se repite es de 16.80 años, si se desea en años
cumplidos será de 17.
El conjunto de datos que obtenemos al hacer cualquier encuesta o votación, podemos representarlo
gráficamente, mediante un diagrama de barras o un gráfico de sectores, o bien mediante tres valores que
llamamos media, mediana y moda.
n=
da
Mo Lri c
da dp
Página 86 de 142
ESTADISTICA 1
n=
da
Mo Lri *c
da dp
n=
Página 87 de 142
ESTADISTICA 1
5. MEDIDAS DE DISPERSION
INTRODUCCIÓN
Las medidas de tendencia central también son llamadas medidas de posición, que tratan de medir o dar a
conocer los datos que se dispersan o se alejan con relación a la media, mediana, moda, cuartiles, deciles o
percentiles; en esta unidad se tomará como referencia la media aritmética. En general el uso de las medidas
de tendencia central no son ayuda suficiente para comparar dos o más distribuciones o muestras,
especialmente cuando la media es igual en cada una de ellas. Entre las diferentes medidas de dispersión
están: el rango o recorrido, desviación media, varianza, coeficiente de variación, etc..
OBJETIVO
Al finalizar esta unidad el estudiante estará en capacidad de calcular y definir el recorrido o rango, desviación
media, varianza, desviación típica, variable normalizada, para datos no agrupados y agrupados utilizando sus
fórmulas correctamente.
Es una medida de dispersión que toma datos de una muestra para calcular la sumatoria de los valores
absolutos de las desviaciones de cada uno de los datos de una muestra con relación a la media aritmética,
dividida por el tamaño de la muestra (n). La desviación media se calcula para datos no agrupados y agrupados
mediante procesos matemáticos.
TALLER 12
Método para datos no agrupados . La media aritmética de las desviaciones para datos no agrupados con
relación a la media aritmética de los datos se puede escribir de la siguiente forma:
Página 88 de 142
ESTADISTICA 1
X i X fi * (X i X )
DM DM
n n
Dónde:
X = Media aritmética de los datos.
Dm = desviación media.
Xi = Valor de cada uno de los datos observados.
fi = Frecuencia absoluta de cada valor Xi.
Para el cálculo de la desviación media se puede elaborar ciertas tablas que permiten organizar cada uno de
los resultados obtenidos en el proceso, ver las dos Tablas siguientes
GRUPO A
fi * (X i X ) 200
DM = 8
n 25
Página 89 de 142
ESTADISTICA 1
Xi fi Producto fi*I ( X i X ) I
(X i X )
45 1 15 15
50 2 10 20
55 3 5 15
60 5 0 0
65 3 5 15
70 2 10 20
75 1 15 15
n = 17 fi * ( X i
X ) 100
GRUPO B
fi * (X i X ) 100
DM 5 .9
n 17
De acuerdo a los resultados de la desviación media, se puede afirmar que el grupo A presenta mayor
dispersión que el grupo B con relación a la media, por lo tanto quien ocupa el primer puesto es el grupo B y el
segundo para el A. Si no se está convencido se puede recurrir al concepto de varianza.
n= fi * ( X i
X )
fi * (X i X )
DM =
n
Página 90 de 142
ESTADISTICA 1
X f Producto fi*I ( X i X ) I
(X i X )
n= fi * ( X i
X )
fi * (X i X )
DM =
n
X f Producto fi*I ( X i X ) I
(X i X )
n=
fi * ( X i X )
Página 91 de 142
ESTADISTICA 1
fi * (X i X )
DM =
n
TALLER 13
Método para datos agrupados. Recordando que datos agrupados son aquellos en donde se trabaja con
marcas de clase y no con datos realmente observados junto con las frecuencias (f i) de cada clase. Su
expresión matemática es:
fi * (X i X )
DM
n
Xi = Marcas de clase.
fi = Frecuencia absoluta de cada intervalo.
n = Número de observaciones.
n=
fi * ( X i X )
fi * ( X i X )
DM
n
Página 92 de 142
ESTADISTICA 1
n=
fi * ( X i X )
fi * ( X i X )
DM
n
Xi fi Producto fi*I ( X i X ) I
(X i X )
n=
fi * ( X i X )
fi * ( X i X )
DM
n
Página 93 de 142
ESTADISTICA 1
TALLER 14
La varianza es una medida de dispersión que consiste en la suma de las desviaciones al cuadrado de cada
uno de los datos con relación a la media aritmética, dividida por el tamaño de la muestra n. Cuando la
dispersión de los datos es mayor, también lo son sus desviaciones, por lo tanto lo será su varianza. En el
proceso de cálculo, la varianza toma unidades cuadráticas resultando un inconveniente, de allí que se ha
tomado otra medida de dispersión llamada desviación típica o estándar que se simboliza por S. La varianza
puede ser para datos no agrupados y agrupados.
Para datos no agrupados . La expresión que se utiliza para éstos casos es la siguiente:
2 2
S2
(X i X ) S2
fi ( X i X )
n n
Xi = Datos observados.
fi = Frecuencia absoluta de cada uno de los datos.
Siguiendo el proceso para solucionar el problema anterior de los grupos A y B ahora utilizando el concepto de
varianza. En primer lugar se debe elaborar tablas de valores para cada uno de los grupos, ver Tabla 1 y 2 que
pertenece a A y B respectivamente. Reemplazando los datos de las Tablas 1 y 2 se obtiene la varianza tanto
para A y B.
f i ( X i X ) 2500
Página 94 de 142
ESTADISTICA 1
2
S2
(Xi X )
2500
100
n 25
f (X
i i X ) 2 1000
2
S2
(Xi X ) 1000
58.82
n 17
Según los resultados de las varianzas el grupo B ocupa el primer puesto 100>58.82
n=
fi ( X i X )2
2
S2
(X i X )
n
Página 95 de 142
ESTADISTICA 1
n=
fi ( X i X )2
2
S2
(X i X)
n
n=
f (X
i i X )2
2
S2
(X i X )
n
TALLER 15
Método para datos agrupados. Para estos casos se puede utilizar una expresión similar a la anterior en
donde los datos observados son reemplazados por las marcas de clase X i con sus correspondientes
frecuencias fi.
Página 96 de 142
ESTADISTICA 1
2
S2
f (Xi i X)
n
n= 2
fi ( X i X )
2
S2
fi ( X i X )
n
Xi fi Producto fi* ( X i X ) 2
(X i X ) (X i X ) 2
n= 2
fi ( X i X )
2
S2
fi ( X i X )
n
Página 97 de 142
ESTADISTICA 1
Xi fi Producto fi* ( X i X ) 2
(X i X ) (X i X ) 2
n= 2
fi ( X i X )
2
S2
fi ( X i X )
n
TALLER 16
Se define como la raíz cuadrada de la varianza tomada con signo positivo o la raíz cuadrada de las
desviaciones al cuadrado con relación a la media aritmética y se representa por S, su expresión matemática
es la siguiente: La desviación típica o estándar permite hacer comparaciones con los datos originales en forma
directa, debido a que su resultado lleva la misma unidad de medida que los datos observados. La desviación
típica puede encontrar tanto para datos no agrupados y agrupados.
2
S
fi ( X i X )
S Varianza
n
S = Desviación típica.
fi = Frecuencia de cada dato Xi.
Xi = Valor de cada uno de los datos.
Siguiendo con el caso de los dos grupos A y B tomar el concepto desviación típica para decidir cuál de los
grupos ocupa el primer lugar mediante el uso de los valores de las Tablas 1 y 2 y la fórmula anterior, se tiene:
Página 98 de 142
ESTADISTICA 1
f i ( X i X ) 2500
GRUPO A
2
S
fi ( X i X )
2500
25 5
n 100
GRUPO B
2
S
fi ( X i X )
1000
58 . 82 7 . 67
n 17
Según estos resultados se puede afirmar que el grupo B ocupa el primer lugar, debido a que éste presenta
menor desviación con relación a la media aritmética.
Página 99 de 142
ESTADISTICA 1
TALLER 17
Cuando no se puede obtener la media aritmética, la desviación media, varianza y desviación típica con los
datos realmente observados debido a que éstos son numerosos, se procede a agrupar en clases o intervalos,
en donde Xi representa las marcas de clase y fi las frecuencias de cada intervalo, para esto se utiliza
expresiones semejantes a las anteriores con algunas modificaciones.
2
S
f (X i i X)
n
Veamos el siguiente caso, después de tabular los datos, agrupar en intervalos ver Tabla 1 para una muestra
de 200 elementos.
Para utilizar la expresión para S, hay necesidad de hallar la media aritmética y confeccionar la Tabla 2
tomando como referencia la Tabla 1, así:
X
f i * Xi
=
3640
18.2
n 200
2
S
f (Xi X )
=
7182.00
= 35.91 = 5.99 = 6
n 200
2
S
f (Xi X )
n
n= 2
fi ( X i X )
2
S
f (Xi X )
n
Xi fi Producto fi*( ( X i X ) )2
(X i X ) (X i X ) 2
n= 2
f (X
i i X)
2
S
f (Xi X )
n
n= 2
fi ( X i X )
2
S
f (Xi X )
n
6. TEORIA DE LA PROBABILIDAD
INTRODUCCION
Para desarrollar ésta unidad es necesario ciertos conocimientos elementales sobre la teoría de conjuntos y
ciertas operaciones entre ellos; que luego serán utilizados en los temas relacionados con los conceptos
modernos de probabilidades debido a que ésta se considera netamente axiomática, trazando así, un camino
hacia la probabilidad condicional e incondicional. Además los conceptos son utilizados en inferencia
estadística.
OBJETIVOS
CONJUNTOS
A los conjuntos es costumbre designarlos con letras mayúsculas, mientras que para los elementos se utiliza
letras minúsculas encerrado entre llaves { }. Además si se toma una parte de elementos de un conjunto se lo
llama subconjunto, o sea un conjunto que está incluido en otro; que también se designará con letras
mayúsculas. Así:
DIVISION DE CONJUNTOS
Conjuntos finitos.
Conjuntos infinitos.
Conjuntos finitos. Un conjunto es finito o infinito contable si está vacío o tiene elementos fácilmente
contables, dando como resultado un número positivo. Se puede considerar como conjuntos, a los:
Días de un mes.
Alumnos de la Universidad de Nariño.
Libros de la biblioteca del CESMAG.
Candidatos a ser presidentes de Colombia.
Niños de un barrio.
Conjuntos infinitos. Un conjunto es infinito o no contable cuando, NO se puede contar u obtener su valor con
exactitud: Pueden ser considerados como conjuntos infinitos a:
Peces de un lago.
Arboles de una montaña.
Estrellas del universo.
Niños de Colombia.
Habitantes del departamento de Nariño.
Cuando un conjunto es bastante grande pero se puede contar o llegar a obtener un resultado lo más cercano
posible al valor verdadero, se lo denomina conjunto infinito contable, así:
ESPECIFICACION DE CONJUNTOS
Por extensión. Consiste en escribir todos los elementos, separados por comas y encerrarlos en llaves:
A={a, o, u, e, i}
B={3, 6, 9 12, 18}
C={Alejandra, Marcela, Daniela, Jimena, David}
Por comprensión. Consiste en dar una propiedad común a todos los elementos del conjunto y encerrarlos en
llaves; esta propiedad debe ser muy precisa; la deben cumplir todos los elementos del conjunto y solamente
los elementos del conjunto.
Al igual que en aritmética se puede realizar las cuatro operaciones que son suma, resta, multiplicación y
división; mediante los conjuntos se puede realizar algunas operaciones que son utilizadas para determinar las
correspondientes probabilidades, ellas son:
Unión.
Intersección.
Diferencia.
Complemento.
Unión. Si se tiene dos o más conjuntos, la unión o reunión de éstos será otro conjunto que está conformado
por los elementos de éstos o uno de ellos, matemáticamente se puede expresar, figura es 1.
A B=C={ x : x A o x B }
AB
Sea A, el conjunto formado por los libros de física del grado diez y sea B el conjunto de libros de física del
grado once. La unión de estos será otro conjunto equivalente a sumar los del grado diez y once. La unión
puede se puede dar entre dos o más conjuntos.
Si se toma un informe para secundaria está conformada por diferentes asignaturas que constituyen los
elementos; éstas a su vez se agrupan por áreas y la unión de éstas conforma el informe.
Intersección. La intersección de dos o más conjuntos, es el conjunto que está conformado por los elementos
comunes que pertenecen a cada uno de los conjuntos, matemáticamente la representación para dos conjuntos
es:
A B=C={ x : x A y x B }
Si se cumple que A B=φ, se dice que los conjuntos son disyuntos, o sea que no existe intersección, y se
puede representar gráficamente, ver Figura 2
A B
FIGURA 2 intersección de conjuntos
Si un curso está constituido por U=21 estudiantes y conforman dos equipos; al de Básquet B pertenecen 14 y
10 al de voleibol V: entonces el conjunto de estudiantes que juegan básquet y voleibol será C, ver Figura 3.
U=21
B+V=14+10=24
B V=(B+V)-U
B V=24-21=3 B7
V 11 C3
B V=3=C
U-B=21-14=7
U-V=21-10=11
A B
Diferencia o complemento relativo. Si se tiene dos conjuntos, sean A y B se llama diferencia o complemento
relativo de A con respecto a B; al conjunto de elementos que pertenece a A y no a B, que matemáticamente se
escribe:
A-B=C={ x : x A x B }
B-A=D={ x : x B x A }
Dando como resultado los conjuntos C y D que son dos conjuntos diferentes, al menos que los dos sean
vacíos. Su representación gráfica está en la Figura 4
A-B B-A
Si se considera el caso anterior, que consta de un grupo de A=21 estudiantes en donde el grupo B=14 juegan
básquet y el grupo V=10 juegan voleibol; se puede hallar:
Complementación. Esta operación se efectúa sobre cada una de las partes del universo. Siendo A cualquier
parte del universo U, su complemento se denota de diferentes maneras, así: Ac, CA, A'. El conjunto
complementario de un conjunto A, es el conjunto de todos los individuos que pertenecen al universo y no
pertenecen al conjunto A. Simbólicamente se puede escribir:
Ac = CA = A' = { x / x U x A }
TECNICAS DE CONTAR
Principio fundamental del conteo. Este principio se enuncia de la siguiente manera: Sí un suceso puede
realizarse de n1 maneras diferentes, un segundo suceso puede realizarse de n2 maneras diferentes, un tercer
suceso puede realizarse de n3 maneras diferentes y así sucesivamente hasta llegar al último; el número de
maneras que los sucesos se pueden ordenar es equivalente al producto, así: n1*n2*n3*.... = n; Total de
ordenaciones.
EJEMOLO. Para formar una junta directiva hay 3 candidatos para presidente, 2 para tesorero y 2 para
secretarias; los tres cargos podrán ocuparse de: 3*2*2 = 12 maneras u ordenaciones diferentes. Para
determinar el número de ternas se procede a formar el árbol de ordenaciones, así:
Página 107 de 142
ESTADISTICA 1
T1 S1
P1 S2
T2 S1
S2
T1 S1
P2 S2
T2 S1
S2
T1 S1
P3 S2
T2 S1
S2
FIGURA 5
Notación factorial. La notación factorial n!; significa el producto ordenado de enteros positivos desde n hasta
1 o desde 1 hasta n; que se lee; n factorial y se puede escribir de la siguiente manera:
De acuerdo al concepto de factorial se puede resolver diferentes problemas, así: Un estudiante desea saber
de cuantas formas puede ordenar libros de: biología, uno de química y uno de física en el estante de su
biblioteca; para resolver éste problema el estudiante procede a desarrollar de dos maneras una gráfica y otra
analítica. Para el primer caso ver Figura 6, 7 y 8
FIGURA 6
Q
B F
B
Q F
B
F Q
FIGURA 7
Q F
B F Q
B F
Q F B
B Q
F Q B
FIGURA 8
En primer lugar el estudiante hace un gráfico ubicando y ordenando B, Q, F de arriba hacia abajo, todos a
partir de un punto de origen, ver Figura 6
Luego hace un nuevo gráfico ubicando a lado y lado de B, Q, F los restantes libros para cada uno de ellos
haciendo un segundo ordenamiento de dos libros que corresponde a cada ramificación, ver Figura 7
Por último en la Figura 8 y en cada ramificación de la Figura 7 ubica el tercer libro para completar el tercer
orden que corresponde a la igualdad de ramificaciones, así:
Variaciones. Según algunos autores, variación es la enumeración de una cantidad de elementos o sucesos
en un orden determinado; tomados de r en r de un conjunto formado por n elementos o sucesos. Además
para que haya variaciones algunos matemáticos consideran que debe cumplir la relación de que r<n. En una
variación, se puede repetir los elementos que conforman los diferentes subconjuntos y no importa el orden en
cada uno de ellos. Las variaciones también son llamadas pruebas con sustitución; debido a que, en cada,
ordenamiento de tamaño r se extrae un elemento del conjunto y se lo devuelve a dicho conjunto una vez
hecho su respectivo análisis; así, hasta terminar. Para hallar el número de variaciones en forma analítica se
utiliza.
n!
nVr = n*(n -1)*(n - 2)*(n - 3)*...*(n - r +1) nVr
(n - r)!
Dónde:
EJEMPLO. Un profesor tiene 10 estudiantes y quiere formar grupos de 4 estudiantes. De cuántas maneras
podrá organizar?. En este caso se tiene n=10 y r=4 que reemplazando en su fórmula se tiene:
El resultado anterior de 5040 está expresando un número grande de grupos y cada uno con 4 estudiantes que
se forman a partir de 10 estudiantes. Si los valores de n son pequeños se halla las variaciones gráfica y
analíticamente. Suponiendo un grupo de 4 estudiantes Alejandra, Beatriz y Diana solicitan reingreso a la
universidad y tienen que presentar entrevista; ellas piensan que pueden ser llamadas individualmente o en
grupos de dos y resuelven analítica y gráficamente, ver Figura 9. El conjunto solución S según la Figura 9
equivale:
0 r=1 r=2 S1
B =AB
A C =AC
D =AD
A =BA
B C =BC
D =BD
A =CA
C B =CB
D =CD
A =DA
D B =DB
C =DC
Para n = 4 y r = 1
4! 4! 4 3 2 1
4 V1 = * * * 4 4V1 = 4 formas de 1 en 1
(4 1)! 3! 3*2*1
Para n = 4 y r = 2
4! 4! 4 3 2 1
4 V2 = * * * 12 4V2 = 12 formas de 2 en 2
(4 2)! 2 2*1
n! n!
nVn n! nPn = n! n! = n(n - 1)(n - 2)(n - 3)...1
(n - n)! 0!
Como las permutaciones son un caso particular de las variaciones que se cumple para n=r. Debido a esto,
algunos matemáticos no hacen diferencia entre estos dos conceptos; simplemente utilizan permutaciones para
hallar el ordenamiento cuando, r menor o igual a n. Considerando el grupo de estudiantes: Alejandra, Beatriz,
Carolina y Diana se puede hallar las permutaciones de 4 en 4 gráfica y analíticamente; esto se encuentra en la
Figura 10, que ha tenido como punto de referencia la Figura 9 aumentando en una tercera y cuarta
ramificación. En forma analítica para n=4 y r=4 es.
0 1 2 3 4
B C D
D C
A C B D
D B
D B C
C B
A C D
D C
B C A D
D A
D A C
C A
A B D
D B
C B A D
D A
D A B
B A
A B C
C B
D B A C
C A
C A B
B A
FIGURA 10 representación para 4P4
Tomando de izquierda a derecha, desde la columna 0 hasta 1, las variaciones tomadas de 1 en 1, son: S 1
= {A, B, C, D}
Tomando de izquierda a derecha por cada ramificación hasta la columna 2, están las variaciones tomadas
de 2 en 2, ellas son: S2 = {............................
Tomando de izquierda a derecha por cada ramificación hasta la columna 3, están las variaciones tomadas
de 3 en 3, ellas son: S3 = {............................
Página 111 de 142
ESTADISTICA 1
Tomando de izquierda a derecha por cada ramificación hasta la columna 4, están las permutaciones
tomadas de 4 en 4, ellas son: S4 = {............................
Combinaciones. Se denomina combinación a una ordenación o enumeración de; cierto número de elementos
o sucesos tomados de r en r de un conjunto de n elementos, sin repetición de ellos en más de un
ordenamiento. En las combinaciones se cumple que: r siempre es menor o igual a n, r n sus expresiones
matemáticas para el cálculo son:
Tomando el caso de las cuatro estudiantes que solicitan el reingreso a la universidad; se procede a encontrar
las combinaciones; su proceso es similar al de variaciones y permutaciones, la diferencia consiste en que no
deben aparecer nombres repetidos en cada ordenamiento. El procedimiento gráfico está en la Figura 11
0 1 2 3 4
B C D
A D
C D
D
B C D
D
C D
D
Figura 11 diagrama combinatorio
En una variación y permutación se tiene en cuenta el orden. Los siguientes ordenamientos son diferentes: AB
BA; AC CA; AD DA; BC CB; BD DB; CD DC
En cambio para las combinaciones los anteriores ordenamientos son equivalentes, por lo tanto uno de ellos
debe aparecer una sola vez en un ordenamiento.
El proceso para hallar cada una de las combinaciones de acuerdo a la Figura 11 y en otros casos es el
siguiente:
4! 4! 4*3*2*1
4 C1 = 4
(4 1)!1! 3!*1! 3*2*1
4! 4! 4 3 21
4 C2 = * * * 6
(4 2)!2! 2!* 2! 2*1*2*1
4! 4! 4*3*2*1
4 C3 = 4
(4 3)!3! 1!* 3! 1*3*2*1
4! 4! 4 3 21
4 C4 = * * * 1
(4 4)!4! 0!* 4! 1*4*3*2*1
Cuando el número de elementos es muy grande, se dificulta hallar el número de combinaciones gráficamente,
entonces se procede a resolver analíticamente.
TALLER 18
CONJUNTOS
A. P-Q
B. Q-P
C. P-(Q-R)
D. (P-Q)-R
E. (P Q R)-(P Q R)
F. (P Q) R
G.(P Q) (P R)
A. A' F. B-A
B. B' G. A-C
C. A B H. A'-C'
D. (A B)' I. A-(B C)
E. A-B J. A-(B-C)
K. A D P. (B C)-A'
L. A-D Q. (A C)-N
M. A-D' R. N-A, N-B
N. (A-D)' S. N-(A B C D)
O. (B C)-D
Un estudiante desea organizar un derrotero de exámenes con las asignaturas de física, química, biología y
estadística; además desea saber de cuantas maneras puede hacer, identificando el primero, segundo,
tercero y cuarto examen.
Otro estudiante realiza el mismo ejercicio utilizando asignaturas de física, química, biología, estadística,
matemáticas y español.
4. Tú puedes ordenar los elementos de laboratorio de química: una pipeta, un tubo de ensayo, un beaker y
una probeta de: 1 en 1, 2 en 2, 3 en 3 y 4 en 4; analítica y gráficamente.
5. Tú puedes hallar el número de variaciones de 3 en 3 de las cuatro estudiantes del caso anterior; gráfica y
analíticamente.
6. .Tú puedes hallar los diferentes ordenamientos gráfica y analíticamente con los colores siguientes: rojo,
naranja, amarillo, verde y azul de acuerdo a: 5V1, 5C1; 5V2, 5C2; 5V3, 5C3; 5V4. 5C4; 5P5. 5C5
CONCEPTO DE PROBABILIDAD
La teoría de la probabilidad tuvo su origen con los juegos de azar hace aproximadamente unos tres siglos. En
ciertas ciudades europeas, el juego de azar era un pasa-tiempo, de donde surgió la necesidad de un método
matemático para calcular las probabilidades y ser aplicadas a éstos. Entre los matemáticos que intervinieron
para que los juegos de azar tuvieran aplicación matemática están en su orden los siguientes: Blaise Pascal,
Pierre Fermat, James Bernoulli, De Moire, La Place y otros que dieron origen a la teoría moderna de la
probabilidad que se expandió rápidamente por todas partes del mundo, durante el siglo XIX se desarrolla la
teoría de errores, la mecánica estadística, etc. En la actualidad la teoría de probabilidades es una parte
importante de las matemáticas, con un campo de aplicación en las ciencias naturales, técnicas, sociales,
genética, economía, sicología, ingeniería y especialmente en el desarrollo de la estadística.
Espacio muestral, evento o suceso. Se llama espacio muestral al conjunto S, que está conformado por los
resultados de un experimento, en donde a cada resultado le corresponde uno y solo uno de los elementos de
S. Un evento o suceso es un subconjunto de elementos o resultados del espacio muestral S; un subconjunto o
clase de eventos de S puede tomar varios nombres:
Utilizando las operaciones entre conjuntos se puede combinar dos o más eventos; dando como resultados o
eventos compuestos que permitirán encontrar sus correspondientes probabilidades de cuerdo ciertas
condiciones.
Si A y B son eventos que pertenecen a S, se puede considerar los siguientes eventos compuestos:
Considerando un experimento que consiste en contestar 3 preguntas con V si la afirmación es correcta y con F
si la afirmación es falsa. Para este caso se puede tomar las siguientes condiciones:
Una forma de solucionar es elaborando el diagrama de árbol, que está en la Figura 12.
A A`=S
Evento B`=S-B={FFF}
B B`=S
Evento C`=S-C={FFV,FVF,FVV,VFF,VFV,VVV}
C C`=S
Evento A C=Ø, (Vacío) o evento imposible cuando A y C son eventos mutuamente exclusivos o
incompatibles.
Concepto clásico de probabilidad. Clásicamente una probabilidad se puede definir como una relación entre
un evento A que tiene n resultados (muestras) de un total de N casos igualmente posibles pertenecientes al
espacio muestral S (población) o evento seguro, se escribe:
n(A)
P(A)
N(S)
Dónde:
Según el concepto clásico de probabilidad se considera que todos los eventos elementales de S tienen igual
posibilidad o probabilidad de ser seleccionados.
Tomando el espacio muestral del caso anterior que está conformado de 8 elementos, o sea N=8
Para calcular la probabilidad del evento A que consiste en contestar dos preguntas verdaderas; donde A
está conformado por 3 elementos, o sea:
n(A) 3
P(A) = 0.374 37.5%
N(S) 8
Hallar la probabilidad del evento B de contestar por lo menos una pregunta verdadera será:
n(A) 7
P(A) = 0.875 87.5%
N(S) 8
n(A) 1
P(A) = 0.125 12.5%
N(S) 8
Página 116 de 142
ESTADISTICA 1
n(A) 3
P(A) = 0.374 37.5%
N(S) 8
TALLER 20
PROBABIBILIDADES
DIAGRAMA DE ÁRBOL
0 1ª Opción 2ª Opción 3ª Opción
F F
V
F V F
V
F F
V
V V F
V
3. Tú puedes resolver la siguiente inquietud; sea S el espacio muestral conformado por los números de 1 al 20
que pertenecen a las fichas de una determinada rifa.
4. Se hace girar la flecha y se observa sobre qué número se detiene. Calcula las probabilidades de los
siguientes sucesos
6. En una empresa hay 200 empleados, 100 hombres y 100 mujeres. Los fumadores son 40 hombres y 35
mujeres. Si elegimos un empleado al azar, calcula la probabilidad de que sea
A. Hombre y no fume.
B. Una mujer y no fume
C. Un hombre y fume
D. Una mujer y fume
HOMBRES MUJERES
FUMADORES 40 35
NO FUMADORES 60 65
7. En una bolsa hay bolas de colores, pero no sabemos cuántas ni qué colores tienen. En 100
extracciones (devolviendo la bola cada vez) hemos obtenido bola blanca en 41 ocasiones, bola negra en
19, bola verde en 18 y bola azul en 22. Al hacer una nueva extracción, qué probabilidad asignarías a:
8. En una bolsa tenemos tres bolas marcadas con los números 1, 2 y 3, respectiva- mente. Extraemos una
bola, anotamos su número y la devolvemos a la bolsa. Extraemos otra bola, observamos su número y lo
sumamos al anterior.
1 2 3
1
2
3
H. Hallar la probabilidad que al sumar dos números obtenidos en sus lanzamientos sea: 2, 3, 4, 5, 6, 7,
8, 9, 10, 11, 12.
ANA 1 2 3 4 5 6
EVA
EVA 1 1, 1 1, 2 1, 3 1, 4 1, 5 1, 6
2 2, 1 2,2 2, 3 2, 4 2, 5 2, 6
3 3, 1 3, 2 3, 3 3,4 3, 5 3, 6
4 4, 1 4, 2 4, 3 4, 4 4, 5 4, 6
5 5, 1 5, 2 5, 3 5, 4 5, 5 5, 6
6 6, 1 6, 2 6, 3 6, 4 6, 5 6, 6
TABLA: PROBABILIDADES
Suma 2 3 4 5 6 7 8 9 10 11 12
P(suma)
P(suma)
P(suma)
Suma
de
P(suma)
7. DISTRIBUCION DE
PROBABILIDADES ESPECIALES
INTRODUCCION
Cuando se habla de probabilidades como en la unidad anterior, se tiene en mente o materialmente un espacio
o conjunto grande o pequeño, infinito o finito que se llama espacio muestral, evento seguro o cierto que
simbolizamos con la letra S que está conformado por eventos H1, H2, H3, .... Hn y éstos a su vez generan
resultados específicos. Si a cada resultado se le asigna un número que está asociado con o sin las cuatro
operaciones fundamentales se denomina variable aleatoria. Con ésta variable se puede hallar su probabilidad
de acuerdo a unas funciones que llevan nombres específicos y serán objeto de estudio durante ésta unidad.
OBJETIVOS
DISTRIBUCIÓN BINOMIAL
Esta distribución también se conoce como distribución de Bernoulli, en honor del matemático suizo Jacob
Bernoulli quien fue que la dedujo. Esta distribución se utiliza para tamaños de pruebas, experimentos o
muestras menores de 50 debido a que si el número de muestras es mayor o muy grande los resultados no
pueden ser los esperados, entonces se utiliza la distribución normal. Sea S un espacio muestral en donde se
pueden presentar pruebas repetidas e independientes o que es lo mismo decir pruebas con reemplazamiento,
entonces se tiene dos resultados posibles llamados éxito E y fracaso F.
P(E) = p P(F) = q
Como las pruebas para un éxito y un fracaso son independientes, lo cual implica que no importa las veces que
se repita un experimento y sus probabilidades siempre serán las mismas. En una distribución Binomial se
pueden presentar diferentes características entre ellas están:
EJEMPLO. Si se toma una muestra de 29 estudiantes del tercer semestre de los cuales 8 son mujeres y 21
hombres, llamando éxito a la probabilidad de seleccionar una mujer y fracaso al seleccionar un hombre en un
experimento con reemplazamiento, las probabilidades de éxito y fracaso serán:
n( E ) 8
P(E)=p = = 0.276 = 27.6%. El 27.6% indica la probabilidad de seleccionar una mujer.
n( S ) 29
n( F ) 21
P(F)=q = = 0.724 = 72.4%. El 72.4% indica la probabilidad de seleccionar un hombre.
n( S ) 29
P(F) = 1 - p
P(F) = 1 - 0.276 = 72.4%
P(F) = 72.4%
De esto se puede deducir que la suma de las dos probabilidades siempre es igual a la unidad. De acuerdo a
las condiciones anteriores la distribución Binomial para obtener K éxitos en n pruebas, matemáticamente se
escribe de la siguiente forma:
n n
P(K) = pk qn-K = pK (1 - p)n-K
k k
n n
B(K; n, p) = pK qn-K = pK (1 - p)n-K
k k
Dónde:
Tomando los 29 estudiantes de los cuales 8 son mujeres y 21 hombres con sus probabilidades de 0.276 y
0.724 respectivamente, hallar las probabilidades de seleccionar:
Para solucionar éste problema se utiliza una de las expresiones escritas anteriormente y reemplazando cada
uno de los datos de acuerdo a las condiciones exigidas.
n
B(k; n, p) = pK * qn-K
k
6
B(5; 6, 0.276) = (0.276)5 (0.724)6-5 = 6(0.0016)(0.724) = 0.0069 = 0.69%
5
4
B(3; 4, 0.276) = (0.276)3 (0.724)4-3 = 4(0.0210)(0.724) = 0.0608 = 6.08%
3
7
B(6; 7, 0.276) = (0.276)6 (0.724)7-6 = 7(0.00044)(0.724) = 0.0022 = 0.22%
6
10
B(8; 10, 0.276) = (0.276)8(0.724)10-8 =45(0.00003)(0.52) = 0.0007 = 0.07%
8
15
B(8; 15, 0.276) = (0.276)8(0.724)15-8=64(0.00003)(0.0104) = 0.02015 = 2.015%
8
Los resultados anteriores se pueden analizar, para el quinto caso indica que la probabilidad de obtener 8 (k)
mujeres en 15 (n) pruebas con p = 0.276, es igual a la probabilidad de 2.015%.
La tabla que se utiliza en éste tema está identificada con la letra B, ver Anexo 1, además está compuesta para
diversos valores de K según sea los de n. En éste caso se ha tomado para n = 20 y su aplicación se extiende
a diferentes casos. La tabla Binomial se aplica a valores individuales que están o no en la tabla que está
conformada por filas y columnas, un modelo se presenta en la Tabla 1. Para hallar la probabilidad de elegir
diferentes éxitos utilizando la tabla de probabilidad B. Cuando la probabilidad del éxito es de: p = 0.05
n=1 y K = 1,
n=2 y K = 0, 1, 2
TABLA 1 BINOMIAL
PROBABILIDAD P
n K 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45
1 0 0.9500 0.9000 0.8500 0.8000 0.7500 0.7000 0.6500 0.6000 0.5500
1 0.0500
2 0 0.9025
1 0.0925 0.4550
2 0.0025
De ésta manera se puede encontrar probabilidades para diferentes valores de n, K y p; identificando en primer
lugar n luego K y con ésta la intersección del valor de p. En la tabla para la distribución Binomial B la
probabilidad p va desde 0.05 hasta 0.5, ver Anexo 1;
a) P(2; 8, 0.4) g) P(8; 15, 0.25 m) P(4; 8, 0.45) s) P(12; 14, 0.6)
b) P(3; 5, 0.15) h) P(2; 6, 0.4) n) P(5; 8, 0.35) t) P(3; 10, 0.35)
c) P(4; 8; 0.45) i) P(4; 6, 0.25) o) P(3; 6, 0.3) u) P(6; 7, 0.45)
d) P(12; 18, 0.35) j) P(3; 10, 0.35) p) P(6; 10, 0.45) v) P(8; 10, 0.45)
e) P(3; 10, 0.65) k) P(15; 17, 0.45) q) P(8; 15 0.25) w) P(5; 12, 0.5)
f) P(10; 16, 0.8) l) P(8; 15, 0.75) r) P(4; 8, 0.55)
DISTRIBUCIÓN DE POISSON
Es una función de distribución de probabilidades K derivada de la distribución Binomial cuando cumple las
siguientes condiciones:
La distribución de Poisson fue elaborada por un matemático francés de apellido Poisson, con el propósito de
aplicar a diferentes procesos físicos en donde se considera el tiempo como variable fundamental de todo
evento o suceso. Para hallar la probabilidad de K éxitos o cambios se utiliza la expresión matemática:
e * K K
P(K; μ) =
K! K!* e
Dónde:
Algunos autores recomiendan utilizar la distribución de Poisson cuando el producto de las observaciones n por
la probabilidad de éxito p, es menor o igual que 5 y otros a 7, o sea: n*p 5 o n*p 7, según esto n debe ser
grande y p se debe aproximar a cero, cumpliendo así con la condición específica para la distribución de
Poisson.
EJEMPLO. En una fábrica de lapiceros se ha encontrado que de cada cien dos son defectuosos (exito). Hallar
la probabilidad, K=0, 2 y 4 lapiceros defectuosos (fracaso) en una muestra de 200.
2
p= = 0.02
100
p = 0.02
q = 0.98
μ = n*p = 200*0.02 = 4,
Para: K = 0, 2, 4
e * K K
P(K; μ) =
K! K!* e
Para K = 0 y μ = 4 se obtiene:
1
P(0; 4) = (2.718282)-4 = 0.0183 = 1.83%. P(0; 4) = 1.83%
1
Para K = 2 y μ = 4 se obtiene:
16
P(2; 4) = (2.718282)-4 = 0.1465 = 14.65%. P(2; 4) = 14.65%
2
Para K = 4 y μ = 4 se obtiene:
256
P(4; 4) = (2.718282)-4 = 0.1954 = 19.54%. P(4; 4) = 19.54%
24
Mediante el uso de la tabla P se puede hallar la probabilidad para cada valor de K una vez conocido el valor
de la media (μ). El valor de la media está ubicado en la parte superior horizontal y los de K verticalmente, la
intersección de los dos valores determina el valor de la probabilidad, ver Anexo 2. Sea K=0, 2, 4 y la media
μ=4. Mediante el uso de la tabla P las probabilidades correspondientes son:
Según los resultados anteriores una probabilidad se puede hallar mediante dos procesos, sea con la fórmula o
con la tabla P y sus valores son iguales. En algunos problemas la media o valor esperado μ no es fácil
encontrar multiplicando n*p, debido a que se desconoce un elemento de ellos, a cambio de éstos se encuentra
otros que mediante ciertos procesos permiten calcular la media para luego encontrar las probabilidades
deseadas.
EJEMPLO. Suponiendo que en una fábrica de maletines se ha examinado una población de N=410 unidades,
encontrándose diferentes defectos que en la Tabla 2 están representados por Ki. En la columna dos en 310
maletines hay cero defectuosos, 53 tienen un defecto, etc.
K Ni 190
μ= i*
= 0.4634 = 0.46; μ = 0.46
N 410
Con éste resultado y los de Ki podemos calcular sus probabilidades correspondientes, éstos resultados están
en la Tabla .2 cuarta columna, los resultados de la sexta columna permiten comprobar si el cálculo es el
correcto.
TALLER 21
PROBABILIDADES ESPECIALES
1. Se realiza una prueba en donde se debe contestar 5 preguntas, con un SI cuando la respuesta es
correcta y con un NO, cuando la respuesta es incorrecta.
A. 10 niñas en 12 pruebas
B. 8 niñas en 11 pruebas
C. 6 niñas en 10 pruebas
D. 4 niñas en 9 pruebas
E. 2 niñas en 8 pruebas
3. En una bolsa en donde se encuentran 45 bolas distribuidas así, 25 blancas (éxito) y 20 rojas
(fracaso) y se desea seleccionar grupos de la siguiente manera.
Media E(X) = np
Varianza S2 = npq
Desviación típica S = npq
4. En una fábrica de maletines se encontró que de cada 100 maletines 5 tienen algunos defectos, si se
toma una muestra de 180 maletines; hallar la probabilidad para los siguientes casos:
5. En una fábrica de lapiceros se ha encontrado que de cada cien dos son defectuosos. Hallar la
probabilidad, K=1, 3 y 5 lapiceros defectuosos en una muestra de 200.
2
p= = 0.02
100
q = 0.98
μ = n*p = 200*0.02 = 4
E(K) = μ = np Media
Var(K) = μ Varianza
σ= Desviación típica
DISTRIBUCIÓN NORMAL
La distribución Normal fue introducida por Gauss en relación con la teoría de errores de medidas físicas, de
allí, que su gráfica también lleva el nombre de campana de Gauss. La distribución Normal es una distribución
continua más importante y utilizada en diferentes trabajos estadísticos. Se utiliza la distribución Normal y no la
distribución Binomial o de Poisson cuando el número de pruebas n se hace muy grande y las probabilidades
del éxito y fracaso están girando a 0.5, o sea que ninguna de ellas se aproxima a cero. Esta distribución está
expresada mediante la fórmula:
1 2
1 ( X ) /
2
f(X) = *e
2
Dónde:
En la solución de un determinado problema a excepción de X las demás letras son constantes; o sea que f(X)
es función únicamente de X. Al dar valores a X se encuentra los de f(X) que al ser llevadas al plano cartesiano
se obtiene una gráfica llamada curva normal o campana de Gauss. Esta gráfica presenta unas características
que se describen a continuación y están en la Figura 1
0.5 0.5
Área Área
50% 50%
FIGURA 1 área bajo la curva
La probabilidad de encontrar datos entre más o menos una desviación típica es del 68.27%,
La probabilidad de encontrar datos entre más o menos dos desviaciones típicas es del 95.45%,
La probabilidad de encontrar datos entre más o menos tres desviaciones típicas es del 99.73%,
El valor restante al 99.75% equivalente a 0.25% corresponde a los extremos llamados colas.
Página 131 de 142
ESTADISTICA 1
99.75%
95.45%
68.27%
Cuando a la variable aleatoria X que pertenece a la distribución f(X), se desea expresar en unidades de la
desviación típica, se denomina distribución Normal estandarizada, y se expresada mediante la siguiente
expresión.
X
Z=
Dónde:
f(Z)
En adelante todos los cálculos sobre probabilidades en la distribución Normal se realizará con la variable
tipificada Z para hallar el área bajo la curva utilizando la tabla Normal, y luego hacer sus interpretaciones
físicas. Al realizar una gráfica de f(X) con base a la variable tipificada Z se obtiene la Figura 3. La Figura 3
describe unas propiedades que son:
Una vez hecho el cambio de escala en el eje horizontal mediante la variable Z, se puede calcular las
probabilidades utilizando la tabla N para la curva Normal estandarizada identificada por N, ver Anexo 3.
EJEMPLO. Analizar el siguiente caso sobre la población de una institución con 101 estudiantes que
obtuvieron en una asignatura promedio de 7.07 con una desviación típica de 12. Se considera que los datos
se distribuyen normalmente, hallar la probabilidad y el número de estudiantes.
A. P(X<6)
B. P(6 X 8)
C. P(X>8)
D. P(X = 7.03)
E. P(4 X 7)
F. P(7.5 X 9.5)
G. P(5 X)
Para dar solución se utiliza la expresión para la variable tipificada o normalizada Z, siguiendo los pasos:
X 5 . 99 7 . 07 1 . 08
Z 0 . 96
1 . 12 1 . 12
Llevar Z a la gráfica Normal estandarizada, ver Figura 4. Una vez ubicado el valor de Z se puede hallar el área
correspondiente a ésta área utilizando la tabla N. Existen tablas para valores de Z que van desde el centro
hasta los extremos y otras en sentido contrario, en Este caso se utiliza el primer caso. Esta tabla sólo contiene
valores positivos, debido a que no hay área negativas y además el valor de Z negativo por simetría
corresponde al valor de Z positivo.
A1 A1
0.3315 0.3315
-0.96 0.96 Z
FIGURA 4 Ubicación de Z
El área correspondiente para Z=-0.96 en la tabla N, Z estará entre 0 y 0.96, esto por simetría. Para utilizar la
tabla N en éste caso y en otros se toma la primera columna hasta llegar a 0.9 a partir de éste valor se
desplaza por la fila hacia la derecha hasta llegar a la columna identificada por 6, en la intersección de ésta fila
y columna se encuentra un valor que corresponde al área entre 0 y 0.96 equivalente a 0.3315, que en forma
de probabilidad se escribe:
El área de probabilidad es: P(Z -0.96) o P(0.96 Z), o sea el área que se encuentra a la izquierda de -0.96
o a la derecha de 0.96, esto por simetría. Además el área de probabilidad no es la encontrada, el área
verdadera está identificada con la letra A y no A1, ver Figura 4.
A partir de cero hacia la izquierda o derecha en una curva Normal el área es 0.5, el área de probabilidad A,
será:
El resultado anterior indica que el 16.85% obtuvieron puntaje menor que 6, no aprobaron la materia.
Para identificar cuantos estudiantes obtuvieron un puntaje menor que 6, se multiplica la probabilidad o área A
por el total de estudiantes N = 101
Número de Estudiantes:
Z1 = X 6 7 . 07 1 . 07 -0.95 Z1 = -0.95
1 . 12 1 . 12
Z2 = X 8 7 . 07 0 . 93 0.83 Z2 = 0.83
1 . 12 1 . 12
A1 A2
-0.95 0.83 Z
FIGURA 5 Ubicación de Z1 y Z
Z = X 8 . 01 7 . 07 0 . 94 0.84
1 . 12 1 . 12
Página 135 de 142
ESTADISTICA 1
A1 A
0 0.84 Z
FIGURA 6 Ubicación de Z
En la tabla N se encuentra el área A1, para el área A se obtiene restando de 0.5 el área A1.
Como la población N es de 101 estudiantes, entonces la suma de n1, n2 y n3 debe igual a N, así:
N = n1 + n2 + n3 = 17 + 63 + 20 = 100
Hay un faltante de un estudiante, debido a los decimales que no se han tenido en cuenta en los tres casos.
Z2 = X 2 7 . 04 7 . 07 0 . 04 -0.03
1 . 12 1 . 12
-0.04 -0.03 Z
FIGURA 7 Ubicación de Z1 y Z2
A
Área
Prob
-2.70 -0.06 Z
FIGURA 8 Ubicación de Z1 y Z2
A
Área
proba.
0.38 2.17 Z
FIGURA 9 Ubicación de Z1 y Z2
n6 = N*A = 101*0.337 = 34
n6 = 34
Z = X 5 7 . 07 2 . 07 -1.85
1 . 12 1 . 12
A1 0.5
-1.85 Z
FIGURA 10 Ubicación de Z
n7 = N*A = 101*0.9678 = 98
n7 = 98, Valor indica que, 98 estudiantes con ese puntaje mayor o igual a 5
Para determinar la relación o acercamiento que existe entre las distribuciones Binomial, Poisson y Normal se
puede hacer mediante un caso utilizando sus correspondientes tablas para cada distribución. Suponiendo que
un estudiante contesta 3 preguntas erróneamente (éxito) de un total de 15 en una primera prueba. Si el mismo
estudiante en una segunda prueba se propone contestar 2 erróneas de un total de 20, hallar su probabilidad.
3
P(E) = 0.2 = 20% probabilidad de éxito
15
12
P(F) = 0.8 = 80% probabilidad de fracaso.
15
μ = n*p = 20*0.2 = 4, valor esperado.
K = 2 y n = 20 en la segunda prueba.
Para las probabilidades utilizando los resultados anteriores en cada una de las distribuciones será:
Z = X 2 4 2 -1.12 Z = -1.12
1 . 79 1 . 92
A A1
-1.12 0
FIGURA 11 ubicación de Z
TALLER 22
DISTRIBUCION NORMAL
1. Hallar las probabilidades y el número de estudiantes cuando la media es de 7.10 y la desviación típica de
1.2 en una muestra de 145 en los intervalos:
2.
4. Los montos de dinero que se piden en las solicitudes de préstamos en un BANCO tiene una distribución
normal, una media de $70.000 y una desviación estándar de $20.000. Esta mañana se recibió una
solicitud de préstamo. ¿Cuál es la probabilidad de que:
5. Entre las ciudades de Estados Unidos con una población de más de 250.000 habitantes El tiempo de viaje
más largo pertenece a la ciudad de Nueva York, donde el tiempo medio es de 38.3 minutos. Suponga que
la distribución de los tiempos de viaje en la ciudad de Nueva York tiene una distribución de probabilidad
normal y la desviación estándar es de 7.5 minutos.
BIBLIOGRAFIA
1. BARBANCHO, Alfonso G. Estadística elemental moderna: Barcelona, Ediciones Ariel, 1978.
2. BRIONES, Guillermo. Métodos y técnicas de investigación para las ciencias sociales: Editorial Trillas,