Guia de Trabajo - Estadistica General PDF
Guia de Trabajo - Estadistica General PDF
Guia de Trabajo - Estadistica General PDF
Visión
Ser una de las 10 mejores universidades privadas del Perú al año 2020,
reconocidos por nuestra excelencia académica y vocación de
servicio, líderes en formación integral, con perspectiva global;
promoviendo la competitividad del país.
MISIÓN
Somos una universidad privada, innovadora y comprometida con el
desarrollo del Perú, que se dedica a formar personas competentes,
íntegras y emprendedoras, con visión internacional; para que se
conviertan en ciudadanos responsables e impulsen el desarrollo de
sus comunidades, impartiendo experiencias de aprendizaje
vivificantes e inspiradoras; y generando una alta valoración mutua
entre todos los grupos de interés.
Universidad Continental
Material publicado con fines de estudio
Código: ASUC01275
2
Gestión Curricular
Asignatura: Estadística general
Presentación
RESULTADO DE APRENDIZAJE
Distribuciones
Introducción, tipos
bidimensionales y Medidas resumen o Distribuciones de
de distribuciones y
gráficos descriptivas probabilidad
gráficos
comparativos
Resultado de Resultado de Resultado de Resultado de
Introducción
La Asignatura de Estadística General pertenece al plan curricular de cursos generales, el
cual se desarrolla dentro de la modalidad presencial, la presente guía - auto formativo
material idóneo dentro de su formación Universitaria.
La Estadística General está orientada a adquirir herramientas básicas para reforzar sus
habilidades de inter relación con la sociedad en todos sus ámbitos. Es así, a asignatura trata
de aquellos temas que permite a los estudiantes desarrollar sus habilidades lógicas y más
importantes aún, aplicar lo aprendido en el ámbito profesional y solucionar problemas del
día a día.
De esta manera se desarrollará competencia general de aprendizaje autónomo,
debidamente organizados y sistematizados tomando en cuenta los principios
pedagógicos, por ello en primer lugar se presenta la teoría acompañados de ejemplos, de
igual modo se muestran ejercicios desarrollados, ejercicios y problemas plantados y
finalmente la meta cognición de su aprendizaje.
Para el estudio la guía se sugiere la siguiente secuencia en cada resultado de aprendizaje:
Al finalizar la unidad I, el estudiante será capaz de utilizar distribuciones
unidimensionales y gráficos estadísticos para la interpretación de resultados
estadísticos.
Al finalizar la unidad II, el estudiante será capaz de comparar e interpretar los
resultados de las distribuciones bidimensionales en acontecimientos de sus
actividades diarias.
Al finalizar la unidad III, el estudiante será capaz de calcular las medidas de
tendencia central, variación, posición relativa y deformación para interpretar datos
relacionados a su carrera profesional.
Al finalizar la unidad IV, el estudiante será capaz de calcular e interpretar
probabilidades en distribuciones discretas y continuas en acontecimientos
cotidianos de su carrera profesional.
Por tanto Ud. requiere de un conocimiento directo, práctico de la Estadística General que
permita aplicar y emprender nuevos retos, tomando casos prácticos de su entorno y
logrando conocimientos de la Estadística general a través de una aplicación objetiva, la
motivación y nuevas metodologías para desarrollar y consolidar su desarrollo universitario.
Los autores
Índice
Contenido
Unidad I ..................................................................................................................................................... 1
Semana 1 .................................................................................................................................................. 2
INTRODUCCIÓN A LA ESTADÍSTICA................................................................................................. 2
SESIÓN 1: INTRODUCCIÓN A LA ESTADÍSTICA.............................................................................. 4
1 DEFINICIÓN. .............................................................................................................................. 4
2 UTILIDAD E IMPORTANCIA. .................................................................................................... 4
3 CLASES DE ESTADISTICA. ........................................................................................................ 4
4 TERMINOS UTILIZADOS EN LA ESTADISTICA........................................................................ 5
Variable cualitativa nominal: .............................................................................................. 6
Variable cualitativa ordinal: ................................................................................................ 6
4 REDONDEO DE DATOS: .............................................................................................................. 7
Semana 2 ................................................................................................................................................ 12
SESIÓN 3: DISTRIBUCIÓN DE FRECUENCIAS PARA LAS VARIABLES CUALITATIVAS ............ 14
1 ORGANIZACIÓN DE LOS DATOS. ...................................................................................... 14
2 DISTRIBUCIÓN DE FRECUENCIAS. ....................................................................................... 14
3 CLASES DE FRECUENCIAS. ................................................................................................... 14
1.1. FRECUENCIAS SIMPLES: ........................................................................................................ 14
1.2. FRECUENCIAS ACUMULADAS: ........................................................................................... 16
2. TABLAS DE FRECUENCIAS – VARIABLES CUALITATIVA. ..................................................... 17
3. TABLA DE FRECUENCIAS – VARIABLE CUALITATIVA DISCRETA. ...................................... 18
Semana 3 ................................................................................................................................................ 21
DISTRIBUCIÓN DE FRECUENCIAS UNIDIMENSIONALES ............................................................. 21
SESIÓN 3: DISTRIBUCIÓN DE FRECUENCIAS PARA LAS VARIABLES CUANTITATIVAS ......... 23
1. RECOMENDACIONES: ........................................................................................................... 23
Los intervalos deben tener igual amplitud. ................................................................... 23
2. PASOS: ...................................................................................................................................... 23
Semana 4 ................................................................................................................................................ 30
GRÁFICOS ESTADÍSTICOS ................................................................................................................ 30
SESIÓN 7: GRÁFICOS ESTADÍSTICOS ESPECIALES....................................................................... 32
Entre las gráficas más utilizadas tenemos: .................................................................................... 32
1. GRÁFICA DE BARRAS. ........................................................................................................... 32
2. HISTOGRAMA. ......................................................................................................................... 32
Gestión Curricular
Asignatura: Estadística general
2
Gestión Curricular
Asignatura: Estadística general
3
Unidad I
ORGANIZACIÓN DE APRENDIZAJES
SEMANA N° 4: ……….
7. Gráficos estadísticos
especiales: Pareto, tallo y
hoja, pictograma, Otras
gráficas.
8. Gráficos estadísticos
especiales: Pareto, tallo y
hoja, pictograma, otras
gráficas con spss - Excel.
1
Gestión Curricular
Asignatura: Estadística general
Semana 1
INTRODUCCIÓN A LA ESTADÍSTICA
La palabra Estadística procede del vocablo “Estado”, pues
era función principal de los Gobiernos de los Estados
establecer registros de población, nacimientos, defunciones,
impuestos, cosechas... La necesidad de poseer datos cifrados
sobre la población y sus condiciones materiales de existencia
han debido hacerse sentir desde que se establecieron
sociedades humanas organizadas.
Es difícil conocer los orígenes de la Estadística. Desde los comienzos de la civilización han
existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros
símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de
personas, animales o ciertas cosas.
2
Gestión Curricular
Asignatura: Estadística general
HISTORIA LA ESTADISTICA
758 Durante los mil años posteriores a la caída del Imperio Romano se hicieron muy pocas
operaciones estadísticas, con la notable excepción de las relaciones de tierras
LECTURA
pertenecientes a la Iglesia, compiladas por Pipino el Breve y por Carlomagno en los años
758 y 762, respectivamente. En Francia se realizaron algunos censos parciales de siervos
durante el siglo IX.
1532 Debido al temor que Enrique VII tenía de la peste, en el año 1532 empezaron a
registrarse en Inglaterra las defunciones causadas por esta enfermedad. En Francia, más o
menos por la misma época, la ley exigía a los clérigos registrar los bautismos, fallecimientos
y matrimonios.
1540 Alrededor del año 1540, el alemán Sebastián Muster realizó una compilación
estadística de los recursos nacionales, que comprendía datos acerca de la organización
política, instituciones sociales, comercio y poderío militar.
1632 Durante un brote de peste que apareció a fines del siglo XVI, el gobierno inglés
comenzó a publicar estadísticas semanales de los decesos. Esa costumbre continuó
muchos años, y en 1632 los llamados Bills of Mortality (Cuentas de Mortalidad) ya contenían
datos sobre los nacimientos y fallecimientos por sexo. En 1662, el capitán John Graunt
compiló documentos que abarcaban treinta años, mediante los cuales efectuó
predicciones sobre el número de personas que morirían de diversas enfermedades, así
como de las proporciones de nacimientos de hombres y mujeres que cabía esperar. El
trabajo de Graunt, condensado en su obra Natural and political observations… made upon
the Bills of Mortality (Observaciones políticas y naturales…hechas a partir de las Cuentas de
Mortalidad), fue un esfuerzo de inferencia y teoría estadística.
1691 Gaspar Neumann, un profesor alemán que vivía en Breslau, se propuso destruir la
antigua creencia popular de que en los años terminados en 7 moría más gente que en los
restantes, y para lograrlo hurgó pacientemente en los archivos parroquiales de la ciudad.
Después de revisar miles de partidas de defunción, pudo demostrar que en tales años no
fallecían más personas que en los demás.
3
Gestión Curricular
Asignatura: Estadística general
ESTADÍSTICA
Propósito:
Define la estadística e identifica los tipos de datos en situaciones cotidianas.
1 DEFINICIÓN.
La estadística es la ciencia cuyo objetivo es reunir información cuantitativa relacionada a
individuos, grupos, series de hechos, entre otros. Gracias al análisis de estos datos se pueden
deducir algunos significados precisos o algunas previsiones para el futuro.
La estadística, en general, es la ciencia que trata la recopilación, la organización, la
presentación, el análisis y la interpretación de datos numéricos con el fin de realizar una toma
de decisiones más efectiva.
2 UTILIDAD E IMPORTANCIA.
La estadística resulta muy útil no sólo para recopilar y describir datos, sino también para
interpretar la información obtenida, que puede ser aprovechada para demostrar la evolución
de un fenómeno a través de cierto tiempo. En Perú, el Instituto Nacional de Estadística e
Informática (INEI) se encarga de recabar información estadística y geográfica de todo el país,
en diferentes áreas y contextos. Los datos que publica sirven para dar a conocer, a cualquier
persona, la situación en la que se encuentra el área de donde se obtuvo la información. Los
métodos estadísticos se utilizan prácticamente en investigaciones de todas las áreas de
conocimiento, tanto en el ámbito académico, como en el profesional y laboral; en todos ellos
la finalidad es poder resolver un problema, entendiendo que un problema queda definido
como la diferencia entre lo real y lo deseado, en donde la estadística muestra la realidad
para que el investigador pueda analizar sus deseos y con ello tomar una decisión.
3 CLASES DE ESTADISTICA.
a) Estadística descriptiva.
Se orienta en la presentación y clasificación de los datos obtenidos de la población que
se analiza, es decir, describe datos. Esta aplicación de la estadística busca plantear y
resolver problemas específicos y/o hacer previsiones a partir de los datos de una muestra,
dado que es muy difícil estudiar a la población completa. Esta rama de la estadística
concluye a partir de los datos, como la estimación de un resultado.
4
Gestión Curricular
Asignatura: Estadística general
b) Estadística inferencial.
Permite sacar conclusiones sobre una población a partir de una muestra, cuando es difícil
estudiar la población debido a su gran tamaño o que provenga de un proceso que no
se detiene, utilizando a la probabilidad cuando no se está seguro de la verdad.
5
Gestión Curricular
Asignatura: Estadística general
Clases de variables:
Variable cualitativa:
Son las cualidades, aquí no se pueden realizar operaciones matemáticas.
Ejemplo:
Género: masculino, femenino.
Profesión: docente, abogado, ingeniero, etc.
Estado civil: soltero, casado, viudo, etc.
Es decir, las variables cualitativas se refieren a características o cualidades que no
pueden ser medidas con números. Podemos distinguir dos tipos:
Variable cualitativa nominal:
Presenta modalidades no numéricas que no admiten un criterio de orden.
Ejemplo:
El estado civil, con las siguientes modalidades: soltero, casado, separado,
divorciado y viudo.
Variable cualitativa ordinal:
Presenta modalidades no numéricas, en las que si admite un orden.
Ejemplo:
La nota en un examen: suspenso, aprobado, notable, sobresaliente.
Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ...
Medallas de una prueba deportiva: oro, plata, bronce.
Variable cuantitativa:
Son valores que se obtienen por medición o conteos, aquí se pueden realizar
operaciones matemáticas.
Ejemplo:
N° de estudiantes.
Temperatura,
N° de hijos,
Ingresos mensuales, etc.
Dentro de las variables cuantitativas se encuentran las variables: discretas y
continuas.
6
Gestión Curricular
Asignatura: Estadística general
e) Escalas de medición:
4 REDONDEO DE DATOS:
Consiste en aproximar un número a su valor cercano.
Casos:
a) Cuando la primera cifra eliminada sea menor de 5, la última cifra a redondear debe
mantenerse igual.
7
Gestión Curricular
Asignatura: Estadística general
Ejemplos:
12.743 redondeando a dos decimales, queda 12.74
85.613 redondeando a un decimal, queda 85.6
b) Cuando la primera cifra eliminada es mayor de 5, la última cifra a redondear debe
aumentar en uno.
Ejemplos:
1.658 redondeando a dos decimales, queda 1.66
124.869 redondeando a un decimal, queda 124.9
Según ITINTEC (Instituto de Investigación Tecnológica Industrial y de Normas Técnicas)
considera un caso especial (c), cuando la cifra a eliminar es cinco.
c) Cuando la primera cifra eliminada sea 5, la última cifra retenida debe incrementarse en
una unidad si este es impar, debe mantenerse igual si la última cifra retenida es par o
cero.
Ejemplos:
12.475 redondeando a dos decimales, queda 12.48
14.425 redondeando a dos decimales, queda 14.42
24.205 redondeando a dos decimales, queda 24.20
Problemas Desarrollados
Respuestas:
1.Estadístico 2. Parámetro 3. Parámetro 4. Estadístico
5) Determine si la variable es cualitativa o cuantitativa y señale si son discretas o continuas.
a) Lugar de residencia
b) Número de vecinos de un edificio.
c) Profesiones de empleados.
d) Número de llamadas telefónicas.
e) Consumo de gasolina cada 200 km.
8
Gestión Curricular
Asignatura: Estadística general
Respuestas:
a. Cualitativo b. Cuantitativo c. Cualitativo d. Cuantitativo e. Cuantitativo
discreto discreto continuo
Problemas Propuestos
9
Gestión Curricular
Asignatura: Estadística general
b) Color de cabello.
Variable: ______________________________
c) Distancia que recorren dos personas caminando durante 5 minutos.
Variable: ______________________________
d) Número de cursos desaprobados por un grupo de alumnos.
Variable: ______________________________
e) Talla de recién nacidos.
Variable: ______________________________
f) Temperatura corporal.
Variable: ______________________________
g) Peso de los alumnos del Primer Semestre de la EAP de Psicología.
Variable: ______________________________
4. Identificar el nivel de medición que se utilizará para medir las siguientes variables. Luego
señale cuántas son de nivel de razón.
a) Número de personas que vive en el distrito de Orcotuna.
________________________________________
10
Gestión Curricular
Asignatura: Estadística general
j) Marcas de cerveza
________________________________________
5. Una marca de cloro líquido se vende en botellas cuya etiqueta dice contener 128 onzas (un
galón). Debido a múltiples quejas recibidas de consumidores, INDECOPI decide investigar si
la cantidad promedio en las botellas es realmente 128 onzas. En su puesto de inspector de
INDECOPI decide visitar algunos comercios y compra 100 botellas de esta marca de cloro
para corroborar las quejas de los consumidores. El resultado indica que la cantidad promedio
en las botellas es de 126 onzas.
Indique en términos del problema cuánto vale el parámetro.
_________________________________________________________________________________________
_________________________________________________________________________________________
Video de Apoyo
11
Gestión Curricular
Asignatura: Estadística general
Semana 2
DISTRIBUCIONES DE FRECUENCIAS
UNIDIMENSIONALES
John Graunt, A John Graunt se le atribuye haber iniciado la demografía formal. Sentó las
bases de la “regularidad estadística” al encontrar una “ley” para la mortalidad.
Edmund Halley, En 1693 retomó las tablas sobre la expectativa de vida de la población
diseñadas por John Graunt y las perfeccionó proponiendo algunas fórmulas para calcular
la «población estacionaria» y la manera como la edad está distribuida dentro de esa
población, lo cual fue un gran adelanto no sólo para los futuros estudios sobre demografía
sino para el cálculo actuarial aplicable en el negocio de los seguros de vida
Fisher, Ronald Aylmer, Científico, matemático, estadístico, biólogo evolutivo y genetista
inglés (1890-1962).
Realizó muchos avances en la estadística, una de las contribuciones más importante fue la
inferencia estadística que descubrió en 1920.
12
Gestión Curricular
Asignatura: Estadística general
En un momento en que el continente europeo era devastado por las epidemias, esta obra
resume análisis de las décadas anteriores, y aporta estadísticas vitales sobre los ciudadanos
de Londres, incluyendo las causas de mortalidad, la población total de Londres y la
monogamia, entre otros. Es pionero en calcular la razón de masculinidad al nacer, la tasa
bruta de mortalidad y detecta la estacionalidad de algunos fenómenos demográficos.
Añadió así profundidad al análisis, y la información numérica empezó a tener uso más allá
de los fines políticos y militares.
Fuente: Camúñez Ruiz, José Antonio y Basulto Santos, Jesús. (2012) En el alumbramiento
de la estadística moderna: John Graunt. Septem Ediciones.
García González, Juan Manuel. 2011, Observaciones políticas y naturales hechas a partir
de los boletines de mortalidad. EMPIRIA. Revista de Metodología de Ciencias Sociales.
N.o 21, enero-junio, pp. 185-199. ISSN: 1139-5737.
Vilquin Éric (1978). Une édition critique en français de l’œuvre de John Graunt (1620-
1674). Présentation d’un ouvrage hors collection de l’INED. Population, 33e année, n°2,
pp. 413-423.
13
Gestión Curricular
Asignatura: Estadística general
VARIABLES
CUALITATIVAS
Propósito:
Define las variables estadísticas e identifica los tipos de frecuencias en situaciones
cotidianas.
2 DISTRIBUCIÓN DE FRECUENCIAS.
Se denomina distribución de frecuencias a los cuadros o tablas numéricos de las variables
recopiladas para su fácil comprensión, interpretación y análisis.
En general una distribución de frecuencias o tabla de frecuencias es una ordenación en forma
de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.
Aquí se encuentran las diferentes frecuencias tales como:
La frecuencia absoluta.
Frecuencia relativa.
Frecuencia porcentual.
Frecuencias acumuladas
3 CLASES DE FRECUENCIAS.
1.1. FRECUENCIAS SIMPLES:
14
Gestión Curricular
Asignatura: Estadística general
Ejemplo:
En la siguiente tabla se representa las calificaciones obtenidas por los estudiantes del
III ciclo de Administración de la Universidad Continental, en la asignatura de
Estadística.
Xi ni
𝑋1 = 00 𝑛1 = 6
𝑋2 = 05 𝑛2 = 4
𝑋3 = 10 𝑛3 = 12
𝑋4 = 15 𝑛4 = 13
𝑋5 = 20 𝑛5 = 5
𝑁 = 40
Xi ni hi
𝑋1 = 00 𝑛1 = 6 0.150 𝑛3 12
ℎ3 = = = 0.3
𝑋2 = 05 𝑛2 = 4 0.100 𝑁 40
𝑋3 = 10 𝑛3 = 12 0.300
𝑋4 = 15 𝑛4 = 13 0.325
𝑋5 = 20 𝑛5 = 5 0.125
𝑁 = 40 1.000
𝒉𝒊 % = 𝒉𝒊𝒙𝟏𝟎𝟎%
15
Gestión Curricular
Asignatura: Estadística general
Ejemplo:
Utilizando el ejemplo anterior.
Xi ni hi hi%
𝑋1 = 00 𝑛1 = 6 0.150 15.0%
𝑋2 = 05 𝑛2 = 4 0.100 10.0%
𝑋3 = 10 𝑛3 = 12 0.300 30.0%
𝑋4 = 15 𝑛4 = 13 0.325 32.5%
𝑋5 = 20 𝑛5 = 5 0.125 12.5%
𝑁 = 40 1.000 100.0%
16
Gestión Curricular
Asignatura: Estadística general
Problemas Desarrollados
Ejemplo:
En una encuesta de opinión sobre preferencias de bebidas gaseosas por su marca: coca
cola (K), inca cola (I), sprite (S). 30 consumidores dieron las siguientes respuestas.
S S K I I I S K K S I K I S S
I I S K K S S K I K I K S I I
17
Gestión Curricular
Asignatura: Estadística general
K
I
30%
37%
S
33%
Bebidas gaseosas
40
30 36.7
33.3
30
NI%
20
10
0
I S K
XI
Ejemplo:
En una encuesta a 28 hogares, para saber sobre el número de hijos por familia (X), se
obtuvieron las siguientes respuestas.
4 3 2 0 2 1 6 9 4 3 1 2 0 2
3 2 1 4 3 2 3 4 3 2 4 2 9 6
Construir la distribución de frecuencias de la variable X.
Realizar la gráfica de barras.
18
Gestión Curricular
Asignatura: Estadística general
Solución
Construimos la tabla de distribución de frecuencias del número de hijos por familia(X):
Xi ni hi hi%
0 2 0.07 7
1 3 0.11 11
2 8 0.29 29
3 6 0.21 21
4 5 0.18 18
6 2 0.07 7
9 2 0.07 7
TOTAL N = 28 1.00 100.00
Número de hijos
9
6
4
3
XI
2
1
0
0 2 4 6 8 10
NI
Problemas Propuestos
5 7 9 7 8 5 2 4 3
6 8 7 6 9 8 4 6 4
8 5 9 6 7 9 4 7 5
3) Los directivos de “Real Plaza” realizan una prueba de mercado respecto a la facilidad de
navegación en su nuevo sitio web. Selecciona al azar 18 usuarios frecuentes y les solicita
19
Gestión Curricular
Asignatura: Estadística general
que califique la relativa facilidad para navegar como mala (M), buena (B), excelente (E) o
sobresaliente (S)”. Los resultados son los siguientes, elabore la tabla de frecuencias e
interprete.
B E S B M S
M S E S B E
M M B M E S
4) Para un estudio de accesibilidad, durante 30 días anotamos el número de plazas libres de
aparcamiento a las 5 de la tarde. Elabore la tabla de frecuencias e interprete.
1 1 5 0 5 3 0 3 3 2
2 3 1 1 2 1 2 0 1 3
2 1 5 0 2 2 1 3 3 2
5) Se realizó una encuesta a los trabajadores de la casa de préstamos “Perú Cash”, sobre el
número de hijos. Elabore la tabla de frecuencias e interprete.
2 1 2 4 1 3 2
3 2 3 2 0 3 4
3 2 1 3 2 1 2
Video de Apoyo
20
Gestión Curricular
Asignatura: Estadística general
Semana 3
DISTRIBUCIÓN DE FRECUENCIAS
UNIDIMENSIONALES
En el siglo XIX, la estadística entra en una nueva fase de su
desarrollo con la generalización del método para estudiar
fenómenos de las ciencias naturales y sociales. Galton (1.822-
1.911) y Pearson (1.857-1936) se pueden considerar como los
padres de la estadística moderna, pues a ellos se debe el paso
de la estadística deductiva a la estadística inductiva.
21
Gestión Curricular
Asignatura: Estadística general
Chaptal, ministro del interior francés, publica en 1801 el primer censo general de
población, desarrolla los estudios industriales, de las producciones y los cambios,
haciéndose sistemáticos durante las dos terceras partes del siglo XIX.
Fuente: Pearson, Egon (1978). The History of Statistics in the 17th and 18th Centuries against
the changing background of intellectual, scientific and religious thought (Lectures by Karl
Pearson given at University College London during the academic sessions 1921-1933).
Nueva York: MacMillanPublishng Co., Inc. p. 744. ISBN 0-02-850120-9.
Salsburg, David (2001). The Lady Tasting Tea: How Statistics Revolutionized Science in
the Twentieth Century. ISBN 0-7167-4106-7.
Stigler, Stephen M. (1986). The History of Statistics: The Measurement of Uncertainty
before 1900. Belknap Press/Harvard University Press. ISBN 0-674-40341-X.
22
Gestión Curricular
Asignatura: Estadística general
VARIABLES
CUANTITATIVAS
Propósito:
Organizar datos en una tabla de distribución de frecuencias para variables
cuantitativas continuas.
Este cuadro se usa cuando la variable cuantitativa es continua o cuando el número de valores
distintos de una variable discreta es muy grande (N > 20).
1. RECOMENDACIONES:
Agrupar los datos en no más de 20 intervalos ni menos de 5
Los intervalos deben tener igual amplitud.
2. PASOS:
1° Identifique el dato mayor y dato menor.
Dato mayor = Xmax
Dato menor = Xmin
2° Hallamos el rango o recorrido (R).
R = Xmax – Xmin
3° Hallamos el número de intervalos (K).
Si: n ≥ 10, por la Regla de Sturges
K = 1 + 3.322 log(n)
Por la Ley de Portugal:
Si: 25 ≤ n ≤ 400
K = ξ𝒏
Si: n ≤ 50
K = 1 + 3.322 log(n)
Si: n > 100
23
Gestión Curricular
Asignatura: Estadística general
24
Gestión Curricular
Asignatura: Estadística general
Como “K” tiene tres posibles valores: (6, 7 ó 8), hallamos tres posibles “C”
𝑅 63
𝐶1 = = = 10.5 = 11 aplicando R = K.C =6.11 = 66
𝐾 6
𝑅 63
𝐶2 = = =9 aplicando R = K.C =7.9 = 63 cumple
𝐾 7
(K.C ≥ R)
𝑅 63
𝐶3 = = = 7.875 = 8 aplicando R = K.C = 8.8 = 64
𝐾 8
Entonces:
Organizamos una tabla de 7 intervalos (K = 7)
Con amplitud de 9 (C = 9)
Frecuencias simples
Intervalos
absolutas relativas porcentaje
[𝑳𝒊 − 𝑳𝑺 [ ni hi h i%
[26 − 35[ 1 0.023 2.3
[35 − 44[ 4 0.089 8.9
[44 − 53[ 5 0.111 11.1
[53 − 62[ 14 0.311 31.1
[62 − 71[ 14 0.311 31.1
[71 − 80[ 5 0.111 11.1
[80 − 89] 2 0.044 4.4
Total N = 45 1.000 100.0
25
Gestión Curricular
Asignatura: Estadística general
HISTOGRAMA
16
14
14 14
12
10
8
NI
6
4 5 5
4
2
1 2
0
26 - 35 35 - 44 44 - 53 INTERVALOS
53 - 62 62 - 71 71 - 80 80 - 89
POLÍGONO DE FRECUENCIAS
16
14 14 14
12
10
8
NI
6
5 5
4 4
2 2
1
0
26 - 35 35 - 44 44 - 53 53 - 62 62 - 71 71 - 80 80 - 89
INTERVALOS
Problemas Desarrollados
1. Los siguientes datos son los pesos en kg de 30 estudiantes del Programa BECA 18, atendidos
en el mes de diciembre del 2017, en el consultorio de nutrición del Hospital ESSALUD -
HUANCAYO:
26
Gestión Curricular
Asignatura: Estadística general
Solución
Identifique el dato mayor y dato menor
Dato mayor = Xmax = 99.8
Dato menor = Xmin = 58.4
Hallamos el rango o recorrido (R)
R = Xmax – Xmin = 99.8 – 58.4 = 41.4
Hallamos el número de intervalos (K)
Si: n = 30
Utilizamos la Ley de Portugal
Si: n ≤ 50 K = 1 + 3,322 log(n)
K = 1 + 3,322 log (30)
K = 5.90
Los posibles valores de: K = 5, 6 ó 7
Hallamos la amplitud o la longitud del intervalo de clase (C):
𝑅
𝐶=
𝐾
𝑅 41.4
𝐶1 = = = 8.28 = 8.3 aplicando R = K.C = 5 x 8.3 = 41.5
𝐾 5
𝑅 41.4
𝐶2 = = = 6.9 aplicando R = K.C =6 x 6.9 = 41.4
𝐾 6
𝑅 41.4
𝐶3 = = = 5.91 = 5.9 aplicando R = K.C = 7 x 5.9 = 41.3
𝐾 7
Organizamos una tabla de 8 intervalos (K = 6)
Con amplitud (C = 6.9)
Determinemos los extremos de los intervalos [𝑳𝒊 − 𝑳𝑺 ]
Si: Xmin = 58.4 C = 6.9 K=6
I1 == [58.4 − 58.4 + 6.9[ = [58.4 − 65.3[
I2 = [58.4 + 6.9 − 58.4 + 2. (6.9)[ = [65.3 − 72.2 [
I3 = [58.4 + 2. (6.9) − 58.4 + 3. (6.9)[ = [72.2 − 79.1[
I4 = [58.4 + 3(6.9) − 58.4 + 4(6.9)[ = [79.1 − 86.0[
I5 = [58.4 + 4(6.9) − 58.4 + 5(6.9)[ = [86.0 − 92.9[
I6 = [58.4 + 5(6.9) − 58.4 + 6(6.9)[ = [92.9 − 99.8[
Li - Ls ni hi hi% Ni Hi Hi%
[58.4 − 65.3[ 4 0.13 13 4 0.13 13
[65.3 − 72.2 [ 11 0.37 37 15 0.50 50
[72.2 − 79.1[ 7 0.23 23 22 0.73 73
[79.1 − 86.0[ 3 0.10 10 25 0.83 83
[86.0 − 92.9[ 3 0.10 10 28 0.93 93
[92.9 − 99.8[ 2 0.07 7 30 1.00 100
N = 30 1.00 100
Problemas Propuestos
1. Se ha llevado a cabo un estudio para evaluar los volúmenes de venta (miles de soles por día)
de 24 establecimientos comerciales de Huancayo y se encontraron los siguientes resultados.
Elabore la tabla de frecuencias e interprete.
27
Gestión Curricular
Asignatura: Estadística general
2. En la fábrica de SAZON LOPESA se hizo un estudio sobre el peso (kg) de los trabajadores con
el fin de establecer una orientación sobre nutrición y buena salud. Los resultados fueron los
siguientes: Elabore la tabla de frecuencias e interprete.
60 84 112 120 72 61
70 74 68 90,5 81 75
84 64,2 118 84 96,4 65
84 65 97,5 82 98 62
3. Las calificaciones finales del curso de ESTADISTICA donde las notas están sobre 10 son los
siguientes. Elabore la tabla de frecuencias e interprete.
4,5 8,0 8,5 7,5 6,5 3,5 6,0
4,5 4,5 8,5 8,5 10,0 7,0 6,5
9,5 7,0 6,0 8,5 6,5 6,5 8,5
4. Elabore la tabla de frecuencias e intérprete del registró de tiempo en minutos que demoran
30 estudiantes para ejecutar una tarea, resulto los siguientes datos:
21.3 15.8 18.4 22.1 19.4 15.8 26.4 17.3 11.2 23.4
26.8 22.7 18.0 20.5 11.0 18.2 23.6 24.6 20.5 16.6
8.3 21.9 12.3 23.3 13.4 17.9 12.3 13.4 15.8 19.5
68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71
79 62 67 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74
86 67 73 81 72 63 76 75 85 77
28
Gestión Curricular
Asignatura: Estadística general
Video de Apoyo
29
Gestión Curricular
Asignatura: Estadística general
Semana 4
GRÁFICOS ESTADÍSTICOS
Los gráficos son medios popularizados y a menudo
los más convenientes para presentar datos, se
emplean para tener una representación visual de la
totalidad de la información. Los gráficos estadísticos
presentan los datos en forma de dibujo de tal modo
que se pueda percibir fácilmente los hechos
esenciales y compararlos con otros.
William Playfair, Ingeniero mecánico y economista político escocés. Trabajó más de 36 años
en el diseño de gráficos estadísticos. Se le considera pionero en el uso del gráfico lineal para
representar series temporales, y fue el creador del gráfico circular, de sectores y de barras.
Michael Van Langren: recogió las distintas estimaciones que se habían hecho de la distancia
que separa Toledo de Roma (12 en total).
C. Joseph Priestley: Utilizo gráficos estadísticos, principalmente mapas destacados en los
años 1700 – 1799.
30
Gestión Curricular
Asignatura: Estadística general
GRÁFICOS ESTADISTICA
Cuando se hace un estudio estadístico se obtiene una gran cantidad de datos numéricos.
Para tener una información clara y rápida de lo obtenido en el estudio se han creado las
LECTURA
gráficas estadísticas.
Existen también varios tipos de gráficas, o representaciones gráficas, utilizándose cada uno
de ellos de acuerdo al tipo de información que se está usando y los objetivos que se
persiguen al presentar la información.
Hay un punto que conviene remarcar: existe software que permite la construcción rápida y
eficiente de gráficas a partir de bases de datos o hojas de cálculos, pero no importa cuán
bonita, bien delineada, bien coloreada o bien presentada esté una gráfica, si no se han
tomado en cuenta consideraciones de este tipo que tienen que ver más sobre el objetivo
de estas herramientas y la Estadística: la transmisión eficiente de la información.
Hay muchos tipos de gráficas estadísticas. Cada una de ellas es adecuada para un estudio
determinado, ya que no siempre se puede utilizar la misma para todos los casos. Tienen una
estructura distinta, lo cual les permite ser utilizados para diferentes objetivos, y es que la
mayoría de las veces utilizan datos o variables distintos.
G
FUENTE: Stigler, Stephen M. (1999) Statistics on the Table: The History of Statistical
Concepts and Methods. Harvard University Press. ISBN 0-674-83601-4
31
Gestión Curricular
Asignatura: Estadística general
GRÁFICOS
ESTADÍSTICOS
Propósito:
Construye gráficos estadísticos, analiza e interpreta los resultados.
Un gráfico estadístico es una representación visual de una serie de datos estadísticos, además es
una herramienta muy eficaz, ya que un buen gráfico:
1. GRÁFICA DE BARRAS.
Cada barra rectangular corresponde a una modalidad, tiene una base constante, y su altura
puede ser medida en unidades de frecuencia relativa, absoluta o porcentual.
2. HISTOGRAMA.
Es una gráfica de barras donde la escala horizontal representa clases de valores de datos y la
escala vertical representa frecuencias. Las alturas de las barras corresponden a los valores de
frecuencia y no existe separación entre las barras.
32
Gestión Curricular
Asignatura: Estadística general
3. POLÍGONO DE FRECUENCIAS.
Utiliza segmentos lineales conectados a puntos que se localizan directamente por encima de
los valores de las marcas de clase. Las alturas de los puntos corresponden a las frecuencias
de clase; en tanto que los segmentos lineales se extienden hacia la derecha y hacia la
izquierda, de manera que la gráfica inicia y termina sobre el eje horizontal.
4. OJIVA.
Es una gráfica lineal que representa frecuencias acumulativas. La ojiva utiliza fronteras de
clase a lo largo de la escala horizontal, y que la gráfica comienza con la frontera inferior de
la primera clase y termina con la frontera superior de la última clase. Las ojivas son útiles para
determinar el número de valores que se encuentran por debajo de un valor específico.
5. GRÁFICA DE PUNTOS.
Es aquella donde se marca cada valor de un dato como un punto a lo largo de una escala
de valores. Los puntos que representan valores iguales se apilan.
33
Gestión Curricular
Asignatura: Estadística general
6. GRÁFICO DE PARETO.
Con el Diagrama de Pareto se pueden detectar los problemas que tienen más relevancia
mediante la aplicación del principio de Pareto (pocos vitales, muchos triviales) que dice que
hay muchos problemas sin importancia frente a solo unos graves. Ya que, por lo general, el
80% de los resultados totales se originan en el 20% de los elementos.
3. PICTOGRAMA.
También llamada gráfica de imágenes o pictografía. Es un diagrama que utiliza imágenes o
símbolos para mostrar datos para una rápida comprensión. En un pictograma, se utiliza una
imagen o un símbolo para representar una cantidad específica.
34
Gestión Curricular
Asignatura: Estadística general
4. GRÁFICA CIRCULAR.
También se utilizan para visualizar datos cualitativos. Presenta datos cualitativos como si fueran
rebanadas de un pastel. Para construir una gráfica circular, se divide el círculo en las
proporciones adecuadas. Cada sector corresponde a una modalidad y su correspondiente
ángulo en el centro.
5. DIAGRAMA DE DISPERSIÓN.
Es una gráfica de datos apareados (x, y), con un eje x horizontal y un eje y vertical. Los datos
se aparean de tal forma que cada valor de un conjunto de datos corresponde a un valor de
un segundo conjunto de datos. Para elaborar manualmente un diagrama de dispersión,
construya un eje horizontal para los valores de la primera variable, construya un eje vertical
para los valores de la segunda variable y después grafique los puntos. El patrón de los puntos
graficados suele ser útil para determinar si existe alguna relación entre las dos variables.
35
Gestión Curricular
Asignatura: Estadística general
6. PIRAMIDE DE POBLACIÓN.
Es una representación gráfica de la distribución por edad y sexo de una población en un
momento determinado. Nos pueden brindar información sobre migración de la población,
mortalidad, guerras, epidemias y muchas otras situaciones que se presentan en una
población. Además, que nos ayuda a comparar los resultados de diversos fenómenos.
7. CAJA Y BIGOTES.
Son una representación visual que describe varias características importantes, al mismo
tiempo, tales como la dispersión y simetría. Para su realización se representan los tres cuartiles
y los valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o
verticalmente.
Problemas Desarrollados
1. La empresa “La Grande” registra las horas extras de los colaboradores en un año
determinado, obteniendo la siguiente tabla:
Intervalos Xi fi Fi hi Hi pi Pi
[38-44> 41 7 7 0.0795 0.0795 7.95% 7.95%
[44-50> 47 8 15 0.0909 0.1705 9.09% 17.05%
[50-56> 53 15 30 0.1705 0.3409 17.05% 34.09%
[56-62> 59 25 55 0.2841 0.6250 28.41% 62.50%
[62-68> 65 18 73 0.2045 0.8295 20.45% 82.95%
[68-74> 71 9 82 0.1023 0.9318 10.23% 93.18%
[74-80] 77 6 88 0.0632 1 6.82% 100.00%
TOTAL 88 1 100.00%
Elaborar el polígono de frecuencia y ojiva, e interpreta
36
Gestión Curricular
Asignatura: Estadística general
Solución:
Interpretación:
De los 88 colaboradores de la empresa “La Grande”,25 trabajan de 56 a menos de 62
horas haciendo el porcentaje en un 28,41%.
Solución:
3. A partir del grafico que se muestra elabore su tabla de distribución de frecuencia, donde se
muestran el consumo de 300 comensales de “Rustica”:
37
Gestión Curricular
Asignatura: Estadística general
Solución:
Ventas de
fi Fi hi Hi pi% Pi% ángulo
comida
sándwiches 120 120 0.4 0.4 40 40 144
ensalada 63 183 0.21 0.61 21 61 76
sopa 45 228 0.15 0.76 15 76 54
bebidas 27 255 0.09 0.85 9 85 32
postres 45 300 0.15 1 15 100 54
TOTAL 300 1 100 360
Problemas Propuestos
1. El siguiente cuadro muestra el total de inasistencia de los alumnos del mes, de tres facultades
distintas. Elabora un gráfico de barras. (elige otro gráfico que te parezca conveniente)
FACULTADES
MESES
Ingeniería Derecho Medicina
Julio 30 24 20
Agosto 35 30 38
Septiembre 19 25 25
Octubre 20 19 27
Noviembre 15 20 32
Diciembre 18 22 38
38
Gestión Curricular
Asignatura: Estadística general
Número
fi Fi
de quejas
1 2 2
2 4 6
3 21 27
4 15 42
5 6 48
6 1 49
7 1 50
TOTAL 50
3. La empresa ELECTROCENTRO S.A. está llevando a cabo un estudio minucioso acerca de los
salarios que perciben los obreros de esta institución, con la finalidad de realizar mejoras
económicas entre su personal. La siguiente tabla muestra los salarios que perciben una
muestra de 26 de estos obreros:
Salarios Cantidad de obreros
2 [750 − 900 >
4 [900 − 1050 >
6 [1050 − 1200 >
7 [1200 − 1350 >
3 [1350 − 1500 >
3 [1500 − 1650 >
1 [1650 − 1800]
Construir un diagrama de tallo y hojas para los datos indicados, indicar las características de
la distribución.
5. En la siguiente tabla se muestran los resultados después de las evaluaciones a un grupo de
estudiantes de la carrera profesional de contabilidad. (utilizar dos tipos de gráficos)
ESTUDIANTES (GENERO)
CONDICIÓN
Varones Mujeres
Aprobado 65 96
Desaprobado 25 32
Retirado 10 8
39
Gestión Curricular
Asignatura: Estadística general
Video de Apoyo
40
Gestión Curricular
Asignatura: Estadística general
Unidad II
ORGANIZACIÓN DE APRENDIZAJES
41
Gestión Curricular
Asignatura: Estadística general
Semana 5
EVALUACIÓN DE LA PRIMERA UNIDAD
SESIÓN 9: EVALUACIÓN DE LA PRIMERA UNIDAD
Problemas de repaso
42
Gestión Curricular
Asignatura: Estadística general
3. Las calificaciones finales del curso de ESTADISTICA GENERAL donde las notas están sobre 10 y
son los siguientes. Elabore la tabla de frecuencias e interprete.
4,5 8,0 8,5 7,5 6,5 3,5 6,0
4,5 4,5 8,5 8,5 10,0 7,0 6,5
9,5 7,0 6,0 8,5 6,5 6,5 8,5
4. Los sistemas de cómputo fallan por muchas razones, entre ellas las fallas de hardware o
software, errores del operador, sobrecargas del sistema mismo y a otras causas. La tabla
siguiente muestra los resultados obtenidos en un estudio acerca de las causas de fallas en una
muestra de 98 sistemas de cómputo. Usted debe priorizar entre las dos principales causas de
falla de los sistemas de cómputo. Elabore el gráfico apropiado que permita visualizar dicho
propósito.
5. Como parte de un informe que deberán presentar al Ministerio de Trabajo, se ha tomado los
datos referentes a los sueldos mensuales de una muestra de empleados de la Municipalidad
Distrital de Huancayo. Los datos se muestran en la siguiente ojiva. Se pide reconstruir la tabla
y contestar: ¿Qué porcentaje de la muestra representan los empleados que perciben de S/.
900 a menos de S/. 1200?
43
Gestión Curricular
Asignatura: Estadística general
Semana 6
DISTRIBUCIONES DE FRECUENCIAS
BIDIMENSIONALES
La estadística bivariada trata de ir más allá
elaborando índices y resultados estadísticos en
términos de relaciones entre dos variables de interés,
así como de establecer inferencias sobre una
población a partir de datos que provienen de una
muestra (como, por ejemplo, en los estudios mediante
encuesta).
Francis
Gaston
Correlación
R. H.
Hooker
A. Francis Gaston: ideó el método conocido por Correlación, que tenía por
objeto medir la influencia relativa de los factores sobre las variables.
B. H. Hooker, que efectuaron amplios estudios sobre la medida de las
relaciones.
44
Gestión Curricular
Asignatura: Estadística general
Definición de bidimensional
LECTURA
El adjetivo bidimensional se utiliza para calificar a aquello que tiene dos dimensiones (2D).
Un cuerpo que se proyecta a lo largo y a lo ancho, por ejemplo, cuenta con dos
dimensiones. En cambio, si también tiene profundidad, se trata de un objeto con tres
dimensiones (3D) y recibe el calificativo de tridimensional.
Cabe destacar que, aún en una superficie bidimensional, es posible simular un efecto
tridimensional. Una hoja de papel es bidimensional: sin embargo, apelando a la perspectiva,
es posible dibujar un cubo, dando una sensación de tridimensionalidad.
Dentro del ámbito de la electricidad podemos establecer que también se utiliza el término
que ahora nos ocupa. En concreto, se emplea para referirse a la característica que puede
tener un elemento conductor. Así, se establece que si es bidimensional es porque en una de
las direcciones del espacio es aislante mientras que en las otras dos podemos determinar
que cuenta con una mayor conductividad.
Además de todo lo indicado es necesario determinar que existe lo que se conoce como
diseño gráico bidimensional. Este es una disciplina que se sustenta en diseñar y darle forma
a figuras de dos dimensiones para diversos tipos de áreas. En concreto, para fotografías,
dibujos, pinturas, imágenes de ordenador…
Fuente: Julián Pérez Porto y María Merino. Publicado: 2016. Actualizado: 2018.
Definición de: Definición de bidimensional (https://definicion.de/bidimensional/)
45
Gestión Curricular
Asignatura: Estadística general
DATOS
CUALITATIVOS
Y MIXTOS
Propósito:
Organiza y compara dos variables cualitativas y mixtas; elaborando sus respectivas
graficas e interpretando los resultados.
46
Gestión Curricular
Asignatura: Estadística general
b) Completamos cada celda de la tabla con el número de veces que aparece cada dato
bivariado. Para ello contamos la cantidad de estudiantes de género masculino que
viajarán a la costa, que viajarán a la sierra y a la selva. Hacemos lo propio con las
estudiantes de género femenino. Luego sumamos para calcular los totales de fila y
columna. (4 / 24) x 100 = 16,67%
47
Gestión Curricular
Asignatura: Estadística general
Problemas Desarrollados
48
Gestión Curricular
Asignatura: Estadística general
Solución
Aplicando el programa IBM SPSS Statistics Editor para obtener la tabla cruzada:
TABULACIÓN CRUZADA
ESTADO CIVIL
Total
SOLTERO(A) CASADO(A) VIUDO(A)
Recuento 4 3 2 9
VARON
Recuento 3 4 2 9
MUJER
Recuento 7 7 4 18
Total
% del total 38,9% 38,9% 22,2% 100,0%
Graficando:
49
Gestión Curricular
Asignatura: Estadística general
Problemas Propuestos
a) Elabore una tabla de contingencia para organizar los datos, considerando frecuencias
absolutas y relativas conjuntas.
b) Elabore la distribución de frecuencias marginales para las variables “Género” y “Fumador”.
c) Construya el gráfico de barras agrupadas para presentar dicha tabla de contingencia.
F I F A F I
F A F I F A
F A M D M I
F D M A M A
M I M I F I
3. Se está estudiando la relación que existe entre el grado de instrucción y el número de hijos
que tienen las mujeres de Huancayo. Para ello se ha entrevistado a un grupo de pobladoras
y los resultados se muestran a continuación:
50
Gestión Curricular
Asignatura: Estadística general
Método B A C C B C A A B C A B B A C
Tiempo 11 14 10 11 11 10 10 15 9 14 17 9 10 11 12
51
Gestión Curricular
Asignatura: Estadística general
Video de Apoyo
52
Gestión Curricular
Asignatura: Estadística general
Semana 7
DISTRIBUCIONES DE FRECUENCIAS
BIDIMENSIONALES
A finales del siglo XIX, Sir Francis Gaston ideó el método
conocido por Correlación, que tenía por objeto medir la
influencia relativa de los factores sobre las variables. De aquí
partió el desarrollo del coeficiente de correlación creado por
Karl Pearson y otros cultivadores de la ciencia biométrica como
J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron
amplios estudios sobre la medida de las relaciones.
John Graunt:
Compilación
estadística de
los recursos
nacionales
Sebastián
Muster:
53
Gestión Curricular
Asignatura: Estadística general
Fuente: BERMISON ORTEGA, Russell Frank. (2006). El Nuevo Marketing. México: Pearson
Prentice Hall.
54
Gestión Curricular
Asignatura: Estadística general
DATOS
CUALITATIVOS
Propósito:
Elabora la tabla bidimensional de dos variables cuantitativas e interpreta la relación
positiva o negativa.
2. DIAGRAMA DE DISPERSIÓN:
55
Gestión Curricular
Asignatura: Estadística general
Ejemplo:
Correlación lineal positiva: Temperatura y volumen
Correlación lineal negativa: Volumen y presión
No existe Correlación: inteligencia y la belleza.
Problemas Desarrollados
1. Los datos obtenidos al estudiar las variables X = “número de goles anotados” e Y = “número
de goles recibidos”, en 40 partidos jugados por el equipo campeón de la liga de fútbol sala,
son:
(5;4) (4;2) (3;1) (3;2) (6;3)
(4;2) (5;3) (4;2) (4;3) (3;1)
(3;3) (5;3) (6;4) (3;2) (4;2)
(3;2) (6;4) (3;1) (4;2) (5;3)
(4;2) (6;4) (4;2) (6;4) (4;4)
(5;3) (4;2) (5;3) (3;1) (2;2)
(1;1) (2;1) (4;2) (5;3) (5;3)
(6;4) (5;3) (2;2) (3;3) (3;2)
Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el
diagrama de dispersión.
Solución:
Construimos una tabla con tantas columnas como valores tome X y con tantas filas como
valores tome Y en la distribución. Si observamos los datos, X toma los valores 1, 2, 3, 4, 5 y 6, e
Y toma los valores 1, 2, 3 y 4. En este caso, la tabla constará de 6 filas y 4 columnas. − Hallamos
la frecuencia absoluta de cada par de valores de la variable (X, Y). Para ello contamos el
número de veces que se repite ese par de valores en la distribución y lo anotamos en la casilla
correspondiente. Así, por ejemplo, observa que el par (5, 4) aparece una sola vez; el (4, 2)
aparece diez veces; y el (6, 1), ninguna.
Tabla bidimensional
Frecuencias marginales
56
Gestión Curricular
Asignatura: Estadística general
N° de goles N° de goles
Frecuencia Frecuencia
marcados recibidos
1 1 1 6
2 3 2 15
3 10 3 12
4 11 4 7
5 9
6 6
Total 40 Total 40
Diagrama de dispersión
57
Gestión Curricular
Asignatura: Estadística general
b. Gráfico 2
c. Gráfico 3
No presentan relación
Problemas Propuestos
1. En una clase compuesta por 30 alumnos, se ha hecho un estudio sobre el número de horas
diarias de estudio X y el número de suspensos Y, obteniéndose los siguientes resultados:
(2, 0), (2, 2), (0, 5), (2, 1), (1, 2), (2, 1), (3, 1) (4, 0), (0, 4), (2, 2) (2, 1), (2, 1), (4, 0), (3, 1), (2, 4),
(2, 1), (1, 2), (2, 1), (2, 0), (3, 0) (3, 2), (2, 2), (2, 2), (2, 1), (0, 5), (1, 3), (2, 2), (2, 1), (1, 3), (1, 4)
Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el
diagrama de dispersión. Luego señale el tipo de relación que existe entre ambas variables.
2. El número de horas dedicadas al estudio de una asignatura y la calificación final obtenida
en el correspondiente examen por ocho personas vienen dados en la tabla.
X: Horas de estudio 20 16 34 23 27 32 18 22
Y: Calificaciones del examen 6,5 6,0 8,5 7,0 9,0 9,5 7,5 8,0
58
Gestión Curricular
Asignatura: Estadística general
4. Los siguientes datos representan los años de práctica profesional y el ingreso anual (en miles
de soles) para un conjunto de servidores públicos:
Años de Años de
Ingreso Ingreso
práctica práctica
5 4 3 2
15 4 6 3
24 9 12 3
16 7 27 7
19 6 13 5
5. Un estadístico de una determinada línea aérea está estudiando la relación entre la distancia
de destino con la carga de mercancía para un tamaño estándar de embalaje. Se obtuvieron
los siguientes datos para una muestra aleatoria de diez facturaciones de carga:
59
Gestión Curricular
Asignatura: Estadística general
Distancia Carga
22,4 6,8
36,8 10,5
14,4 4,0
27,2 7,9
16,0 8,1
35,2 9,5
8,0 3,1
19,2 7,2
9,6 4,5
25,6 9,3
Video de Apoyo
60
Gestión Curricular
Asignatura: Estadística general
Semana 8
EVALUACIÓN PARCIAL
61
Gestión Curricular
Asignatura: Estadística general
Unidad III
ORGANIZACIÓN DE APRENDIZAJES
TEMAS Y SUBTEMAS ACTIVIDADES EVALUCIÒN
SEMANA N° 9 Actividad N° 17 Consolidado 2:
17. Medidas de tendencia Calcula las medidas de Evaluación individual de
central: Media, mediana, tendencia central e interpreta los desarrollo teórico-práctico
moda resultados. A partir de los datos
Conceptos básicos y de la encuesta.
propiedades de las medidas Actividad N° 18
de tendencia central. Aplica las funciones del SPSS
Estadística, división, objetivos, para calcular las medidas de
definiciones, tipos de datos. tendencia central, de la base de
Métodos y fuentes de datos de la encuesta realizada a
recolección de datos. sus compañeros e interpreta los
18. Medidas de tendencia resultados.
central: Media, mediana, Actividad N° 19
moda con spss. Calcula las medidas de
SEMANA N° 10
dispersión apoyándose de una
19. Medidas de variación o
calculadora e interpreta los
dispersión: Varianza,
resultados. A partir de los datos
desviación estándar y
de la encuesta.
coeficiente de variación.
Actividad N° 20
Medidas deformación:
Aplica las funciones del SPSS
asimetría, interpretación.
para calcular las medidas de
20. Medidas de variación o
dispersión: Varianza, variación, de la base de datos
desviación estándar, de la encuesta realizada a sus
coeficiente de variación y compañeros e interpreta los
asimetría con spss. resultados.
SEMANA N° 11 Actividad N° 21
21. Medidas de posición relativa: Calcula las medidas de posición
Cuartiles y percentiles. relativa e interpreta los
Medidas deformación: resultados. A partir de los datos
curtosis, Diagrama de Cajas y de la encuesta.
bigotes. Actividad N° 22
22. Medidas deformación: Calcula las medidas de
asimetría y curtosis deformación e interpreta los
Diagrama de Cajas y bigotes resultados. A partir de los datos
con spss. de la encuesta.
SEMANA N° 12 Actividad N° 23
23. Evaluación de la tercera Calcula las medidas de
unidad. deformación e interpreta los
24. Verificación de resultados de resultados. A partir de los datos
la evaluación de la primera de la encuesta.
unidad.
Actividad N° 24
62
Gestión Curricular
Asignatura: Estadística general
Semana 9
MEDIDAS DE TENDENCIA CENTRAL
Gustav
Theordor
Fechner:
Utilizo la
mediana
Francis
Galton
63
Gestión Curricular
Asignatura: Estadística general
MEDIDAS DE CENTRALIZACIÓN
LECTURA
64
Gestión Curricular
Asignatura: Estadística general
MEDIDAS DE
CENTRALIZACIÓN
Propósito:
Calcular e interpretar las medidas de tendencia central (media, mediana y moda) de
datos no agrupados y agrupados.
Calcula e Grafique e interpreta la asimetría haciendo uso de las medidas de tendencia
central.
65
Gestión Curricular
Asignatura: Estadística general
a. De datos discretos:
Ejemplo:
Se tiene 50 familias y el número de sus hijos (X) que se distribuye en la siguiente forma,
determina la media aritmética.
X Frecuencias
0 3
1 9
2 12
3 10
4 8
5 5
6 2
7 1
N = 50
Se aumenta una columna donde se coloca el producto del valor de cada dato por su
respectiva frecuencia.
X Frecuencias 𝒏𝒊 𝑿𝒊
0 3 0
1 9 9
2 12 24
3 10 30
4 8 32
5 5 25
6 2 12
7 1 7
N = 50 139
∑𝒌
𝒊=𝟏 𝒏𝒊 𝑿𝒊 𝟏𝟑𝟗
Luego, se utiliza la formula 𝒙
̅= para hallar la M.A. 𝒙
̅= = 𝟐. 𝟕𝟖
𝑵 𝟓𝟎
b. De datos continuos:
Ejemplo:
Se han registrado el peso de 50 lingotes de acero producidos por una Empresa Minera,
la muestra fue obtenida de la producción semanal y las unidades están dadas en kg.
Hallar la M.A.
Li - Ls ni
91.5 – 92.5 4
92.5 – 93.5 11
93.5 – 94.5 20
94.5 – 95.5 9
95.5 – 96.5 6
N = 50
Solución
Aumentamos dos columnas, uno para la marca de clase y otro para el producto de
cada marca de clase con su respectiva frecuencia.
66
Gestión Curricular
Asignatura: Estadística general
Li - Ls Xi ni ni.Xi
91.5 – 92.5 92 4 368
92.5 – 93.5 93 11 1023
93.5 – 94.5 94 20 1880
94.5 – 95.5 95 9 855
95.5 – 96.5 96 6 576
N = 50 4702
Luego:
∑𝒌
𝒊=𝟏 𝒏𝒊 𝑿𝒊 𝟒𝟕𝟎𝟐
Se utiliza la formula 𝒙
̅= para hallar la M.A. 𝒙
̅= = 𝟗𝟒. 𝟎𝟒
𝑵 𝟓𝟎
2. LA MODA (𝑴𝒐):
Es el valor que en una distribución de datos ocurre con mayor frecuencia, es decir, es el dato
que se repite mayor cantidad de veces que los demás. En algunas distribuciones de datos hay
más de una moda y se les denomina bimodal (dos modas) o multimodal (varias modas).
Cálculo de la moda:
Ejemplo 2:
En la siguiente distribución de datos se tiene las puntuaciones:
14 16 16 16 18 19 19 19 21 22
Hallar la moda:
Las puntuaciones que más se repite son: 16 y 19, por lo tanto, la distribución de los datos es
bimodal
Ejemplo:
Determina la moda de la distribución siguiente:
N° de hijos por N° de
familia familias
67
Gestión Curricular
Asignatura: Estadística general
Xi ni
0 60
1 120
2 210
3 360
4 160
5 50
6 a más 30
Total 990
68
Gestión Curricular
Asignatura: Estadística general
El límite inferior: Li = 50
∆1 = ni – ni – 1 ∆ 2 = ni – ni + 1
∆1 = 40 – 28 ∆2 = 40 – 31
∆1 = 12 ∆2 = 9
Su amplitud (c): c = 10
Reemplazando en la fórmula:
∆1 12
𝑀𝑜 = 𝐿𝑖 + ( ) 𝑐 = 50 + ( ) 10 = 55.71
∆1 + ∆2 12 + 9
3. LA MEDIANA (𝑴𝒆):
La mediana es una medida de tendencia central, cuyo valor divide a un conjunto de datos,
ordenado con respecto a la magnitud de sus valores, de tal manera que el número de datos
por encima de la mediana es igual al número de datos por debajo de la misma.
𝑿 𝒏 +𝑿 𝒏
( ) ( +𝟏)
𝟐 𝟐
si el número de datos es par 𝑴𝒆 = 𝟐
Ejemplo:
Sean los siguientes 11 datos obtenidos de la observación de una variable X:
0 8 1 2 9 1 3 8 4 7 6
Significa que el 50% de los datos de la distribución son mayores que 4 y los otros 50% son
menores que 4.
69
Gestión Curricular
Asignatura: Estadística general
N° de caras Frecuencias
(Xi) (ni)
0 2
1 19
2 46
3 62
4 47
5 20
6 4
Ejemplo:
Sean datos correspondientes a la medición en centímetros de 200 varillas, determine
la Me:
70
Gestión Curricular
Asignatura: Estadística general
Li – Ls ni
29.5 – 30.5 4
30.5 – 31.5 8
31.5 – 32.5 23
32.5 – 33.5 35
33.5 – 34.5 62
34.5 – 35.5 44
35.5 – 36.5 18
36.5 – 37.5 4
37.5 – 38.5 1
38.5 – 39.5 1
Luego se busca un Ni que sea mayor o igual que N/2 (N = n° total de datos)
N/2 = 200/2 = 100
Entonces: 𝑁𝑖 ≥ 100 el más cercano será Ni = 132
33.5 – 34.5 62 132
li = 33,5
c=1
n = 200
𝑁𝑖−1 = 70
ni = 62
Reemplazando en la fórmula:
𝑛 200
−𝑁𝑖−1 −70 30
𝑀𝑒 = 𝑙𝑖 + (2 ) . 𝑐 = 33.5 + ( 2
) . 1 = 33.5 + = 33,98
𝑛𝑖 62 62
71
Gestión Curricular
Asignatura: Estadística general
Problemas Desarrollados
1. Una persona que trabaja en forma independiente gana en un mes s/. 200; otro mes
s/.600, un tercer mes s/.400 y un cuarto mes S/.440, ¿En promedio ménsula cuánto gana?
200 + 600 + 400 + 440 1640
𝑋̅ = = = 410
4 4
2. Se escogieron al azar 24 familias y se les pregunto por el número de hijos que tenía cada
una; las respuestas obtenidas fueron las siguiente: 2,4,6,6,2,3,0,0,4,5,3,3,4,3,5,2,1,2,0,3,4,5,1,1
Hallar el promedio del número de hijos de las 25 familias.
Solución
Realizamos la tabla de frecuencia:
Xi ni Xi.ni
0 3 0
1 3 3
2 4 8
3 5 15
4 4 16
5 3 15
6 2 12
n= 24 69
Remplazando en la fórmula para determinar la Ma:
69
̅
𝑋= = 2,875 = 2.88
24
3. Sea una distribución de frecuencias de puntuaciones obtenidas por 105 estudiantes en
una prueba de estadísticas. Hallar la media aritmética.
72
Gestión Curricular
Asignatura: Estadística general
Li - Ls xi ni xi.ni
2–4 3 3 9
4–6 5 2 10
6–8 7 5 35
8 - 10 9 9 81
10 - 12 11 12 132
12 - 14 13 10 130
14 - 16 15 2 30
16 - 18 17 5 85
N = 48 512
Remplazando en la fórmula para determinar la Ma:
512
̅
𝑋= = 10.67 = 10.7
48
Problemas Propuestos
1. Una empresa ha realizado un test físico entre todos sus empleados para comprobar la
capacidad de esfuerzo que posee cada uno de ellos. Una de las medidas que
componen el test es el número de pulsaciones después de una determinada actividad
física que está altamente relacionada con las que se realizan a lo largo de una jornada
laboral. Los datos conseguidos han sido distribuidos en la siguiente tabla:
Numero de Número de
pulsaciones empleados
[65-70> 12
[70-75> 15
[75-80> 10
[80-85> 28
[85-90] 30
[90-95] 5
a) ¿Qué porcentaje de empleados tuvo menos de 85 pulsaciones?
b) Calcula la media aritmética, la mediana y la moda. Interpreta los resultados.
2. Los ingresos en dólares de 18 hombres elegidos al azar del Banco BBVA CONTINENTAL
(entre un total de 1000) se muestran a continuación:
45,16 83,61 79,85 22,07 76,91 65,73
88,91 99,49 62,59 34,20 88,61 41,50
68,89 92,22 54,33 53,20 16,60 62,59
a) Calcula la media aritmética empleando la tabla de frecuencias.
b) Halla la mediana y moda e interpreta (en termino de dólares).
73
Gestión Curricular
Asignatura: Estadística general
c) ¿Se puede considerar que las poblaciones de 1000 personas tendrán la misma media
que la muestra de 18 personas? ¿Por qué?
3. El grafico tallo y hoja muestra los productos vendidos de la tienda “La Moderna” en un
día. Calcular las medidas de tendencia central y graficar el sesgo y, ¿la media aritmética
es significativa en los productos vendidos?
TALLO HOJAS
2 2
3 122
4 2333
5 228
6 7
4. De los 46 productos vendidos de la tienda “Casa Sueldo” un día domingo. Calcular las
medidas de tendencia central, asimetría e interpretar el sesgo. Elabora una tabla de
frecuencias a partir del histograma.
5. Se tiene el siguiente cuadro que corresponde quesos producidos por trabajador para la
empresa SERRANITA:
Litros de lácteos producidos 5-11> 11-17> 17-23> 23-29> 29-35>
Cantidad de trabajadores 12 18 13 9 10
74
Gestión Curricular
Asignatura: Estadística general
Video de Apoyo
75
Gestión Curricular
Asignatura: Estadística general
Semana 10
MEDIDAS DE VARIACIÓN O DISPERSIÓN
La desviación típica cumple la llamada desigualdad
de Tchebychev: según la cual, los datos que se alejan
de la media una distancia igual o menor que s,
multiplicado por un coeficiente k suponen más de la
proporción 1-1/k2. Así, el 75% de los datos al menos, se
encuentra a menos de dos desviaciones típicas y el
89% a menos de tres.
Hiparco de
NIcea
Telescopio
para observar
el cielo
Galileo Galilei
76
Gestión Curricular
Asignatura: Estadística general
VARIABILIDAD Y DISPERSIÓN
estadística, pues dotan a esta ciencia de su razón de ser y pueden ser abordadas,
tanto desde la estadística descriptiva, como de la probabilidad y la inferencia.
Tanto Wild y Pfannkuch (1999), como Moore (1990) incluyen la percepción de la
variabilidad aleatoria como componentes esenciales del razonamiento
estadístico.
Las medidas de dispersión son, además, esenciales en una distribución de datos,
complementando a las de posición central, al caracterizar la variabilidad de los
datos respecto a las mismas. Como sugieren Batanero, González- Ruiz, López-
Martín y Contreras (2015), es importante que los estudiantes las comprendan y
diferencien las relacionadas con la distribución de datos, la distribución de
probabilidad y la distribución muestral.
A pesar de su importancia, la investigación didáctica sobre la comprensión de la
variabilidad y la dispersión es relativamente escasa, en comparación con la
existente respecto a las ideas de centro y medidas de posición central. Por este
motivo me interesé en comenzar una línea de investigación al respecto, que
desembocará en un estudio del tema en los libros de texto y otro estudio de
evaluación amplio de la comprensión de estas ideas en estudiantes de educación
secundaria y se concretará en una tesis doctoral.
La finalidad del este trabajo fin de Máster es realizar una síntesis de la investigación
didáctica relacionada con este tema, que sirva de fundamento para la futura tesis
doctoral, ya avanzada. Para llevarla a cabo se ha realizado una extensa consulta,
estudio, análisis y síntesis de dicha investigación, clasificándola y resumiéndola en
esta memoria, que se organiza en los siguientes capítulos:
En el primero de ellos se comienza justificando el interés de realizar este trabajo de
síntesis, se presenta una síntesis de la evolución histórica de estos conceptos, se
analizan los contenidos curriculares relacionados con las ideas de variabilidad y
dispersión y se presentan los objetivos del trabajo.
El segundo capítulo expone en forma resumida algunas ideas de nuestro marco
teórico que es el enfoque ontosemiótico que consideramos de interés para nuestro
trabajo actual y nuestra futura tesis doctoral.
En el tercer capítulo se presenta el trabajo de síntesis de la investigación previa
que se organiza a través de los significados de la dispersión, aportando a su vez
estudios 5 sobre la percepción y las concepciones de estudiantes y futuros
profesores de las medidas de dispersión.
Fuente: (Hald, 1998, p. 33) Los errores aleatorios de las observaciones nos llevan a errores
aleatorios de una función de las observaciones que pueden ser grandes, incluso si los
errores de observación son pequeños.
77
Gestión Curricular
Asignatura: Estadística general
MEDIDAS DE
VARIACIÓN O
DISPERSIÓN
Propósito:
Calcular e interpretar medidas de variación o dispersión.
Describir y comparar distribuciones de datos a partir de sus medidas de dispersión.
Aplicar las medidas de dispersión para analizar la representatividad de la media
aritmética.
∑(𝑿𝒊 − 𝑴𝒂)𝟐
𝑺= √
𝒏
Ejemplo:
El tiempo que utilizan 6 niños de igual edad para desarrollar una misma tarea fue la
siguiente:
16; 12; 15; 18; 13; 14 minutos
Hallar la varianza (S2) y la desviación estándar (S) del conjunto de datos:
Solución:
Hallamos la Ma:
16 + 12 + 15 + 18 + 13 + 14 88
𝑀𝑎 = = = 14.7
6 6
78
Gestión Curricular
Asignatura: Estadística general
∑(𝑿𝒊 − 𝑴𝒂)𝟐 𝒏𝒊
𝑺= √
𝒏
Ejemplo:
En la siguiente distribución de frecuencias del número de hijos de 50 familias, se pide
hallar la varianza (S2) y la desviación estándar (S) del conjunto de datos:
N° de hijos N° de familias
Xi ni
0 3
1 9
2 12
3 10
4 8
5 5
6 2
7 1
Completando columnas:
Xi ni 𝒏𝒊 𝑿𝒊 (𝑿𝒊 − 𝑴𝒂)𝟐 (𝑿𝒊 − 𝑴𝒂)𝟐 . 𝒏𝒊
0 3 0 7,73 23,19
1 9 9 3,17 28,53
2 12 24 0,61 7,32
3 10 30 0,05 0,5
4 8 32 1,49 11,92
5 5 25 4,93 24,65
6 2 12 10,37 20,74
7 1 7 17,81 17,81
N = 50 139 134,66
79
Gestión Curricular
Asignatura: Estadística general
𝟏𝟑𝟗
Hallando la M.A: 𝑴𝒂 = = 𝟐. 𝟕𝟖
𝟓𝟎
Luego:
∑(𝑿𝒊 − 𝑴𝒂)𝟐 . 𝒏𝒊 𝟏𝟑𝟒, 𝟔𝟔
𝑺𝟐 = = = 𝟐. 𝟔𝟗
𝒏 𝟓𝟎
Entonces: 𝑆 = ξ2,69 = 1.64
El número de hijos de las 50 familias tienen una dispersión promedio de 1.64 hijos con
respecto a la media aritmética.
∑(𝑿𝒊 − 𝑴𝒂)𝟐 𝒏𝒊
𝑺= √
𝒏
Donde:
Xi = marca de clase
Ma = media aritmética
n = número total de datos
(𝑿𝒊 − 𝑴𝒂)𝟐 = desviación al cuadrado de cada dato con respecto a la
media.
Ejemplo:
Se han registrado el peso de 50 lingotes de acero producidos por SIDERPERU, la
muestra fue obtenido de la producción semanal y las unidades están dadas en
kg. Hallar la varianza (S2) y la desviación estándar (S) del conjunto de datos.
Li - Ls ni
91,5 – 92,5 4
92,5 – 93,5 11
93,5 – 94,5 20
94,5 – 95,5 9
95,5 – 96,5 6
N = 50
Solución
Hallando la Ma:
4702
𝑀𝑎 = = 94.04
50
Completando la columna cinco:
|𝑿𝒊 − 𝑴𝒂|𝟐 = |𝑿𝟏 − 𝑴𝒂|𝟐 = |𝟗𝟐 − 𝟗𝟒, 𝟎𝟒|𝟐 = 𝟒, 𝟏𝟔𝟏𝟔
Completando la columna seis:
|𝑿𝒊 − 𝑴𝒂|𝟐 . 𝒏𝒊 = |𝑿𝟏 − 𝟗𝟒, 𝟎𝟒|𝟐 . 𝒏𝟏 = |𝟗𝟐, 𝟎 − 𝟗𝟒, 𝟎𝟒|𝟐 . 𝟒 = 𝟒, 𝟏𝟔𝟏𝟔. 𝟒 = 𝟏𝟔, 𝟔𝟒𝟔𝟒
80
Gestión Curricular
Asignatura: Estadística general
∑(𝑿𝒊 − 𝑴𝒂)𝟐 𝒏𝒊
𝑺= √ = √𝟏, 𝟐𝟎 = 𝟏, 𝟎𝟗𝟓
𝒏
Por lo tanto, los lingotes de acero en la producción semanal de SIDER PERÚ se
dispersan en promedio de 1,095 kg con respecto a la media aritmética.
2. COEFICIENTE DE VARIACIÓN:
Ejemplo 1.
Hallar el coeficiente de variación (CV) del tiempo que utilizan 6 niños de igual edad para
desarrollar una misma tarea, los resultados son los siguientes: 16; 12; 15; 18; 13; 14 minutos.
Solución
Hallando la Ma:
16 + 12 + 15 + 18 + 13 + 14 88
𝑀𝑎 = = = 14.7
6 6
Determinando la varianza:
(16 − 14.7)2 + (12 − 14.7)2 + (15 − 14.7)2 + (18 − 14.7)2 + (13 − 14.7)2 + (14 − 14.7)2
𝑆2 =
6
𝑆 2 = 3.89
𝑆 = ξ3.89 = 1.97
Hallando el CV:
𝑺 𝟏. 𝟗𝟕
𝑪𝑽 = 𝒙𝟏𝟎𝟎% = 𝒙𝟏𝟎𝟎% = 𝟏𝟑. 𝟒𝟎%
𝑴𝒂 𝟏𝟒. 𝟕
81
Gestión Curricular
Asignatura: Estadística general
Ejemplo 2.
Sea la distribución de frecuencias de las notas de Estadística general de estudiantes de la
Universidad Continental. Hallar S2, S, CV.
Li - Ls ni
00 – 02 3
02 – 04 5
04 – 06 2
06 – 08 12
08 – 10 8
10 – 12 3
12 – 14 7
14 – 16 10
N=50
Solución:
Completando cuadrados con los pasos estudiados:
Li - Ls Xi ni Xi.ni (𝑿𝒊 − 𝑴𝒂)𝟐 (𝑿𝒊 − 𝑴𝒂)𝟐 . 𝒏𝒊
00 – 02 1 3 3 66.59 199.77
02 – 04 3 5 15 37.95 189.75
04 – 06 5 2 10 17.31 34.62
06 – 08 7 12 84 4.67 56.04
08 – 10 9 8 72 0.03 0.24
10 – 12 11 3 33 3.39 10.17
12 – 14 13 7 91 14.75 103.25
14 – 16 15 10 150 34.11 341.10
N=50 458 934.94
458
Hallando la Ma: 𝑀𝑎 = = 9.16
50
Hallando S2:
∑(𝑋𝑖 − 𝑀𝑎)2 . 𝑛𝑖 934.94
𝑆2 = = = 18.70
𝑛 50
Hallando S:
𝑆 = ξ18.70 = 4.32
Hallando CV:
𝑆 4.32
𝐶𝑉 = 𝑥100% = 𝑥100 = 47.16
𝑀𝑎 9.16
82
Gestión Curricular
Asignatura: Estadística general
Problemas Desarrollados
1. Las edades de 8 niños son las siguientes: 5, 6, 8, 7, 5, 6,9 y 10 años. Determine la varianza y
la desviación estándar.
Solución
Hallamos la Ma:
5 + 6 + 8 + 7 + 5 + 6 + 9 + 10 56
𝑀𝑎 = = =7
8 8
Halando la varianza y la desviación estándar:
(5 − 7)2 + (6 − 7)2 + (8 − 7)2 + (7 − 7)2 + (5 − 7)2 + (6 − 7)2 +(9 − 7)2 + (10 − 7)2
𝑆2 =
8
4+1+1+0+4+1+4+9
𝑆2 =
8
24
𝑆2 = =3
8
𝑆 = ξ3 = 1.73
2. Se han registrado la edad en una muestra de 53 niños que tienen problemas de salud. Hallar
la varianza y la desviación estándar.
Li - Ls ni
0-3 5
3-6 12
6-9 20
9 - 12 10
12 - 15 6
Solución
Completando la tabla de frecuencias:
Xi ni mi ni.xi (mi- Ma)2 (mi- Ma)2. ni
0-3 5 1.5 7.5 36 180
3-6 12 4.5 54.0 9 108
6-9 20 7.5 150.0 0 0
9-12 10 10.5 105.0 9 90
12-15 6 13.5 81.0 36 216
n =53 397.5 594
Determinamos la Ma:
397.5
𝑀𝑎 = = 7.5
53
Hallando la varianza y desviación estándar:
594
𝑆2 = = 11.21
53
𝑆 = ξ11.21 = 3.35
83
Gestión Curricular
Asignatura: Estadística general
84
Gestión Curricular
Asignatura: Estadística general
Problemas Propuestos
2. Calcular todas las medidas de dispersión para los datos de la siguiente distribución:
Xi 0-100 100-200 200-300 300-800
ni 90 140 150 120
3. Un artículo reportó los siguientes datos sobre consumo de oxígeno (ml/kg/min) para una
muestra de diez bomberos que realizaron un simulacro de supresión de incendio.
29,5 49,3 30,6 28,2 28,0
26,3 33,9 29,4 23,5 31,6
Calcule lo siguiente:
a) El rango muestral.
b) La varianza muestral (s2) a partir de la definición (es decir, calculando primero las
desviaciones y luego elevándolas al cuadrado, etcétera).
c) La desviación estándar muestral.
d) S2 utilizando el método más corto. (con ayuda de la formula)
4. Una compañía requiere los servicios de un técnico especializado. De los expedientes
presentados, se han seleccionado 2 candidatos: A y B, los cuales reúnen los requisitos. Para
decidir cuál de los 2 se va a contratar se toman siete pruebas a cada uno de ellos. Los
resultados se dan a continuación:
Prueba
1 2 3 4 5 6 7
Puntaje obtenido por A 57 55 54 52 62 55 59
Puntaje obtenido por B 80 40 62 72 46 80 40
85
Gestión Curricular
Asignatura: Estadística general
Video de Apoyo
(https://www.youtube.com/watch?v=oZRaDwnpXkY)
86
Gestión Curricular
Asignatura: Estadística general
Semana 11
MEDIDAS DE POSICIÓN RELATIVA
Ronald A.
Fisher
Biometría
Universidad
de
Cambridge
A. Ronald A. Fisher: Fisher expresó que las desviaciones que excedían dos veces
la desviación estándar eran consideradas significativas. Previamente a esto las
desviaciones que excedían tres veces el error probable eran consideradas
significativas. Previamente a esto las desviaciones que excedían tres veces el
error probable eran consideradas significativas. Para una distribución simétrica
el error probable la mitad del rango intercuantil. El cuantil superior de la
distribución normal estándar está entre 0.66 y 0.67, su error probable es
aproximadamente 2/3 de la desviación estándar. Parece que el criterio de
Fisher del 5% tenía sus raíces en la práctica previa.
87
Gestión Curricular
Asignatura: Estadística general
fiebre le das el antitérmico con sabor a fresa y si ves que la cosa no mejora se lo alternas
con el de sabor a naranja.
El peso bien, la altura genial y un percentil por encima de lo que a su edad le corresponde...
El padre o madre mira al médico, le devuelve la sonrisa que demuestra lo orgulloso que
está de su bebé y sale de la consulta contentísimo sabiendo que su hijo o hija, a pesar de
los mocos, tiene un percentil por encima de la media.
Los padres lo comentan con las abuelas cuando les llaman para preguntar por el niño y les
dejan claro que la cosa va bien porque el niño tiene un percentil por encima de la media.
Están tan contentos que incluso hablan con sus hermanos y les preguntan qué percentil
tenían sus hijos a la edad del suyo. Sin querer, durante la semana, el percentil se convierte
en el tema de conversación con amigos y otros padres y madres. Llegan por tanto a la
conclusión de que están haciendo la cosa bien porque tienen un hijo con un percentil por
encima de la media. ¡Felicidades!
Pero, ¿alguien se ha preguntado alguna vez qué es eso del percentil? Y todavía mejor,
¿para qué sirve? La cosa es sencilla, pero solo para los matemáticos, en mi caso lo he
tenido que preguntar varias veces y me ha sorprendido descubrir que es un término que
todos los padres y madres tenemos en cuenta, pero pocos sabemos qué es realmente.
Un percentil es una medida estadística para comparar resultados, nos permite saber cómo
está situado un valor en función de una muestra. Si hablamos de bebés, nos permitiría
comparar los datos de nuestro bebé con otros de sus mismas características. Estas
características son la edad y el sexo.
Los aspectos de su desarrollo que comparamos o los que más interés despiertan en los
padres son: El peso, La altura, La circunferencia de la cabeza
Si nos dice nuestro pediatra que nuestro bebé de 6kg está en el percentil 25, quiere decir
que hay un 25% de los bebés estudiados que están en el mismo peso o menos y un 75%
que están por encima.
Pongo el ejemplo, al contrario, a ver si consigo aclarar la cosa un poco más: si nuestro
bebé se encuentra en el percentil 75 de peso, quiere decir entonces que de toda la
muestra solo hay un 25% que pesen más que nuestro hijo. En España, los valores y las curvas
utilizados para medir los percentiles (las curvas son la representación gráfica de los valores,
esos papeles con líneas y puntitos que nos da siempre el pediatra al acabar la revisión) son
las proporcionadas por el Sistema Público de Salud que están realizadas por el Instituto de
Investigación sobre Crecimiento y Desarrollo de la Fundación Faustino Orbegozo Eizaguirre.
Estas tablas hacen dos diferencias por edad, niños de 0 a 2 años y de 2 a 14 años y son
diferentes para niños y para niñas. Existen 7 percentiles que agrupan las medidas que se
consideran normales, del percentil 3 al 97, pasando por el 19, 25, 50 -que sería la media-,
75 y 90. Por debajo del 3 y por encima del 97, nuestro pediatra, que al fin y al cabo es quien
revisa los datos, nos dirá qué pasos seguir. Los percentiles, al tratarse de una medida
estadística no son iguales en todos los países, es más o menos lógico pensar que la muestra
para extraer los datos no será igual aquí que en un país con grandes problemas para
alimentar a su población. Por esto, nuestro hijo puede estar en un percentil en España y en
otro muy diferente en otro país. El estudio de los datos y el método de elaboración de las
tablas para crear los percentiles, es preciso y, posiblemente, cada vez mejor, pero hasta
qué punto pueden ser concluyentes, lo vamos a determinar nosotros. Si nuestro hijo crece
y se desarrolla continuamente de forma controlada por un profesional, el número que
alcance en una gráfica es algo más.
Fuente: BERMISON ORTEGA, Russell Frank. (2006). El Nuevo Marketing. México: Pearson
Prentice Hall.
88
Gestión Curricular
Asignatura: Estadística general
MEDIDAS DE
POSICIÓN
Propósito:
Calcular e interpretar medidas de posición relativa (cuartiles y percentiles).
Efectuar análisis exploratorio de datos haciendo uso de diagramas de caja y bigote.
1. CUARTILES:
Son valores que dividen a un conjunto de datos ordenados en forma ascendente o
descendente en cuatro partes iguales del conjunto de datos.
Es decir:
89
Gestión Curricular
Asignatura: Estadística general
Ejemplo:
Consideremos los siguientes datos ordenados (n = 13).
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13
Datos 104 112 134 146 155 168 170 195 246 302 338 412 678
Solución.
134+146
Posición del cuartil inferior = (13 + 1)/4 = 3.5 𝑄1 = = 140
2
En nuestro ejemplo:
Mínimo = 104 25%
Cuartil inferior(Q1) = 140 25%
Mediana(Q2) = 170 25%
Cuartil superior(Q3) = 320 25%
máximo = 678
90
Gestión Curricular
Asignatura: Estadística general
Ejemplo:
Sean los siguientes datos correspondientes a la medición en centímetros de 200 varillas.
Hallar el primer y el tercer cuartil.
Li - Ls ni
29,5 – 30,5 4
30,5 – 31,5 8
31,5 – 32,5 23
32,5 – 33,5 35
33,5 – 34,5 62
34,5 – 35,5 44
35,5 – 36,5 18
36,5 – 37,5 4
37,5 – 38,5 1
38,5 – 39,5 1
Realizamos el mismo procedimiento que en la mediana, se aumenta una columna para
la frecuencia acumulada (Ni)
Li - Ls ni Ni
29,5 – 30,5 4 4
30,5 – 31,5 8 12
31,5 – 32,5 23 35
32,5 – 33,5 35 70
33,5 – 34,5 62 132
34,5 – 35,5 44 176
35,5 – 36,5 18 194
36,5 – 37,5 4 198
37,5 – 38,5 1 199
38,5 – 39,5 1 200
N =200
Hallando el Q1.
Luego se busca un Ni que sea mayor o igual que N/4 (N = n° total de datos)
N/4 = 200/4 = 50,
Entonces: 𝑁𝑖 ≥ 50 el más cercano será Ni = 70, esto nos indica que aquí esta Q1.
32,5 – 33,5 35 70
Donde:
Li = 32,5
c=1
N = 200
𝑁𝑖−1 = 35
𝑛𝑖 = 35
Reemplazando en la fórmula:
𝒏 𝟐𝟎𝟎
− 𝑵𝒊−𝟏 − 𝟑𝟓
𝑸𝟏 = 𝒍𝒊 + ( 𝟒 ) . 𝒄 = 𝟑𝟐. 𝟓 + ( 𝟒 ) . 𝟏 = 𝟑𝟐. 𝟗𝟑
𝒏𝒊 𝟑𝟓
Hallando el Q3.
Luego se busca un Ni que sea mayor o igual que 3N/4 (N = n° total de datos)
3N/4 = 3(200)/4 = 150,
91
Gestión Curricular
Asignatura: Estadística general
Entonces: 𝑁𝑖 ≥ 150 el más cercano será Ni = 176, esto nos indica que aquí esta Q3.
34,5 – 35,5 44 176
Donde:
Li = 34,5
c=1
N = 200
𝑁𝑖−1 = 132
𝑛𝑖 = 44
Reemplazando en la fórmula:
𝟑𝒏 𝟑. 𝟐𝟎𝟎
− 𝑵𝒊−𝟏 − 𝟏𝟑𝟐
𝑸𝟑 = 𝒍𝒊 + ( 𝟒 ) . 𝒄 = 𝟑𝟒. 𝟓 + ( 𝟒 ) . 𝟏 = 𝟑𝟒. 𝟗𝟏
𝒏𝒊 𝟒𝟒
∴ 𝑸𝟏 = 𝟑𝟐. 𝟗𝟑 ∧ 𝑸𝟑 = 𝟑𝟒, 𝟗𝟏
2. PERCENTILES:
Los percentiles dividen al conjunto de observaciones en cien partes iguales. Hay 99
percentiles.
P1=1% P5=5% P50=50% P99=99%
1% 1% 1% 1% 1% 1%
92
Gestión Curricular
Asignatura: Estadística general
Ejemplo:
Determine el cuartil 3 de los siguientes valores muestrales:
25 – 18 – 47 – 35 – 32 – 19 – 20 – 26 – 35 – 30 – 28 – 30
Solución
Ordene de menor a mayor los datos (n = 12)
18 – 19 – 20 – 25 – 26 – 28 – 30 – 30 – 32 – 35 – 35 – 47
Calcule el valor del localizador para el P75 = Q3
L = (75/100).12 = 9 (Se promedia el 9no y 10mo dato)
Calcule el valor del P75 = Q3
P75 = (32 + 35)/2 = 33,5
INTERPRETACIÓN: El 75% de los valores son menores o iguales a 33,5, mientras que el 25%
restante son mayores o iguales a 33,5
Considerando el intervalo:
75 – 80 3 6
Reemplazando en la fórmula:
10(35)
−3
𝑃10 = 𝐶10 = 75 + ( 100 ) . 5 = 75.83
3
Hallando P90:
90𝑛 90(35)
Si: = = 31.5 ⟹ 𝑁𝑖 ≥ 31.5 ⟼ 𝑁𝑖 = 35
100 100
Considerando el intervalo:
90 – 95 12 35
93
Gestión Curricular
Asignatura: Estadística general
Reemplazando en la fórmula:
90(35)
− 23
𝑃90 = 𝐶90 = 90 + ( 100 ) . 5 = 93.54
12
25 75 25% 75%
% Q % P
1 25
b) Q2 = P50 = Mediana
50% 50%
M
c) Q3 = P75 e
Q P
3 75
4. RANGO INTERCUARTIL.
Es una medida de dispersión estadística, la cual indica la distancia a la que se encuentra el
50% central de datos. Mediante esta medida se eliminan los valores extremadamente
alejados. El rango intercuartílico es altamente recomendable cuando la medida de
tendencia central utilizada es la mediana (ya que la mediana es insensible a posibles valores
extremos)
R.I. = Q3 – Q1
Q Q Q
1 2 3
94
Gestión Curricular
Asignatura: Estadística general
Se llama "valor extremo" o “dato distante” a aquel que está muy alejado de la mayor parte
de los demás valores. Los valores extremos se deben considerar ya que pueden revelar
información importante y afectar en gran medida el valor de la media y de la desviación
estándar.
Ejemplo:
Datos 1: 9 – 10 – 13 – 14 – 17 – 56
Datos 2: 3 – 34 – 36 – 40 – 42 – 47
Una caja es un rectángulo que se construye sobre la base de los valores del primer
cuartil, la mediana y el tercer cuartil. Permite comparar diversos conjuntos de datos
simultáneamente respecto a simetría, variabilidad, centro, valores extremos y valores
atípicos.
95% de los datos
1,5RIQ 1,5RIQ
RIC = Q3 – Q1
3RIQ 3RIQ
7. COEFICIENTE DE CURTOSIS.
95
Gestión Curricular
Asignatura: Estadística general
Solución:
Hallando 𝑄3 𝑦 𝑄1 , 𝑃90 𝑦 𝑃10
Completando la tabla:
Li - Ls ni Ni
70 – 75 3 3
75 – 80 3 6
80 – 85 7 13
85 – 90 10 23
90 - 95 12 35
35
Hallando Q1:
𝑛
−𝑁𝑖−1
Recordando: 𝑄1 = 𝐿𝑖 + (4 ).𝑐
𝑛𝑖
𝑛 35
Si: = = 8.75 ⟹ 𝑁𝑖 ≥ 8.75 ↦ 𝑁𝑖 = 13
4 4
Considerando el intervalo:
80 – 85 7 13
Reemplazando datos:
𝑛
− 𝑁𝑖−1 8.75 − 6
𝑄1 = 𝐿𝑖 + (4 ) . 𝑐 = 80 + ( ) . 5 = 81.96
𝑛𝑖 7
96
Gestión Curricular
Asignatura: Estadística general
Hallando Q3:
3𝑛
−𝑁𝑖−1
Recordando: 𝑄3 = 𝑙𝑖 + ( 4 ).𝑐
𝑛𝑖
3𝑛 3(35)
Si: = = 26.25 ⟹ 𝑁𝑖 ≥ 26.25 ⟼ 𝑁𝑖 = 35
4 4
Considerando el intervalo:
90 - 95 12 35
Reemplazando en la fórmula:
3𝑛 3(35)
− 𝑁𝑖−1 − 23
𝑄3 = 𝑙𝑖 + ( 4 ) . 𝑐 = 90 + ( 4 ) . 5 = 91.35
𝑛𝑖 12
Hallando P10:
10𝑛 10(35)
Si: = = 3.5 ⟹ 𝑁𝑖 ≥ 3.5 ⟼ 𝑁𝑖 = 6
100 100
Considerando el intervalo:
75 – 80 3 6
Reemplazando en la fórmula:
10(35)
−3
𝑃10 = 𝐶10 = 75 + ( 100 ) . 5 = 75.83
3
Hallando P90:
90𝑛 90(35)
Si: = = 31.5 ⟹ 𝑁𝑖 ≥ 31.5 ⟼ 𝑁𝑖 = 35
100 100
Considerando el intervalo:
90 – 95 12 35
Reemplazando en la fórmula:
90(35)
− 23
𝑃90 = 𝐶90 = 90 + ( 100 ) . 5 = 93.54
12
Por lo tanto:
𝑄3 − 𝑄1 91.35 − 81.96 9.39 9.39
𝐾= = = = = 0.2651 = 0.27
2(𝑃90 − 𝑃10 ) 2(93.54 − 75.83) 2(17.71) 35.42
Significa que viene a ser una curva de frecuencias suavemente leptocurtica
Problemas Desarrollados
Solución:
Primer paso: Ordenar los datos en forma ascendente:
91 – 115 – 120 – 160 – 170 – 185 – 190 – 233 – 255 – 265
Segundo paso: Se sabe que Q1 = P25, por lo tanto, calcularemos el percentil 25.
97
Gestión Curricular
Asignatura: Estadística general
25
Calcular el localizador L: (k = 25) 𝐿= × 10 = 2,5
100
Tercer paso: Redondeamos L con las reglas del redondeo que hemos aprendido
anteriormente, en este caso L=3
Cuarto paso: Calculamos el valor de P25 (el dato que ocupa la posición 3 empezando
del menor dato).
91 – 115 – 120 – 160 – 170 – 185 – 190 – 233 – 255 – 265
P25=120
Interpretación: El 25% de los datos son menores o iguales a 120 y el 75% restante son
mayores o iguales que este valor.
98
Gestión Curricular
Asignatura: Estadística general
Remplazando en la fórmula:
10𝑛 10(45)
− 𝑁𝑖−1 −3
𝑃10 = 𝑙𝑖 + ( 100 ) . 𝑐 = 42 + ( 100 ) . 8 = 45
𝑛𝑖 4
Hallando el:𝑃90
Si: 90N/100 =90(45)/100= 40.50
Luego se busca un Ni que sea mayor o igual que N/4 (N=n° Total de datos)
Entonces: Ni ≥ 40.50 el más cercano será Ni = 41
[66 − 74[ 8 41
Dónde:
Li = 66 𝑁𝑖−1 = 33 𝑛𝑖 = 8 c=8
90𝑛 90(45)
− 𝑁𝑖−1 − 33
𝑃90 = 𝑙𝑖 + ( 100 ) . 𝑐 = 66 + ( 100 ) . 8 = 73.50
𝑛𝑖 8
Problemas Propuestos
Me = P5 ( ) Q2 =P50 =Me ( )
99
Gestión Curricular
Asignatura: Estadística general
4. Los ingresos diarios (en Nuevos Soles) de un grupo de supervisores de la obra de construcción
del nuevo centro comercial se han resumido en la siguiente tabla de frecuencias:
Ingresos Xi ni
[48 − 52[50 12
[52 − 56[54 25
[56 − 60[58 58
[60 − 64[62 32
[64 − 68[66 10
a) ¿Cuánto tiene como ingreso máximo el 32% de los supervisores?
b) ¿Cuánto tiene como ingreso mínimo el 25% de los supervisores?
5. Dada la tabla siguiente, referente a los pesos de cierto número de pacientes de un hospital:
Pesos ni
[0 − 12[5
24
[12 − 24[
18
[24 − 36[
36
[36 − 48[
17
[48 − 60[
10
[60 − 72[
a) Calcule media, mediana y moda de los pesos.
b) Calcule: Cuartil 1, 2 y 3. (Compare el cuartil 2 con la mediana). Comente.
c) Calcule: Percentil 28 y 50. (Compare el percentil 50 con la mediana). Comente.
d) ¿Cuánto pesa como máximo el 19% de pacientes?
e) ¿Cuánto pesa como mínimo el 42% de pacientes?
f) Calcule el rango intercuartil (RIC). Interprete.
Video de Apoyo
Video 1: Cuartiles introducción | Qué son y como encontrarlos en datos sin agrupar
(https://www.youtube.com/watch?v=suSz9RXFNTs)
100
Gestión Curricular
Asignatura: Estadística general
Semana 12
EVALUACIÓN DE LA TERCERA UNIDAD
SESIÓN 23: PRUEBA DE DESARROLLO
Problemas de repaso
1. La tabla siguiente muestra los nombres de los 42 presidentes de Estados Unidos, junto con
el número de sus hijos.2
Washington 0 Hayes 8 F.D. Roosevelt 6
Van Buren 4 J.Q. Adams 4 Carter 4
Buchanan 0 Fillmore* 2 T. Roosevelt* 6
Adams 5 Garfi eld 7 Truman 1
W.H. Harrison 10 Jackson 0 Taft 3
Lincoln 4 Pierce 3 Eisenhower 2
Jefferson 6 Arthur 3 G.H Reagan* 4
Tyler* 15 Cleveland 5 .W. Bush 6
A. Johnson 5 Coolidge 2 Wilson* 3
Madison 0 Nixon 2 Kennedy 3
Polk 0 B. Harrison* 3 Clinton 1
Grant 4 Hoover 2 Harding 0
Monroe 2 Ford 4 L.B. Johnson 2
Taylor 6 McKinley 2 G.W. Bush 2
*Casado dos veces
Fuente: Time Almanac 2007
2. El número de pases completados por Brett Favre, mariscal de campo de los Empacadores
de Green Bay, se registró en cada uno de los 16 juegos regulares de la temporada de
verano de 2006 (www.espn.com)9.
15 31 25 22 22 19 17 28 24 5 22 24 22
20 26 21
101
Gestión Curricular
Asignatura: Estadística general
3. Los científicos del medio ambiente están cada vez más preocupados por la acumulación
de elementos tóxicos en mamíferos marinos, así como en el paso de esos elementos a los
descendientes de esos animales. El delfín de franjas (Stenella coeruleoalba), considerado
el principal depredador en la cadena alimenticia marina, fue objeto de este estudio. Las
concentraciones de mercurio (microgramos/gramo) en los hígados de 28 delfi nes de
franjas machos fueron como sigue:
4. Los pesos (en libras) de los 27 paquetes de carne molida de res del ejercicio 2.24 (véase el
conjunto de datos EX0224) aparecen a continuación, en orden de menor a mayor:
102
Gestión Curricular
Asignatura: Estadística general
Unidad IV
ORGANIZACIÓN DE APRENDIZAJES
103
Gestión Curricular
Asignatura: Estadística general
Semana 13
PROBABILIDADES FUNDAMENTOS
Andréi
Nikoláyevich
Kolmogórov
B. efectos
psicologicos
C. Euclides
104
Gestión Curricular
Asignatura: Estadística general
TEORÍA DE LA PROBABILIDAD
Blaise Pascal hacia un viaje con el apasionado jugador de dados y cartas, conocido como
El Caballero de Mere, quien era noble e ilustrado. Este creía que había encontrado una
falsedad en los números al analizar el comportamiento de los dados, era diferente cuando
se utilizaba un dado, que cuando se utilizaban dos dados. Esta presunción era una
comparación errónea, entre las probabilidades de sacar un seis en un solo dado o de sacar
un seis con dos dados.
PROBLEMA PLANTEADO CON DIFERENTES JUEGOS DE AZAR Lo planteado por Mere a Pascal
dieron origen a una correspondencia entre pascal y algunos de sus amigos matemáticos
entre ellos PIERRE DE FERMAT abogado de profesión pero amantes de las matemáticas.
105
Gestión Curricular
Asignatura: Estadística general
PROBABILIDADES
Propósito:
Identificar los elementos de los experimentos aleatorios.
Calcular e interpretar la probabilidad de la ocurrencia de eventos aleatorios.
1. FUNDAMENTOS.
Si el único propósito del investigador fuese describir los resultados de un experimento o fenómeno
concreto, los métodos analizados en Estadística Descriptiva pueden considerarse suficientes.
Pero si lo que se pretende es utilizar la información obtenida para extraer conclusiones generales
sobre todos aquellos objetos del tipo de los que han sido estudiados, entonces estos métodos
constituyen sólo el principio del análisis, y debe recurrirse a métodos de inferencia estadística, los
cuales implican el uso inteligente de la teoría de la probabilidad.
Utilizando la teoría de la probabilidad podremos sacar conclusiones precisas acerca de una
población en base a una muestra extraída de ella, y que muchos de los estudios estadísticos son
de hecho, estudio de las propiedades de una o más variables estadísticas.
En muchas oportunidades nos hemos encontrado con afirmaciones donde no existe 100% de
certeza sobre la aparición o realización de un hecho o fenómeno.
Por ejemplo, continuamente escuchamos situaciones como las siguientes:
Dados los niveles de inflación en los últimos meses en el país, es probable que el próximo año
la economía alcance niveles de hiperinflación.
Debido a la agresiva campaña publicitaria sobre el programa de vacunación para este
año, es probable que aumente sustancialmente el número de niños vacunados.
Dada la reducción continua de los ingresos reales y el aumento del desempleo en la
población, es probable que en los próximos meses se desate una serie de conflictos sociales.
En estos ejemplos se puede apreciar que el resultado final no se conoce con exactitud o certeza,
existe por lo tanto Inseguridad.
Así “se vive en un mundo donde se está en incapacidad de predecir el futuro con completa
certeza. La necesidad de tener suficiente poder para manejar la inseguridad obliga a estudiar y
usar la teoría de la probabilidad”.
La probabilidad, por lo tanto, nos proporciona la base para el estudio de la inferencia estadística.
Aquí estudiaremos conceptos y técnicas de probabilidad, que nos permitan comprender el
análisis estadístico inferencial.
106
Gestión Curricular
Asignatura: Estadística general
107
Gestión Curricular
Asignatura: Estadística general
En general:
Todos los juegos al azar constituyen experimentos aleatorios: Rifas, dados, carreras de
caballos, loterías, barajas, etc.
Los trabajos de investigación constituyen también experimentos aleatorios, ya que antes
de ejecutarlos, no se sabe si las hipótesis planteadas serán probadas o desaprobadas.
108
Gestión Curricular
Asignatura: Estadística general
El espacio muestral se representa como una secuencia de las letras s y n. Dado que el
experimento termina cuando una bolsa de leche no cumple con las especificaciones de
volumen, el espacio muestral estará formado por una secuencia de “s” seguida por una
“n”.
S = {n, sn, ssn, sssn, ssssn, sssssn,...}
d. SUCESOS O EVENTOS.
Suceso aleatorio es un acontecimiento que ocurrirá o no, dependiendo del azar.
Además, un suceso aleatorio es cualquier subconjunto del espacio muestral y se denota
con las letras mayúsculas A, B, C, etc.
Ejemplos 1:
Sea el experimento aleatorio:
“Selección de un alumno de acuerdo a su rendimiento académico
El espacio muestral será:
𝐸𝑀 = {𝑆𝑂𝐵𝑅𝐸𝑆𝐴𝐿𝐼𝐸𝑁𝑇𝐸, 𝐵𝑈𝐸𝑁𝑂, 𝑅𝐸𝐺𝑈𝐿𝐴𝑅, 𝑀𝐴𝐿𝑂}
Podemos observar que cada resultado es un subconjunto del espacio muestral, por lo
tanto, cada uno de ellos es un evento. Si denotamos por A, B, C, D los eventos; entonces
tendremos:
𝐸𝑣𝑒𝑛𝑡𝑜 𝐴 = {𝑆𝑂𝐵𝑅𝐸𝑆𝐴𝐿𝐼𝐸𝑁𝑇𝐸}
𝐸𝑣𝑒𝑛𝑡𝑜 𝐵 = {𝐵𝑈𝐸𝑁𝑂}
𝐸𝑣𝑒𝑛𝑡𝑜 𝐶 = {𝑅𝐸𝐺𝑈𝐿𝐴𝑅}
𝐸𝑣𝑒𝑛𝑡𝑜 𝐷 = {𝑀𝐴𝐿𝑂}
Ejemplos 2:
Un experimento aleatorio sería el lanzamiento de un dado, siendo su espacio muestral:
𝛀 = {𝟏; 𝟐; 𝟑; 𝟒; 𝟓; 𝟔}
Pudiéndose dar infinidad de procesos aleatorios, tales como:
𝐴: 𝑜𝑏𝑡𝑒𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑢𝑛 𝑛ú𝑚𝑒𝑟𝑜 𝑝𝑎𝑟 𝑒𝑛 𝑒𝑙 𝑙𝑎𝑛𝑧𝑎𝑚𝑖𝑛𝑒𝑡𝑜 𝑑𝑒 𝑢𝑛 𝑑𝑎𝑑𝑜
𝐴 = {2; 4; 6} ⟹ 𝐴 ⊂ 𝛀
𝐵: 𝑜𝑏𝑡𝑒𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑢𝑛 𝑛ú𝑚𝑒𝑟𝑜 𝑚𝑒𝑛𝑜𝑟 𝑞𝑢𝑒 3 𝑒𝑛 𝑒𝑙 𝑙𝑎𝑛𝑧𝑎𝑚𝑖𝑛𝑒𝑡𝑜 𝑑𝑒 𝑢𝑛 𝑑𝑎𝑑𝑜
𝐵 = {1; 2} ⟹ 𝐵 ⊂ 𝛀
Ejemplos 3:
Otro experimento aleatorio sería el lanzamiento de dos monedas, siendo su
espacio muestral:
𝐄 = {𝒄𝒄; 𝒄𝒔; 𝒔𝒄; 𝒔𝒔}
Siendo algunos de los procesos aleatorios:
𝐴: 𝑜𝑏𝑡𝑒𝑛𝑐𝑖ó𝑛 𝑑𝑜𝑠 𝑠𝑒𝑙𝑙𝑜𝑠 𝑒𝑛 𝑒𝑙 𝑙𝑎𝑛𝑧𝑎𝑚𝑖𝑛𝑒𝑡𝑜 𝑑𝑒 𝑑𝑜𝑠 𝑚𝑜𝑛𝑒𝑑𝑎𝑠
𝐴 = {𝑠𝑠} ⟹ 𝐴 ⊂ 𝐄
𝐵: 𝑜𝑏𝑡𝑒𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑒𝑥𝑎𝑐𝑡𝑎𝑚𝑒𝑛𝑡𝑒 𝑢𝑛 𝑠𝑒𝑙𝑙𝑜 𝑒𝑛 𝑒𝑙 𝑙𝑎𝑛𝑧𝑎𝑚𝑖𝑛𝑒𝑡𝑜 𝑑𝑒 𝑑𝑜𝑠 𝑚𝑜𝑛𝑒𝑑𝑎𝑠
𝐵 = {𝑠𝑐; 𝑐𝑠} ⟹ 𝐵 ⊂ 𝐄
109
Gestión Curricular
Asignatura: Estadística general
110
Gestión Curricular
Asignatura: Estadística general
EVENTOS INDEPENDIENTES.
Dos eventos son independientes si ambos no tienen ninguna relación entre sí; es decir,
si la ocurrencia de uno de ellos, no incluyen en la ocurrencia del otro.
Ejemplo:
Sean los eventos:
𝑋 = 𝑃𝑟𝑖𝑚𝑒𝑟 𝑎𝑙𝑢𝑚𝑛𝑜 𝑞𝑢𝑒 𝑎𝑝𝑟𝑢𝑒𝑏𝑒 𝑒𝑙 𝑒𝑥𝑎𝑚𝑒𝑛 𝑑𝑒 𝑒𝑠𝑡𝑎𝑑𝑖𝑠𝑡𝑖𝑐𝑎
𝑌 = 𝑆𝑒𝑔𝑢𝑛𝑑𝑜 𝑎𝑙𝑢𝑚𝑛𝑜 𝑞𝑢𝑒 𝑎𝑝𝑟𝑢𝑒𝑏𝑒 𝑒𝑙 𝑒𝑥𝑎𝑚𝑒𝑛 𝑑𝑒 𝑒𝑠𝑡𝑎𝑑𝑖𝑠𝑡𝑖𝑐𝑎
X e Y son independientes porque al ocurrir el evento X, éste no incluye para que el
evento Y ocurra.
3. CONCEPTO DE PROBABILIDAD.
La probabilidad es una disciplina abstracta que se usa como modelo para hacer
deducciones relativas a eventos que posiblemente pueden ocurrir.
4. TIPOS DE PROBABILIDAD.
Existen tres enfoques para el estudio de la probabilidad:
a. Probabilidad clásica.
Llamada también probabilidad a priori debido a que es posible conocer el resultado con
anterioridad, es decir, sin llevar acabo el experimento y sólo basado en un razonamiento
lógico.
Generalmente esta probabilidad se usa para experimentos simples.
Se calcula a través de:
𝑪𝒂𝒔𝒐𝒔 𝒇𝒂𝒗𝒐𝒓𝒂𝒃𝒍𝒆𝒔 𝒅𝒆 𝑶𝒄𝒖𝒓𝒓𝒆𝒏𝒄𝒊𝒂 𝒅𝒆𝒍 𝑬𝒗𝒆𝒏𝒕𝒐 𝑨
𝒑(𝑨) =
𝑻𝒐𝒕𝒂𝒍 𝒅𝒆 𝑪𝒂𝒔𝒐𝒔 𝑷𝒐𝒔𝒊𝒃𝒍𝒆𝒔
Ejemplo 1:
Hallar la probabilidad de obtener cara en el lanzamiento de una moneda.
Solución
Definimos el espacio muestral:
𝐸𝑀 = {𝑐𝑎𝑟𝑎, 𝑠𝑒𝑙𝑙𝑜}
Sea el evento:
𝐴 = 𝑂𝑏𝑡𝑒𝑛𝑒𝑟 𝑐𝑎𝑟𝑎
Luego:
𝐶𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑑𝑒 𝑂𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝐸𝑣𝑒𝑛𝑡𝑜 𝐴 1
𝑝(𝐴) = =
𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 2
111
Gestión Curricular
Asignatura: Estadística general
Ejemplo 2:
Hallar la probabilidad de obtener el número 2 en el lanzamiento de un dado.
Solución
Definimos el espacio muestral:
𝐸𝑀 = {1,2,3,4,5,6}
Sea el evento:
𝐵 = 𝑂𝑏𝑡𝑒𝑛𝑒𝑟 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 2
Luego:
𝐶𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑑 𝑂𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝐸𝑣𝑒𝑛𝑡𝑜 𝐴 1
𝑝(𝐵) = =
𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 6
c. Probabilidad Subjetiva.
Es la probabilidad asignada bajo un criterio “personal”; basándose en cualquier tipo de
evidencia disponible.
112
Gestión Curricular
Asignatura: Estadística general
Estas probabilidades se asignan a eventos que puedan suceder sólo una vez o muy pocas
veces.
Ejemplos:
La probabilidad de que el hombre llegue a habitar la luna en los próximos 20 años.
La probabilidad de que se encuentre una cura para el sida en los próximos 5 años.
Se puede decir que, dado un experimento determinado la probabilidad subjetiva de un
evento “A” es el grado de creencia asignado a la ocurrencia de este evento por un
individuo basado en toda la evidencia a su disposición con las siguientes exigencias:
a) 𝑃(𝐴) = 0 Representa que A no ocurrirá.
b) 𝑃(𝐴) = 1 Representa que A si ocurrirá.
c) 0 < 𝑃(𝐴) < 1 Representa el grado de certeza de que el evento “A” ocurrirá.
113
Gestión Curricular
Asignatura: Estadística general
Problemas Desarrollados
2. Teniendo en cuenta los resultados del espacio muestral, en el ejercicio anterior, hallar las
siguientes probabilidades:
a) Que el nacimiento sea del sexo femenino.
b) Que un menor de edad padezca de desnutrición leve.
c) Que gane Perú en el partido de vóley.
d) Que el producto “x” tenga demanda elástica.
Solución
Utilizaremos para el cálculo de probabilidad de cada uno de ellos, la probabilidad clásica
cuya fórmula es:
𝑪𝒂𝒔𝒐𝒔 𝒇𝒂𝒗𝒐𝒓𝒂𝒃𝒍𝒆𝒔 𝒅𝒆 𝑶𝒄𝒖𝒓𝒓𝒆𝒏𝒄𝒊𝒂 𝒅𝒆𝒍 𝑬𝒗𝒆𝒏𝒕𝒐 𝑨
𝒑(𝑨) =
𝑻𝒐𝒕𝒂𝒍 𝒅𝒆 𝑪𝒂𝒔𝒐𝒔 𝑷𝒐𝒔𝒊𝒃𝒍𝒆𝒔
a) Sea el evento: 𝐹 = 𝑛𝑎𝑐𝑖𝑚𝑖𝑒𝑛𝑡𝑜 𝑑𝑒𝑙 𝑠𝑒𝑥𝑜 𝑓𝑒𝑚𝑒𝑛𝑖𝑛𝑜
1
Luego: 𝑝(𝐹) = = 0.5 = 50%
2
114
Gestión Curricular
Asignatura: Estadística general
3. Un experimento genera un espacio muestral que contiene ocho sucesos (E1, E2,……,E8) con
1
la 𝑝(𝐸1 ) = , i = 1,2,3,…..,8. Los sucesos A y B se definen así:
8
𝐴 = {𝐸1 , 𝐸4 , 𝐸6 }
𝐵 = {𝐸3 , 𝐸4 , 𝐸5 , 𝐸6 , 𝐸7 }
Encuentre: p(A), p(Al), p(AUB)
Solución
Graficando:
3
a) 𝑝(𝐴) = = 0.38 = 38%
8
5
b) 𝑝(𝐴𝑙 ) = = 0.63 = 63%
8
6
c) 𝑝(𝐴 ∪ 𝐵) = 𝑝(𝐴) + 𝑝(𝐵) − 𝑝(𝐴 ∩ 𝐵) = 𝑐 = = 0.75 = 75%
8
Problemas Propuestos
115
Gestión Curricular
Asignatura: Estadística general
4. En una muestra aleatoria de 120 pacientes, se encontró que 30 de ellos tienen cáncer. ¿cuál
es la probabilidad de que un paciente elegido al azar tenga cáncer?
5. En la empresa Scotiabank, se tiene una muestra de cuatro hipotecas para vivienda está
clasificada como de tasa Fija (F) o tasa Variable (V).
a) ¿Cuáles resultados están en el evento de que exactamente tres de las hipotecas
seleccionadas sea de tasa variable?
b) ¿Cuáles resultados están en el evento de que las cuatro hipotecas sean del mismo tipo?
c) ¿Cuáles resultados están en el evento de que a lo sumo una de las cuatro hipotecas
sea de tasa Variable?
Video de Apoyo
116
Gestión Curricular
Asignatura: Estadística general
Semana 14
DISTRIBUCIÓN DE PROBABILIDAD DISCRETA
En teoría de la probabilidad y estadística, la distribución
Siméon
Denis
Poisson
Matemático
y científico
suizo
Johann
Bernoulli
117
Gestión Curricular
Asignatura: Estadística general
Poisson nació en Pithiviers, Loiret, hijo de Siméon Poisson. Su padre sirvió como
LECTURA
soldado raso en las guerras de Hanover, pero disgustado por el trato abusivo que
recibió de los oficiales nobles, desertó. Cuando nació su hijo, ocupaba diversos
cargos administrativos, y al parecer estuvo a la cabeza del gobierno local durante
el período revolucionario.
«Petit Poisson deviendra grand // Pourvu que Dieu lui prête vie.»
118
Gestión Curricular
Asignatura: Estadística general
DISTRIBUCIÓN
BINOMIAL, POISSON
Propósito:
Explica y diferencia las principales distribuciones de probabilidad para variables
aleatorias discretas.
Aplica e interpreta las distribuciones de probabilidades para variables aleatorias
discretas en el desarrollo de prácticas y ejercicios.
1. DISTRIBUCIÓN BINOMIAL.
Una distribución de probabilidad binomial resulta de un procedimiento que cumple con todos
los siguientes requisitos:
El procedimiento tiene un número fijo de ensayos.
Los ensayos deben ser independientes. (El resultado de cualquier ensayo individual no
afecta las probabilidades de los demás ensayos).
Todos los resultados de cada ensayo deben estar clasificados en dos categorías
(generalmente llamadas éxito y fracaso).
La probabilidad de un éxito permanece igual en todos los ensayos.
El desarrollo de este tema, implica comprender previamente los siguientes conceptos:
a) Notación factorial.
Se utiliza para representar las operaciones de multiplicación secuencial.
Su desarrollo significa el producto ordenado de los números enteros positivos, desde el
que indica el signo factorial, hasta llegar a 1.
Ejemplo:
Tres factorial 3! = 3𝑥2𝑥1 = 6
Cinco factorial 5! = 5𝑥4𝑥3𝑥2𝑥1 = 120
. .
. .
N factorial 𝑁! = (𝑁)(𝑁 − 1)(𝑁 − 2) … . 𝑥2𝑥1
Por definición:
0! = 1
1! = 1
b) Combinaciones.
Es un método que nos permite agrupar un conjunto de elementos en diferentes
formas sin considerar el orden de colocación.
𝒏 𝒏!
𝑪 =
𝒙 𝒙! (𝒏 − 𝒙)!
119
Gestión Curricular
Asignatura: Estadística general
Ejemplo:
De un equipo multidisciplinario, formado por un economista, un sociólogo, un
antropólogo. ¿Cuántos comités de dos profesionales pueden formarse?
Solución
Según datos:
n = 3, x = 2
Luego la cantidad de comités a formarse, serían:
3 3! 3𝑥2𝑥1 6
𝐶 = = = =3
2 2! (3 − 2)! (2𝑥1)(1)! 2
Se pueden formar 3 comités, que serían:
Primer comité : Economista, Sociólogo.
Segundo comité : Sociólogo, Antropólogo.
Tercer comité : Economista, Antropólogo.
c) Cálculo de probabilidades mediante la distribución binomial.
La distribución binomial se utiliza para calcular probabilidades de variables discretas.
Se aplica en aquellos experimentos aleatorios que tienen sólo dos resultados mutuamente
excluyentes.
Ejemplos:
EXPERIMENTO ALEATORIO RESULTADOS POSIBLES
1) Lanzamiento de una moneda al aire. Cara o sello
2) Nacimiento de un ser humano con varón o mujer
respecto al sexo.
3) Estado de salud de una persona. Sano o enfermo
4) Situación ocupacional de una persona. Ocupado o desocupado
120
Gestión Curricular
Asignatura: Estadística general
Es decir:
RESULTADOS PROBABILIDAD
ÉXITO p PROBABILIDAD DE ÉXITO
FRACASO q PROBABILIDAD DE
FRACASO
Dónde: p+q=1
Si E y F (éxito y fracaso) denotan las dos categorías posibles de todos los resultados.
Entonces:
Ejemplo:
Supongamos que en la comunidad “x”, hemos encontrado a través de una muestra, que
el 30% de la población en edad activa, se encuentran desempleados y el 70% tenía
empleo.
En este experimento esperamos como éxito que la población tenga empleo, y como
fracaso que la población esté desempleada, por lo tanto:
EVENTOS RESULTADOS PROBABILIDAD
Empleados Éxito p = 0.70
Desempleados Fracaso q = 0.30
Total p + q = 1.00
Podemos decir entonces: Si seleccionamos una persona al azar de esta población, la
probabilidad de que se encuentre con empleo es de 0.70, y de que se halle desempleado
es de 0.30.
Pero si seleccionamos dos personas al azar de esta población, una después de otra,
según el orden de extracción podemos obtener:
Personas seleccionadas:
PRIMERA SEGUNDA
Ocupada Ocupada
Ocupada Desocupada
Desocupada Ocupada
Desocupada Desocupada
121
Gestión Curricular
Asignatura: Estadística general
APARICIÓN DEL
PROBABILIDAD DEL RESULTADO
RESULTADO
PRIMER SEGUNDA
LITERAL SIMBÓLICA NÚMERICA
SELECCIÓN SELECCIÓN
Ocupado Probabilidad que las
Ocupado dos personas estén 𝑝. 𝑝 = 𝑝2 (0.70)(0.70) = 0.49
ocupadas
Ocupado Probabilidad que la
1ª persona esté
Desocupado 𝑝. 𝑞 (0.70)(0.30) = 0.21
ocupada y la 2ª
desocupada
Desocupado Probabilidad que la
1ª persona este
Ocupado 𝑞. 𝑝 (0.30)(0.70) = 0.21
desocupada y la 2ª
ocupada
Desocupado Probabilidad de que
Desocupado las dos personas 𝑞. 𝑞 = 𝑞 2 (0.30)(0.30) = 0.09
estén desocupadas
Al sumar la probabilidad simbólica y numérica, observamos que se trata de una expansión
binomial, así:
SIMBÓLICA: 𝒑𝟐 + 𝒑𝒒 + 𝒒𝒑 + 𝒒𝟐 = 𝒑𝟐 + 𝟐𝒑𝒒 + 𝒒𝟐 = (𝒑 + 𝒒)𝟐
NÚMERICA: 0.49 + 0.21 + 0.21 + 0.09
= 0.49 + 2(0.21) + 0.09 = (0.70 + 0.30)2
Expansión binomial Binomio
El binomio esta elevado al exponente 2, porque se trata de 2 ensayos o 2 selecciones.
Esto quiere decir que, si el número de ensayos o selecciones se incrementan, el exponente
será mayor.
Por ejemplo, si seleccionamos 5 personas al azar, entonces tendríamos:
(𝑝 + 𝑞)5 = (0.70 + 0.30)5
Y si quisiéramos hallar la probabilidad de que las 5 personas estén ocupadas, sería sumamente
laborioso desarrollar la expansión binomial.
Para ello existe una fórmula que nos ayuda a simplificar cualquier valor específico de
probabilidad.
122
Gestión Curricular
Asignatura: Estadística general
Ejemplo:
Supongamos en la comunidad “x”, donde a través de una muestra se encontró que el
30% de la población en edad activa estaba desempleada. Calcular la probabilidad
de seleccionar dos personas ocupadas en esta población.
Solución
Según datos del problema:
n=2 entonces p = 0.70
x=2 personas ocupadas q = 0.30
Aplicando la fórmula:
𝒏!
𝒑(𝒙) = . 𝒑𝒙 𝒒(𝒏−𝒙)
𝒙! (𝒏 − 𝒙)!
𝟐!
𝒑(𝒙 = 𝟐) = . (𝟎. 𝟕𝟎)𝟐 (𝟎. 𝟑𝟎)(𝟐−𝟐) = (𝟎. 𝟒𝟗)(𝟎. 𝟑𝟎)𝟎
𝟐! (𝟐 − 𝟐)!
𝒑(𝒙 = 𝟐) = 𝟎. 𝟒𝟗
La probabilidad de seleccionar dos personas ocupadas de esta población, es de 49%.
(coincide con el resultado de la tabla anterior).
𝝁 = 𝒏. 𝒑 𝝈𝟐 = 𝒏. 𝒑. 𝒒 𝝈 = √𝒏. 𝒑. 𝒒
2. DISTRIBUCIÓN POISSON.
Una distribución de probabilidad Poisson resulta de un procedimiento que cumple con todos
los siguientes requisitos:
El experimento consiste en contar el número “x” de veces que ocurre un evento en
particular durante una unidad de tiempo dada, o en un área o volumen dado.
La probabilidad de que un evento ocurra en una unidad dada de tiempo, área o volumen
es la misma para todas las unidades.
El número de eventos que ocurren en una unidad de tiempo, área o volumen es
independiente del número de los que ocurren en otras unidades.
El número medio (o esperado) de eventos en cada unidad se denota por la letra griega
(“lambda”) (𝝀)
2.1. Introducción.
La distribución de Poisson se usa para modelar situaciones en la que el número de pruebas
es muy grande y el número de éxitos es muy pequeño, situaciones en las que hay
ocurrencias aleatorias de sucesos por unidad de espacio o tiempo, y en donde se desea
conocer la probabilidad de un número específico de éxitos.
123
Gestión Curricular
Asignatura: Estadística general
El intervalo de tiempo dado puede ser de cualquier duración, por ejemplo, un minuto, un
día, una semana, etc. Así la variable aleatoria x puede representar el número de llamadas
telefónicas por hora, el número de pacientes fallecidos en un día determinado. El espacio
podría ser un segmento de línea, un área o volumen, un pedazo de material. Así, x podría
representar el número de bacterias en un determinado campo de cultivo.
2.2. El proceso de Poisson.
Las siguientes proposiciones describen lo que se conoce como proceso de Poisson:
a) Las ocurrencias de los eventos son independientes.
b) Teóricamente, debe ser posible un número infinito de ocurrencias del evento en el
intervalo.
c) La probabilidad de una ocurrencia del evento en un intervalo dado es proporcional
a la longitud del intervalo.
La distribución de probabilidad de Poisson está dada por:
𝒆−𝝀 . 𝝀𝒙
𝒑(𝒙) =
𝒙!
𝒙 = 𝟎, 𝟏, 𝟐, …
Donde:
𝒙 = número de ocurrencias cuya probabilidad se desea conocer.
𝒆 =constante matemática = 2,71828.
𝝀 =número promedio de ocurrencias por unidad de tiempo o espacio.
𝝁=𝝀 𝝈𝟐 = 𝝀
Ejemplo:
La oficina de estadística del hospital ESSALUD ha estudiado el número de muertes debido
a una cierta enfermedad y ha llegado a la conclusión de que éstas están distribuidas de
acuerdo con la ley de Poisson. Los registros del hospital revelan que, durante este período,
el número de muertes ha sido en promedio, de 3 por día. Si dicha oficina está en lo cierto,
al suponer una distribución de Poisson, hallar la probabilidad de que:
a) En un día dado, mueran exactamente 2 pacientes con esa enfermedad.
b) En un día particular, nadie muera de la enfermedad.
c) En un día particular, mueran 3 ó 4 pacientes.
Solución
Sea:
𝒙 = el número de pacientes fallecidos debido a la enfermedad
𝝀 = número promedio de muertes = 3 por día
a) En un día dado, mueran exactamente 2 pacientes con esa enfermedad.
124
Gestión Curricular
Asignatura: Estadística general
𝑒 −3 . 32 0,05𝑥9
𝑝(x = 2) = = = 0,225
2! 2𝑥1
La probabilidad de que mueran 2 pacientes es de 22,5%
b) En un día particular, nadie muera de la enfermedad.
𝑒 −3 . 30 0,05𝑥1
𝑝(x = 0) = = = 0,05
0! 1
La probabilidad de que nadie muera es del 5%
c) En un día particular, mueran 3 ó 4 pacientes.
𝑒 −3 .33 𝑒 −3 .34 0,05𝑥27 0,05𝑥81
𝑝(x = 3) + p(x = 4) = + = + = 0,225 + 0,16875 = 0,39
3! 4! 3𝑥2𝑥1 4𝑥3𝑥2𝑥1
Problemas Desarrollados
Distribución binomial
125
Gestión Curricular
Asignatura: Estadística general
Solución
Remplazando los datos en la fórmula
𝑛 𝑛!
𝑝(𝑥) = 𝐶 𝑝 𝑥 𝑞 (𝑛−𝑥) = . 𝑝 𝑥 𝑞 (𝑛−𝑥)
𝑥 𝑥! (𝑛 − 𝑥)!
6 6!
𝑝(4) = 𝐶 . (0,20)4 . (0,80)(6−4) = . (0,20)4 . (0,80)(6−4)
4 4! (6 − 4)!
𝑝(4) = 0,0154 = 1.54%
3. Suponiendo que la probabilidad de que un automovilista respete la luz verde es de 0.75,
utilice la fórmula de probabilidad binomial para calcular la probabilidad de obtener
exactamente 3 automovilistas que respeten la luz verde cuando va a cambiar de luz 5
segundos antes.
Solución
Calculamos, p(3) dado que n = 5
Si: x = 3 p = 0.75 q = 0.25
Remplazando en la fórmula:
𝑛!
𝒑(𝒙) = . 𝑝 𝑥 𝑞 (𝑛−𝑥)
𝑥! (𝑛 − 𝑥)!
5! 5𝑥4𝑥3!
𝑝(3) = . (0.75)3 (0.25)(5−3) = . (0.75)3 (0.25)(2) = 10. (0.42)(0.06)
3! (5 − 3)! 3! (2)!
𝑝(3) = (10)(0.025) = 0.25 = 25%
Los 3 automovilistas que respeten la luz verde cuando va a cambiar de luz 5 segundos
antes representa un 25%.
Distribución de Poisson.
Número de eventos
3 personas en 10 minutos 3 personas en 10 minutos
esperados (x)
12 personas 60 minutos
n 2 personas
n 10 minutos
Utilizando la fórmula:
𝒆−𝝀 . 𝝀𝒙
𝒑(𝒙) =
𝒙!
𝒆−𝟓 . 𝟓𝟑
𝒑(𝟑) = = 𝟎, 𝟏𝟒𝟎𝟒 = 𝟏𝟒. 𝟎𝟒%
𝟑!
126
Gestión Curricular
Asignatura: Estadística general
Problemas Propuestos
Distribución binomial
1. Utilice la fórmula de probabilidad binomial para calcular la probabilidad de x éxitos, dada la
probabilidad p de éxito en un solo ensayo.
a) 𝑛 = 20, 𝑥 = 4, 𝑝 = 0.15
b) 𝑛 = 9, 𝑥 = 2, 𝑝 = 0.35
Distribución de Poisson
1. La central telefónica de una empresa recibe un promedio de 3,5 órdenes de pedido por hora.
Estas ocurrencias se producen al azar. ¿Cuál es la probabilidad de que se produzcan
exactamente 4 llamadas en una hora dada?
2. Se sabe que el número promedio de camiones-tanque de aceite que llegan por día al puerto
del Callao, es 10. las instalaciones del puerto pueden atender cuándo más a 15 camiones-
tanque en un día. ¿Cuál es la probabilidad de que en un determinado día se tengan que
regresar los camiones?
3. El número promedio de Buses que llegan cada día al Terminal Terrestre de Huancayo es 11.
Las facilidades que tiene el Terminal hace a que pueden manejar hasta 22 buses por día.
127
Gestión Curricular
Asignatura: Estadística general
¿Cuál es la probabilidad de que en un día dado se tenga que rechazar el ingreso de buses al
Terminal Terrestre de Huancayo?
4. En Caja Centro se analiza la cantidad de clientes que se atiende en las ventanillas, se obtuvo
que la cantidad de clientes promedio que se atiende en esta institución financiera en un lapso
de 30 minutos es de 10 clientes. ¿Cuál es la probabilidad de que se atiendan a 7 clientes en
20 minutos?
Video de Apoyo
128
Gestión Curricular
Asignatura: Estadística general
Semana 15
DISTRIBUCIÓN NORMAL
Abraham de
Moivre
Distribución
gaussiana
en música
Lannis
Xenakis
A. Abraham de Moivre
La distribución normal fue presentada por primera vez por Abraham de Moivre en un
artículo del año 1733,5 que fue reimpreso en la segunda edición de su The Doctrine of
Chances, de 1738, en el contexto de cierta aproximación de la distribución binomial
para grandes valores de n. Su resultado fue ampliado por Laplace en su libro Teoría
analítica de las probabilidades (1812), y en la actualidad se llama Teorema de De
Moivre-Laplace.
129
Gestión Curricular
Asignatura: Estadística general
DISTRIBUCIÓN NORMAL
LECTURA
La distribución normal fue presentada por primera vez por Abraham de Moivre en un artículo
del año 1733,5 que fue reimpreso en la segunda edición de su The Doctrine of Chances, de
1738, en el contexto de cierta aproximación de la distribución binomial para grandes valores
de n. Su resultado fue ampliado por Laplace en su libro Teoría analítica de las probabilidades
(1812), y en la actualidad se llama Teorema de De Moivre-Laplace.
El nombre de "campana" viene de Esprit Jouffret que usó el término "bell surface" (superficie
campana) por primera vez en 1872 para una distribución normal bivariante de componentes
independientes. El nombre de "distribución normal" fue otorgado independientemente por
Charles S. Peirce, Francis Galton y Wilhelm Lexis hacia 1875.[cita requerida] A pesar de esta
terminología, otras distribuciones de probabilidad podrían ser más apropiadas en
determinados contextos; véase la discusión sobre incidencia,
130
Gestión Curricular
Asignatura: Estadística general
DISTRIBUCIÓN
NORMAL
Propósito:
Identifica el tipo de variable aleatoria y construye la distribución de la función de
probabilidad.
1. Introducción.
Si se tiene una muestra grande de valores que corresponden a variables continuas, como por
ejemplo el peso en kg de 44 recién nacidos en un hospital, para el análisis de la información
se procedería a tabularlos a través de una distribución de frecuencias y su gráfico
correspondiente, el histograma, tal como se muestra a continuación:
HOSPITAL “X”
Distribución de frecuencias de recién nacidos por peso
Peso (en Frecuencia
kg) (cantidad)
1.00 – 1.99 4
2.00 – 2.99 10
3.00 – 3.99 20
4.00 – 4.99 8
5.00 – 5.99 2
Total 44
Histograma de la distribución de frecuencias de recién nacidos por peso.
Analizando los datos en el histograma, observamos que, con respecto al peso de los recién
nacidos, existen:
a) Pocos niños con bajo peso al nacer (4 niños tienen entre 1 y 2 kg de peso)
b) La mayoría de recién nacidos, tienen peso medio (20 niños tienen entre 3 y 4 kg de peso)
c) Pocos niños tienen sobrepeso al nacer (2 niños tienen entre 5 kg y 6 kg de peso)
Esta distribución de datos se llama “NORMAL” y se presenta en múltiples mediciones de la vida
real.
131
Gestión Curricular
Asignatura: Estadística general
Si unimos, mediante una curva los puntos medios de cada rectángulo en el histograma, se
obtiene el siguiente gráfico.
2. Definición.
La distribución normal es una de las distribuciones más utilizadas, que permiten calcular
probabilidades para variables continuas.
Muchas poblaciones tienen distribución normal o pueden ajustarse muy bien a ella.
132
Gestión Curricular
Asignatura: Estadística general
Ejemplos:
Estatura, peso y otras características físicas.
Errores de medición en experimentos científicos
Tiempos de reacción en experimentos psicológicos
Mediciones de inteligencia y aptitud.
Calificaciones en diversas pruebas.
Muchas medidas e indicadores económicos.
𝝁𝟏 𝝁𝟐 𝝁𝟑
Observamos en este gráfico que las 3 curvas normales tienen idéntica dispersión, pero distintas
medias.
𝝁𝟏
𝝁𝟐
𝝁𝟑
Observamos en este gráfico que las 3 curvas normales tienen distintas dispersión, pero igual
medias.
Esto significa que cada curva normal tiene su propia distribución, lo que hace imposible el
cálculo de probabilidades. Por lo tanto, se hace necesario que la curva normal así obtenida
se trasforme en una CURVA NORMAL TIPIFICADA.
133
Gestión Curricular
Asignatura: Estadística general
𝝈
𝝈=𝟏
𝝁
𝝁=0
CURVA NORMAL CURVA NORMAL TIFICADA
134
Gestión Curricular
Asignatura: Estadística general
Es necesario que Ud. tenga en cuenta que toda el área bajo la curva normal tipificada
tiene un valor de 1 ó 100%, y cada mitad 0.50 ó 50%.
Ejemplo 1:
Determinar el área bajo la curva normal para valores de z entre:
𝑧 = 0 y 𝑧 = 1.8 (es decir 0 ≤ 𝑧 ≤ 1.8).
Solución
Construyendo el gráfico del área pedida.
Área pedida
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
. .
. .
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
Por lo tanto 0.4641 es el área pedida, o también podemos decir que la probabilidad de
que z esté comprendida entre 0 y 1.8, es:
𝑝(0 ≤ 𝑧 ≤ 1.8) = 0.4641 = 46.41%
135
Gestión Curricular
Asignatura: Estadística general
Ejemplo 2:
Los coeficientes de inteligencia (CI) de un grupo de estudiantes, tienen
aproximadamente una distribución normal, con una media de 100 y una
desviación típica de 10. Se pide:
a) Hallar la proporción de estudiantes con CI mayores que 125.
b) ¿Cuál es la probabilidad de que un estudiante elegido al azar entre los de esa
población, tenga una CI entre 105 y 115?
Solución
Sea: x = coeficiente de inteligencia.
Donde: 𝜇 = 100 𝜎 = 10
a) Se pide: 𝑝(𝑥 ≥ 125)
Graficando:
𝜎 = 10 𝜎=1
Área Pedida
𝟎. 𝟓𝟎 𝟎. 𝟒𝟗𝟑𝟖
𝝈 =10
136
Gestión Curricular
Asignatura: Estadística general
0.4332 0.1915
137
Gestión Curricular
Asignatura: Estadística general
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.000 0.0040 0.0080 0.012 0.016 0.0199 0.023 0.027 0.031 0.0359
0 0 0 9 9 9
0.1 0.039 0.0438 0.0478 0.051 0.055 0.0596 0.063 0.067 0.071 0.0753
8 7 7 6 5 4
0.2 0.079 0.0832 0.0871 0.091 0.094 0.0987 0.102 0.106 0.110 0.1141
3 0 8 6 4 3
0.3 0.117 0.1217 0.1255 0.129 0.133 0.1368 0.140 0.144 0.148 0.1517
9 3 1 6 3 0
0.4 0.155 0.1591 0.1628 0.166 0.170 0.1736 0.177 0.180 0.184 0.1879
4 4 0 2 8 4
0.5 0.191 0.1950 0.1985 0.201 0.205 0.2088 0.212 0.215 0.219 0.2224
5 9 4 3 7 0
0.6 0.225 0.2291 0.2324 0.235 0.238 0.2422 0.245 0.248 0.251 0.2549
7 7 9 4 6 7
0.7 0.258 0.2611 0.2642 0.267 0.270 0.2734 0.276 0.279 0.282 0.2852
0 3 4 4 4 3
0.8 0.288 0.2910 0.2939 0.296 0.299 0.3023 0.305 0.307 0.310 0.3133
1 7 5 1 8 6
0.9 0.315 0.3186 0.3212 0.323 0.326 0.3289 0.331 0.334 0.336 0.3389
9 8 4 5 0 5
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
1.0 0.341 0.3438 0.3461 0.348 0.350 0.3531 0.355 0.357 0.359 0.3621
3 5 8 4 7 9
1.1 0.364 0.3665 0.3686 0.370 0.372 0.3749 0.377 0.379 0.381 0.3830
3 8 9 0 0 0
1.2 0.384 0.3869 0.3888 0.390 0.392 0.3944 0.396 0.398 0.399 0.4015
9 7 5 2 0 7
1.3 0.403 0.4049 0.4066 0.408 0.409 0.4115 0.413 0.414 0.416 0.4177
2 2 9 1 7 2
1.4 0.419 0.4207 0.4222 0.423 0.425 0.4265 0.427 0.429 0.430 0.4319
2 6 1 9 2 6
1.5 0.433 0.4345 0.4357 0.437 0.438 0.4394 0.440 0.441 0.442 0.4441
2 0 2 6 8 9
1.6 0.445 0.4463 0.4474 0.448 0.449 0.4505 0.451 0.452 0.453 0.4545
2 4 5 5 5 5
1.7 0.455 0.4564 0.4573 0.458 0.459 0.4599 0.460 0.461 0.462 0.4633
4 2 1 8 6 5
1.8 0.464 0.4649 0.4656 0.466 0.467 0.4678 0.468 0.469 0.469 0.4706
1 4 1 6 3 9
1.9 0.471 0.4719 0.4726 0.473 0.473 0.4744 0.475 0.475 0.476 0.4767
3 2 8 0 6 1
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.0 0.477 0.4778 0.4783 0.478 0.479 0.4798 0.480 0.480 0.481 0.4817
2 8 3 3 8 2
2.1 0.482 0.4826 0.4830 0.483 0.483 0.4842 0.484 0.485 0.485 0.4857
1 4 8 6 0 4
2.2 0.486 0.4864 0.4868 0.487 0.487 0.4878 0.488 0.488 0.488 0.4890
1 1 5 1 4 7
2.3 0.489 0.4896 0.4898 0.490 0.490 0.4906 0.490 0.491 0.491 0.4916
3 1 4 9 1 3
138
Gestión Curricular
Asignatura: Estadística general
2.4 0.491 0.4920 0.4922 0.492 0.492 0.4929 0.493 0.493 0.493 0.4936
8 5 7 1 2 4
2.5 0.493 0.4940 0.4941 0.494 0.494 0.4946 0.494 0.494 0.495 0.4952
8 3 5 8 9 1
2.6 0.495 0.4955 0.4956 0.495 0.495 0.4960 0.496 0.496 0.496 0.4964
3 7 9 1 2 3
2.7 0.496 0.4966 0.4967 0.496 0.496 0.4970 0.497 0.497 0.497 0.4974
5 8 9 1 2 3
2.8 0.497 0.4975 0.4976 0.497 0.497 0.4978 0.497 0.497 0.498 0.4981
4 7 7 9 9 0
2.9 0.498 0.4982 0.4982 0.498 0.498 0.4984 0.498 0.498 0.498 0.4986
1 3 4 5 5 6
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
3.0 0.498 0.4987 0.4987 0.498 0.498 0.4989 0.498 0.498 0.499 0.4990
7 8 8 9 9 0
3.1 0.499 0.4991 0.4991 0.499 0.499 0.4992 0.499 0.499 0.499 0.4993
0 1 2 2 2 3
3.2 0.499 0.4993 0.4994 0.499 0.499 0.4994 0.499 0.499 0.499 0.4995
3 4 4 4 5 5
3.3 0.499 0.4995 0.4995 0.499 0.499 0.4996 0.499 0.499 0.499 0.4997
5 6 6 6 6 6
3.4 0.499 0.4997 0.4997 0.499 0.499 0.4997 0.499 0.499 0.499 0.4998
7 7 7 7 7 7
3.5 0.499 0.4998 0.4998 0.499 0.499 0.4998 0.499 0.499 0.499 0.4998
8 8 8 8 8 8
3.6 0.499 0.4998 0.4999 0.499 0.499 0.4999 0.499 0.499 0.499 0.4999
8 9 9 9 9 9
3.7 0.499 0.4999 0.4999 0.499 0.499 0.4999 0.499 0.499 0.499 0.4999
9 9 9 9 9 9
3.8 0.499 0.4999 0.4999 0.499 0.499 0.4999 0.499 0.499 0.499 0.4999
9 9 9 9 9 9
3.9 0.500 0.5000 0.5000 0.500 0.500 0.5000 0.500 0.500 0.500 0.5000
0 0 0 0 0 0
4.0 0.500 0.5000 0.5000 0.500 0.500 0.5000 0.500 0.500 0.500 0.5000
0 0 0 0 0 0
Problemas Desarrollados
1. Determinar el área bajo la curva normal para valores de z entre: z = 0 y z = -1.8 (es decir:
−1.8 ≤ 𝑧 ≤ 0
Solución
Construyendo el gráfico del área pedida.
Área pedida
139
Gestión Curricular
Asignatura: Estadística general
Como se puede observar, en la tabla no existen valores negativos de z, por lo tanto siempre
que aparezcan valores negativos de z, se obvia el signo para buscar su valor en la tabla.
El resultado en este caso es el mismo que el ejemplo anterior debido a que la curva normal
tipificada es simétrica.
𝑝(−1.8 ≤ 𝑧 ≤ 0) = 0.4641 = 46.41%
2. Determinar el área bajo la curva normal para valores a la derecha de
𝑧 = −1.15 (es decir: 𝑧 ≥ −1.15).
Solución
Construyendo el gráfico del área pedida.
Área pedida
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
. .
. .
1.1 0.3643 0.3749
Luego:
ÁREA PEDIDA = 0.3749 + 0.50 = 0.8749
ÁREA PEDIDA = 𝑝(𝑧 ≥ −1.15) = 0.8749 = 87.49%
3. Determinar el área bajo la curva normal, para valores entre z = 0.92 y z = 2.84
(es decir: 0.92 ≤ 𝑧 ≤ 2.84)
Solución
Construyendo el gráfico del área pedida.
140
Gestión Curricular
Asignatura: Estadística general
Área pedida
Ubicamos los valores de z = 0.92 y z = 2.84 en la tabla, de la misma forma que en los
ejemplos anteriores.
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
Luego:
ÁREA PEDIDA = 0.4977 – 0.3212 = 0.1765
También: 𝑝(0.92 ≤ 𝑧 ≤ 2.84) = 0.1765 = 17.65%
Problemas Propuestos
141
Gestión Curricular
Asignatura: Estadística general
Video de Apoyo
142
Gestión Curricular
Asignatura: Estadística general
Semana 16
EVALUACIÓN FINAL
143
Gestión Curricular
Asignatura: Estadística general
Referencias bibliográficas
Díaz, A. (2013). Estadística aplicada a la administración y la economía. México D. F.: McGraw Hill.
144
Gestión Curricular
Asignatura: Estadística general
Pérez, C. (2012) Estadística Aplicada –IBM SPSS. España: Garceta grupo editorial.
Robert Johnson, Patricia Kuby. Estadística Elemental. Thomson Editorial. México 2002
Ross, S. (2011). Probabilidad y Estadística para Ingenieros. 3a. ed. México: Mc Graw Hill, 2001.
145