Mathematics">
Nothing Special   »   [go: up one dir, main page]

Estad Soc

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 102

Área Empresarial

Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

Fundamentación
En esta asignatura se pretende que el alumno desarrolle actividades que le permitan
conocer, interpretar y comprender en forma simple y razonada conceptos básicos de
probabilidad y estadística que estén aplicadas a las Ciencias Sociales.

Esta materia le permitirá el análisis de un gran volumen de datos para su posterior


aplicación en el planteo y resolución de problemas de manera ágil y acertada.

Los conceptos que conciernen a la Estadística tienen que ver con un sector del Análisis
Matemático, que Ud. estudió en la anterior asignatura. La complejidad respecto a las
demostraciones de las fórmulas que se utilizan, como las deducciones correspondientes,
pertenecen al desarrollo teórico. Por lo tanto, trabajaremos con la aplicación y uso
correcto de estas fórmulas.

El nivel al que están enfocados los temas responde a la necesidad de servir como guía a
los alumnos que se inicien en esta disciplina. Se pretende facilitar la introducción a la
materia pero sin que deba considerarse que reemplaza a la consulta bibliográfica.

Aprenderá estrategias que lo preparen para utilizar en el campo de la Estadística


softwares específicos. Esto posibilita la aplicación del instrumental y ofrece superar
muchas limitaciones que la complejidad de los cálculos imponían. Por lo tanto, no es
posible pensar en una Estadística que no esté vinculada al uso de la computadora.

Objetivos generales
 Comprender los conceptos de cada tema que se desarrolle en esta materia.
 Visualizar las aplicaciones de los conceptos estadísticos y valorar la importancia
como herramienta importante en el área social.
 Desarrollar capacidad de análisis y síntesis.
 Proponer, interpretar y resolver situaciones problemáticas.
 Demostrar capacidad para el razonamiento deductivo-inductivo, transfiriendo los
conocimientos adquiridos al análisis y diseño de sistemas.
 Dominar la expresión gráfica, simbólica y conceptual relacionada con la
probabilidad.

INSTITUCIÓN CERVANTES 1
INSTITUCIÓN CERVANTES

Contenidos
Unidad I: Presentación de los datos
Estadística
Concepto general. El método estadístico: etapas. Recopilación de datos. Población e
individuo: definición. Atributos: clasificación. Variables discretas y continuas.
Muestras. Tablas y gráficos. Serie Simple. Amplitud de variable. Agrupamiento de
datos. Frecuencia: serie de frecuencia y serie de intervalos de clase. Gráficos: de barras,
de sectores. Histograma. Polígono de frecuencias.
Ejercicios. Aplicaciones.

Unidad II: Análisis y medición de los datos


Análisis y medición de datos.
Medidas o parámetros de posición. Media aritmética o promedio. Cálculo: serie
simple, serie de frecuencia y serie de intervalos de clase. Mediana. Cálculo: serie simple,
serie de frecuencia y serie de intervalos de clase. Modo. Cálculo: serie simple, serie de
frecuencia y serie de intervalos de clase.
Formas de curvas. Distribución normal. Medidas o parámetros de dispersión: a) serie
simple: desvíos, desviación media, varianza, desviación estándar o típica; b) serie de
frecuencia: desvíos, desviación media, varianza, desviación estándar o típica; c) serie de
intervalos de clase: desvíos, desviación media, varianza, desviación estándar o típica (dos
formas de cálculo).
Asimetría.
Fórmula para convertir a unidades estándar.
Fórmula para el coeficiente de variación.
Ejercicios. Aplicaciones.

Unidad III: Probabilidad


Probabilidades.
Sucesos aleatorios. Introducción axiomática del concepto de probabilidad.
Propiedades. Probabilidad de dos sucesos. Probabilidad compuesta y total. Casos
Particulares: sucesos excluyentes, contrarios e incluidos. Principio de probabilidad
compuesta. Principio de probabilidad total. Probabilidad Condicionada.
Ejercicios. Aplicaciones.

Unidad IV: Distribuciones de probabilidad para variables aleatorias discretas y


continuas
Variables aleatorias discretas. Distribuciones de probabilidad. Valor esperado.
Distribución Binomial, y Distribución de Poisson. Variables aleatorias continuas.
Distribución Normal de probabilidad. Conversión a unidades estándar.
Ejercicios y Aplicaciones.

Unidad V: Muestreo
Diseño de muestras.
Poblaciones finitas. Poblaciones infinitas.
Distribución de muestreo. Distintas clases de muestreo. Muestreo Aleatorio Simple.
Muestreo Sistemático. Muestreo Estratificado. Muestreo por Conglomerados.
Ejemplos.
2 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

Unidad VI: Estimación por intervalos de confianza para la media


Estimación puntual. Distribución muestral de la media. Teorema del límite central.
Intervalos de confianza de uno y dos extremos, para la media, utilizando la distribución
normal.
Ejercicios y Aplicaciones.

Propuesta metodológica
Los recursos que se emplearán en el aula son el material bibliográfico citado y algún
otro que el docente o alumno quiera aportar; pizarra y marcadores. Por otro lado, se
mostrarán programas de computación relacionados a la materia que se encuentran
disponibles en el mercado.

En algunos temas, el análisis e interpretación de las situaciones que se planteen, los


alumnos podrán resolverlos en mesas de trabajo para una mejor discusión.

Las actividades obligatorias serán revisadas en clase, y permiten la autoevaluación de los


conceptos teóricos y su aplicación.

Evaluación

 Regularidad
Para regularizar la materia, el alumno debe tener APROBADO con un mínimo de 60%
las dos evaluaciónes parciales. También debe entregar en tiempo y forma las actividades
denominadas obligatorias y un trabajo práctico, para un mejor seguimiento. Estas se
encuentran detalladas en el cronograma de actividades que oportunamente se le entrega
al alumno.

El cumplimiento de estas condiciones lo habilita para rendir el EXAMEN FINAL.

 Examen final
El alumno aprobará la materia con un mínimo del 60% del examen. Éste consistirá en
el planteo de situaciones problemáticas para su resolución y preguntas de índole teórico.

INSTITUCIÓN CERVANTES 3
INSTITUCIÓN CERVANTES

Bibliografía
 KAZMIER, L. Y DIAZ MATA, A. –Estadistica Aplicada a la Administración y
Economía. Editorial Mc Graw Hill, Méjico, 1997.
 SPIEGEL, M. –Estadística. Editorial Mc Graw Hill, España, 1991.
 MEYER, P. –Probabilidad y Aplicaciones Estadísticas. Editorial Addison-Wesley
Iberoamericana, 1986.
 TORANZOS, F. –Teoría Estadística y Aplicaciones. Editorial Kapeluz, 1982.
 Módulo de la Cátedra.
 Cualquier texto que responda a los contenidos que forman parte de esta asignatura.

4 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

Evaluación Diagnóstica

1. Resolver los siguientes ejercicios con números racionales:

2
 7   1 4
   3− : 
a)  6  : 4 + 2 3=
1− 1   1
+ 2 
  
 2  4 

2 3
6 1
5 −   − 22 . 
 10   2
b) −1 =
2
−1
5 −1
1
10

2. Repasar conceptos de Teoría de Conjuntos.


 Simbología.
 Representación.
 Operaciones con conjuntos: Unión de conjuntos, Intersección de conjuntos,
Complemento de un conjunto.

3. Plantear y resolver los siguientes problemas:


a) Determinar el número que es igual a 3 mas el triplo de dicho número.
b) En un negocio venden bicicletas y triciclos, un niño dijo: “Hay 23 manubrios ”. Y otro
agregó: “En total hay 57 ruedas ”. ¿Cuántos triciclos y cuantas bicicletas hay?

4. Graficar la siguiente función: y = 3 x + 1

INSTITUCIÓN CERVANTES 5
INSTITUCIÓN CERVANTES

6 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

 Unidad I
Presentación de los Datos

Objetivos
 Comprender los casos en que se debe aplicar la teoría de muestras, su importancia y
beneficios.
 Confeccionar las diferentes tablas y gráficos a partir de datos estadísticos.
 Realizar los cálculos de los parámetros estadísticos en casos prácticos.
 Interpretar gráficos y demás datos estadísticos correctamente.
 Determinar las distribuciones de probabilidad para variables aleatorias continuas y
discretas.

INSTITUCIÓN CERVANTES 7
INSTITUCIÓN CERVANTES

Introducción
La observación es la clave de la comprensión. La observación, entonces, es de capital
importancia para desarrollar las habilidades de un pensamiento crítico y de análisis de
datos.

En la primera parte de este módulo se hace énfasis, en los cuatro componentes de un


buen análisis de datos, la delineación, observación, cálculo y descripción; y en la
importancia de satisfacer las suposiciones al emplear las técnicas de inferencia
estadísticas.

Cada día de nuestras vidas estamos expuestos a una amplia variedad de información
numérica relativa a fenómenos como la actividad del mercado de valores, los hallazgos de
estudios de mercado, los resultados de encuestas de opinión, las tasas de desempleo, los
pronósticos de éxito futuro de determinadas industrias, pronósticos del tiempo, datos
deportivos, etc. El tema de la estadística abarca la recolección, presentación, y
caracterización de la información para ayudar tanto en el análisis de datos, como en el
proceso de la toma de decisiones.

En el área de negocios, la estadística puede aplicarse en:

Contabilidad:
 Para seleccionar muestras con propósito de auditoria.

Finanzas:
 Para estar al tanto de medidas financieras en el transcurso del tiempo y desarrollar
formas de pronosticar valores de estas medidas en momentos futuros.

Administración:
 Para describir características de empleados dentro de una empresa.
 Para controlar y/o mejorar la calidad de los productos fabricados.

Marketing:
 Para estimar la proporción de clientes que prefieren un producto sobre otros, y las
razones de esta preferencia.
 Para sacar conclusiones acerca de las estrategias de publicidad más convenientes
para la introducción de un nuevo producto al mercado.

En esta unidad, y como para comenzar a romper el hielo, empezaremos a analizar


conceptos básicos que utilizaremos a lo largo del desarrollo de esta materia. Así luego, en
su uso continuo, tendremos un mayor dominio de los mismos.

8 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

Estadística descriptiva
Puede definirse, como el conjunto de métodos que incluyen la recolección,
presentación, caracterización y análisis de un conjunto determinado de datos, con el fin de
describir apropiadamente las diversas características de los mismos.

Los métodos de la estadística descriptiva son importantes y han sido la base de los
métodos de la estadística inferencial. Han servido para mejorar la teoría de la
probabilidad, que, actualmente, ha hecho posible la implementación de la estadística en
todos los campos de la investigación.

Estadística inferencial
La estadística inferencial puede definirse como el conjunto de métodos que hacen
posible la estimación de una característica determinada de la población o la toma de
decisiones referentes a la población, basándose solo en los resultados de la muestra extraída en
la misma.

Para aclarar esto, son necesarias otras definiciones.

 Una población (o universo) es la totalidad de elementos a ser estudiados.


 Una muestra es la porción de la población que se selecciona para su análisis.
 Un parámetro es una medida de resumen que se calcula para describir una
característica de la población.
 Un estadístico es una medida de resumen que se calcula para describir una
característica de la muestra seleccionada de la población.

Para relacionar estas definiciones, pensemos en el siguiente ejemplo: supongamos que


el director de este instituto desea realizar una encuesta para conocer el rendimiento del
alumnado. La población o universo en este caso, serían todos los estudiantes actualmente
inscriptos, mientras que la muestra consistiría solo en aquellos estudiantes que hubieran
sido seleccionados para participar en la encuesta. La característica más importante de
una muestra, es la representatividad en la misma de todos los integrantes de la
población, es decir, en este ejemplo, se debería seleccionar alumnos de todos los cursos.
El objetivo de la encuesta sería determinar el rendimiento de todo el alumnado (el
parámetro), esto se obtendría utilizando los estadísticos obtenidas de la muestra de
estudiantes.

El uso de la estadística inferencial se debe al hecho de que a medida que una población
crece, por lo general resulta demasiado costoso, lento e incómodo, obtener la información
deseada de toda la población.

Tener en cuenta que N es el total de elementos de la población, y n es la cantidad de


elementos de la muestra.

Los atributos con respecto a los cuales se hace el relevamiento de los datos, se clasifican
en dos tipos: cualitativos y cuantitativos.
INSTITUCIÓN CERVANTES 9
INSTITUCIÓN CERVANTES

Los cualitativos se refieren a propiedades o características propias del objeto.


No se les puede asociar de manera natural un número (No son fáciles de determinar
cuando se trata de cualidades subjetivas: idoneidad, estado de salud, nivel cultural,
belleza, etc.). En cambio, quedan bien determinados cuando se trata de elegir entre un
número de posibilidades: sexo, estado civil, nacionalidad, profesión, nivel de instrucción
(primario, secundario, terciario, etc.).

Los atributos de tipo cuantitativo están expresados por cantidades numéricas que
pueden ser de tipo discretas o continuas.

Las cantidades discretas están expresadas por números enteros (...-2; -1; 0; 1;2; 3...),
mientras que las continuas lo están por números reales (...-2; -1,5;-1,3;-1; -0,9; -0,6; -0,2;
0; 1; 1,5; 1,7; 2; 2,3; 2,9;; 3,5...), lo que significa que entre los valores de dos mediciones
existen siempre infinitos valores intermedios. Por ejemplo: peso, talla, tiempo, longitud,
área, volumen, precio, etc.).

 Toda observación de tipo cualitativa se llama carácter.


Toda observación de tipo cuantitativa se llama variable.

Resumiendo los últimos conceptos con sus clasificaciones, obtenemos:

Cualitativos Carácter ---


Atributos Discretas (números enteros)
Cuantitativos Variables
Continuas (números reales)

Métodos utilizados para analizar un


determinado conjunto de datos

Recolección de los datos


Consiste simplemente en, una vez determinado el tema de interés a estudiar y la
población o muestra sobre la cual se investigará el mismo, escribir los datos tal cual los
vamos obteniendo.

Presentación y caracterización de los datos


Existen distintas formas de presentar los datos obtenidos, ya sea en forma no agrupada
(Serie Simple), o en forma agrupada (Serie de Frecuencia o Serie de Intervalos de clase),
la cual es conveniente cuando tenemos un conjunto muy grande de datos, pues se hace
más sencillo su manejo.

10 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

1) Serie Simple: ésta consiste en confeccionar una tabla, donde ubicaremos todos los
datos recogidos, inclusive los que están repetidos, escribiéndolos tantas veces como se
repitan, en orden ascendente, es decir, de menor a mayor.
2) Serie de Frecuencia: consiste en realizar una tabla de tres columnas, escribiendo en
la primera columna cada dato una sola vez, en la segunda columna de la tabla se
coloca la cantidad de veces que se repite cada dato, esta cantidad recibe el nombre de
frecuencia absoluta (f) de ese dato y en la tercera columna se coloca la frecuencia
relativa (fr)de cada dato, la cual se obtiene dividiendo la frecuencia absoluta de cada
dato por la cantidad total de datos. Es decir, la frecuencia relativa nos indica la
representatividad de cada dato en el conjunto total.
3) Serie de Intervalos de clase: consiste en realizar una tabla de tres columnas,
escribiendo en la primera, los distintos intervalos seleccionados, de acuerdo al tipo de
información que se desea obtener. En la segunda columna colocamos la cantidad de
datos que hay en cada intervalo y en la tercera, la frecuencia relativa de cada
intervalo, que al igual que para la serie de frecuencia, ésta se obtiene del cociente
entre la frecuencia absoluta de cada intervalo y la cantidad total de datos.
Luego estudiaremos cada una de estas series detenidamente, aclarando todos los
detalles de las mismas.

Para presentar en forma más concreta estas series, desarrollamos un ejemplo simple:

Consideramos las notas de 10 alumnos de un determinado curso de un colegio


secundario, éste es un atributo cuantitativo continuo, es decir, una variable continua,
pues las notas están comprendidas entre 0 y 10, pudiendo ser también, por ejemplo: 2,5;
7,2; etc.

Primero dijimos que, una vez decidido el tema de estudio (promedio general de las
notas de los alumnos de un determinado curso en un colegio secundario), sobre una
determinada población (todos los alumnos del curso elegido), se obtienen los datos
necesarios, en este caso, esto se puede realizar fijándonos en las libretas de cada alumno y
escribiendo sus promedios generales en el orden que vamos leyendo.

Entonces, vamos paso por paso, para no confundirnos,

1. Averiguamos los promedios de los 10 alumnos del curso, ya sea preguntándoselos o


fijándonos en sus libretas y los vamos escribiendo, éstos son:

5,6 - 10 - 8,7 - 6,3 - 3,8 - 7,4 - 9,5 - 10 - 2 - 7,4

Si intentamos tener una idea del promedio general del curso, será mucho más fácil si
realizamos la serie simple de los mismos.

La serie simple correspondiente a estos datos es:

NO X
1 2
2 3,8

INSTITUCIÓN CERVANTES 11
INSTITUCIÓN CERVANTES

NO X
3 5,6
4 6,3
5 7,4
6 7,4
7 8,7
8 9,5
9 10
10 10

Como se observa, de esta forma es mucho más fácil y rápido ver, por ejemplo, entre que
valores varían los promedios de los alumnos, que en el caso de tenerlos desordenados, no
es tan sencillo.

2. Si queremos agrupar los datos, entonces construimos la Serie de Frecuencia

X f fr = f/N (fr*100)%
2 1 0.10 10%
3,8 1 0.10 10%
5,6 1 0.10 10%
6,3 1 0.10 10%
7,4 2 0.20 20%
8,7 1 0.10 10%
9,5 1 0.10 10%
10 2 0.20 20%
TOTALES N=10 1.00 100%

Supongamos que se quiere saber la cantidad de alumnos con bajos promedios,


promedios regulares y buenos promedios. Con este fin es útil el uso de la Serie de
Intervalos de clase.

De acuerdo a las categorías que nos interesa estudiar, definimos los intervalos.

Las distribuciones en intervalos de clase presentan los datos de una manera mas
práctica, pero tiene el inconveniente de la pérdida de exactitud en cuanto a los datos en sí
y respecto de los parámetros o estadísticos a calcular, es decir, que la agrupación de los
datos nos favorece en la practicidad del manejo de los mismos, pero mientras más
agrupamos, vamos perdiendo precisión en los resultados.

Las características indispensables a tener en cuenta al crear la Serie de Intervalos de


clase, son los siguientes, debemos asegurarnos que cada observación pertenezca a un solo
intervalo. Generalmente se toman intervalos de igual amplitud o longitud y ninguno de
los intervalos debe superponerse con otro.

Para el ejemplo que venimos desarrollando, la Serie de Intervalos de clase es:

X f fr = f / N (fr*100)%
[0-3) 1 0.10 10%
[3-6) 2 0.20 20%
12 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

X f fr = f / N (fr*100)%
[6-9) 4 0.50 50%
[9-12) 3 0.20 20%
N=10 1.00 100%

En el primer intervalo están los valores de la variable comprendidos entre el 0


(incluyendo este valor) y el 3 (sin incluirlo).

Las frecuencias que figuran en la segunda columna indican la cantidad de datos que
están comprendidos en cada intervalo. Son las frecuencias de un intervalo de clase (f).

Las siguientes son características a tener en cuenta, como autocontrol, para saber si la
serie que hemos construido está bien o no.

Siempre la suma de las frecuencias absolutas debe coincidir con el total de datos.

Siempre la suma de las frecuencias relativas debe ser 1 lo que equivale al 100%, si
consideramos porcentajes.

Bueno, espero que hayan entendido, por lo menos hasta aquí, todos los conceptos
desarrollados. Quizás ustedes me estén diciendo que sí (eso espero), pero como yo no
puedo verlos no nos queda otro remedio que comprobarlo a través de la realización de los
ejercicios 1-2-3-4-y 5 de la Unidad I del cuadernillo de ejercicios. Estudien y practiquen
con los ejercicios, así no se les acumulan todos los temas para el final.

¿Y? ¿Qué esperan para empezar a realizar los ejercicios?

Una vez finalizados los ejercicios, sigamos con el desarrollo de la unidad.

Gráficos
Otra forma de presentar los datos es a través de gráficos.

Los gráficos permiten interpretar y visualizar el fenómeno que se estudia en forma más
clara. A través de ellos se logra una comprensión más rápida del significado de los datos
obtenidos y de la relación de dependencia que pueda existir entre ellos.
Hay distintos tipos de gráficos, según con qué serie estemos trabajando. Entre los más
conocidos podemos nombrar los gráficos de barras, los gráficos de sectores, los
histogramas y los polígonos de frecuencia. Los que describiremos a continuación.

De acuerdo con la serie que se esté trabajando, será el gráfico que corresponde realizar.

Sigamos con el mismo ejemplo usado anteriormente.

Para el caso de la serie simple el gráfico es muy sencillo. Veamos nuevamente la tabla y
recordemos que todos los datos están escritos, aún los que están repetidos, se escriben
tantas veces como aparezcan, por lo tanto la frecuencia de cada dato, en la serie simple es
siempre 1.

INSTITUCIÓN CERVANTES 13
INSTITUCIÓN CERVANTES

Buscando cuidadosamente en nuestra memoria quizás nos acordemos que alguna vez
sentimos hablar de sistema de coordenadas cartesianas. Usando esta herramienta,
representaremos los datos presentados en la serie simple.

Recordemos que en un sistema de coordenadas cartesianas el eje x, era el eje horizontal,


donde ahora ubicaremos los datos, y el eje y era el eje vertical, en el cual representaremos
las frecuencias de cada dato.
f

0 1 2 3 4 5 6 7 8 9 10 X

Por lo tanto, debido a las características de esta serie, obtenemos un gráfico, donde todas
las frecuencias tienen la misma altura (1).

Gráficos de barras (Serie de Frecuencias)


Veamos ahora que gráfico corresponde a la serie de frecuencias ya realizada. Utilizando
nuevamente un sistema de coordenadas cartesianas, como se explicó anteriormente,
obtenemos:

0 1 2 3 4 5 6 7 8 9 10 X

La longitud de las líneas siempre es igual a la frecuencia de cada dato.

Pueden ser líneas simples o múltiples según se trate de representar uno o más atributos
(características) de los datos. Cuando se trata de líneas múltiples, se presentan agrupadas
y los grupos deben aparecer separados.

Las líneas pueden ser horizontales o verticales. Pueden presentarse diferentes gráficos
de líneas para una misma serie de datos.
14 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

Tengamos en cuenta que la variable estudiada en este ejemplo, es una variable


cuantitativa (se usan líneas aunque gráfico se llame gráfico de barras).

¿Por qué se usan líneas en vez de barras?

Pues, porque si usáramos barras, estaríamos abarcando más de un valor por vez. Y lo
que nosotros representamos en el gráfico es la frecuencia de cada valor por separado, y no
de un conjunto de valores, como haremos luego en la serie de intervalos.

Si la variable fuese cualitativa, ¿qué pasaría?...

Pues, veamos los siguientes ejemplos:

Ejemplo 1
Un determinado país posee el siguiente cuadro de población:

TRABAJO POBLACION
Agricultura y Pesca 400 000
Industria 2 000 000
Servicios 1 800 000
Comercio y Banca 1 300 000
Construcción 600 000
Minas 200 000

En este caso, usamos para realizar el gráfico barras de un ancho determinado, pero fijo,
en vez de líneas, es decir, los rectángulos que quedan formados deben tener siempre
igual base, pues de lo contrario no sería posible una buena comparación, ya que estarían
cambiando varias cosas a la misma vez.

El gráfico de barras correspondiente a este ejemplo es:

2500000

2000000

1500000

1000000

500000

0
Ag. Y Pes. Ind. Serv. Com. Cons. Minas.

INSTITUCIÓN CERVANTES 15
INSTITUCIÓN CERVANTES

 Ejemplo 2
¿Existe corrupción en los medios de comunicación?

Si 65% No 23% No sabe/No contesta 12%

70
60
50
40
30
20
10
0
SI NO NS/NC

Gráficos de sectores
La representación en sectores resulta útil cuando se desea comparar datos que están
expresados en porcentaje.

Mediante el gráfico de sectores se representa la proporción, dentro del conjunto total, de los
distintos datos o caracteres.

El área de cada sector representa la frecuencia relativa de cada dato o característica,


multiplicada por 100, es decir, (fr*100)%.

La representación sectorial es conveniente cuando el número de sectores es pequeño y


sus áreas están bien diferenciadas. Es posible separar algún sector para resaltar el o los
datos que nos interesan en mayor medida.

Tomando el ejemplo anterior, el gráfico de sectores sería el siguiente:

12%

SI
23%
NO
NS/NC

65%

16 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

Histograma – Polígono de frecuencia


Se utiliza principalmente para representar la serie de intervalos de clase. Sobre el eje horizontal
se representan los intervalos de clase y sobre el vertical, la frecuencia de los mismos.

El gráfico consiste en un conjunto de rectángulos adyacentes (pues, donde termina un


intervalo comienza el siguiente), cuya base representa un intervalo de clase y cuya altura
es la frecuencia de ese intervalo.
5

0
0 3 6 9 12

Construimos así el histograma para la serie de intervalos de clase de los promedios de


los alumnos de un determinado curso de un colegio secundario.

Para construir el polígono de frecuencias se unen los puntos medios de las bases
superiores de cada rectángulo. Para cerrar el polígono se agregan dos intervalos: uno
anterior al primero y otro posterior al último del mismo ancho de los ya dibujados y se
prolonga el polígono hasta los puntos medios de estos intervalos.

Tenemos, así, el histograma y el polígono de frecuencias.

0
0 3 6 9 12

INSTITUCIÓN CERVANTES 17
INSTITUCIÓN CERVANTES

El área total de los rectángulos es igual al área limitada por el polígono y el eje
horizontal, que representa la totalidad de los datos.

Bueno, como podrán darse cuenta no se van a salvar de hacer los ejercicios. Así
8 que ahora comiencen ('y terminen') a realizar los ejercicios 6 y 7 de la Unidad I.

18 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

 Unidad II
Análisis y medición de datos

Objetivos
 Comprender la necesidad de síntesis, su importancia y beneficios.
 Realizar los cálculos de los parámetros estadísticos en casos prácticos.
 Interpretar las medidas resúmenes correctamente.

INSTITUCIÓN CERVANTES 19
INSTITUCIÓN CERVANTES

Cálculo, descripción y medición de


datos
Supongamos ahora que tenemos los promedios de todos los alumnos de cuatro cursos
de un determinado colegio secundario, pero que en lugar de tener solo 10 alumnos cada
curso, tenemos 30; 45; 35 y 25 alumnos por cada uno de estos. Si se quieren comparar los
rendimientos generales de los cuatro cursos, por más que presentemos los datos en
cualquiera de las distintas series ya estudiadas, la tarea se complica, ya que tendríamos
que comparar varias tablas con muchos datos cada una. Y así, a simple vista, se hace
difícil poder saber que curso tuvo mejor rendimiento.

Entonces, ¿qué hacemos si éste sea nuestro caso?

Generalmente se observa una tendencia de los datos a agruparse alrededor de ciertos


valores centrales, llamados parámetros de posición.

Estos parámetros son:

Promedio o Media
Mediana
Modo o moda

Estos parámetros son valores que caracterizan a los datos de la población en estudio.
Pero para tener una idea más completa y precisa de cómo están distribuidos los datos,
además de los valores centrales es necesario conocer si los datos están alejados o no con
respecto a esos valores centrales. Esto es, una vez calculado el valor central (promedio),
graficar éste conjuntamente con los datos y ver si realmente es o no representativo de los
mismos. O sea, si los datos están bien concentrados (cercanos) alrededor de este valor, o
muy alejados (no concentrados) del mismo.

Como el valor central más usado es el promedio, los desvíos se miden con respecto a él.
Es decir, una vez calculado el promedio de un determinado conjunto de datos, medimos
el alejamiento de cada dato con respecto al promedio (desvíos).

Por lo tanto, con esto vemos la necesidad de estudiar también los parámetros de
dispersión.

Estos son:

Desvíos
Desviación media
Varianza
Desviación estándar

A continuación estudiaremos la forma de cálculo de los parámetros de posición y de los


parámetros de dispersión, así como su utilidad e interpretación de acuerdo a cada
conjunto de datos. Esto lo haremos para cada uno de los distintos tipos de series
presentadas en la primera unidad.

20 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

Empezaremos con el estudio de los parámetros de posición y de dispersión para el


conjunto de datos presentados en una serie simple.

Parámetros de posición. Serie simple

Promedio
El promedio de una población, en una serie simple, se calcula realizando el cociente
entre la suma de todos los datos (x) y la cantidad total que hay de los mismos, es decir N
o n, según estemos considerando una población o una muestra respectivamente.

En símbolos:

µ= ∑x x=
∑x
N n

Según corresponda a una población o a una muestra respectivamente.

Las características más importantes del promedio son:

a) Involucra todos los datos de la población o muestra seleccionada, y además, éstos


contribuyen de la misma manera a su determinación.
b) Es relativamente confiable, ya que los promedios de muchas muestras tomadas de
una misma población, usualmente no fluctúan tanto como otros parámetros o
estadísticos.
c) Por sus propiedades el promedio es algo como el centro de gravedad de la
distribución de todos los datos.

Para una muestra

∑x
x=
n
Siguiendo con el ejemplo desarrollado en la unidad I, y fijándonos en el cuadro
realizado para la serie simple, sumamos la columna de los datos (x) y obtenemos 70,7.
En este ejemplo, no se está considerando ninguna muestra de la población, por lo tanto
obtenemos el promedio de la población total, es decir, del curso completo.

µ=∑ =
x 70.7
= 7.07
N 10

Para diferenciar entre las descripciones de poblaciones y las descripciones de muestras,


tendremos en cuenta que nos referimos a la descripción de una población cuando
hablamos de parámetros y a una descripción de una muestra cuando consideramos un
valor estadístico. Generalmente los parámetros se expresan por medio de letras griegas.
INSTITUCIÓN CERVANTES 21
INSTITUCIÓN CERVANTES

Mediana
La mediana de una serie simple es el valor del dato que divide al conjunto total en dos
partes iguales.

Siguiendo con el ejemplo de la primera unidad, tenemos:

X
2
3,8
5,6
6,3
7,4
7,4
8,7
9,5
10
10

Para este ejemplo, tenemos 10 datos. La mediana corresponde al valor central de la


serie, es decir, al valor del dato que divide en dos conjuntos con igual cantidad de datos
cada uno. En este caso el valor sería un valor intermedio entre la quinta y la sexta nota,
es decir el valor intermedio o promedio entre 7,4 y 7,4. Este valor es (7,4+7,4)/2=7,4.
Este valor divide al conjunto total de 10 datos en 2 conjuntos con 5 datos cada uno.

Por lo tanto, tendríamos:


Me=7,4

Si la serie tuviera una cantidad impar de datos la mediana coincidiría con un valor de
los datos el central, es decir, si tuviéramos en vez de 10 notas, 11 notas.
X
1
2
3,8
5,6
6,3
7
7,4
8,7
9,5
10
10

El valor de la mediana, en este caso correspondería al valor x=7, pues es el valor que
divide al conjunto total de 11 datos en dos conjuntos con 5 datos cada uno, es decir,

Me=7
22 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

Modo
El Modo es el valor del dato que tiene mayor frecuencia, es decir el dato que se repite
mayor cantidad de veces.

En una serie simple, no se puede calcular el modo, pues todos los datos tienen
frecuencia 1, por lo tanto ningún dato tiene frecuencia máxima.

Parámetros de dispersión. Serie


simple

Desvíos

Se llama desvío
d = x−x

de un dato, con respecto al promedio del conjunto total de datos a la diferencia entre el
valor del dato y el promedio del conjunto total de datos. Por desgracia, los desvíos tienen
algunos signos positivos y otros, negativos, y su suma siempre será cero. Por lo tanto no
se puede realizar un promedio de los desvíos, pues este siempre dará cero. Para salvar
este inconveniente consideramos el valor absoluto de cada desvío, es decir, el valor del
desvío, pero siempre positivo.

d = x−x

Ya que en realidad nos interesa la magnitud de los desvíos y no su signo, podemos


tomar el valor absoluto de éstos y realizar así su promedio, al que llamaremos desviación
media.
Es decir, la desviación media será
∑ x−x
dm =
n

Consideremos ahora un ejemplo más corto que el anterior.

Sea el conjunto de notas de un alumno en una determinada materia:

5; 8; 5; 9; 6.

Se quiere averiguar el promedio de este alumno en esa materia y cómo están


distribuidas estas notas con respecto al promedio, es decir, calcular los desvíos y la
desviación media de los mismos con respecto al promedio.

El promedio es de 6,60 y la desviación media 1.52.


INSTITUCIÓN CERVANTES 23
INSTITUCIÓN CERVANTES

En la siguiente tabla se verán los pasos necesarios para el cálculo de lo requerido en


una forma muy sencilla.

En la primera columna de esta tabla se tienen los datos (x), ordenados de menor a
mayor.

En la segunda columna colocamos el valor del promedio de esta serie, x , obtenido


como se explicó anteriormente, sumando todos los datos y dividiendo esa suma por 5,
que en este ejemplo es el total de datos observados.

En la tercera columna calculamos los desvíos de los datos con respecto al promedio, es
decir, realizamos d = x − x para cada dato.

En la cuarta columna calculamos el valor absoluto de los desvíos de los datos con
respecto al promedio,

d = x−x

En la quinta columna calculamos los cuadrados de los desvíos de los datos con
respecto al promedio,

d = (x − x )
2

que nos será útil para el cálculo de otro parámetro de dispersión, que estudiaremos
luego.

Es decir, la tabla será:

2
x x x−x x−x x−x
5 6,6 -1,6 1,6 2,56
5 6,6 -1,6 1,6 2,56
6 6,6 -0,6 0,6 0,36
8 6,6 +1,4 1,4 1,96
9 6,6 +2,4 2,4 5,76
33 0,00 7,6 13,20

µ = ∑ = = 6.6
x 33
N 5

O sea que para saber qué hemos realizado en cada columna, basta con leer el título de
la columna.

24 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

Desviación media
La desviación media es el promedio de los valores absolutos de los desvíos.

En símbolos:

∑ x−x
dm =
N

Para el cálculo de la desviación media en el ejemplo anterior, se deben sumar todos los
números de la tercera columna y dividir esa suma por la cantidad total de datos, es decir,

7 ,6
dm = = 1 , 52
5

Entonces, en este caso la desviación media, o el promedio de los desvíos es 1,52.

La desviación media es útil para comparar la dispersión de los datos, ya que en general
puede afirmarse que a mayor desviación media, mayor dispersión hay de los datos con
respecto al promedio, y a menor desviación media, hay menor dispersión de los datos con
respecto al promedio.

Por las dudas no esté muy clara esta interpretación de la desviación media, lo vamos a
explicar de otra forma: mientras más grande es la desviación media más 'desparramados'
(dispersos) están los datos con respecto al promedio. Y mientras más pequeño sea el
valor de la desviación media, más amontonados (concentrados) se encuentran los datos
en torno al promedio, y por lo tanto, este último será un buen representante de los datos.

Es decir, la desviación media nos da una idea de si los datos que tenemos están muy
lejos o no del promedio del conjunto de datos, que es el valor representativo del mismo.
Esta medida, rara vez se usa.

Otros parámetros de dispersión, usados también para medir el alejamiento de los datos
con respecto al promedio de los mismos, ya sea en un sentido o en otro, son la Varianza y
la Desviación estándar.

Veremos la forma de cálculo de estos parámetros para el ejemplo anterior, utilizando la


tabla ya confeccionada.

Varianza
Otra alternativa es trabajar con el cuadrado de los desvíos, ya que esto eliminará
también el efecto de los signos. Para evitar los valores negativos de los desvíos suelen
tomarse los cuadrados de los mismos.

Se llama varianza de un conjunto de datos, al promedio de los cuadrados de los desvíos.

INSTITUCIÓN CERVANTES 25
INSTITUCIÓN CERVANTES

La varianza se denota con σ 2 (sigma cuadrado).

Para una población, la varianza está dada por

∑(x − µ)
2
σ2 =
N

Y para una muestra la varianza está dada por S².

S 2
=
¦ (x − x) 2

n −1

Esto significa que para su cálculo debemos hacer la suma de todos los números que se
encuentran en la quinta columna y dividir esa suma por la cantidad total de datos.

Es decir,
13,2
S2 = = 2.64
5

De acuerdo con su definición, la varianza posee las siguientes características:

 La varianza nunca es negativa, pues es suma de términos positivos.


 La varianza es igual a cero solo en el caso de que todos los desvíos sean iguales a
cero, lo que equivale a decir que todos los datos tienen el mismo valor.
 A efectos de la comparación entre distintos conjuntos de datos, poseen mayor grado
de dispersión aquellos que poseen un mayor valor de la varianza.

Desviación estándar
Se llama desviación estándar a la raíz cuadrada de la varianza.

Al promediar las desviaciones cuadráticas de los datos con respecto al promedio de los
mismos, y sacar la raíz cuadrada del resultado, compensamos el hecho de que las
desviaciones se elevaron al cuadrado.

Para una población tendremos:


Σ (x − µ )
2
σ =
N

Y para una muestra:


Σ (x − x )
2
S =
n −1

26 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

En el ejemplo anterior:
σ = 2.64 = 1,62

Al ser un cálculo que se desprende de la varianza, verifica las mismas características


que ésta.

Después de tantas explicaciones de conceptos nuevos, espero que no se encuentren


muy mareados. Por las dudas este fuera el caso, haremos una síntesis de lo visto hasta
ahora en esta segunda unidad.

Los temas desarrollados hasta este momento son parámetros de posición y de


dispersión para una serie simple.

Estudiamos el promedio, la mediana y el modo, como parámetros de posición y los


desvíos, la desviación media, la varianza y la desviación estándar, como parámetros de
dispersión.

Lo más importante de estos parámetros son las siguientes características:


La mediana es el valor central de todo el conjunto de datos.
El modo es el valor del dato que se repite más cantidad de veces.
El promedio es el valor representativo de todo el conjunto de datos.

Ahora, ¿cómo podemos hacer para saber si ese valor calculado como promedio, es
8 o no un buen representante de los datos?

¿Qué se les ocurre como respuesta a esta pregunta?

Veamos si lo que imaginaron es correcto o no...

Ya dijimos que la desviación estándar nos da una idea de cuán alejados o próximos se
encuentran los datos con respecto al promedio. De aquí se desprende que si el valor de la
desviación estándar es pequeño, los valores de los datos están próximos o concentrados
alrededor del promedio de la serie y como consecuencia el promedio es un buen
representante de los datos. En caso contrario, es decir si el valor de la desviación estándar
es grande, esto implica que los valores de los datos están alejados o no concentrados
alrededor del promedio de la serie y como consecuencia el promedio no es un buen
representante de los datos.

Para las series de frecuencias y de intervalos de clase, estudiaremos los mismos


parámetros de posición y dispersión. Estos poseen la misma interpretación que para la
serie simple, pero tienen una pequeña variación en la forma de calcularlos, la que
explicaremos a continuación.

INSTITUCIÓN CERVANTES 27
INSTITUCIÓN CERVANTES

Parámetros de posición. Serie de


frecuencias

Promedio
El promedio, en una serie de frecuencias, se calcula realizando el cociente de la suma de
los productos de cada dato y su respectiva frecuencia por la cantidad total de datos, es
decir N o n, según se este considerando una población o una muestra respectivamente.

Para el cálculo del promedio en este tipo de serie, realizamos la siguiente tabla:
Volvemos al ejemplo para el cual desarrollamos la serie de frecuencia en la primera
unidad, agregando a aquella tabla 3 columnas.

X f x*f x fr = f/N (fr*100)% fa


2 1 2 7,07 0.10 10% 1
3,8 1 3,8 7,07 0.10 10% 2
5,6 1 5,6 7,07 0.10 10% 3
6,3 1 6,3 7,07 0.10 10% 4
7,4 2 14,8 7,07 0.20 20% 6
8,7 1 8,7 7,07 0.10 10% 7
9,5 1 9,5 7,07 0.10 10% 8
10 2 20 7,07 0.20 20% 10
TOTALES N=1 70,7 1.00 100%
0

La tercera columna, en donde se realizan los productos de cada dato de la primera


columna, por su respectiva frecuencia ubicada en la segunda columna. La cuarta
columna, en donde ya está calculado el promedio de la serie, obtenido a través de la
siguiente fórmula

µ= ∑ x∗ f Es el promedio para la población.


N

Es decir, sumamos todos los valores obtenidos en la tercera columna (70,7) en donde
estamos considerando la cantidad de veces que figura cada dato, para que así cada uno de
éstos tenga la importancia que le corresponde dentro del conjunto total de datos, y
dividimos este valor por 10, que en este ejemplo es la totalidad de datos. La séptima
columna, denominada frecuencia acumulada (fa) se calcula de la siguiente manera, la
primera frecuencia acumulada es igual a la primera frecuencia absoluta, en este caso
fa=1. Para obtener la segunda frecuencia acumulada, se le suma a la primera (fa=1), la
segunda frecuencia absoluta f=1, y obtenemos fa=2. Para obtener la tercer frecuencia
acumulada, se le suma a la segunda (fa=2), la tercera frecuencia absoluta f=1, y
obtenemos fa=3 y así seguimos hasta sumar o acumular la ultima frecuencia absoluta.

28 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

Un detalle muy importante, que también nos sirve a modo de control, para saber si lo
que estamos haciendo está bien o no, es que la última frecuencia acumulada, debe ser
igual a la cantidad total de datos, pues ya los acumula a todos.

¿Está claro?

En caso de obtener una respuesta negativa, será necesario volver a leer toda la
explicación de modo más concentrado que la vez anterior. Y en caso de seguir siendo
negativa la respuesta a esta última pregunta, no dude en acudir sin falta y puntualmente
a su próximo horario de tutoría.

Veamos a continuación cómo se calcula en una serie de frecuencias la mediana.

Mediana
Para ello se consideran las frecuencias acumuladas (fa).

La mediana corresponde a la observación cuya frecuencia acumulada es la menor (fa),


que es mayor o igual al número que se obtiene de hacer (n+1)/2.

Es decir, la mediana de la serie es el valor del dato, para el cual su fa, satisface el menor
número que cumple la condición

n +1
fa ≥
2

En el ejemplo, la primera frecuencia acumulada que es mayor o igual a


(n+1)/2=(10+1)/2=5,5 es fa=6 , que corresponde al dato x=7,4. Por lo tanto, en esta
serie de frecuencia la mediana es
Me=7,4

Modo
El modo de un conjunto de datos, es el valor del dato que posee mayor frecuencia o -
en 'forma más casera' - el dato que más se repite.

Cuando en el conjunto de datos hay un sólo modo, se dice que los datos poseen una
distribución unimodal. Si hay dos datos con la misma frecuencia máxima, la distribución
es bimodal. En caso de haber mayor cantidad de datos con la misma frecuencia máxima,
diremos que los datos poseen una distribución polimodal.

Siguiendo con la misma serie de frecuencia, observamos que la frecuencia máxima que
encontramos en la segunda columna de la tabla es f=2 y además ésta se repite dos veces,
es decir para los valores de los datos x=7,4 y para x=10, por lo tanto la distribución de
estos datos es bimodal y sus modos son:
Mo=7,4 y Mo=10
INSTITUCIÓN CERVANTES 29
INSTITUCIÓN CERVANTES

Pues, ambos datos poseen frecuencia absoluta máxima, igual a 2.

Parámetros de dispersión. Serie de


frecuencias
Los parámetros de dispersión a estudiar para la serie de frecuencias son los mismos que
se estudiaron para una serie simple. La única diferencia radica en la forma de definir los
mismos, debido a que los datos están agrupados.

Para hacer más sencillo el cálculo de los mismos, seguiremos desarrollando el mismo
ejemplo que veníamos utilizando.

A la tabla realizada para el cálculo de los parámetros de posición le agregaremos


algunas columnas que nos facilitarán este trabajo.

x F x*f x x−x x − x *f (x-x)2 (x- fr = f/N (fr*100) fa


2
2 1 2 7,07 5,07 5,07 25,70 25,70 0.10 10% 1
3,8 1 3,8 7,07 3,27 3,27 10,69 10,69 0.10 10% 2
5,6 1 5,6 7,07 1,47 1,47 2,16 2,16 0.10 10% 3
6,3 1 6,3 7,07 0,77 0,77 0,59 0,59 0.10 10% 4
7,4 2 14,8 7,07 0,33 0,66 0,11 0,22 0.20 20% 6
8,7 1 8,7 7,07 1,63 1,63 2,66 2,66 0.10 10% 7
9,5 1 9,5 7,07 2,43 2,43 5,90 5,90 0.10 10% 8
10 2 20 7,07 2,93 5,86 8,58 17,17 0.20 20% 10
Totales N=10 70,7 21,16 65,09 1.00 100%

Es decir, en la tabla realizada para el cálculo de los parámetros de posición, agregamos


4 columnas. Las columnas que se agregaron son la quinta en la que se encuentran los
valores absolutos de los desvíos de cada dato con respecto al promedio. La sexta
columna, en la que se encuentran los valores de la quinta columna multiplicados por
sus correspondientes frecuencias. La séptima columna en la que calculamos los
cuadrados de los desvíos de la quinta columna y la octava columna en la que se
encuentran los valores de los desvíos cuadráticos, multiplicados por sus
correspondientes frecuencias.

Calculamos ahora los parámetros de dispersión

Desviación Media
La desviación media está definida por la fórmula

dm =
∑ (x − x) f
N

30 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

Es decir, la suma de los valores que se encuentran en la sexta columna, dividido por la

cantidad de datos.
En este caso

dm =
∑ (x − x) f =
21.16
= 2.116
N 10

Varianza
La varianza está definida como el promedio de los desvíos cuadráticos, multiplicados
por las correspondientes frecuencias, para considerar los datos todas las veces que éstos
figuran. En otras palabras la varianza está dada por

S 2
=
∑ (x − x) 2
f
N

Es decir, la suma de los valores que se encuentran en la octava columna, dividido por la
cantidad de datos.
Que en nuestro ejemplo estaría dada por

S2 =
∑ (x − x) 2
f
=
65.09
= 6.509
N 10

Desviación estándar
Al igual que en la serie simple, la desviación estándar está dada por

S=
∑ (x − x) 2
f
= 6.509 = 2.55
N

¿Cuál es la interpretación del valor obtenido para la desviación estándar?


El valor que obtuvimos es 2,55. Este valor es grande en relación a los datos que
tenemos. Como habíamos calculado que el promedio era 7,07 y el valor de la desviación
estándar nos dice que hay mucha dispersión de los datos, esto nos estaría diciendo que el
promedio no es un buen representante de los datos, pues este es 7,07 y sin embargo hay
notas con valor 2 y 3,8 que viendo solo el valor del promedio, uno no se imaginaria que
estuviesen dentro del conjunto de datos.

Con este análisis vemos que teniendo los valores del promedio y de la desviación
estándar podemos obtener una buena caracterización del conjunto de datos que
poseemos.

INSTITUCIÓN CERVANTES 31
INSTITUCIÓN CERVANTES

Parámetros de posición. Serie de


intervalos de clase

Promedio
Para hallar el promedio en este tipo de series, se calcula primero el punto medio de
cada intervalo. En la tercera columna de la tabla realizada más abajo figuran los valores
medios de cada intervalo,
xm
en la cuarta, los productos de las frecuencias de cada intervalo por su punto medio

xm ∗ f

En una distribución de frecuencias de intervalos de clase, el promedio se calcula


sumando los productos de las frecuencias por los valores medios de cada intervalo y
dividiendo la suma por el numero de observaciones.

Los valores medios o representantes de los intervalos se calculan sumando los extremos
del intervalo correspondiente y dividiendo esta suma por dos.

2 2

xm xm*f xm - x (xm - x ) (xm - x ) * f fr = (fr*100)


X F xm - x * f fa
f/N %
[2-4) 2 3 6 4.2 8.4 17.64 35.28 0.2 20 2
[4-6) 1 5 5 2.2 2.2 4.84 4.84 0.1 10 3
[6-8) 3 7 21 0.2 0.6 0.04 0.12 0.3 30 6
[8-10) 2 9 18 1.8 3.6 3.24 6.48 0.2 20 8
[10-12) 2 11 22 3.8 7.6 14.44 28.88 0.2 20 10
Totales N=10 72 22.4 75.6 1.00 100

El promedio se obtiene dividiendo la suma de los valores de la cuarta columna por el


número de observaciones.

µ=∑
( xm ∗ f )
Para la población completa
N

X=
∑ (x m ∗f)
para muestras.
n

Para nuestro ejemplo

72
µ= = 7.2
10

32 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

Como podemos apreciar, el valor del promedio no coincide con los valores de los
promedios para las series anteriores. Esto se debe a que al agrupar los datos en
intervalos, se pierde la exactitud de las mediciones observadas.

Mediana
Si consideramos las frecuencias acumuladas correspondientes a los intervalos,
tendremos
n +1
= 5,5
2

La mediana está contenida en el intervalo que corresponde a fa=6; por lo tanto el valor
de la mediana es el representante del intervalo [6, 8). Es decir,

Me=7

En la distribución de frecuencias de intervalos de clase, el modo corresponde al


intervalo [6 – 8) con una frecuencia absoluta f=3. Se toma como modo al representante
del intervalo o sea a 7

Mo=7

Parámetros de dispersión. Serie de


intervalos de clase
Con la ayuda de la tabla los calculamos con las definiciones ya dadas.

Desviación media

dm =
∑ (x − x) f =
22.4
= 2.24
N 10

Es decir, es la suma de todos los valores de la sexta columna, dividida por la cantidad de
observaciones.

INSTITUCIÓN CERVANTES 33
INSTITUCIÓN CERVANTES

Varianza

S 2
=
 (x − x) 2
f
=
75.6
= 7.56
N 10

Esto es la suma de los valores de la octava columna, dividida por la cantidad de


observaciones.

Desviación estándar
Como ya lo dijimos anteriormente la desviación estándar es la raíz cuadrada de la
varianza.

S=
∑ (x − x) 2
f
= 7.56 = 2.75
N

Simetría y asimetría de la distribución


de los datos
Las curvas que representan una distribución en intervalos de clase adoptan distintas
formas. Cuando coinciden los tres parámetros de posición; promedio, mediana y modo,
se dice que la distribución es normal; la curva es simétrica y se denomina curva o
campana de gauss.

Me = x = M

Cuando los parámetros de posición no coinciden, las curvas son asimétricas. Esta
asimetría puede ser a derecha o a izquierda, depende de la ubicación del modo, que es el
valor que mayor frecuencia tiene, y por ello de ahí en más, ya sea para la izquierda o para
la derecha, la curva es descendente.

34 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

Asimetría a derecha. Asimetría a izquierda.

Distribución normal – Curva de Gauss


La desviación media no es muy usada en la práctica. Para el estudio de las
distribuciones se usa la desviación estándar.

En particular, la desviación estándar es muy útil en caso de distribución normal de


frecuencias.

 El coeficiente de dispersión (o desviación estándar) es el indicador de la forma en que


los valores de la serie se agrupan en torno a la media aritmética.

Como hemos dicho: una distribución normal está representada por la curva o campana de
Gauss. Una distribución de este tipo queda determinada por la media aritmética y la
desviación estándar.

Conocidos estos dos parámetros se puede calcular la frecuencia de cualquier valor de la


variable o de un intervalo limitado por dos valores de la variable.

En una distribución normal, se cumple la siguiente relación: si a partir del punto que
corresponde al valor del promedio se llevan hacia ambos lados, o, 2 o, 3 o,quedan
determinados los siguientes intervalos:

[ x-o; x+o ] que contiene el 68% de las observaciones.


[ x-2 o; x+2 o] que contiene el 95% de las observaciones.
[ x-3 o; x+3 o ] que contiene al 99% de las observaciones.

INSTITUCIÓN CERVANTES 35
INSTITUCIÓN CERVANTES

A esta altura del desarrollo de esta unidad, es conveniente empezar a practicar los
8 temas desarrollados, con algunos ejercicios. Para ello realizaremos los ejercicios 1-
2 y 3 de la Unidad II del Cuadernillo de ejercicios.

Si la desviación estándar es muy pequeña, significa que los valores de los datos se
concentran alrededor del valor del promedio. Si la desviación estándar es muy grande,
los valores de los datos están muy dispersos con respecto al promedio de los mismos. Por
lo tanto las curvas representantes de estas situaciones serían las siguientes:

x x

En la curva 1 se muestra una variable con pequeña desviación estándar, los valores
están concentrados en torno del valor medio. En la curva 2, la desviación estándar es
muy grande; hay gran dispersión. Ambas distribuciones normales comparten el valor del
promedio, pero la dispersión es muy distinta.

Fórmula para convertir a unidades


estándar
Hasta aquí hemos dado ejemplos en los que ha sido importante el conocimiento acerca
de la variabilidad de los datos. Este también es el caso cuando queremos comparar
números que pertenecen a diferentes conjuntos de datos.

36 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

Para ilustrar lo explicado, analicemos el siguiente ejemplo, supongamos que se toma en


un curso un determinado examen de portugués que consta de dos partes: vocabulario y
gramática, y cierto alumno promedió 68 puntos en la parte de vocabulario y 85 puntos en
la parte de gramática.

A primera vista, parecería que el alumno presentó un resultado mucho mejor en


gramática que en vocabulario.

Pero, pensemos un ratito lo que estamos haciendo y reflexionemos... ¿Tiene sentido?

Pues no, porque estamos comparando dos cosas distintas entre sí. Miremos esto de otra
forma. Supongamos que todos los alumnos de la clase promediaron 53 puntos en
vocabulario con una desviación estándar S=12 y 75 puntos en gramática con una S=16.
Así podemos sostener que el promedio de este estudiante en la parte de vocabulario es de
(68-53)/12=15/12=1.25 sobre el promedio de la clase, en tanto que su rendimiento en la
parte de gramática es de solo (85-75)/16=10/16=0.625 sobre el promedio de la clase.

Entonces, a pesar de que no se pueden comparar las calificaciones originales, es posible


hacerlo con estas nuevas calificaciones adimensionales. Es evidente que en la
comparación con el resto del curso, dicho estudiante tiene una mejor calificación en
vocabulario que en su conocimiento de gramática. ¿Cómo concluimos esto?

Como primera medida veamos la diferencia entre lo realizado en el párrafo anterior y la


comparación de las calificaciones originales.

Esto sí tiene sentido, pues estamos comparando una nota particular con el promedio
general de lo mismo. Como resultado de esta comparación observamos que la nota de
este alumno en vocabulario está más alejada del promedio que la clase tiene en
vocabulario que lo que está alejada su nota de gramática con respecto al promedio
general del curso en gramática. Por lo tanto, este alumno se destaca más con respecto a
su curso en vocabulario que en gramática, pues su nota está más alejada positivamente
del promedio que el curso tiene en vocabulario.

En resumen, lo que hemos hecho es convertir las calificaciones en unidades estándar,


es decir independientes entre sí, para lograr así poder compararlas.

En general, si x es una medida perteneciente a un conjunto de datos que tiene el


promedio x y desviación estándar S, entonces su valor expresado en unidades estándar
será:

x−x x−µ
Ζ= o Ζ=
S σ
Dependiendo que los datos constituyan una muestra o una población.

En estas unidades, z nos indica cuántas desviaciones estándar un valor está por
encima o por debajo del promedio del conjunto de datos al que pertenece.

INSTITUCIÓN CERVANTES 37
INSTITUCIÓN CERVANTES

Coeficiente de variación
Una desventaja de la desviación estándar como una medida de variación es que
depende de las unidades de medida. Un valor de desviación estándar puede ser grande o
pequeño según lo que estemos midiendo. Teniendo en cuenta esto tomaremos una
medida de variación relativa, es decir una proporción de la variación con respecto al
promedio del mismo conjunto de datos al que pertenece la desviación.

S σ
V= = 100% O V = = 100 %
x µ

En general, se considera que si:

V > 30%, los datos se encuentran dispersos con respecto a su promedio.


y si
V < 30%, los datos se encuentran concentrados alrededor de su promedio. Es
decir, que el promedio es un buen representante de los datos.

Ahora están ya en condiciones de realizar todos los ejercicios restantes de la Unidad II.

No dejes de hacerlos, practicar mucho y concurrir a consultar tus dudas. No las dejes
acumular!!!!

 Los pasos esenciales para lograr una buena realización de un problema


son:
1. Leer detenidamente y con mucha atención el enunciado del problema.
2. Si no se entendió volver a leerlo.
3. Diferenciar lo que nos preguntan en el problema de lo que tenemos como dato.
4. Escribir tanto las incógnitas como los datos.
5. Calcular lo que nos solicitan.
6. Una vez obtenidos los resultados y/o gráficos, analizar con mucho cuidado el sentido
de los mismos. Ya que por ejemplo, nuestros datos son cantidad de personas, y
sacamos el promedio, éste no nos puede dar una cantidad negativa. Aunque este
ejemplo les parezca muy obvio, suele ser uno de los errores más comunes que
aparecen, pues se limitan simplemente a la realización de los cálculos que involucran
las fórmulas, y cuando obtienen el número requerido, allí finalizan el problema. Y sin
embargo aquí es donde comienzan los ' grandes problemas'.
7. Interpretar exhaustivamente los resultados, aunque en el ejercicio no esté
explícitamente pedido.

Ahora resuelvan en el Cuadernillo de Actividades las actividades nº 1 al 23


correspondientes a esta unidad.

Una vez aprendidos y estudiados los conceptos expuestos en las Unidades I y II y luego
de realizar los ejercicios correspondientes a estas unidades está en condiciones de realizar
el siguiente trabajo práctico con el programa estadístico INFOSTAT.

38 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

A este programa lo utilizaremos en todos los trabajos prácticos que se realizarán en esta
materia.

La base de datos que se les entregará consta de distintas variables, entre las que
encontramos variables cualitativas y cuantitativas, y para cada una de ellas tenemos los
datos de n = 100 empleados.

El objetivo de este trabajo es obtener medidas descriptivas (estudiadas en las Unidades I


y II) de las variables que tienen en la base de datos.

Antes de que empiece a desarrollar este trabajo explicaremos a través de un ejemplo


cómo usar el programa Infostat en este caso.

 Ejemplo
1. Activamos el menú ¨ESTADISTICAS¨.
2. Una vez en este menú, elegimos la opción ¨MEDIDAS RESUMEN¨ y dentro de él,
elegimos la variable que se va a estudiar (en este caso la variable SUELDO) y
aceptamos.

INSTITUCIÓN CERVANTES 39
INSTITUCIÓN CERVANTES

3. De esta manera obtendremos el cuadro de diálogo donde se enumeran todas las


medidas descriptivas que podemos calcular con este programa.

40 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

4. Una vez que estamos en este cuadro de diálogo, elegimos las medidas que nos
interesa calcular y aceptamos. Obteniendo de esta manera el siguiente cuadro de
diálogo.

Atención
 Algo muy importante y que no se debe olvidar de realizar, bajo ningún aspecto, es
una correcta interpretación de los resultados.

Mostraremos cómo hacerlo con esta variable para que le sirva como guía para el resto
de las variables.
INSTITUCIÓN CERVANTES 41
INSTITUCIÓN CERVANTES

La variable SUELDO tiene un promedio x = 1524, 64 y una desviación estándar


s = 1536, 63 . Esto... ¿QUÉ SIGNIFICA?

Significa que en promedio los 100 empleados ganan $1524 con un error aproximado de
$1536. Es decir que en realidad ganan entre $0,00 y $3060.

Con esto podemos concluir que en este caso el promedio no es un buen representante
de los datos, al tener una desviación estándar tan grande. Es decir, los datos están muy
dispersos con respecto al promedio. Y esto es real pues, existen empleados con $406
(valor mínimo) de sueldo y otros con $8173 de sueldo (valor máximo).

Atención
 También debe realizar los gráficos correspondientes a cada variable.

En este caso, al ser la variable SUELDO una variable continua, corresponde realizar el
histograma. Para ello seguimos los siguientes pasos:

1. Activamos el menú “GRAFICOS”.


2. Una vez en este menú, elegimos la opción “HISTOGRAMA” (en este caso) y dentro
de él, elegimos la variable que se va a estudiar (en este caso, la variable SUELDO) y
aceptamos.

42 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

3. Obteniendo de esta manera, al aceptar

INSTITUCIÓN CERVANTES 43
INSTITUCIÓN CERVANTES

De donde se puede concluir que, aproximadamente 69 empleados tienen un sueldo


entre los $400 y $1640.

20 empleados cobran entre $1640 y $3000.


10 empleados cobran entre $3000 y $4500, etc.

Ahora realice Ud. el mismo trabajo con el resto de las variables. Para ello guíese
8 con las pautas establecidas en el Trabajo Práctico nº 1 presentado en el
Cuadernillo de Actividades y con el ejemplo anterior.

44 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

 Unidad III
Probabilidades

Objetivos
 Comprender el concepto de probabilidad y sus propiedades.
 Identificar, plantear y resolver correctamente situaciones problemáticas.

Contenidos que Ud. debe tener en


claro antes del estudio de esta unidad
 Teoría de Conjuntos
 Teoría de Funciones

INSTITUCIÓN CERVANTES 45
INSTITUCIÓN CERVANTES

Probabilidades
Ya todos estamos familiarizados con el concepto de probabilidad. A menudo usamos
este término para referirnos a la posibilidad de que un suceso ocurra o no. Además, si se
plantea el caso en que hay que calcular la probabilidad de que salga “Número” en un
tiro de una moneda, todos podremos decir que esta probabilidad es de ‘LA MITAD’. A
estos conocimientos intuitivos, les daremos forma Matemática en esta unidad. Para ello
comenzaremos con algunos conceptos.

Llamaremos sucesos, eventos o acontecimientos aleatorios a aquellos


acontecimientos en que interviene en gran medida el azar.

Debemos distinguir los sucesos determinísticos (donde existe una ley matemática que
rige su comportamiento); de los aleatorios (donde no es posible predecir con exactitud su
comportamiento).

De todas las situaciones posibles, tomaremos sólo los casos aleatorios igualmente
posibles o equiposibles, es decir, aquellas situaciones en que no se manifiesta preferencia
de un caso sobre otro.

Introducción al concepto de
probabilidad
Denotaremos con el nombre E al conjunto ESPACIO con el que trabajaremos. Este
conjunto: ESPACIO está formado por todas las posibilidades, es decir, todos los posibles
resultados correspondientes al acontecimiento con que estamos tratando. En término de
conjuntos equivale a nuestro Conjunto Universal o Referencial.

Designaremos con A, B, C, a todo subconjunto del espacio E.


Supongamos que tenemos el conjunto de fichas siguientes:

Llamamos E al conjunto de los 12 sucesos.


# E = n = 12

(El cardinal de un conjunto es el número de elementos de ese conjunto)

Llamamos A al conjunto de las fichas con forma de rombo:


#A=c=2 (A es un subconjunto de E)

46 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

El espacio nos queda dividido en las fichas que tienen forma de rombo y aquellas que
no la tienen.

Representamos la situación mediante diagramas:

La posibilidad de extraer un rombo es igual al número de elementos de A dividido por


el número de elementos de E

#A 2 1
p( A) = = =
# E 12 6

Como el # A es siempre menor que el # E; la probabilidad siempre será menor que 1.


También la probabilidad de un suceso será mayor que 0 al ser # A mayor que 0.

#A<#E p(A) < 1 0 < p(A) < 1


#A>0 p(A) > 0

Llamaremos B al conjunto de fichas cuadradas. Como no hay fichas cuadradas en E,


tendremos:

B=∅ #B=0
La probabilidad de extraer una ficha cuadrada es:

#B 0
p( B ) = = =0 p (B) = 0
# E 12

No hay posibilidad de extraer una ficha cuadrada, o, lo que es lo mismo, existe la


imposibilidad de extraer una ficha cuadrada.

Llamamos C al conjunto de fichas de color blanco

C=E # C = # E = 12 = n

n # E 12
p (C ) = p ( E ) = = = =1 p(E) = 1
n # E 12

Es decir que existe la certeza de extraer una ficha de color blanco.

Resumiendo todo lo que hemos deducido, podemos enunciar las siguientes


propiedades:

INSTITUCIÓN CERVANTES 47
INSTITUCIÓN CERVANTES

Propiedad 1

La probabilidad de un suceso X en un espacio E es un número real comprendido


entre 0 y 1

0 ≤ p(X) ≤ 1

La probabilidad se expresa normalmente por una fracción.

c = # X
c 
p( X ) = siendo n = # E
n c ≤ n

Propiedad 2
Si todos los elementos de E cumplen con la propiedad X, tendremos:

#X=#E=c=n

Entonces:

n
p( X ) = p( E ) = =1 p(E) = 1 expresa la CERTEZA
n

Propiedad 3
Si ningún elemento de E cumple con la propiedad X, tendremos:

X=∅ #X=0

0
p ( X ) = p ( ∅) = =0 p(∅) = 0 expresa la IMPOSIBILIDAD
12

Propiedad 4

Si consideramos al conjunto A como el conjunto de las fichas con forma de rombo,


tendremos:

#A 2 1
#A=c=2 p( A) = = =
#E 12 6

# E = n = 12

Si tomamos el conjunto N formado por aquellos elementos que no cumplen con la


condición A, o lo que es lo mismo, el complemento del conjunto a

48 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

# N = # E - # A = n - c = 12 - 2 = 10

n − c 10 5 p ( A) + p ( A ) = 1
p( N ) = = =
n 12 6

c n−c n
p( M ) + p( N ) = + = =1
n n n


La suma de las probabilidades de que un suceso ocurra o no es 1

Para recordar
/ NUNCA una probabilidad puede ser superior a 1

Actividades
1. ¿Cuál es la probabilidad de sacar un 2 en la cara superior de un dado que se arroja
sobre una mesa?

2. ¿Cuál es la probabilidad de obtener cara al arrojar una moneda?

3. Si extraemos una carta de un mazo de 50 cartas ¿Cuál es la probabilidad de obtener


un tres?

4. En una urna hay 6 bolitas rojas, 7 negras, 4 azules y 2 amarillas. Si se extrae una al
azar ¿Cuál es la probabilidad de obtener una roja?

5. Una persona compra 2 números de una rifa de 4 cifras. ¿Qué probabilidad hay de
que obtenga el primer premio?

Probabilidad de 2 sucesos
Para comprender este tema debemos tener muy en claro las operaciones entre
conjuntos, por lo que le recomiendo que repase este tema.

Hasta ahora hemos analizado la probabilidad de un suceso A en un espacio E.

Ahora vamos a considerar dos sucesos A y B en un espacio E de eventos.

Ejemplo:

INSTITUCIÓN CERVANTES 49
INSTITUCIÓN CERVANTES

Sea E el conjunto de 10 fichas.

A = {x/x es una ficha negra}

B = {x/x es una ficha con el número “2”}

# E = 10 #A=4 #B=3

Observamos que A y B tienen elementos comunes

A ∩ B = { x/x es una ficha negra y con el número “2” }

Calculamos la probabilidad de cada suceso:

#A 4 2 #B 3
p( A) = = = p( B) = =
# E 10 5 # E 10

Se plantean los siguientes problemas:

a) ¿Cuál es la probabilidad de extraer una ficha negra y con el número “2”?

Dos de las 10 fichas son negras y con el número “2”.

2 1 2 = # ( A ∩ B )
p(A ∩ B) = p(A y B) = p( " Ne gra" y"2") = = siendo 
10 5 10 = # E

#(A  B)
p ( AyB ) =
# E

La probabilidad de que ocurra A y B se llama probabilidad compuesta.

c) ¿Cuál es la probabilidad de extraer una ficha que sea negra o con el número “2”?

50 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

5 5 =# (A ∪ B)
p(A o B) = p(" Negra"o "2") = siendo
10 10 =# E

# ( A  B)
p( AoB) =
#E

La probabilidad de que ocurra A o B se llama probabilidad total. Como usted ya


sabe, podemos determinar el cardinal de la unión entre dos conjuntos haciendo:

# ( A ∪ B ) = # A+ # B −# ( A ∩ B )

Aplicando esto, tendremos:

# (A ∪ B)
p( A ∪ B ) =
#E
# A+ # B −# ( A ∩ B )
=
#E
# A # B # (A ∩ B)
= + −
#E #E #E
= p( A) + p(B ) − p( AyB )

A esta última fórmula se la llama Principio de Probabilidad Total.

Entonces el principio de probabilidad total sería:

p(A o B) = p(A) + p(B) - p(A y B)

Al igual que en las operaciones con Conjuntos, se presentan algunos casos particulares
que reciben nombres específicos.

Casos particulares

I- Sucesos Excluyentes
Dos sucesos son EXCLUYENTES O INCOMPATIBLES cuando no pueden ocurrir
simultáneamente.

Mantenemos el conjunto E de 10 fichas. # E = 10

Sean:

INSTITUCIÓN CERVANTES 51
INSTITUCIÓN CERVANTES

A = { x/x es una ficha con el número “1” } #A=2


B = { x/x es una ficha con el número “4” } #B=1

#A 2 1 #B 1
p ( A) = = = p(B) = =
# E 10 5 # E 10

Calculamos p(A y B) ninguna ficha tiene el número “1” y el “4” a la vez, por lo tanto:
A∩B = ∅ # (A∩B) = 0

# ( A ∩ B) 0
p ( AyB) = = =0
#E 10

#( A ∩ B ) # A + # B # A # B
p ( AoB ) = = = + = p( A) + p( B )
#E #E #E #E

1 1 3
p ( AoB ) = + =
5 10 10

Para sucesos excluyentes:


 p( AyB) = 0
Si A ∩ B = ∅ ⇒ 
 p( AoB) = p( A) + p(B)

Tener en cuenta que esta fórmula es la del principio de PROBABILIDAD TOTAL,


simplemente es el caso en que los sucesos son excluyentes.

II- Sucesos Contrarios


Dos sucesos son CONTRARIOS si son conjuntos complementarios respecto del
espacio E
Si:
A = { x/x es una ficha negra }# A = 4; # E = 10
A = { x/x es una ficha no negra } # A =6

#A 4 2 #A 6 3
p( A) = = = p( A ) = = =
# E 10 5 # E 10 5

Para sucesos contrarios


 p ( AyA ) = 0 IMPOSIBILI DAD
Como A ∩ A = ∅ resulta : 
 p ( AoA ) = p( A) + p ( A ) = p ( E ) CERTEZA

52 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

8 El caso de Sucesos Contrarios es un caso particular de Sucesos Excluyentes.

Considerando todo esto responda:

¿Los sucesos excluyentes son un caso particular de los sucesos contrarios?

III- Sucesos Incluidos

Sea E el conjunto de las 10 fichas: # E = 10


A = { x/x es una ficha blanca } #A=6
B = { x/x es una ficha con el número cinco } # B = 1

En este caso B ⊂ A; A∩B=B y A∪B=A

#A 6 3 #B 1
p ( A) = = = p( B) = =
# E 10 5 # E 10
# ( A ∩ B) # B 1
A∩ B = B p ( AyB) = = = p( B) =
#E #E 10
# ( A ∪ B) # A 3
A∪ B = A p ( AoB) = = = p ( A) =
#E #E 5

Para un suceso incluido en otro:


 p( AyB) = p( B )
Si B ⊂ A ⇒ 
 p( AoB) = p( A)

Responda
¿Los sucesos contrarios son un caso particular de sucesos incluidos?. ¿Por qué?

1. Considera nuevamente la bolsa con las fichas anteriores. Construye el diagrama de


Venn en cada caso y determina la probabilidad de que, al extraer una ficha se
cumplan las siguientes condiciones (Identifique si se trata de un caso particular):

I. a) Que sea blanca y esté marcada con 2


b) Que sea blanca o esté marcada con 2
II. a) Que sea negra y esté marcada con 5
b) Que sea negra o esté marcada con 5
III a) Que sea blanca y esté marcada con 3
b) Que sea blanca o esté marcada con 3
IV a) Que sea blanca y negra
b) Que sea blanca o negra
INSTITUCIÓN CERVANTES 53
INSTITUCIÓN CERVANTES

2. En un club se reúnen 20 socios infantiles, 24 cadetes, 13 activos y 8 vitalicios. 35 de


los asistentes son de sexo masculino.

Se realiza un sorteo entre todos los asistentes.


a) ¿Cuál es la probabilidad de que reciba el premio un socio activo?
b) ¿Cuál es la probabilidad de que lo reciba un varón?
c) ¿Y una mujer?
d) Entre los socios activos hay 6 mujeres. ¿Cuál es la probabilidad de que reciba el
premio un socio activo y de sexo masculino?
e) ¿Cuál es la probabilidad de que reciba el premio un socio activo o de sexo femenino?

Probabilidad Condicionada
Existen dos casos en los que se da una probabilidad condicionada: el primero, cuando
analizamos dos sucesos consecutivos; y el segundo, cuando hay un solo evento con dos
sucesos o propiedades que puedan ocurrir simultáneamente, siendo una de esas
propiedades un dato que nos restrinja el espacio con el que vamos a trabajar (Cuando
“sabemos” una característica del suceso).

Supongamos que en una bolsa hay 3 bolillas blancas y 2 rojas. Realizamos dos
extracciones sucesivas. La probabilidad de obtener blanca en la primera es:

3
p( B) = que es la probabilidad simple
5

¿Cuál es la probabilidad de obtener blanca en la segunda extracción?

Por supuesto todos sabemos que esto va a depender de qué hicimos con la bolilla: si la
sacamos de la bolsa o si volvimos a ponerla allí.

 Caso 1
La bolilla retirada no se reintegra en la bolsa. Al no hacerlo, la probabilidad de que
salga blanca en la segunda extracción depende de lo que haya salido en la primera.

a) Si en la primera extracción se obtiene una bolilla blanca, en la bolsa quedan 2 blancas


y 2 rojas; entonces la probabilidad de que salga una bolilla blanca en la segunda
extracción sabiendo que salió blanca en la primera es:

2 1
p( B ) = = (siendo blanca la primera)
4 2

b) Si en la primera extracción sale una bolilla roja, en la bolsa quedan 3 blancas y 1


roja. La probabilidad de que salga blanca en la segunda extracción sabiendo que ha
salido roja en la primera es:

54 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

3
p( B) = (siendo roja la primera)
4

la probabilidad de obtener blanca en la segunda extracción depende o está


condicionada por lo ocurrido en la primera; por lo tanto los sucesos son
dependientes

Probabilidad para la
1º Extracción Nomenclatura
2º Extracción
1 1
BLANCA p( B) = p( B / B ) =
2 2
3 3
ROJA p( B) = p( B / R ) =
4 4

p(B/B) que se lee probabilidad de B sabiendo que ha ocurrido B o bien probabilidad de


que sea blanca sabiendo que la primera bolilla fue blanca.
p(B/R) que se lee probabilidad de B sabiendo que ha ocurrido R o bien probabilidad de
que sea blanca sabiendo que la primera bolilla fue roja.

p (B / R)

 dato de lo salido anteriormente


 probabilidad buscada

Que se lee: Probabilidad de Blanca sabiendo que salió Roja.

La otra situación que se puede dar es que la bolilla retirada se reintegre a la bolsa.
Como en la bolsa están las 5 bolillas, la probabilidad de que salga blanca sigue siendo 3/5

Por lo tanto lo que haya salido antes no modifica la situación inicial. Son sucesos
independientes.

La probabilidad de obtener una blanca en la segunda extracción es igual a la


probabilidad de obtenerla en la primera.

p(B / B) = p(B / R) = p(B)

 Caso 2
En el conjunto E hay fichas blancas y negras. Como podemos apreciar, podemos
clasificar a estas fichas según dos criterios: por el número que tienen o por el color.

Consideremos el siguiente conjunto de E:

B = {x/x es una ficha blanca }


X = { x/x es una ficha con el número 3 }
INSTITUCIÓN CERVANTES 55
INSTITUCIÓN CERVANTES

Supongamos que una persona a la distancia ve que se extrae una ficha blanca y desea saber la
probabilidad de que tenga el número 3. En este caso, podemos ver que tenemos un “dato” que
nos dice que debemos trabajar con un subconjunto en lugar de hacerlo con el Espacio completo.

Lo que se busca es la probabilidad de sacar un tres sabiendo que la ficha es blanca:


p( X / B )
Esta probabilidad estará dada por:

p(X/B)=2/6=1/3
donde 2 es la cantidad de fichas blancas con el número 3 y 6 es la cantidad de fichas
blancas.
Por lo tanto:
# (X ∩ B )
p (X / B ) =
#B

Nota que el espacio fue restringido al conjunto de las fichas blancas

Actividades
1. En una bolsa hay 3 bolillas blancas y 5 negras:
a) ¿Cuál es la probabilidad de obtener una bolilla blanca?
b) Se extrae una bolilla y resulta ser blanca. Se vuelve a introducir en la bolsa.
¿Cuál es la probabilidad de que, en la segunda extracción, la bolilla resulte ser
blanca?
c) ¿Cuál hubiera sido la probabilidad si luego de la primera extracción la bolilla no
se hubiera devuelto a la bolsa?

2. De un mazo de 40 cartas españolas, se extrae primero una carta y luego otra.


a) ¿Cuál es la probabilidad de obtener una carta de copas en la primera extracción?
b) Consideremos ahora los siguientes casos:
I. Antes de retirar la segunda, la primera se reintegra al mazo y éste vuelve a
mezclarse. ¿Cuál es la probabilidad de obtener una copa en la segunda
extracción si en la primera salió un 7 de copas?
II. Se extrae la primera carta, se observa que es un 7 de copas y se la deja a
un lado. Se extrae una segunda carta: ¿Cuál es la probabilidad de que sea de
copas?
c) ¿En cuál de los casos son sucesos dependientes y en cuál independientes?

Principio de Probabilidad Compuesta


Trabajaremos un poco con esta fórmula para deducir otra nueva forma de cálculo para
la probabilidad compuesta. Si dividimos numerador y denominador por #E, tendremos:

56 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

# (A ∩ B)
p( X / B ) =
#B
#(A ∩ B)
= #E
#B
#E
p( A y B )
=
p (B )

Si despejamos de esta última igualdad, tendremos:

p( A y B ) = p( A / B ) . p( B )

Fórmula general de la Probabilidad Compuesta (Probabilidad de que ocurra A y B)


p(A y B) = p(A) p(B / A) = p(B) p(A / B)

Para sucesos independientes vimos que:

p(B / A) = p(B)

p(A y B) = p(A) P(B) FÓRMULA DE LA PROBABILIDAD COMPUESTA


PARA SUCESOS INDEPENDIENTES

 La probabilidad compuesta de dos acontecimientos es igual al producto de las


probabilidades simples de cada uno de ellos si y solo si los acontecimientos son
independientes

Hagamos un ejemplo donde combinemos los principios de probabilidad total y


compuesta:

Se tiran 3 monedas

a) ¿Cuál es la probabilidad de que salgan 3 caras?

Casos posibles:

A1 C C C
A2 C C X
A3 C X C
A4 X C C
A5 C X X
A6 X C X
A7 X X C
A8 X X X
INSTITUCIÓN CERVANTES 57
INSTITUCIÓN CERVANTES

Hay 8 casos posibles y solo 1 favorable (A1)


1
p ( CyCyC ) = Para cada moneda, la probabilidad de que salga cara es
8
1
p(C) =
2
111 1
p ( CyCyC ) = =
222 8

b) ¿Cuál es la probabilidad de que salgan 2 caras?


De los 8 casos posibles hay 3 favorables: los que están en el segundo, tercero y cuarto
lugar.

p("2 caras") = 3/8

Hallamos la probabilidad de cada uno de los sucesos favorables

111 1
p ( A2 ) = p ( CyCyX ) = =
222 8
111 1
p ( A3 ) = p ( CyXyC ) = =
222 8
Probabilidad Compuesta
111 1
p ( A4 ) = p ( XyCyC ) = =
222 8
1 1 1 3
p ( A2 oA3 oA4 ) = + + =
8 8 8 8

Ahora resuelvan en el Cuadernillo de Actividades las actividades correspondientes


8 a esta unidad.

58 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

 Unidad IV
Distribuciones de probabilidad para
variables aleatorias discretas y continuas

Objetivos
 Distinguir entre los distintas funciones de densidad correspondientes a cada variable
aleatoria, ya sea discreta o continua.
 Resolver situaciones aplicadas.

INSTITUCIÓN CERVANTES 59
INSTITUCIÓN CERVANTES

Introducción
En cierto sentido el experimento de tirar una moneda, estudiado anteriormente en la
unidad de Probabilidad, ocurre muy a menudo en los negocios. La única diferencia es
que la probabilidad de que salga una cara no es ½.

Considérese una encuesta de mercadeo, realizada para predecir las preferencias para
unos productos. La entrevista de un solo consumidor se parece, en muchos aspectos, al
lanzamiento de una sola moneda, porque el consumidor puede estar a favor de un
producto particular – una cara – o bien puede estar en contra (o indeciso) – una cruz.
En la mayoría de los casos, la fracción de consumidores a favor de un producto particular
no será igual a ½.

Se realizan sondeos similares en las ciencias sociales, en la industria y en la educación.

El sociólogo se interesa en la fracción de casas rurales que poseen electricidad; el


fabricante de cigarrillos desea conocer la fracción del número de fumadores que prefiere
su marca; el profesor se interesa en la fracción del número de sus alumnos que aprueba el
curso.

La opinión de cada persona muestreada es análoga al lanzamiento de una moneda


cargada (ya que la probabilidad de cara normalmente no es 1/2). Aunque diferentes en
algunos aspectos, los experimentos descriptos exhiben a menudo, hasta cierto grado
razonable de aproximación, las características de un experimento binomial (o
binómico).

Distribución Binomial

 Definición
Un experimento binomial es un experimento que posee las siguientes propiedades:

1. El experimento consta de n ensayos o pruebas idénticos.


2. Cada prueba puede tener uno de dos resultados. Debido a la falta de una mejor
nomenclatura, llamaremos convencionalmente a un resultado éxito, E, y al otro,
fracaso, F.
3. La probabilidad de un éxito en una sola prueba es igual a p y permanece constante de
uno a otro. La probabilidad de un fracaso es (1 – p) = q.
4. Las pruebas son independientes.
5. Interesa conocer x, la cantidad de éxitos observados en n pruebas
6. Las variables aleatorias que pueden presentar este tipo de distribución de
probabilidad, son las variables aleatorias discretas.

La distribución de probabilidad para un experimento binomial que consiste en n


lanzamientos es de la siguiente forma:

60 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

n!
p( x ) = p xqn - x x = 0;1;2; 3;...; n
x !(n - x ) !

donde n = numero de pruebas


p = probabilidad de exito
q = 1- p

 Ejemplo
Se inspeccionan los grandes lotes de productos que llegan a una planta manufacturera
a fin de encontrar artículos defectuosos, mediante un plan de muestreo. Se selecciona
una muestra aleatoria de n artículos de cada uno de los lotes y se inspeccionará la
muestra, anotando el número x de defectuosos. Si x es menor que o igual a algún número
de aceptación a ya especificado, se aceptará el lote. Si x es mayor que a, se rechazará el
citado lote.

Supóngase que un fabricante utiliza un plan de muestreo con n = 10 y a =1. Si el lote


contiene exactamente 5% de defectuosos, ¿cuál será la probabilidad de que el lote sea
aceptado? ¿Cuál será la probabilidad de que sea rechazado?

Solución
Como el lote contiene 5% de defectuosos, la probabilidad de que un artículo, sacado de
ahí, sea defectuoso es p = 0.05. Entonces la probabilidad de observar x defectuosos en
una muestra de n = 10 artículos es:

10!
p( x ) = 0.05x 0.9510- x
x !(10 - x ) !

La probabilidad de aceptar el lote es la de que x sea menor que o igual al número de


aceptación a = 1. Por lo tanto,

10! 10!
p(aceptar ) = p(0) + p(1) = 0.050 0.9510- 0 + 0.0510.9510- 1
0 !(10 - 0) ! 1!(10 - 1) !
= 0.914
p(rechazar ) = 1 - p(aceptar )
= 1 - 0.914
= 0.086

Aunque no se conoce en un caso práctico el valor exacto de p, se desearía conocer la


probabilidad de aceptar lotes malos (lotes con un valor grande de p) y de aceptar lotes
buenos (lotes para los cuales p es pequeña).

INSTITUCIÓN CERVANTES 61
INSTITUCIÓN CERVANTES

Distribución de Poisson
Esta distribución de probabilidad es un buen modelo para la distribución de
frecuencias relativas del número de eventos raros que ocurren en una unidad de tiempo,
de distancia, de espacio, etc. Por esta razón se la utiliza mucho en administración de
empresas para modelar la distribución de frecuencias relativas del número de accidentes
industriales por unidad de tiempo o por administradores de personal, para modelar la
distribución de frecuencias relativas del número de accidentes de los empleados o el
número de reclamaciones de seguros, por unidad de tiempo. La distribución de
probabilidad de Poisson puede proporcionar, en algunos casos, un buen modelo para la
distribución de frecuencias relativas del número de llegadas por unidad de tiempo, a una
unidad de servicio (por ejemplo, el número de pedidos recibidos en una planta
manufacturera o el número de clientes que llegan a una instalación de servicio, a una
caja registradora de un supermercado, etc.).

Las fórmulas para la distribución de probabilidad de Poisson son las siguientes:

l e- l
p( x ) = x = 0;1;2;...; ¥
x!

donde x = numero de eventos raros por unidad de tiempo, de dis t an cia, de espacio, etc..
Media = el simbolo l que aparece en p (x )

Note que x es normalmente pequeño en la práctica; teóricamente podría ser muy


grande, sin límite. Por lo tanto, la variable aleatoria de Poisson es un ejemplo de
variable aleatoria discreta que puede tomar un número infinito (pero contable) de
valores.

 Ejemplo
Las lesiones laborales graves que ocurren en una planta siderúrgica, tienen un
promedio o media anual de 2.7. Dado que las condiciones de seguridad serán iguales en
la planta durante el próximo año, ¿cuál es la probabilidad de que el número de lesiones
graves sea menor que dos?

Solución

P (x < 2) = p(0) + p(1)


2.7x e - 2.7
en donde p(x ) =
x!

Sustituyendo en la fórmula para p(x), con e - 2.7 = 0.067206 , se obtiene

62 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

2.7 0 0.067206 2.71 0.067206


P (x < 2) = p(0) + p(1) = +
0! 1!
= 0.067206 + (2.7) 0.067206
= 0.249

Por lo tanto, la probabilidad que haya a menos de dos lesiones laborales graves el
próximo año en la planta fabril de acero, es de 0.249.

Variables Aleatorias Continuas


Una variable aleatoria continua, como se vio en la unidad I, es la que puede tomar un
número infinitamente grande de valores que corresponden a los puntos en un intervalo
de una recta. Las estaturas y los pesos de las personas, el tiempo entre dos eventos o la
vida útil de un equipo de oficina, son ejemplos típicos de variables aleatorias continuas.

El modelo probabilístico para la distribución de frecuencias de una variable aleatoria


continua implica la selección de una curva, generalmente regular o alisada, a la que se
llama distribución de probabilidad o función de densidad de probabilidad de una variable.
Si la ecuación de esta distribución de probabilidad continua es f(x) entonces, la
probabilidad de que x esté en el intervalo a< x <b es el área bajo la curva de distribución
para f(x) entre los dos puntos a y b (Véase la Fig. 4.1).

Si la variable es discreta se suma hasta el valor en el que queremos conocer la


distribución, si es continua se integra hasta allí.

• discreta → F(xi ) = Σ Pi (suma hasta xi)

X • continua → F(xi) = ∫
xi
f ( x) .dx →la probabilidad de que aparezca
−∞
cualquier valor hasta “xi”

F(x)

x
Fig. 4.1. Distribución de probabilidad para una variable aleatoria continua
INSTITUCIÓN CERVANTES 63
INSTITUCIÓN CERVANTES

Esto concuerda con la interpretación de un histograma de frecuencias relativas, donde


las áreas sobre un intervalo, bajo el histograma, correspondieron a la proporción de
observaciones que caen en dicho intervalo. Ya que el número de valores que puede
tomar x es infinitamente grande y no se puede contar, la probabilidad de que x sea igual a
un valor específico, por ejemplo a, es cero (0). Entonces las afirmaciones probabilísticas
acerca de las variables aleatorias continuas siempre corresponden a áreas bajo la
distribución de probabilidad sobre un intervalo por ejemplo, de a a b –y se expresan como
P(a< x <b). Notesé que la probabilidad en a< x <b es igual a la probabilidad de que
a < x £ b , pues P (x = a ) = P (x = b) = 0 .

Hay muchas distribuciones de probabilidad continuas, y cada una se representa


mediante una ecuación f(x), que se escoge de manera que el área total bajo la curva de
distribución de probabilidad sea igual a 1.

Una vez que conocemos la ecuación f(x) de una distribución de probabilidad


particular, se pueden encontrar probabilidades específicas, por ejemplo, la probabilidad
de que x esté en el intervalo a< x <b, de dos maneras. Podemos graficar la ecuación
(véase la Fig. 4.1) y utilizar métodos numéricos para aproximar el área sobre el intervalo
a< x < b. Este cálculo puede realizarse utilizando métodos muy aproximados. O bien,
si f(x) tiene una forma particular, podemos usar el cálculo integral para encontrar P(a< x
<b). Afortunadamente, no hay que utilizar en la práctica, ninguno de estos métodos,
porque se han calculado y tabulado las áreas bajo la mayoría de las distribuciones de
probabilidad continuas más empleadas.

Ahora estudiaremos una de las distribuciones de probabilidad continuas de mayor uso:


la distribución de probabilidad normal.

Distribución de Probabilidad Normal


La distribución de probabilidad normal dada por la ecuación

2
e - ( x - m) 2 s 2
f (x ) = (- ¥ < x< ¥ )
s 2p

se representa gráficamente como la curva acampanada que se muestra en la Fig. 4.2.

Los símbolos ey p representan números irracionales cuyos valores son


aproximadamente 2.7183 y 3.1416, respectivamente; m y s son la media y la desviación
estándar poblacional.

64 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

Se simboliza X N ( µ , σ ) y se lee:

“ X se distribuye normal con media µ y DS σ”

µ-σ µ µ+σ

Fig.4.2. Función de densidad de probabilidad normal.

La ecuación para la función de densidad se deduce de manera que el área bajo la curva
representará la probabilidad. Por lo tanto el área total bajo la curva es igual a 1.

La distribución de probabilidad normal, mostrada en la Fig.4.2, es simétrica respecto a


la media m El ancho de las regiones delineadas, en la Fig.4.2, es una desviación estándar
s .

En la práctica se encuentran pocas veces variables que cambien de “menos infinito” a


“más infinito”, cualquiera que sea el significado que se desee atribuir a estas expresiones.
Ciertamente, la estatura de personas o la vida útil de un equipo de oficina no satisfacen
estos requisitos. Sin embargo, el histograma de frecuencias relativas para muchos tipos
de mediciones tiene forma acampanada, la cual se puede aproximar con la función
mostrada en la Fig.4.2.

Tabulación de las áreas de la


distribución de probabilidad normal
Recuerde que la probabilidad de que una variable aleatoria continua tome un valor en
el intervalo de a a b, es el área bajo la función de densidad de probabilidad, entre los
puntos a y b (Fig. 4.3).

P(a< x

a µ b

Fig. 4.3. Probabilidad P(a< x <b) para una variable aleatoria distribuida
normalmente.

A fin de evaluar las áreas bajo la curva normal, observamos que la ecuación para la
distribución de probabilidad normal, depende de los valores numéricos de m y s y que
podemos generar un número infinitamente grande de distribuciones normales dando
INSTITUCIÓN CERVANTES 65
INSTITUCIÓN CERVANTES

diversos valores a estos parámetros. Obviamente no es práctico tener en tablas separadas


las áreas de cada una de estas curvas, sino que conviene tener una tabla de áreas aplicable
a todas las curvas. La manera más fácil de utilizar una sola tabla, es trabajar con áreas
situadas dentro de un número específico de desviaciones estándares respecto a la media.
Por ejemplo, se sabe que aproximadamente el 0.68 de ésta área estará dentro de una
desviación estándar de la media; 0.95 dentro de dos, y casi la totalidad dentro de tres.
¿Qué fracción del área total caerá dentro de 0.7 desviaciones estándares? A esta pregunta,
así como a otras se les da respuesta en las tablas de valores normales que figuran en la
bibliografía citada.

Como la curva normal es simétrica respecto a su media, la mitad del área bajo la curva
se encuentra a la izquierda de la media y la otra mitad a la derecha. También, debido a
la simetría se puede simplificar la tabla de las áreas listándolas entre la media y un
número especificado z de desviaciones estándares a la derecha de m . Las áreas a la
izquierda de la media se pueden calcular utilizando el área correspondiente e igual a la
derecha de la media. La distancia de un valor dado de x a la media es (x - m) .

Al expresar esta distancia en unidades de desviaciones estándares s , obtenemos

x- m
z =
s

Nótese que existe una correspondencia uno a uno entre z y x y que, en particular,
z = 0 cuando x = m . El valor de z será positivo cuando x esté por arriba de la
media, y negativo, cuando x sea menor que dicha media. La distribución de
probabilidad de z muchas veces se designa por distribución normal estandarizada,
pues su media es igual a cero y su desviación estándar es igual a 1. Se muestra la
distribución en la Fig. 4.4. El valor bajo la curva normal entre la media z = 0 y un valor
especificado de z > 0 , por ejemplo, z0 , es la probabilidad P(0 £ z £ z0 )

µ=0 z0

Fig. 4.4. Distribución normal estandarizada.

 Ejemplo 1
Obtenga P (0 £ z £ 1.63) . Esta probabilidad corresponde al área entre la media
( z = 0) y un punto z = 1.63 desviaciones estándares a la derecha de la media (véase la
Fig. 4.5).

66 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

P (0 £ z £ 1.63) =0.4
484

0 1.63

Fig. 4.5. Area requerida para el ejemplo.

 Ejemplo 2
Calcular P (- 0.5 £ z £ 1) . Esta probabilidad corresponde al área entre ( z = - 0.5) y
( z = 1.0) , como se muestra en la Fig. 4.6.

A1
A2

-0.5 0 1.0

Fig.4.6 Area requerida para el Ejemplo 2.

Solución

El área requerida es igual a la suma de A1 y A2 , mostrada en la Fig. 4.6.Leyendo los


valores de una tabla de valores normales o calculándolos con el programa estadístico
Infostat, obtenemos A2 = 0.3413 . El área A1 es igual al área correspondiente entre
z = 0 y z = 0.5 , o bien A1 = 0.1915 . Por lo tanto, el área total es

A = A1 + A2
= 0.1915 + 0.3413
= 0.5328

Por lo tanto la probabilidad requerida P (- 0.5 £ z £ 1) =0.5328.

INSTITUCIÓN CERVANTES 67
INSTITUCIÓN CERVANTES

Actividades
Una vez aprendidos y estudiados los conceptos expuestos en las Unidades III y IV está
en condiciones de realizar el siguiente trabajo práctico, usando el programa estadístico
Infostat.

Para realizar este práctico, utilizamos la misma tabla de datos con la que hemos
realizado el trabajo práctico anterior.

Antes de que empiece a desarrollar este trabajo le explicaré a través de un ejemplo


cómo usar el programa Infostat en este caso.

 Ejemplo
La producción de una empresa papelera responde a una distribución Normal de media
527 Kg. diarios de papel y varianza 126 Kg2.

1. Encuentre la probabilidad de que un día determinado se produzca menos de 512


Kg.
2. Encuentre la probabilidad de que un día determinado se produzca más de 532 Kg.
3. Encuentre la probabilidad de que un día determinado se produzca entre 528 y 531
Kg.

Solución
Como en este caso tenemos una distribución Normal, una vez abierto el archivo de
datos con el que trabajaremos, procedemos de la siguiente manera:

1. Activamos el menú ¨Estadísticas¨.


2. Una vez en este menú, elegimos la opción ¨Probabilidades y Cuantiles¨ y dentro de
él la opción que corresponda, de acuerdo con la variable que vamos a estudiar. En
este curso, solo estudiaremos tres distribuciones distintas: La distribución Normal, la
distribución Poisson y la distribución Binomial.
3. Una vez que estamos en este cuadro de diálogo, elegimos la distribución Normal
(correspondiente a este ejemplo) y debemos introducir dos valores, el valor de la
media y de la varianza de la variable.
4. En el cuadro donde figura ¨Valor de x¨ escribimos el valor de probabilidad requerido
y calculamos, obteniendo así el resultado requerido en el cuadro donde dice
“ Pr ob( X £ x) ”.

Entonces, una vez abierto el archivo de datos realizo los pasos especificados
anteriormente:
1) Activo el menú ESTADISTICAS, dentro de él la opción
PROBABILIDADES Y CUANTILES y dentro de este último la opción
NORMAL (en este caso), es decir la siguiente secuencia

68 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

2) Una vez que estamos en este cuadro agregamos los valores requeridos de la
media (527) y la varianza (126) de la variable. Escribiendo también el valor
de la probabilidad que quiero calcular (512). Calculando, obtengo:

INSTITUCIÓN CERVANTES 69
INSTITUCIÓN CERVANTES

1. En este caso, como se puede observar, obtendremos que


la probabilidad de que un día determinado se produzca menos de 512 Kg. es de 0,091
ó del 9,1%.

De la misma forma calculamos las probabilidades requeridas en los ítems 2) y 3) del


ejercicio. Obteniendo de esta manera que:

La probabilidad de que un día determinado se produzca más de 532 Kg. es de


0,328 (siendo este valor el que figura en el cuadro donde dice Pr ob( X > x) )ó del
32,8%.

Para obtener la probabilidad de que un día determinado se produzca entre 528 y 531
Kg., obtenemos primero la probabilidad correspondiente para 531Kg, luego la
correspondiente para 528Kg y las restamos. El valor que se obtiene de esta resta es el
valor buscado. Es decir:

Pr ob(528 < X £ 531) = Pr ob( X £ 531) - Pr ob( X £ 528)


= 0, 6392 - 0, 5355
= 0,1037

Es decir que la probabilidad de que un día determinado se produzca entre 528 y 531
Kg., es de 0,1037 ó del 10,37%.

Ahora sí realice Ud. el mismo trabajo con las variables indicadas. Para ello guíese
8 con las pautas establecidas en el 2º Trabajo Práctico, que se presenta en el
Cuadernillo de Actividades.

70 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

 Unidad V
Intervalos de confianza para la media

Objetivos
1. Construir intervalos de confianza para distintos parámetros e interpretarlos
correctamente.
2. Resolver situaciones aplicadas.

INSTITUCIÓN CERVANTES 71
INSTITUCIÓN CERVANTES

Introducción
La obtención de un estimador por intervalo equivale a tratar de agarrar con un lazo a
un novillo inmóvil. En este caso, el parámetro que se quiere estimar corresponde al
novillo, y el intervalo, al lazo del vaquero. Cada vez que uno saca una muestra se
obtiene un intervalo de confianza para un parámetro y se espera ¨enlazarlo¨-es decir,
incluirlo en el intervalo. No se tendrá éxito en toda muestra, pero un buen estimador por
intervalo tendrá una alta probabilidad de incluir el parámetro estimado.

Supóngase, para considerar un caso práctico, que se desean estimar los réditos medios
de bonos municipales de clase AA. Si tuviéramos que seleccionar 10 muestras, cada una
de n = 30 tasas de interés, para 30 bonos municipales y definir un intervalo de confianza
para la media poblacional m para cada ejemplo, los intervalos podrían aparecer como se
ve en la Fig. 5.1. Los segmentos de recta horizontales representan los 10 intervalos, y la
línea vertical indica la localización de la verdadera tasa media de interés para los bonos
en cuestión. Notesé que el parámetro es fijo y la localización y el ancho del intervalo
varían de una muestra a la otra. De esta manera hablamos de la ¨probabilidad de que el
intervalo contenga a m ¨ y no de la ¨probabilidad de que m esté en el intervalo¨, porque
m es fijo. El intervalo es aleatorio.

M
U
ES
T
R
A

Fig. 5.1. Diez intervalos de confianza para los réditos medios de bonos
municipales de clase AA (con base en una muestra de n = 30 observaciones).

Consideremos ahora, comprendido el concepto de intervalo de confianza, cómo se


obtiene un tal intervalo para una media poblacional m a partir de una muestra aleatoria
de n observaciones.

Se puede determinar un estimador por intervalo, o intervalo de confianza, utilizando


cualquier estimador puntual que sea insesgado y que posea una distribución muestral
aproximadamente normal. Representaremos el parámetro que se quiere estimar por q y
el estimador puntual por q̂ .

72 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

Para ver cómo puede determinarse un intervalo de confianza para q , examinemos la


distribución muestral en la Fig. 5.2. Supóngase que tuviéramos que sacar una muestra
aleatoria de n observaciones de la población y utilizar los datos de la muestra para
calcular una estimación de q . Se indica una estimación puntual particular, indicada por
una flecha vertical en la Fig. 5.2., que cae dentro de 1.96 s qˆ .

0.

1.96 s qˆ q̂ 1.96 s qˆ

Fig. 5.2. Un intervalo de confianza para q .

Puede observarse que el intervalo de qˆ - 1.96 s qˆ a qˆ + 1.96 s qˆ , incluye a q . La


estimación puntual q̂ caerá dentro de 1.96 s qˆ de q con una probabilidad igual a 0.95.

Como el intervalo que describimos arriba contendrá a q con una probabilidad de 0.95,
se le llama intervalo de confianza de 95%. La probabilidad de que el mismo contenga a
q se llama coeficiente de confianza para el intervalo citado. Los límites inferiores y
superiores del intervalo de confianza se denominan límite inferior y límite superior de
confianza (LIC y LSC), respectivamente. Así,

Límite inferior de confianza: LIC = qˆ - 1.96 s qˆ

Límite superior de confianza: LSC = qˆ + 1.96 s qˆ

Estimación de la Media Poblacional


Aunque siempre hay excepciones raras, tamaños de muestra de n = 30 , o más,
asegurarán la validez tanto de la cota para el error de estimación, como del intervalo de
confianza. La distribución muestral para x tendrá aproximadamente una distribución
normal para n ³ 30 , y la desviación estándar muestral s , proporcionará una
aproximación adecuada para la desviación estándar poblacional s . Resumiremos las
fórmulas para los intervalos de confianza, en el recuadro.

INSTITUCIÓN CERVANTES 73
INSTITUCIÓN CERVANTES

INTERVALO DE CONFIANZA DE (1 - a )100% , PARA MUESTRAS


GRANDES, CORRESPONDIENTE A UNA MEDIA POBLACIONAL

za 2 s

n

a
donde za 2 = valor z que corresponde al área 2 en el extremo superior de una
distribución normal estándar z.
n = tamaño muestral.
s = desviación estándar de la población muestreada.

Si se desconoce s , puede aproximarse por la desviación estándar muestral s.

Suposición: n ³ 30 .

 Ejemplo 1
Encuentre un intervalo de confianza de 90% para la media de la tasa principal para
préstamos.

Solución

Debemos notar que el estimador puntual x de la media poblacional m , tiene una


distribución de muestreo que satisface las propiedades de la distribución normal. Por lo
tanto, un intervalo de confianza de 90% para la media de la tasa principal para préstamos
m , es
z s
x ± 0.05
n

o bien
s
x ± 1.645
n

Al sustituir x = 9.1% y n=50, y utilizar s = 0.24% para aproximar s , obtenemos

0.24
9.1 ± (1.645)
50

o bien
9.1 ± 0.0558

Así se ve que la media de la tasa principal para préstamos se encuentra entre 9.0442% y
9.1558%. ¿Podemos asegurar que este intervalo particular contiene a m ? No, pero sí hay

74 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

expectativas de que así es. Si se utiliza el intervalo de confianza para estimar m , la


probabilidad de que un intervalo contenga a m , es 0.90.

Aparte de intervalos de confianza bilaterales (que llamaremos simplemente ¨intervalos


de confianza¨), es posible determinar también intervalos de confianza unilaterales para
parámetros. Un intervalo de confianza unilateral inferior para un parámetro q
estimará que q es mayor que algún límite inferior de confianza (LIC). Un intervalo de
confianza unilateral superior estimará que q es menor que algún límite superior de
confianza (LSC). El valor z que hay que utilizar para un intervalo de confianza
unilateral de (1- a )100% , za , localiza a en un solo extremo de la distribución normal.

 Ejemplo 2
Una corporación quiere emitir algunos pagarés a corto plazo y espera que los intereses
que tendrá que pagar no sean mayores que 11.5%. Para obtener cierta información
acerca de la tasa media de interés que habría de pagar, la corporación pone a la venta 40
pagarés, uno a través de cada una de 40 firmas de corretaje. La media y la desviación
estándar para las cuarenta tasas de interés, eran x = 10.3% y s = 0.31% . Como
solamente interesa el límite superior de la tasa de interés que hay que pagar, hallar un
intervalo de confianza unilateral superior de 95% para la tasa media de interés que
pagaría la corporación para los pagarés.

Solución

Puesto que el coeficiente de confianza es 0.95, a = 0.05 y z0.05 = 1.645 . Por lo tanto,
el intervalo de confianza unilateral superior de 95%, para m es,

z0.05 s

n

o bien
s
x ± 1.645
n

Al sustituir x = 10.3 , n = 40 y s = 0.31 , para aproximar s , obtenemos el intervalo


de confianza unilateral superior
0.31
LSC = 10.3 + (1.645)
40

o bien
LSC = 10.3 + 0.0806 = 10.3806

Así estimamos que la tasa media de interés, que la corporación tendrá que pagar para
sus pagarés, es menor que 10.3806%. ¿Qué tanta confianza puede tenerse en esta
conclusión? Hay mucha seguridad, porque sabemos que la probabilidad de que el
intervalo de confianza unilateral contenga a m , es 0.95.
INSTITUCIÓN CERVANTES 75
INSTITUCIÓN CERVANTES

Una vez aprendidos y estudiados los conceptos expuestos en esta Unidad está en
condiciones de realizar el siguiente trabajo práctico, usando el programa estadístico
Infostat.

Para realizar este práctico, utilizamos la misma tabla de datos con la que hemos
realizado los trabajos prácticos anteriores.

Una vez abierto el archivo de datos con el que trabajaremos, procedemos de la


siguiente manera:

5. Activamos el menú ¨Estadisticas¨.


6. Una vez en este menú, elegimos la opción ¨Inferencia Basada en Una Muestra¨ y
dentro de él la opción ¨Intervalos de Confianza¨.
7. Una vez que estamos en este cuadro de diálogo, elegimos la variable de la que
queremos calcular el intervalo de confianza, y aceptamos, obteniendo así el
intervalo de confianza requerido.

Ejemplo:

Supongamos que se quiere obtener un intervalo de confianza del 95% para el promedio
o media de la variable SUELDO.

Entonces, una vez abierto el archivo de datos realizo los pasos especificados
anteriormente:

1. Activo el menú ESTADISTICAS, dentro de él la opción INFERENCIA BASADA


EN UNA MUESTRA y dentro de este último la opción INTERVALOS DE
CONFIANZA, es decir la siguiente secuencia

76 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

2. Una vez activado el cuadro de diálogo INTERVALOS DE CONFIANZA, paso al


cuadro VARIABLES la variable de la que quiero obtener el intervalo, aceptando,
obtengo:

INSTITUCIÓN CERVANTES 77
INSTITUCIÓN CERVANTES

3. En este caso, como se puede observar, obtendremos un INTERVALO DE


CONFIANZA BILATERAL del 95% para la MEDIA.
4. Si no son esas las especificaciones deseadas, pueden cambiarse en el mismo cuadro de
diálogo. Aceptando esta opción se obtiene ya el intervalo de confianza deseado.

5. Algo muy importante que hay que realizar con todo resultado estadístico es una
correcta interpretación del mismo, así nuestro resultado es:

78 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

La variable SUELDO tiene un promedio x = 1524, 64 y el intervalo del 95% de


confianza, está dado por (1219,74; 1829,54). Esto significa que este intervalo contiene el
valor del promedio de la variable en un 95% de los casos o con una probabilidad del 95%.

Ahora Ud. realice el mismo trabajo con el resto de las variables, por supuesto, para
8 las que tenga sentido calcularlo.
Para ello guíese con las pautas establecidas en el 3º Trabajo Práctico, que se
presenta en el Cuadernillo de Actividades.

INSTITUCIÓN CERVANTES 79
INSTITUCIÓN CERVANTES

80 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística Social

Indice
Fundamentación ..................................................................... 1
Objetivos generales ................................................................ 1
Contenidos............................................................................. 2
Propuesta metodológica ......................................................... 3
Evaluación.............................................................................. 3
Bibliografía ............................................................................ 4
Evaluación Diagnóstica ........................................................... 5

U NIDAD I
Presentación de los Datos ...................................................... 7
Objetivos ............................................................................................................... 7
Introducción .......................................................................... 8
Estadística descriptiva............................................................................................ 9
Estadística inferencial............................................................................................. 9
Métodos utilizados para analizar un determinado conjunto de datos................. 10
Recolección de los datos........................................................................................................10
Presentación y caracterización de los datos .........................................................................10
Gráficos................................................................................................................ 13
Gráficos de barras (Serie de Frecuencias) ...........................................................................14
Gráficos de sectores ...............................................................................................................16
Histograma – Polígono de frecuencia..................................................................................17

U NIDAD II
Análisis y medición de datos ................................................. 19
Objetivos ............................................................................................................. 19
Cálculo, descripción y medición de datos ........................................................... 20
Parámetros de posición. Serie simple ................................................................ 21
Promedio................................................................................................................................21
Mediana .................................................................................................................................22
Modo ......................................................................................................................................23
Parámetros de dispersión. Serie simple ............................................................. 23
Desvíos ...................................................................................................................................23
Desviación media ..................................................................................................................25
Varianza .................................................................................................................................25
Desviación estándar...............................................................................................................26
Parámetros de posición. Serie de frecuencias.................................................... 28
Promedio................................................................................................................................28
Mediana .................................................................................................................................29
Modo ......................................................................................................................................29
Parámetros de dispersión. Serie de frecuencias................................................. 30
Desviación Media..................................................................................................................30
Varianza .................................................................................................................................31
Desviación estándar...............................................................................................................31
Parámetros de posición. Serie de intervalos de clase ........................................ 32
Promedio................................................................................................................................32
Mediana .................................................................................................................................33
Parámetros de dispersión. Serie de intervalos de clase ..................................... 33
Desviación media ..................................................................................................................33
Varianza .................................................................................................................................34
INSTITUCIÓN CERVANTES 81
INSTITUCIÓN CERVANTES

Desviación estándar .............................................................................................................. 34


Simetría y asimetría de la distribución de los datos............................................. 34
Distribución normal – Curva de Gauss .............................................................................. 35
Fórmula para convertir a unidades estándar ....................................................... 36
Coeficiente de variación ...................................................................................... 38

U NIDAD III
Probabilidades...................................................................... 45
Objetivos.............................................................................................................. 45
Contenidos que Ud. debe tener en claro antes del estudio de esta unidad ....... 45
Probabilidades...................................................................................................... 46
Introducción al concepto de probabilidad ........................................................... 46
Actividades........................................................................................................... 49
Probabilidad de 2 sucesos.................................................................................... 49
Casos particulares................................................................................................ 51
I- Sucesos Excluyentes.......................................................................................................... 51
II- Sucesos Contrarios .......................................................................................................... 52
III- Sucesos Incluidos ........................................................................................................... 53
Responda ............................................................................................................. 53
Probabilidad Condicionada .................................................................................. 54
Actividades........................................................................................................... 56
Principio de Probabilidad Compuesta ................................................................. 56

U NIDAD IV
Distribuciones de probabilidad para variables aleatorias
discretas y continuas .............................................................. 59
Objetivos.............................................................................................................. 59
Introducción......................................................................................................... 60
Distribución Binomial........................................................................................... 60
Distribución de Poisson ....................................................................................... 62
Variables Aleatorias Continuas ............................................................................ 63
Distribución de Probabilidad Normal.................................................................. 64
Tabulación de las áreas de la distribución de probabilidad normal ..................... 65
Actividades........................................................................................................... 68

U NIDAD V
Intervalos de confianza para la media ................................... 71
Objetivos.............................................................................................................. 71
Introducción......................................................................................................... 72
Estimación de la Media Poblacional ..................................................................... 73

Material elaborado por Lucía Ruiz


Compaginado por Lic. Marissa Gonella
 2005 – AML 
09/04/07 17:29

82 INSTITUCIÓN CERVANTES
Área Empresarial
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística – Actividades

Actividades

Unidad I
1. Se hizo un censo entre los alumnos de un curso para saber la cantidad de hermanos
que tienen. Los resultados obtenidos son los siguientes:
2, 2, 1, 2, 3, 3, 2, 3, 2, 2, 1, 3, 2, 2, 4, 4, 2, 2, 4, 1, 5, 5, 2, 7, 3, 2, 6, 3
2, 3, 3, 2, 3, 4, 7, 1, 3, 3, 2, 3, 6, 1
a) Construya la serie simple.
b) Construya la serie de frecuencias.
c) Construya la serie de intervalos de clase.
d) Señale qué tipo de atributo es el que se está estudiando.

2. Se toma un grupo de cuarenta socios de un club y se anotan sus edades. Se obtienen


los siguientes datos
18, 25, 36, 13, 4, 6, 7, 42, 56, 35, 5, 6, 44, 37, 21, 47, 32, 7, 33, 26,
23, 11, 14, 12, 15, 16, 17, 13, 12, 23, 2, 4, 6, 10, 12, 8, 25, 57, 74, 47.
a) Construya la serie simple.
b) Sabiendo que en el Club se han establecido las siguientes categorías
de socios:
Infantiles : de 2 a 8 años
Menores : de 8 a 14 años
Adolescentes : de 14 a 18 años
Mayores : de 18 a 99 años

c) Construya la serie de intervalos de clase.


d) Señale qué tipo de atributo es el que se está estudiando.

3. Preguntando a 120 personas sobre su estado civil, se han obtenido los siguientes
resultados:
Están solteros 45, están casados 50, están viudos 15, están divorciados 10.
¿Cuál es la variable en estudio y de qué tipo es?
Realice la tabla que muestre los resultados obtenidos y que muestre las
frecuencias y frecuencias relativas de cada dato.

4. El administrador de un Kiosco ha agrupado las compras de caramelos en la siguiente


distribución de intervalos de clase:[0 – 5); [5 – 10); [10 – 15);
[15 – 20); [20 – 25); [25 – 30); etc.
¿Es posible determinar, en base a esta agrupación las compras valoradas en:
a) Menos de $ 10,00?
b) $ 10,00 o menos?
c) Mas de $ 25,00?
d) $ 25,00 o mas?
INSTITUCIÓN CERVANTES 1
INSTITUCIÓN CERVANTES

5. La siguiente es la distribución de los pesos de 125 muestras de minerales:

Peso en Numero de
Gramos especímenes
[ 0 – 20 ) 16
[ 20 – 40 ) 38
[ 40 – 60 ) 35
[ 60 – 80 ) 20
[ 80 – 100 ) 11
[ 100 – 120 ) 4
[ 120 – 140 ) 1
Total 125

Si es posible, encuentre cuántas de las muestras pesan


a) como máximo 60 gramos..
b) 60 gramos o mas.
c) Mas de 80 gramos.
d) 80 gramos o menos.
e) Exactamente 70 gramos
f) Cualquier valor entre 60 gramos (incluido este) y 100 gramos (sin
tomar este valor)

6. Al 31/10/80 la existencia estimada del parque nacional de automotores es la siguiente:


2600000 automóviles; 720000 piks-ups; 244000 camiones; y 36000 transportes.
(colectivos).
Calcular el porcentual para cada categoría de vehículo y construir el gráfico de
sectores correspondiente.

7. Damos a continuación los promedios de inglés de un curso:


4.33; 5; 7; 9.66; 10; 8; 6; 2; 1.33; 3; 4; 4.50; 7.50; 6.66; 5.50; 9; 4; 1; 10; 4.50; 7.33; 7; 8;
5.50; 6; 6; 2; 5

a) Construya la serie simple.


b) Construya la serie de frecuencias.
c) Construya la serie de intervalos de clase considerando: [0, 2); [2, 4);
[4, 6); [6, 8); [8, 10); [10, 12).
d) Construya el histograma, el polígono de frecuencias, y el gráfico de
barras.

2 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística – Actividades

Unidad II
1. Se dan las notas obtenidas por los alumnos en un examen final:
5; 7; 7; 10; 6; 2; 3; 8; 4; 5; 8; 5; 7; 6; 10; 6; 7; 8; 6; 1; 6; 4; 6; 5; 7; 7; 4; 3; 9; 7; 8; 5.
a) Construye la serie de frecuencias y calcular, x ,Me, y Mo.
b) Construye el histograma, el polígono de frecuencias y el gráfico de
barras.
c) Calcula el promedio, la mediana y el modo para la serie de intervalos
de clase: [0-2) [2-4) [4-6) [6-8) [8-10) [10-12].

2. Los alumnos de un curso deben determinar el volumen de un cilindro midiendo


el diámetro y la altura. Cada alumno hace una medición obteniendo los
siguientes resultados (en cm.).
33.2; 33.6; 34.5; 36.2; 32.7; 32.1; 31.5; 32.2; 33.1; 33.7; 34.3; 34.5; 35.2; 35.7; 35.9;
34.2; 34.3; 36.4; 33.3; 33.9; 33.2; 33.2; 34.3; 35.8.
a) Construir la serie simple y calcular el promedio, Me y Mo.
b) Construir la serie de frecuencia y calcular el promedio, Me y Mo.
c) Construir la serie de intervalos de clase tomando intervalos de 1 cm.
[31-32); [32-33); etc, y calcular el promedio, Me y Mo.
d) Construir el histograma.
e) Calcular la desviación media, varianza y desviación estándar de la
serie simple, de frecuencias y de intervalos de clase.

3. En la siguiente tabla se muestra los resultados de una inspección realizada a 623


juegos de vajillas. En la columna de la x figura la cantidad de piezas defectuosas y
en la de frecuencias aparece la cantidad de juegos que tiene ese numero de fallas.

x 1 12 3 4 5 6 7 8 9 10
f 28 46 60 100 94 126 78 46 33 12

Calcula el promedio, la mediana y el modo en esta serie.

4. En 5 intentos, una persona requirió de 12, 18, 14, 11 y 15 minutos para cambiar el
aceite de una marca particular de automóvil. Calcule la desviación estándar de
esta muestra.

5. En cuatro días, una persona requirió de 37, 32, 35 y 41 minutos para llegar de un
trabajo a otro:
a) Calcular la desviación estándar de estos datos.
b) Sustraiga 30 a cada uno de estos datos, tome estas nuevas cifras, como
una nueva serie y luego calcule su desviación estándar.
c) ¿Qué regla general sugiere esto para simplificar el cálculo de la
desviación estándar?

INSTITUCIÓN CERVANTES 3
INSTITUCIÓN CERVANTES

6. Los registros de una aerolínea demuestran que los vuelos entre dos ciudades
llegan en promedio 5,4 minutos tarde con una desviación estándar de 1,4.
Averiguar, ¿Por lo menos que porcentaje de estos vuelos llegan con un retraso
comprendido entre 2,6 y 8,2 minutos?

7. Determina el valor del promedio, la desviación media, la varianza y la desviación


estándar para la serie de frecuencias del ejercicio 1 de la Unidad I

8. Determina el valor del promedio, la desviación media, la varianza y la desviación


estándar para la serie de intervalos de clase del ejercicio 2 de la Unidad I.

9. Determinar el valor del promedio y la desviación estándar para la serie de


intervalos de clase del ejercicio 7 de la Unidad I. ¿Qué conclusión puedes sacar de
los valores obtenidos? ¿Los valores están agrupados o dispersos?

10. Calcula la desviación estándar del ejercicio 1 de al Unidad II. ¿Cómo se agrupan
los datos en torno al promedio?

11. Calcula la desviación estándar correspondiente al ejercicio 2 de la Unidad II.


¿Qué significa este valor respecto a la agrupación de los datos?

12. Los modelos con dos años de antigüedad de cierta marca de automóvil se han
estado vendiendo, en promedio a $7860 con una desviación estándar de $820, en
tanto que los modelos con tres años de antigüedad de la misma marca cuestan en
promedio $6400 con una desviación estándar de $960.
Un modelo con dos años de antigüedad valuado en $6960 ¿es una mejor oferta
que un modelo con tres años de antigüedad valuado en $5400 sin tomar en cuenta
todas las demás consideraciones?.

13. En 14 días un restaurante tuvo los siguientes pedidos de pollo y de carne:

Pollo : 46, 55, 43, 48, 54, 65, 36, 40, 51, 53, 64, 32, 41, 46
Carne : 39, 41, 45, 30, 46, 36, 37, 23, 30, 33, 50, 44, 41, 28

Calcular los dos coeficientes de variación para determinar el articulo para el


que el número de ordenes es más variable.

4 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística – Actividades

14. Una muestra de 20 trabajadores de una compañía pequeña obtuvieron los


siguientes salarios:
$240 - $240 -$240 -$240 -$240 -$240 -$240 -$240 -$255-$25-$265-$265-$280-$280-
$290-$300-$305-$325-$330-$340
Calcular:
a) El promedio de los sueldos.
b) La mediana y el modo.

15. Para los salarios del problema anterior, describa su distribución en términos de
asimetría.

16. Si estuviera Ud. en cada una de las siguientes situaciones, señale que medida de
posición reportaría para los datos del problema 14 de la Unidad II y en qué
sentido puede considerarse "típico" cada valor.

a) Como vicepresidente responsable de las negociaciones colectivas con


los trabajadores.
b) Como presidente de los representantes de los trabajadores.

17. Suponga que tiene una lista de los precios de un artículo de consumo popular en
22 áreas metropolitanas que varían considerablemente en tamaño y ventas de ese
articulo. Se calculan:
a) La mediana.
b) El promedio para esos datos.
Describa el significado que tendría cada uno de esos valores.

18. Al realizar auditorías anuales, en un despacho contable se lleva un registro del


tiempo que se necesita para auditar 50 cuentas, tal como se señala en la tabla 1.
Calcular:
a) El promedio.
b) La mediana.
c) La moda.

TABLA 1: Tiempo requerido para auditar saldos de cuentas.

X f Xm Xm*f fa
[ 10 - 19 ] 3 14,5 43,5 3 X= tiempos de auditoria
[ 20 - 29 ] 5 24,5 122,5 8
[ 30 - 39 ] 10 34,5 345,0 18 f=numero de registros
[ 40 - 49 ] 12 44,5 534,0 30
[ 50 - 59 ] 20 54,5 1090,0 50
Total 50 2135

INSTITUCIÓN CERVANTES 5
INSTITUCIÓN CERVANTES

19. Comente la forma de la distribución de los tiempos de auditoría reportados en el


ejercicio 18 de la Unidad II.

20. El número de automóviles que vendió cada uno de los 10 vendedores de una
distribuidora en un mes específico, en orden ascendente, es: 2, 4, 7, 10, 10, 10, 12,
12, 14 y 15. Determine para la población:

a) El promedio.
b) La mediana.
c) La moda.
Para el número de automóviles vendidos.

21. Determine el coeficiente de variación para los datos de salarios analizados en los
problemas 14 de la Unidad II.
A- Para la misma empresa industrial del problema 14 de la Unidad II, el salario
diario promedio de una muestra de supervisores, es: x = $730750, con
S= $45520.
Determine el coeficiente de variación para estos salarios.

22. Compare la variabilidad de los salarios de los trabajadores especializados del


problema 14 de la Unidad II con los salarios de los supervisores del problema 22
de la Unidad II.
a) En términos absolutos.
b) Con respecto al nivel promedio de ingresos diarios para los dos grupos
de empleados.

6 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística – Actividades

Trabajo Práctico Nº 1

Objetivos generales
El alumno deberá estar capacitado para:
 Agrupar correctamente cada conjunto de datos e interpretar las frecuencias de los
mismos.
 Reconocer y describir los distintos tipos de variables.
 Representar cada variable, a través de las correspondientes tablas y gráficos.

Objetivos específicos
El alumno deberá estar capacitado para:
 Implementar las opciones “Medidas Resúmenes” y “Frecuencias” del software
estadístico INFOSTAT.
 Implementar las opciones “Histograma” y “Diagrama de Barras” del mismo
software.

Bibliografía y materiales
 Módulo.
 Guía de Actividades.
 Mendenhall, William, Estadística para Administradores. Grupo Editorial
Iberoamérica. 1990.
 Kazmier, L. y Diaz Mata, A., Estadística Aplicada a la Administración y Economía.
McGraw Hill. 1996.
 Infostat (CD y Manual del Usuario).

Nota: Se recomienda la lectura de los siguientes subtítulos del libro de Kazmier:

 Trabajo práctico Nº1: 1.1 al 6; 2.1, 2, 3, 5 al 9; 3.1, 2, 4, 5, 7, 8; 4.1, 5, 7, 8, 9.

Palabras claves
Población – Muestra – Variable – Posición - Dispersión – Frecuencia – Simetría –
Atributo – Discreta – Continua – Parámetro – Estimador – Media – Varianza –
Desviación estándar – Kurtosis.

INSTITUCIÓN CERVANTES 7
INSTITUCIÓN CERVANTES

Orientación
 ¿Cómo puedo describir, en pocas palabras o valores, un conjunto de datos?
 ¿Cómo puedo describir, gráficamente una variable?
 ¿Podré describir de la misma forma a las variables discretas que a las continuas?
 ¿Podré agruparlas de la misma forma?
 ¿Qué gráfico es adecuado para cada una de ellas?
 ¿Qué está representando realmente con cada gráfico?
 ¿Hay diferencia entre tener parte de la información con tener la totalidad de la
misma? (Población – Muestra - Representatividad). ¿Cuáles son esas diferencias?
 ¿Puedo asegurar que las medidas que presento son efectivamente las reales?
(Parámetro - Estimador)
 Las medidas de posición, ¿son indistintas para la representación de cualquier
variable? ¿Por qué?

D Sugerencia
Realice los ejercicios de la Guía de Actividades, correspondientes a las Unidades I y
II.

Actividades
Deberá presentar un informe impreso en Word, con:

 Las medidas resúmenes, que tengan sentido, de cada variable. Gráficos y


comentarios describiendo a cada uno de ellos.
 Deberá explicar oralmente, los criterios utilizados y los resultados obtenidos (Cada
integrante del grupo).
 No se aceptarán planillas de cálculo.

Fecha de Presentación: Cuarto encuentro presencial

Criterios de evaluación
Se evaluará:
 Que las medidas descriptivas estén correctamente especificadas con sus respectivas
unidades de medida.
 Que cada gráfico exprese alguna característica particular de interés.
 Que no se presenten redundancias.
 Que cada medida resumen o gráfico tenga su correspondiente comentario
explicativo.
 Que cada comentario se corresponda con la medida o gráfico que aluda.

8 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística – Actividades

 Que el informe contenga una descripción exhaustiva de cada variable tratada.


 La presentación, considerando el formato, la organización y la claridad.

Unidad III
1. Se arrojan 2 dados: uno rojo y uno blanco.
a) ¿Estos sucesos son dependientes o independientes?
b) ¿Cuál es la probabilidad de obtener 1 en el rojo y 6 en el blanco?
c) ¿Cuál es la probabilidad de obtener 1 en el blanco y un número par en el rojo?
d) ¿Cuál es la probabilidad de obtener 3 en el blanco y 4 o 6 en el rojo?
e) ¿Cuál es la probabilidad de obtener un 1 y un 3?

2. Se arroja un dado. ¿Cuál es la probabilidad de obtener:


a) un 1?
b) un 2?
c) un número par?
d) un 1 o un número par?
e) un 2 o un número par?

3. Para realizar un estudio sobre los peces que habitan un lago del sur, se hace una
encuesta entre los pescadores de la zona. Se les pregunta qué tipo de peces han
extraído del lago y cuántos de cada uno. Con los datos recopilados se construye la
siguiente tabla de frecuencias:

Tipo de pez Frecuencia


Trucha 42
Salmón 32
Otros 26
TOTAL 100

a) Con estos datos: ¿Cuál se estima que es la probabilidad de obtener una trucha de
ese lago?
b) Se supone que en el lago hay 2000 peces: ¿Cuántas truchas estima que hay?

Problemas de aplicación
1. (Clasificación de empleados) Una empresa tiene 60 personas con diploma de
preparatoria en su equipo, 28 de los cuales habían cursado computación en la
preparatoria. De estos empleados, 39 aún no cumplen los 40 años de edad; entre
estos 39, 21 habían cursado computación en la preparatoria. Si se elige al azar una
persona entre las 60, ¿cuál es la probabilidad de que tenga más de 40 años y no tenga
conocimientos de computación?

INSTITUCIÓN CERVANTES 9
INSTITUCIÓN CERVANTES

2. (Compras en supermercados) De los consumidores en un supermercado, 20% compran


10 artículos o menos, el 70% gastan más de $10 y el 68% gasta menos de $10 y
compra más de 10 artículos. ¿Cuál es la probabilidad de que un consumidor elegido
al azar:
a) ¿Gaste más de $10 y compre 10 artículos o menos?
b) ¿Gaste menos de $10 y compre 10 artículos o menos?

3. En cierta comunidad, 70% de las personas fuman; 40% tiene cáncer pulmonar y 25%
fuma y tiene cáncer pulmonar. Si S y L denotan los eventos de fumar y tener cáncer
pulmonar (completando la tabla adjunta)

S S’
L
L’
1

Determine la probabilidad de que un individuo escogido al azar:


a) No fume pero tenga cáncer pulmonar.
b) Fume pero no tenga cáncer pulmonar.
c) No fume ni tenga cáncer pulmonar.
d) Fume o no tenga cáncer pulmonar.
e) No fume o tenga cáncer pulmonar
f) No fume o no tenga cáncer pulmonar.

4. En un edificio de departamentos de 200 familias, 180 tienen televisión y 150 tienen


automóvil propio. Hay 14 familias que no tienen TV pero sí automóvil propio. Si T
y C denotan los eventos de tener TV y tener automóvil propio, entonces
(completando la tabla adjunta)

T T’
C
C’
1

Calcule la probabilidad de que una familia seleccionada en el edificio:


a) No tenga ni TV ni automóvil propio.
b) Tenga automóvil y TV.
c) Tenga TV pero no tenga automóvil.
d) Tenga TV o no tenga automóvil.
e) No tenga TV pero sí automóvil.
f) No tenga automóvil o no tenga TV.

5. (Devolución de automóviles defectuosos) En cierto periodo, una planta automotriz


produce 5000 automóviles. De éstos, 1000 se armaron en lunes, 1000 en martes, etc.,
y por último 1000 en viernes. Fue necesario devolver 400 de estos automóviles que
requerían reparación de serios defectos durante el período de vigencia de la garantía.
De los automóviles armados en viernes, se devolvieron 150.

10 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística – Actividades

6. Un automóvil se construyó en viernes y salió defectuoso: ¿estos dos eventos son


independientes entre sí?

7. (Inspección de productos) Dos inspectores, A y B, examinan un producto. De los


productos defectuosos, el 20% los detectó el inspector A; y si éste detecta un producto
defectuoso, existe una probabilidad de 0,5 que haya pasado por el inspector B. ¿Cuál
será la probabilidad de que un producto defectuoso sea detectado por ambos
inspectores?

8. (Inspección de productos) Un fabricante de latas almacena en grupos de 500. En un


grupo particular, 150 de las latas son anormales. Un inspector selecciona 2 latas al
azar del grupo. ¿Cuál es la probabilidad:
a) de que ambas sean normales?
b) De que ambas estén en buenas condiciones?

9. (Publicidad por televisión) Una compañía estima que el 30% de la población ha visto
un anuncio por televisión de su detergente en polvo. De todos los que han visto el
anuncio, el 10% comprará el producto más tarde. ¿Qué proporción de la población
ha visto el anuncio y ha comprado el producto? Si el 5% de los que no vieron el
anuncio compraron el jabón en polvo, calcule esta probabilidad:
a) Que un individuo seleccionado al azar haya comprado el jabón en polvo.
b) Que una persona que haya comprado el jabón en polvo no haya visto el anuncio.

10. (Perfil de los usuarios de tarjetas de crédito) Una compañía de tarjetas de crédito
descubre que el 40% de sus clientes viven en áreas urbanas y que el 60% viven en
suburbios o en áreas rurales. De los clientes, el 30% promedian más de $200 al mes
en operaciones con su tarjeta de crédito y el 10% viven en áreas urbanas y gastan más
de $200 al mes. Calcule la probabilidad de que un cliente dado viva en un área
urbana determinada y tal cliente gaste menos de $200 al mes usando su tarjeta de
crédito.

11. (Proveedores de componentes) Un fabricante compra cierto componente a dos


proveedores, A y B. Durante cierto tiempo, la compañía usó 20000 de tales
componente, 6000 de los cuales provenían de A. De estos componentes, el 3% de los
suministrados por A y el 1 1/2 % de los surtidos por B resultaron defectuosos. Calcule
la probabilidad de obtener un componente defectuoso dado que lo ha suministrado
A.

INSTITUCIÓN CERVANTES 11
INSTITUCIÓN CERVANTES

Unidad IV

Trabajo Práctico Nº 2

Objetivos generales
El alumno deberá estar capacitado para:
 Identificar correctamente las distintas Distribuciones: Binomial, Poisson, Normal.
 Calcular probabilidades específicas, una vez conocida la distribución de la variable
en estudio.

Objetivos específicos
El alumno deberá estar capacitado para:
 Implementar la opción “Probabilidades” del software estadístico INFOSTAT.
 Generar variables, teniendo distribuciones prefijadas.

Bibliografía y materiales
 Módulo.
 Guía de Actividades.
 Mendenhall, William. Estadística para Administradores. Grupo Editorial
Iberoamérica. 1990.
 Kazmier, L. y Diaz Mata, A. Estadística Aplicada a la Administración y Economía.
McGraw Hill. 1996.
 Infostat (CD y Manual del Usuario).

Nota: Se recomienda la lectura de los siguientes subtítulos del libro de Kazmier:


 Trabajo práctico Nº2: 5.1, 2, 3, 4, 5, 8; 6.1, 2, 3, 6; 7.1 al 5.

Palabras claves
Evento – Variable Aleatoria – Probabilidad – Esperanza Matemática – Distribución de
probabilidades – Densidad – Binomial – Poisson – Normal – Normal Estándar.

12 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística – Actividades

Orientación
 ¿Que entiende Ud. por probabilidad?
 La probabilidad ¿puede ser un número cualquiera o tiene algunas restricciones?
 ¿Cómo podría medir la cantidad de éxitos en una muestra?
 ¿Cómo podría medir la probabilidad de que lleguen 7 autos por minuto a una
estación de peaje, sabiendo que llegan, en promedio, 5 por minuto?
 ¿Cuáles son las principales diferencias entre una variable aleatoria que tiene una
distribución Binomial y una que tiene distribución Poisson?
 ¿Qué entiende por probabilidad acumulada de una variable aleatoria?
 ¿Si una variable aleatoria es continua ¿qué distribución podría ser adecuada para
describirla?
 ¿Cómo debería ser el histograma de una variable aleatoria con distribución Normal?
 ¿Qué características deberíamos tener en cuenta para poder asumir que una variable
aleatoria tiene distribución Normal?

Actividades
Deberá presentar un informe impreso en Word, con los siguientes cálculos:
 Denominando con X a la variable aleatoria Estatura, y sabiendo que ésta tiene una
distribución Normal, calcular:
 la probabilidad de que un empleado de la empresa, elegido al azar, mida
exactamente 1.67 mts.
 la probabilidad de que un empleado de la empresa, elegido al azar, mida menos de
1.67 mts.
 la probabilidad de que un empleado de la empresa, elegido al azar, mida entre 1.70
mts y 1.80 mts.
 la probabilidad de que un empleado de la empresa, elegido al azar, mida 1.67 mts o
menos.
 la probabilidad que entre los empleados de la empresa que miden 1.72 mts, uno de
ellos sea de sexo femenino.
 la probabilidad que entre los empleados de la empresa que miden 1.67 mts, uno de
ellos sea de sexo masculino.
 la probabilidad que entre los empleados de la empresa que miden 1.79 mts, tres de
ellos sean de sexo femenino.
 la probabilidad que entre los empleados de la empresa que miden 1.65 mts, tres de
ellos sean de sexo masculino.
 la probabilidad que entre los empleados de la empresa que miden 1.65 mts, tres de
ellos sean de sexo femenino.
 la probabilidad que entre los empleados de la empresa que miden 1.75 mts, uno o
más de ellos sean de sexo femenino.
 la probabilidad que entre los empleados de la empresa que miden 1.75mts, tres de
ellos o menos sean de sexo masculino.

INSTITUCIÓN CERVANTES 13
INSTITUCIÓN CERVANTES

 Denominando con Y a la variable aleatoria Cantidad de Hijos, y sabiendo que ésta


tiene una distribución Poisson, calcular:
 la probabilidad que un empleado cualquiera perteneciente a la empresa, elegido al
azar, tenga exactamente 2 hijos.
 la probabilidad que un empleado cualquiera perteneciente a la empresa, elegido al
azar, tenga más de 2 hijos.
 la probabilidad que un empleado cualquiera perteneciente a la empresa, elegido al
azar, tenga menos de 2 hijos.
 la probabilidad que un empleado cualquiera perteneciente a la empresa, elegido al
azar, tenga más de 2 hijos y menos de 5 hijos.
 la probabilidad que un empleado cualquiera perteneciente a la empresa, elegido al
azar, tenga 2 hijos o más, pero 5 o menos.
 Deberá explicar oralmente, los criterios utilizados y los resultados obtenidos (Cada
integrante del grupo).
 No se aceptarán planillas de cálculo.

Fecha de Presentación: Quinto encuentro presencial.

Criterios de evaluación
Se evaluará:
 Que los cálculos realizados estén correctamente especificados.
 Que cada cálculo realizado tenga su correspondiente comentario o interpretación
explicativa.
 Que cada comentario se corresponda con el cálculo al que alude.
 Que el informe contenga una descripción exhaustiva de cada variable tratada y sus
correspondientes distribuciones.
 La presentación, considerando el formato, la organización y la claridad.

14 INSTITUCIÓN CERVANTES
Ciencias Empresariales
INSTITUCIÓN CERVANTES Estadística – Actividades

Trabajo Práctico Nº 3

Objetivos generales
 El alumno deberá comprender los conceptos de Estimador y Confianza

Objetivos específicos
El alumno deberá estar capacitado para:
 Implementar la opción “Intervalos de Confianza” (del Menú
Estadísticas→Estimación de Características Poblacionales→Muestreo Aleatorio
Simple) del software estadístico INFOSTAT.

Bibliografía y materiales
 Kazmier, L. y Diaz Mata, A. Estadística Aplicada a la Administración y Economía.
McGraw Hill. 1996.
 Mendenhall, William. Estadística para Administradores. Grupo Editorial
Iberoamérica. 1990.
 Infostat (CD y Manual del Usuario).

Nota: Se recomienda la lectura de los siguientes subtítulos del libro de Kazmier:


 Trabajo práctico Nº3: 8.1, 2, 3, 5; 9.1, 2, 3, 5, 6.

Palabras claves
Estimación – Estimación puntual - Intervalos de Confianza – Error de Estimación.

Orientación
 ¿Cómo podemos estimar puntualmente el valor de la media poblacional?
 ¿Cómo podemos estimar puntualmente el valor de la varianza poblacional?
 ¿Cómo podemos tener una idea del error que cometemos al estimar?
 ¿Con qué tamaño de muestra es conveniente trabajar, para poder utilizar la
distribución normal en las estimaciones?
 Además de una estimación puntual para los parámetros de la población, ¿puede
obtenerse un rango de valores para los mismos?
 ¿Cuál es la diferencia entre estas dos clases de estimaciones?

INSTITUCIÓN CERVANTES 15
INSTITUCIÓN CERVANTES

Actividades
Deberá presentar un informe impreso en Word, con los siguientes cálculos:
 Realice una estimación puntual de la media de la variables: Sueldos, Bonos, Hijos,
Horas Extras, Estatura, etc.
 Realice un intervalo del 90% de confianza para cada una de las estimaciones
anteriores.
 Deberá explicar oralmente, los criterios utilizados y los resultados obtenidos (Cada
integrante del grupo).
 No se aceptarán planillas de cálculo.

Fecha de Presentación: Sexta clase.

Criterios de evaluación
Se evaluará:
 Que los cálculos realizados estén correctamente especificados.
 Que cada cálculo realizado tenga su correspondiente comentario o interpretación
explicativo.
 Que cada comentario se corresponda con el cálculo al que alude.
 Que el informe contenga una descripción exhaustiva de cada variable tratada y sus
correspondientes estimaciones.
 La presentación, considerando el formato, la organización y la claridad.

Material elaborado por Lucía Ruiz


Compaginado por Lic. Marissa Gonella
 2005 – AML 
09/04/07 17:34

16 INSTITUCIÓN CERVANTES

También podría gustarte