Science">
Estadistica DESCRIPTIVA-NOCIONES RESUMEN UBA
Estadistica DESCRIPTIVA-NOCIONES RESUMEN UBA
Estadistica DESCRIPTIVA-NOCIONES RESUMEN UBA
1. Introducción
En el área contable:
• Analizar determinadas variables en el tiempo, tales como nivel de
facturación, de gastos, índices de endeudamiento, etc.
• Seleccionar muestras de comprobantes y realizar tareas de control.
• Realizar control de calidad sobre los artículos fabricados por una
empresa.
• Estudiar los factores que inciden en la rentabilidad de las empresas.
En el área de economía:
• Cuantificar el impacto de ciertos factores en el desempleo.
• Medir la distribución del ingreso.
• Modelar el comportamiento del Producto Bruto Geográfico a través
del tiempo.
En el área de administración:
• Identificar el perfil requerido de los empleados de una empresa.
• Mejorar la calidad de los servicios.
• Estimar la proporción de clientes que prefieren determinados pro-
ductos.
4. ¿Qué es la Estadística?
Como hemos hecho referencia en el punto anterior, los métodos es-
tadísticos constituyen una herramienta indispensable para llegar a conclu-
siones confiables a partir de resultados empíricos que surgen del análisis
de datos.
En un sentido amplio, la estadística es el arte y la ciencia de reunir,
analizar, presentar e interpretar datos. Mood y Graybill expresan que la
estadística es “la tecnología del método científico. La estadística propor-
ciona instrumentos para la toma de decisiones cuando prevalecen condi- 3
ciones de incertidumbre” (1978; pag 3). Otros autores consideran que es la
ciencia desarrollada para resolver problemas en presencia de variabilidad.
La esencia de la estadística consiste en el desarrollo y uso de modelos de
pensamiento que se dirigen hacia la comprensión del mundo real y a la
predicción del futuro ya que tiene en cuenta la incertidumbre.
¿Qué se entiende en estadística por variabilidad e incertidumbre?
Hablamos de variabilidad porque una serie de datos estadísticos surge de
mediciones efectuadas a ciertos elementos y los resultados varían de una
unidad a otra.
Además, muy a menudo se trabaja con una parte de la totalidad de
los elementos o individuos que están bajo consideración en una investiga-
ción, lo cual genera incertidumbre. En estadística, a esa totalidad de ele-
mentos se denomina Población. Como las poblaciones a menudo son muy
grandes, es imposible o muy costoso recoger información de toda la pobla-
ción, lo que obliga a trabajar con una parte representativa de esa pobla-
ción, denominada Muestra Aleatoria.
En este ejemplo, para una muestra aleatoria simple, cada una de las 2000
industrias tiene igual probabilidad de ser seleccionada (0,005=1/2000). Una
forma de conformar la muestra de 150 empresas es elegir al azar 150 nú-
4 meros de un listado de 2000 números que se han asignado a las empre-
sas. El listado de las 2000 industrias se denomina en estadística marco
muestral.
Parámetro y Estadístico
Toda medida resumen que se calcula para describir características pobla-
cionales se llama parámetro, el cual es una cantidad fija que generalmen-
te no se conoce y debe ser estimada. Un estadístico es una medida calcu-
lada con las observaciones muestrales.
Estos métodos de infe- • Planteamiento del Problema: en primer lugar, se deben definir los
rencia estadística serán objetivos del estudio, la población objetivo, a partir de la cual se
estudiados en Estadísti- construirá el marco muestral y las variables de interés y sus rela-
ca II. De manera intuitiva ciones. Cuando se trabaja con una muestra, en el planteamiento
un intervalo de confian-
za es un rango de valo-
del problema, se debe decidir el método de muestreo más conve-
res (calculado en una niente, determinar el tamaño de la muestra y la precisión esperada,
muestra) en el cual se temas que escapan al alcance de esta materia
encuentra el verdadero
valor del parámetro, con
una probabilidad deter-
• Diseño y recopilación: Formulación estadística de la cuestión: de-
minada. Una prueba finir la población de estudio a partir del marco muestral, el tipo de
estadística es un proce- estudio a realizar y las variables de interés. Diseñar cómo se obtie-
dimiento para, a partir de nen los datos, una vez recolectados se realiza un análisis de con-
una muestra aleatoria, sistencia, elaborando de esta manera la base de datos para su aná-
extraer conclusiones
que permitan aceptar o lisis.
rechazar una hipótesis
6 previamente formulada • Organización y presentación de datos: se refiere a la presenta-
sobre el valor de un ción de los datos en tablas y gráficos, que muestran su comporta-
parámetro desconocido
de una población.
miento y de este modo nos ayudan a comprender la información re-
cabada.
7
Estudios exploratorios: estos estudios se basan en casos seleccionados
discrecionalmente (no aleatoriamente) y suelen ser el paso inicial de estu-
dios posteriores, porque ayudan a familiarizarnos con la situación o el pro-
blema, a identificar las variables importantes y a utilizar estas últimas para
plantear hipótesis que puedan ponerse a prueba en una investigación pos-
terior.
La falta de aleatorización es una limitación básica de los estudios ob-
servacionales. Esta limitación se ve reflejada en el análisis de los datos
donde se debe tener mucho cuidado en el momento de obtener conclusio-
nes y en la generalización de las mismas.
Validez es la compro- La validez de las conclusiones obtenidas depende en gran medida de
bación de lo que se los conocimientos del experto sobre el tema que investiga y de la incorpo-
deseaba medir es me- ración de información externa proveniente de otros estudios.
dido realmente.
Algunos ejemplos de estudios exploratorios:
Algunos de los numerosos ejemplos que podemos plantear son los si-
guientes:
Diseño de cuestionarios
19. Necesita financiación para exportar? 22.El monto total de las exportaciones en el 2005 comparadas con las del 2004
1.Si 2.No 1.Aumentaron 2.Disminuyeron 3.Sin cambios 4.NO exportó en el año 2004
11
En ambos modelos de cuestionarios pueden observarse dos tipos de
preguntas:
1) aquellas que se completan con la información solicitada, las que
se denominan preguntas abiertas -por ejemplo, la pregunta 24 del primer
cuestionario- y
2) preguntas en la que el entrevistado debe seleccionar una o más
de las opciones presentadas, las que se denominan preguntas cerradas.
También es conveniente señalar que el cuestionario no debe ser demasia-
do largo y que las preguntas deben ser concisas, no ambiguas y preferen-
temente de tipo cerradas. Las preguntas abiertas condicionan menos al
entrevistado y permite explorar significados pero, la desventaja es que re-
Algunos organismos ciben mayor influencia del encuestador, hay más dificultad para codificar
importantes con infor- las respuestas y se recaban más respuestas inapropiadas.
mación estadística dis-
ponible son: Los datos de fuentes secundarias son aquellos que han sido reuni-
dos y publicados por otras instituciones.
- Instituto Nacional de
Estadísticas y Censos. En general se trabaja con datos provenientes de organismos públicos
- Dirección Nacional de o privados tales como INDEC, BCRA, AFIP, Cámaras empresariales, ONU,
Estadísticas y Censos
FMI, sólo para mencionar algunos, muchos de los cuales, desde hace al-
de la Provincia.
- Comisión Económica gunos años están disponibles en internet.
para América Latina y el
Caribe.
Actividad 1
En cada uno de los siguientes casos defina la población y clasifique el tipo
de estudio de acuerdo a sus objetivos.
Sexo: Mujer
Cantidad de materias aprobadas: 3
Gasto en libros: $147
13
Cuando la pregunta admite como respuesta un número, se trata de una
variable cuantitativa o numérica. A su vez, si los valores que asume la
variable surgen de un conteo o de una enumeración, la variable es numé-
rica discreta, como por ejemplo “cantidad de materias aprobadas” (núme-
ros enteros). En cambio, si se obtienen datos a través de un sistema de
medición, la variable es continua ya que asumiría valores en un intervalo
(números reales). En el relevamiento a los alumnos, el “gasto en libros” y la
“estatura” constituyen ejemplos de este tipo de variables.
Cuando la variable no admite una respuesta numérica, sino que la
unidad de análisis se asigna a una clase o categoría la variable es cualita-
tiva o categórica. Ejemplos de variables cualitativas son: sexo, lugar de
procedencia, nivel de educación de los padres, el motivo por el cual nece-
sita financiación para exportar.
Por ejemplo:
1. Muy Fácil
2. Fácil
3. Regular
14 4. Difícil
5. Muy Difícil
Actividad 2: 15
1- Determine si cada una de las siguientes variables es categórica (cualita-
tiva) o numérica (cuantitativa), y si es numérica indique si es discreta o
continua.
Una vez que disponemos de los datos los organizamos en una tabla
donde en las columnas definimos las variables y en las filas a los indivi-
duos A esta tabla la denominamos base de datos
Actualmente la disponibilidad de datos en soporte electrónico, permi-
te trabajar los mismos desde programas informáticos orientados especial-
Infostat mente para la organización y análisis de datos. Existe una gran oferta de
Este software ha sido estos programas dentro de los cuales hemos seleccionado Infostat. El di-
diseñado en la Univer- seño de Infostat es similar al de otros softwares estadísticos, lo que brinda
sidad Nacional de Cór- al usuario la posibilidad de adaptarse de manera relativamente fácil, y
doba por la Facultad de además cuenta con un manual de ayuda al que se puede acceder selec-
Ciencias Agropecua- cionando la opción MANUAL en el menú AYUDA.
rias.
Existe una versión es- Aspectos generales del software
tudiantil disponible en Al abrir InfoStat, se visualizará una barra de herramientas localizada
su página web. Usted
en la parte superior de la ventana del programa, la que contiene los si-
puede solicitar una
clave gratuita ingresan- guientes menús: Archivo, Edición, Datos, Resultados, Estadísticas, Gráfi-
do por “Clave gratuita cos, Ventanas, Aplicaciones y Ayuda. Los softwares estadísticos en gene-
para versión estudian- ral permiten crear una base de datos o leer una base de datos generada
til”. por otro programa (excel, acces, o algún programa estadístico). En Infostat
podemos abrir una base de datos en formato del programa (extensión idb)
o desde otros formtos comoo Excel, veamos a continuación como abrimos
la base “alumnos.xls” (disponible en la sección Materiales y Recursos del
aula virtual).
Cada fila
representa
un caso u
observación
con todas
16 las variables
Variables Categóricas
Para armar una tabla resumen de este tipo de variables, contamos la can-
tidad de casos que pertenecen a cada clase o categoría, lo que se deno-
mina frecuencia absoluta y calculamos la proporción de casos en cada una
de ellas, lo que se denomina frecuencia relativa, las que pueden expresar-
se en porcentajes. Con estas frecuencias, se puede construir una tabla de
tres columnas, donde en la primera se anotarán las categorías y en las
otras dos, la cantidad y el porcentaje de observaciones.
Para la variable Sector de la Economía al que pertenecen 148 indus-
trias, cuyas categorías están expresadas en escala nominal, las frecuen-
cias se presentan en la Tabla 1.1.
17
Posicionados al inicio de la variabla Sector, para categorizarla:
DATOS -> CATEGORIZAR -> ASIGNAR CATEGORIAS SEGÚN
CODIGO DE VALORES
Asignamos los códigos según las referencias, se genera una nueva variable
Cat_sector con los nombres de las categorías.
Para construir la tabla de frecuencias ESTADISTICAS -> TABLA DE FRECUEN-
CIA.
En la solapa VARIABLES seleccionar la variable Cat_sector (para seleccionar una
variable hacer clic en ella y, con la flecha, pasarla al cuadro de la derecha).
En la ventana TABLA DE FRECUENCIAS marcar FA y FR para obtener una tabla
con las frecuencias absolutas y relativas, que se presenta en una nueva ventana
de Resultados
Frecuencia absoluta:
es el número de casos Tablas de frecuencias
que se repite cada cate- Variable Clase FA FR
goría de la variable. Cat_sector 1 49 0,33
Frecuencia relativa: es Cat_sector 2 36 0,24
la proporción de casos Cat_sector 3 50 0,34
que se repite cada cate- Cat_sector 4 13 0,09
goría de la variable.
Los resultados obtenidos son presentados en la tabla1.1
FRECUENCIA ABSO-
SECTOR DE LA ECONOMÍA PORCENTAJE
LUTA
De Origen Agropecuario 49 49/148 x100 33,1
Productos no metálicos 36 24,3
Productos metálicos 50 33,8
Otras Industrias 13 8,8
Total 148 100,0
Gráfico 1.1.
Sector de la economía
18
Unidad 1: El método estadístico. Organización y presentación de datos
Gráfico 1.2.
Sector de la economía
Sector de la Economía
51,9
Caso: frecuencia absoluta
41,7
31,5
21,3
11,2
Agropecuario No metálicos Metálicos Otras
Cat_sector
Del análisis de la tabla y los gráficos podemos decir que en esta muestra,
las empresas del sector industrial de productos metálicos y del sector de
origen agropecuario poseen participación similar en el total, siendo los dos
grupos más representativos, le siguen en importancia las industrias de
productos no metálicos. Otra variable categórica relevada en escala ordinal
fue la opinión de las empresas acerca de “la suficiencia de la oferta de
mano de obra calificada”. Las respuestas se agruparon en cuatro catego-
rías, según se presenta en la Tabla 1.2.
131/148 x100
Actividad 3
El gerente de una empresa desea conocer la distribución de empleados
de acuerdo a su nivel de instrucción máximo alcanzado. Una vez recolec-
tada la información realizó un resumen de los datos, obteniendo la siguien-
te tabla de distribución de frecuencias:
Variables numéricas
ni
Frecuencias relativas hi =
n
h
i
i =1 H xmax = 1
En Variables a graficar
van los casos
En criterio de clasificación
va la variable que se quiere
graficar
22
Unidad 1: El método estadístico. Organización y presentación de datos
Gráfico 1.4.
Cantidad de empleados área Diseño e Ingeniería Industrial
(frecuencias absolutas)
Gráfico de bastones
14 13
frecuencia absolutas
10
7
7
4 3
2
1 1
0
1 2 3 4 5 6 7
personal de diseño
Gráfico 1.5.
Cantidad de empleados área Diseño e Ingeniería Industrial
(frecuencias absolutas acumuladas)
Diagrama escalonado
30
25
frec. abs. acumulada
20
15
10
5 23
0
1 1 2 3 4 5 6 6
personal_diseño
Actividad 4:
La siguiente tabla muestra el stock de galletas obleas en paquetes de 20
gramos de la marca Trick en 30 kioscos.
Actividad 5:
El gerente de ventas de “La Favorita”, desea lanzar una campaña de pro-
mociones para lograr que los compradores acudan con mayor frecuencia a
su negocio. Para obtener información preguntó a 25 consumidores mien-
tras esperaban en la caja para abonar: ¿Cuántas veces concurrió a este
negocio en el último mes? Para un día particular obtuvo las siguientes res-
puestas:
4 5 3 3 1
4 6 5 4 2
6 6 7 1 5
1 2 4 3 2
2 4 7 7 6
24
Unidad 1: El método estadístico. Organización y presentación de datos
50 45 30 7 10 50 30 30 50 39
40 50 8 25 49 25 50 38 50 10
30 25 5 7 40 26 20 30 25 40
40 40 25 40 66 25 38 21 40 33
33 30 78 15 5 10 38 40 10 66
8 30 18 20 50 35 7 20 36 30
30 20 30 20 40 15 25 35 26
25 60 40 10 25 38 32 30 40
28 40 40 22 52 40 40 8 6
25 50 50 30 35 19 25 47 15
25 60 35 10 18 25 23 29 20
20 50 50 3 10 20 15,3 20 55
45 20 17 30 30 35 17 45 40
13 15 20 30 35 40 20 50 20
40 35 50 10 25 25 50 35 35
25
Gráfico 1.6.
Diagrama de Tallo y hoja de Porcentaje de Costo Laboral
Actividad 6:
El siguiente ejemplo muestra la distribución de edades de 100 personas.
20. Si fueran muy pocas clases, los intervalos podrían ser muy
grandes, es decir cada intervalo abarcaría demasiada cantidad
de observaciones para permitir detectar la tendencia de los datos.
Por otra parte, tener demasiados intervalos se contradice con el
propósito que se persigue que es resumir un conjunto grande de
datos, para facilitar el análisis o la toma de decisiones. Conti-
nuando con el tratamiento de la variable “porcentaje de costo la-
boral” y dado que posee 141 observaciones, 7 intervalos serán
más que suficientes (con la la fórmula automática de Infostat re-
sulta 7,21, por esta razón tomamos 7 intervalos).
Donde:
c: amplitud de cada intervalo.
R: recorrido o rango de variación de la variable.
k: cantidad de intervalos elegidos.
Para el ejemplo:
78 − 3
c= = 10, 714 11
7
c´= 11 donde: c´ es la amplitud definida
y'i-1 - y'i
27
2 ; 13
13 ; 24
24 ; 35
35 ; 46
46 ; 57
57 ; 68
68 ; 79
3) Establecer una regla general para definir los límites del intervalo
de cada clase: para evitar el doble conteo de las observaciones.
Los intervalos serán semiabiertos, pueden ser abiertos por dere-
cha o por izquierda. Por ejemplo, en la primera alternativa los in-
tervalos son: “[)” cerrados por la izquierda y abiertos por la dere-
cha, lo que significa que se incluirá dentro del intervalo un valor
que sea igual al límite inferior; mientras que un valor exactamente
igual al límite superior del intervalo, será incluido en el intervalo
siguiente. Así el valor 35, para este caso, se computará dentro
del cuarto intervalo.
y0' + y1' 2 + 13
y1= = = 7,5
2 2
Para ilustrar la posibilidad que da Infostat de calcular los intervalos en forma per-
sonalizada, construiremos una tabla de frecuencia para la variable de cinco inter-
valos. Para ello, tildando la opción Personalizado, debe indicarse 5 intervalos,
definiendo el mínimo y máximo valor de la variable. Por defecto, Infostat construye
los intervalos cerrados a la derecha, lo que se puede cambiar destildando la op-
ción en el cuadro de dialogo.
Gráfico 1.7.
Porcentaje de Costo Laboral
POLIGONO DE FRECUENCIAS
(a) Histograma con polígono de fre-
0,34
cuencias
0,26
frecuencia relativa
0,17
0,09
0,00
-8 3 14 24 35 46 57 67 78 89
costos lab/costo totAL
Gráfico 1.8.
Ojiva de base menor para el de frecuencias acumuladas en porcentaje de
Costo Laboral
OJIVA
1,00
0,75
frec. rel. acumulada
0,50
0,25
0,00
-8 3 14 24 35 46 57 67 78 89
costos lab/costo totAL 31
Gráfico 1.9.
Análisis de la forma de la distribución de los datos
Distribución simétrica
32
Actividad 7:
Las ventas diarias (en $) para los últimos 120 días de una compañía de
servicios de transporte se organizaron en la siguiente distribución de fre-
cuencias:
FRECUENCIA FRECUENCIA
FRECUENCIA FRECUENCIA
ABSOLUTA RELATIVA
INTERVALO ABSOLUTA RELATIVA
ACUMULADA ACUMULADA
yi −1 − yi ni I hi Ni Hi
530 - 730 3
730 - 930 7
930 – 1130 11
1130 – 1330 22
1330 – 1530 40
1530 – 1730 24
1730 – 1930 9
1930 – 2130 4
Total 120
Determine:
Actividad 8:
Los precios de venta (en miles de $) de 40 casas de una zona residencial
de la ciudad de Córdoba son los siguientes:
EXPORTA
SECTOR DE LA ECONOMÍA
Si No TOTAL
De Origen Agropecuario 10 39 49
Productos no metálicos 6 30 36
Productos metálicos 13 37 50
Otras Industrias 6 7 13
Totales 35 113 148
n
J
igual a la frecuencia
marginal de la categoría n j =1
ij = ni .
j =1
3j = n3.
representada en la fila.
n3. = 50
La suma de cada co- Para nuestro ejemplo j =2
I
n
lumna es igual a la fre- I
= n.2
cuencia marginal de la nij = n. j
i =1 i =1
i2
categoría representada
en la columna. n.2 = 113
La suma de las fre-
cuencias marginales I J I J
por fila y por columnas ni . = n n. j = n
i =1 j =1
n
i =1
i. =n n
j =1
.j =n
son iguales al total de
datos.
35
Para construir una tabla de contingencia en Infostat, acceder desde el
menú ESTADISTICAS -> DATOS CATEGORIZADOS -> TABLAS DE
CONTINGENCIAS
Aparece una ventana en la que se deben desplazar las variables Cat_exporta y
Cat_sector a la ventana CRITERIOS DE CLASIFICACION de la solapa VARIA-
BLES. Luego al aceptar aparecerá la ventana TABLA DE CONTINGENCIA; en la
solapa SELECCIÓN DE FILAS Y COLUMNAS se debe indicar cuál de las varia-
bles se corresponderá con las filas de la tabla y cuál con las
columnas y destildar presentación en orden alfabético. En la solapa OPCIONES
se pueden elegir los tipos de frecuencias, dejamos tildado sólo Frecuencias abso-
lutas y Frecuencias relativas al total, y destildamos las pruebas (chi cuadrado y
otras que se estudiarán en la asignatura Estadística II). En la ventana resultados
se muestran las tablas siguientes.
Tablas de contingencia
Frecuencias absolutas
En columnas:Cat_exporta
Cat_sector NO SI Total
De Origen Agropecuario 39 10 49
Productos no metálicos 30 6 36
Productos metálicos 37 13 50
Otras Industrias 7 6 13
Total 113 35 148
Las frecuencias relativas pueden ser más útiles que las absolutas en
algunas interpretaciones. Por ejemplo el 9% de las empresas (frecuencia
relativa al total igual 0,09), fabrican productos metálicos y exportan. Consi-
derando solamente la variable exporta, leemos la frecuencia marginal por
columna y podemos observar que el 76 % de las empresas no exportan.
Las industrias de origen agropecuario que no exportan son las más fre-
cuentes, con el 26%.
Para graficar las frecuencias absolutas o relativas conjuntas se pue-
den utilizar los gráficos de barras múltiples o los de barras componen-
tes.
En un gráfico de barras múltiples, se representa para cada categoría
de una variable (en este caso los tipos de industria) tantas barras como
categorías de la otra (si exporta o no) y la altura de cada barra es el por-
centaje de frecuencia conjunta entre las dos categorías analizadas. A con-
tinuación, se presenta un gráfico de barras múltiples construido con Excel.
Gráfico 1.10.
Análisis conjunto de Sector de la economía y Exporta.
30
25 26
25
20 20
15 Exporta
10 No Exporta
9
5 7
4 4 5
0
De Origen Productos no Productos Otras
36 Agropecuario metálicos metálicos Industrias
Gráfico 1.11.
Cantidad de empresas que exportan en cada sector
39
Valores acumulados
26
13
0
De Origen AgropecuarioProductos no metálicos Productos metálicos Otras Industrias
Cat_sector
37
Gráfico 1.12.
Proporción de empresas que exportan dentro de cada sector
1,00
0,75
0,50
0,25
0,00
De Origen AgropecuarioProductos no metálicos Productos metálicos Otras Industrias
Cat_sector
Frecuencias condicionadas
X Y1 Y2 … YJ TOTAL
X1 n11 / n1. n12 / n1. … n1J / n1. 1
X2 n21 / n2. n22 / n2. … n2J / n2. 1
. . . … . .
. . . … . .
. . . … . .
XI nI1 / nI. nI1/ nI. … nIJ / nI. 1
FRECUENCIA ABSO-
PARTICIPA PORCENTAJE
LUTA
SI 16 10,8
NO 132 89,2
TOTAL 148 100,0
Tabla 1.9. Localización de otras empresas con las que han participado en
emprendimientos 39
LOCALIZACIÓN DE FRECUENCIA ABSO-
PORCENTAJE
OTRAS EMPRESAS LUTA
Locales (100 km) 10 62,5
De la provincia 3 18,75
Nacionales 3 18,75
TOTAL 16 100,00
Para representar estas variables puede utilizarse un gráfico circular
combinado (Gráfico 1.13). Este gráfico está construido con Excel.
Gráfico 1.13.
Gráfico para frecuencias condicionadas
3 No participa
LOCALIZACIÓN FRECUENCIA
FRECUENCIA PORCENTAJE
DE OTRAS PORCENTAJE ABSOLUTA
ABSOLUTA ACUMULADO
EMPRESAS ACUMULADA
Locales (100 10 62,50
10 62,5
km)
De la provincia 3 18,75 13 81,25
Nacionales 3 18,75 16 100,00
TOTAL 16 100,00
Actividad 9:
Los establecimientos agropecuarios de la Provincia de Córdoba han sido
clasificados de acuerdo a sus niveles de producción, en altos, medianos y
bajos y de acuerdo a la zona geográfica donde se encuentran ubicados.
Los resultados se muestran en la siguiente tabla:
NIVEL DE
ZONA “A” ZONA “B” ZONA “C” TOTAL
PRODUCCIÓN
Alto 69 47 23 139
Mediano 40 25 80 145
Bajo 38 32 36 106
TOTAL 147 104 139 390
Unidad 1: El método estadístico. Organización y presentación de datos
Se pide:
a) ¿En qué dirección sería preferible calcular los porcentajes? ¿Por
qué?
b) Calcule dichos porcentajes y obtener algunas conclusiones.
c) Obtenga la razón entre el número de establecimientos con nivel de
producción alto y el número de establecimientos con nivel de pro-
ducción bajo en cada una de las tres zonas. Comente sus resulta-
dos.
Gráfico 1.14.
Diagrama de Dispersión
180
150
120
90
60
30
0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85
Costos lab/costo total
41
Para construir esta gráfica con Infostat transformamos primero la variable
desde el menú Datos → Transformar, seleccionar la variable y en la venta-
na de dialogo siguiente la transformación que se quiere realizar.
Actividad 10
La tasa de desempleo (x) y la tasa de renuncia (y) para 13 regiones se
relevaron en un momento determinado del tiempo. Los datos obtenidos se
presentan en la siguiente tabla:
20 = 1 log 2 1 =0
21 = 2 log 2 2 =1
22 = 4 log 2 4 =2
23 = 8 log 2 8 =3
24 = 16 log 216 =4
25 = 32 log 232 =5
26 = 64 log 264 =6
.
.
.
Representación gráfica
Gráfico 1.15.
Escala Aritmética
Gráfico 1.16.
(a) Escala Logarítmica
(b)
Producción Anual (en miles de pesos)
1000
100
EMPRESA A
44 EMPRESA B
10
1
2000 2001 2002 2003 2004 2005 2006 2007
Años
Unidad 1: El método estadístico. Organización y presentación de datos
6. Actividades de aprendizaje
46 Actividad 11:
Describa en cada uno de los casos mencionados más abajo:
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) ¿Cuál es la unidad estadística?
d) ¿Cuál es la variable o característica principal de cada estudio y de qué tipo
es?
Unidad 1: El método estadístico. Organización y presentación de datos
Actividad 12:
La empresa Nielsen efectúa encuestas semanales a los televidentes resi-
dentes en la ciudad de Córdoba. Sus calificaciones estadísticas indican el
tamaño de la audiencia para cada uno de los principales programas de la
televisión local. Las calificaciones de los programas y la parte del mercado
para cada canal se publican semanalmente.
a) ¿Qué trata de medir la empresa Nielsen?
b) ¿Cuál es la población?
c) ¿Usted cree que se utilizará una muestra?
d) ¿Qué tipos de decisiones o acciones cree usted que se basan en
las mediciones de Nielsen?
Actividad 13: 47
Una consultora encargada de efectuar estudios de mercado en Córdoba,
pidió a 800 consumidores que probaran un plato de pastas denominado
“ZIA MARIA”, que es de elaboración reciente de un fabricante. De los 800
consumidores consultados 600 dijeron que comprarían el plato si se pusie-
ra a la venta.
a) ¿Qué informará la consultora al fabricante, respecto a la aceptación
del “ZIA MARIA”?
b) ¿Es éste un ejemplo de estadística descriptiva o inferencial? Justifi-
que la respuesta.
c) ¿Cuál es la población, cuál es la muestra y cuál es la unidad esta-
dística?
d) Identifique el parámetro de interés y el estadístico. ¿Se conoce el
valor de alguno de ellos?
Actividad 14:
Un diario de Córdoba informó acerca del tipo de medios de comunicación
existentes en la ciudad. Los datos son los siguientes:
MEDIOS DE COMUNICACIÓN CANTIDAD
Diarios 3
Radios A.M. 4
Radios F.M. 49
Canales T.V. por aire 3
Canales T.V. por cable 5
Revistas 27
Actividad 15:
Determine si cada una de las variables es categórica o numérica. Si es
numérica indique si es discreta o continua, y cuál es la escala de medición.
A los estudiantes de la Facultad de Ciencias Económicas se les preguntó:
Actividad 16:
Para controlar el valor de un inventario, el administrador de una ferretería
quiere limitar la cantidad de cada artículo en el depósito; al mismo tiempo,
evitar perder ventas por falta de stock. Para lograr esto, el administrador
desea saber cuáles son las características de la demanda para cada ar-
tículo.
a) Describa la población de interés para el administrador.
b) Proporcione un ejemplo de muestra representativa de esta pobla-
ción.¿Qué preguntas tendría que hacer el administrador? Elabore
por lo menos tres.
Actividad 17:
Un periódico realizó una encuesta telefónica a 480 habitantes selecciona-
dos aleatoriamente de distintas áreas de la capital cordobesa. La siguiente
tabla muestra las respuestas acerca de la opinión de los servicios de segu-
48 ridad. La pregunta realizada fue: “En su barrio, ¿son adecuados los servi-
cios de policía y de bomberos?” Las respuestas obtenidas fueron:
Actividad 18:
Los siguientes datos se encuentran disponibles en archivos de una empre-
sa. Explicite el tipo de variable y la escala de medición.
ARCHIVO DE PERSONAL
Variable Tipo de varia- Escala de medi-
ble ción
Barrio donde vive el empleado
Salario
Días de vacaciones
Días de ausencia por enfermedad
Edad
Adelantos de sueldo en un mes determina-
do
REGISTRO DE LA PRODUCCIÓN
Variable Tipo de variable Escala de medición
Tipo de producto
Cantidad mensual producida por producto
Costo de la mano de obra
Costo de materiales
REGISTROS DE INVENTARIO
Variable Tipo de variable Escala de medición
Existencia diaria por producto
Existencia diaria por insumo
Descuentos por producto
REGISTROS DE VENTAS
Variable Tipo de variable Escala de medi-
ción
Ventas mensuales por producto
Ventas mensuales por región geográfica
Ventas mensuales por tipo de cliente
Canales de venta
49
Actividad 19:
El área de mercadotecnia de una empresa ha propuesto una nueva bebida
dietética que, piensa, captará una gran parte del mercado de adultos jóve-
nes.
Actividad 20:
Las cotizaciones de un tipo de acciones en la bolsa para los últimos 22
días fueron las siguientes:
8.4 9.2 11.3 7.8 10.9 10. 8.0 9.0 10. 9.7 8.9
2 4
11.7 9.7 9.6 10.5 8.5 8.2 10.3 11. 8.0 3.0
9.9 3
Actividad 21:
La siguiente tabla muestra datos correspondientes a la enegia anual gene-
rada en el país en Gigawatts/hora.
Actividad 22:
Represente gráficamente la siguiente información:
Para elegir el tipo de gráfico, tenga en cuenta que cada uno de ellos debe
permitir discutir las siguientes opiniones:
Actividad 23:
Para 15 empresas se relevó el precio y el margen de utilidad de un produc-
to. Los datos obtenidos (en miles de pesos) se presentan en la siguiente
tabla:
Unidad 1: El método estadístico. Organización y presentación de datos
PRECIO
UTILIDAD (y)
(x)
15 5,3
15 6,0
14,8 5,2
13 3,9
16 4,8
14 4,2
14,5 4,4
15,5 4,7
13 3,9
15 4,5
13,5 4,7
14,6 5,1
15,5 5,4
14,8 5,9
13,8 4,8
Actividad 24:
Una heladería cuenta con dos sucursales en la Ciudad de Córdoba, una
ubicada en la zona Norte y otra ubicada en la zona Sur. A continuación, se
presenta información sobre el número de pedidos telefónicos recibidos por
día, para una muestra aleatoria de 20 días:
Zona
4 6 7 5 5 6 7 4 8 6 8 5 7 6 7 5 6 6 7 4
Norte
Zona
4 6 5 3 6 3 5 6 5 6 4 4 5 6 6 2 3 4 5 6
Sur
Actividad 25:
A continuación, se presentan los precios de venta (en miles de $) de 30
casas de dos zonas residenciales de la Ciudad de Córdoba.
2. Efectúe comparaciones.
Actividad 26:
52
Actividad 27:
Las ventas diarias (en $) para los últimos 120 días de una empresa de ser-
vicios de transporte se organizaron en la una distribución de frecuencias
por intervalos que ser muestra en la siguiente tabla:
Unidad 1: El método estadístico. Organización y presentación de datos
yi-1 - yi ni
530 -730 3
730 - 930 7
930 - 1130 11
1130 - 1330 22
1330 - 1530 40
1530 - 1730 24
1730- 1930 9
1930 - 2130 4
Total 120
Determine:
a) ¿Cuántos días se vendieron entre $ 1130 y $ 1330?
b) ¿Qué porcentaje de días se registraron ventas de entre $ 1130 y $
1330?
c) Represente mediante un histograma y un polígono de frecuencias,
la información dispuesta en la tabla.
d) Aproximadamente ¿cuál es el porcentaje de días que tienen como
ingreso $ 1730 o más?
e) ¿Podría describir la forma de la distribución?
Caso 1
Caso 2
Caso 3
Caso 5
8. Referencias Bibliográficas
56
Unidad 1: El método estadístico. Organización y presentación de datos
Soluciones y respuestas
Actividad 1:
Descripción
Caso de Tipo de estudio ()
de la población
análisis
Actividad 2:
Tablas de frecuencias
Variable Clase Categorías FA FR FAA FRA
NIVEL DE INSTRUCCIÓN 1 1Primario 48 0,45 48 0,45
NIVEL DE INSTRUCCIÓN 2 2Secundario 36 0,34 84 0,79
NIVEL DE INSTRUCCIÓN 3 3Terciario 15 0,14 99 0,93
NIVEL DE INSTRUCCIÓN 4 4Universitario 5 0,05 104 0,98
NIVEL DE INSTRUCCIÓN 5 5NS/NC 2 0,02 106 1,00
c) Gráfico de torta:
Distribución del Nivel de instrucción (salida Infostat).
Gráfico de barras:
Distribución del Nivel de instrucción
Actividad 4:
a) Tablas de frecuencias
b1) 7 kioscos
b2) 15 kioscos
b3) 13%
b4) 50%
Actividad 5:
a) Tabla de distribución de frecuencias
Tablas de frecuencias 59
Variable Clase MC FA FR FAA FRA
Cantidad de veces 1 1 3 0,12 3 0,12
Cantidad de veces 2 2 4 0,16 7 0,28
Cantidad de veces 3 3 3 0,12 10 0,40
Cantidad de veces 4 4 5 0,20 15 0,60
Cantidad de veces 5 5 3 0,12 18 0,72
Cantidad de veces 6 6 4 0,16 22 0,88
Cantidad de veces 7 7 3 0,12 25 1,00
b) Gráfico de Bastones:
Distribución de cantidad de veces que concurrió al negocio
Actividad 6:
Las edades oscilan entre los 18 y los 69 años, con una mayor concentra-
ción entre los 20 y 50 años. La distribución presenta una leve asimetría
hacia la derecha, es decir, hay un desplazamiento de datos hacia las ma-
yores edades.
Actividad 7:
60
Para poder responder la actividad se completó la tabla de distribución de
frecuencias y se confecciono e grafico correspondiente.
Unidad 1: El método estadístico. Organización y presentación de datos
Tablas de frecuencias
Gráficos:
Histograma y polígono de frecuencia de la distribución de ventas diarias.
a) 22 días
b) El 18,33%
c) Ver figura
d) 10,83%
e) La distribución muestra las ventas entre $530 a $2130, presenta una
forma aproximadamente simétrica, observándose un pico en las ventas
entre $1330 y $1530.
Actividad 8:
a) Numero de intervalos =5
Amplitud = $18
Comenzando por el valor 41
Tablas de frecuencias
c) 11 casas
d) El 28%
e) Aproximadamente el 70%
Actividad 9:
a) La dirección en la que sería preferible calcular los porcentajes depende
del objetivo de investigación. Si lo que interesa es el estudio de los niveles
de producción por zona, entonces se deberá calcular los porcentajes en
columnas. Si se focaliza en el análisis de las zonas por nivel de produc-
ción, se deberá calcular el porcentaje en fila. Es posible también, que in-
terese el estudio de ambas distribuciones.
NIVEL DE
ZONA “A” ZONA “B” ZONA “C” TOTAL
PRODUCCIÓN
Alto 49,64 33,81 16,55 100,00
Mediano 27,59 17,24 55,17 100,00
Bajo 35,85 30,19 33,96 100,00
Actividad 10:
Diagrama de dispersión:
Tasa de Desempleo – Tasa de Renuncia
Se puede concluir que hay una relación lineal inversa (o negativa) entre las
variables tasa de desempleo y tasa de renuncia, es decir, a medida que
aumenta (disminuye) la tasa de desempleo, disminuye (aumenta) la tasa
de renuncia.
Actividad 11:
Unidad es-
Caso Población Muestra Variable/s y su clasificación
tadística
Toda la producción Granos de trigo tomados Clasificación de la semilla
Cada semilla
A de trigo dispuesta en del camión para clasificar (excelente, muy buena, buena
de trigo
el camión. la semilla. o mala): variable cualitativa.
¿Cambió de trabajo el último
mes?: variable cualitativa
Todos los trabajado- Cada traba-
100 trabajadores selec- Sueldo mensual: variable
B res de la provincia jador de la
cionados. cuantitativa continua
de Córdoba. provincia
Número de horas trabajadas:
variable cuantitativa continua.
Todas las facturas
Clasificación de la factura (con
emitidas por la em- 50 facturas del último
C Cada factura error o sin error): variable cuali-
presa en el último mes seleccionadas.
tativa.
mes.
Los potenciales Grado de satisfacción con el
D 400 clientes a los que se
clientes del nuevo Cada cliente nuevo producto: variable cuali-
le regaló el producto.
producto. tativa(*)
Todos los clientes de 600 clientes de NVC
Grado de satisfacción con el
NVC que compraron seleccionados de los que
E Cada cliente producto que adquirieron en
electrodomésticos en compraron electrodomés-
NVC: variable cualitativa.
el último año. ticos el último año.
Todas las personas
en condiciones de
1000 personas en condi- Candidato que votó: variable
F votar al momento de
ciones de votar seleccio- Cada votante cualitativa 63
realizarse la elec-
nadas de Capital Federal.
ción, en la Capital
Federal.
(*) Por ejemplo, se pueden usar las siguientes categorías: “Muy satisfe-
cho”, “Moderadamente satisfecho” e “Insatisfecho”. Cuestionario del caso
D, a cargo del estudiante.
Actividad 12:
Actividad 13:
Actividad 14:
Actividad 15:
Actividad 16:
Actividad 17:
65
ARCHIVO DE PERSONAL
Escala de medi-
Variable Tipo de variable
ción
Barrio donde vive el empleado Cualitativa Nominal
Salario Cuantitativa continua Razón
Días de vacaciones Cuantitativa discreta Razón
Días de ausencia por enfermedad Cuantitativa discreta Razón
Edad Cuantitativa continua Razón
Adelantos de sueldo en un mes determi-
Cuantitativa continua Razón
nado
REGISTRO DE LA PRODUCCIÓN
Escala de medi-
Variable Tipo de variable
ción
Tipo de producto Cualitativa Nominal
Cantidad mensual producida por produc-
Cuantitativa discreta Razón
to
Costo de la mano de obra Cuantitativa continua Razón
Costo de materiales Cuantitativa continua Razón
REGISTROS DE INVENTARIO
Escala de medi-
Variable Tipo de variable
ción
Existencia diaria por producto Cuantitativa discreta Razón
Existencia diaria por insumo Cuantitativa discreta Razón
Descuentos por producto Cuantitativa continua Razón
REGISTROS DE VENTAS
Escala de medi-
Variable Tipo de variable
ción
Ventas mensuales por producto Cuantitativa continua Razón
Ventas mensuales por región geográfi-
Cuantitativa continua Razón
ca
Ventas mensuales por tipo de cliente Cuantitativa continua Razón
Canales de venta Cualitativa Nominal
Actividad 19:
Actividad 20:
3 0
4
5
6
7 8
8 0 0 2 4 5 9
9 0 2 6 7 7 9
10 2 3 4 5 9
11 3 3 7
Se observa un valor extremo (3,0) que debería investigarse para determi-
nar si se trata de un valor atípico o es el resultado de un error en el registro
o en la carga de los datos. La distribución de las cotizaciones muestra una
asimetría izquierda.
Actividad 21:
Log natural
Total de energía Total de energía
Años Hidráulica Nuclear Hidráulica Nuclear
generada generada
2008 114724 31456 7330 11,65 10,36 8,90
2009 114337 35093 8162 11,65 10,47 9,01
2010 120011 33300 7171 11,70 10,41 8,88
2011 124802 31309 6371 11,73 10,35 8,76
2012 129007 29308 6395 11,77 10,29 8,76
2013 133705 33333 6207 11,80 10,41 8,73
2014 137181 33345 5514 11,83 10,41 8,62
68
Unidad 1: El método estadístico. Organización y presentación de datos
Actividad 22:
Gráfico a) Gráfico b)
Actividad 23:
Diagrama de dispersión:
Precio – Margen de Utilidad
Se puede concluir que hay una relación lineal directa (o positiva) entre las
variables precio y margen de utilidad de un producto, es decir a mayor
(menor) precio mayor (menor) margen de utilidad.
Actividad 24:
1) Distribuciones de frecuencias.
Tablas de frecuencias
69
Variable Clase MC FA FR FAA FRA
Zona Norte 1 4 3 0,15 3 0,15
Zona Norte 2 5 4 0,20 7 0,35
Zona Norte 3 6 6 0,30 13 0,65
Zona Norte 4 7 5 0,25 18 0,90
Zona Norte 5 8 2 0,10 20 1,00
Variable Clase MC FA FR FAA FRA
Zona Sur 1 2 1 0,05 1 0,05
Zona Sur 2 3 3 0,15 4 0,20
Zona Sur 3 4 4 0,20 8 0,40
Zona Sur 4 5 5 0,25 13 0,65
Zona Sur 5 6 7 0,35 20 1,00
Actividad 25:
1) Zona A
Zona B
Tablas de frecuencias
71
Los precios de venta (en miles de $) de casas en la Zona B se encuentran
entre 100 y 150. La distribución es casi simétrica. La mayoría de las casas
tienen un precio de venta entre 120 y 130.
Actividad 26:
Actividad 27:
a) 22 días
c)
e) La distribución es simétrica.