1 Guía de Estadistica Aplicada - Introducción
1 Guía de Estadistica Aplicada - Introducción
1 Guía de Estadistica Aplicada - Introducción
PRIMERA UNIDAD
5
GUÍA DE PRÁCTICA N° 1: INTRODUCCION A LA ESTADISTICA
2. PROPÓSITO:
Estadística: Etimológicamente
El origen etimológico de la palabra “estadística” no está bien determinado, puesto que existen
distintas opiniones y referencias. Para algunos viene de la voz griega STATERA que significa
“balanza”, otros sostienen que deriva del latín STATUS que significa “situación” mientras que
algunos autores afirman que procede del alemán STAAT que significa “estado” pues era función
principal de los gobiernos de los estados establecer registros de población , nacimientos ,
defunciones, etc.
Objetivo.-
Los objetivos de la estadística pueden ser clasificados en tres grandes capítulos: descripción,
análisis y predicción.
Descripción de grandes colecciones de datos empíricos reduciéndolos a un pequeño
número de características que concentra la parte más importante y significativa de la
información proporcionada por los datos.
La descripción supone que los datos que vienen expresados en su forma natural deben
ser clasificados y presentados sistemáticamente en cuadros o tablas como una pequeña
reducción de datos, esto se obtiene cuando el comportamiento y características de los
datos se expresan por un conjunto de indicadores, medidas de resumen o estadígrafos.
La estadística se inicia estudiando el problema, puesto que es un trabajo preliminar de
casi todas las investigaciones estadísticas; de este modo tanto como la reducción como
la descripción de la información se estudia en la Estadística Descriptiva.
Es importante anotar que la descripción estadística de los fenómenos o hechos es el primer
aspecto al cual se redujo la ciencia estadística durante mucho tiempo, aplicándose
especialmente a los datos demográficos, sociales económicos, etc.
6
base de resultados muestrales conocidos. Aquí se presenta varios problemas que
presentan la Estadística, la estimación estadística, el cálculo de probabilidades, las
pruebas estadísticas, etc. Éstos son aspectos que corresponde esencialmente a la
Inferencia Estadística.
Todo análisis debe suponer la elección adecuada de una muestra representativa, la que
será estudiada en detalle para obtener conclusiones o resultados, que dentro de ciertos
márgenes de aceptación sean válidas a toda la población de la cual fue elegida la muestra.
Antes de recoger la información se debe decidir qué se va a hacer con ella. Cualquier
recolección de información ha de tener un objetivo específico y ser seguida por acciones.
La información es una guía para nuestras acciones. A partir de la información conocemos
los hechos pertinentes y adoptamos acciones apropiadas basadas en esos hechos.
b. Definir su propósito
Definiciones Basicas.-
1. POBLACIÓN
Es el conjunto mayor o colección completa de todos los elementos (puntajes. personas,
mediciones, etc.) que posee al menos una característica común observable, cuyo estudio
nos interesa o acerca de los cuales se desea información.
La población debe estar perfectamente definida en el tiempo y en el espacio, de modo
que ante la presencia de un potencial integrante de la misma, se pueda decidir si forma
parte o no de la población bajo estudio. Por lo tanto, al definir una población, se debe cuidar
que el conjunto de elementos que la integran quede perfectamente delimitado.
La población puede ser según su tamaño de dos tipos:
a. Población finita: cuando se tiene un número determinado de elementos.
b. Población infinita: cuando el número de elementos es indeterminado, o tan grande
que pudiesen considerarse infinitos.
7
Tamaño de la Población: Es el número total de elementos que tiene la población
estudiada y se denota con la letra “N”
2. MUESTRA
Es un subconjunto de la población a la cual se le efectúa la medición con el fin de
estudiar las propiedades de la población de la cual es obtenida.
Una muestra debe ser representativa, esto es, guarda las mismas características de la
población de donde fue seleccionada y debe ser adecuada en cuanto a la cantidad de
elementos que debe tener con respecto a la población.
Existen diversos métodos para calcular el tamaño de la muestra y también para
seleccionar los elementos que la conforman, pero es importante que sea representativa
de la población y sus elementos escogidos al azar para asegurar la objetividad de la
investigación.
Tamaño de muestra: Es el número de elementos de la muestra y se denota con letra
“n”.
3. CENSO
Es un método de recolección de datos mediante el cual la información se obtiene
analizando a la totalidad de los elementos que componen la población o universo bajo
estudio. Un censo debe cumplir las condiciones de universalidad (censar a todos los
elementos de la población) y simultaneidad (realizarse en un momento determinado). Un
censo es equivalente a una fotografía de la población bajo estudio.
4. PARÁMETROS ESTADÍSTICOS
Es un número que describe alguna característica de la población o medida de resumen
de una población. Se considera como un valor verdadero de la característica estudiada
y para determinar su valor es necesario utilizar la información poblacional completa, y
por lo tanto la decisión se toman con certidumbre total.
5. ESTADÍGRAFO O ESTADÍSTICO
Es un número que describe alguna característica de la muestra o medida de resumen
de una muestra y la toma de decisión contiene un grado de incertidumbre.
6. DATO
Es el valor, respuesta o registro que adquiere una característica o variable asociado a
un elemento de la población o muestra, como resultado de la observación, entrevista
o recopilación en general. Puede ser un número, una palabra o un símbolo.
7. VARIABLE
Es una característica estudiada de las unidades estadísticas. Podemos mencionar los
siguientes tipos:
a. Según la Naturaleza de la Variable
a.1 Variables Cualitativas o Estadísticas de Atributos
Cuando expresan una cualidad, característica o atributo, tiene carácter cualitativo,
sus datos se expresan mediante una palabra, no es numérico.
Por ejemplo: estado civil, los colores, lugar de nacimiento, profesiones, actividad
económica, causas de accidentes, etc.
a.2 Variables Cuantitativas
Cuando el valor de la variable se expresa por una cantidad, es de carácter
numérico. El dato o valor puede resultar de la operación de contar o medir; por
ejemplo: edad, número de hijos por familia, ingresos, viviendas por centro
poblado, niveles de desempleo, producción, utilidades de empresas, etc.
Las variables cuantitativas pueden ser: Discreta y Continua.
Variable Discreta
Cuando el valor de la variable resulta de la operación de contar, su valor está
representado sólo por números naturales (enteros positivos); Ejemplos: hijos por
familia, número de accidentes por día, trabajadores por empresa, población por
distritos, habitaciones por vivienda, etc.
Variable Continua
Cuando la variable es susceptible de medirse, es toda variable cuyo valor se
obtiene por medición o comparación con una unidad o patrón de medida. Las
variables continuas pueden tener cualquier valor dentro de su rango o recorrido,
por tanto se expresa por cualquier número real; Ejemplos: área de parcelas,
ingresos monetarios, producción de maíz, peso, estatura, tiempo de servicios,
horas trabajadas, niveles de empleo, etc.
8
Variables Nominales
Son aquellas variables que establecen la distinción de los elementos en diversas
categorías, sin implicar algún orden entre ellas, distribuye a la unidad de análisis
en dos o más categorías. Ejemplos: sexo, estado civil, deportes de práctica,
profesiones, lugar de nacimiento, etc.
Variables Ordinales
Aquellas variables que implican orden entre sus categorías, pero no grados de
distancia igual entre ellas, están referidas a un orden de jerarquía, donde las
categorías expresan una posición de orden. Ejemplo: grado de instrucción, clases
sociales, grado de simpatía, rango de agresividad, orden de mérito, etc.
Variable de Intervalo
Son aquellas que suponen a la vez orden y grados de distancia iguales entre las
diversas categorías, pero no tienen origen natural, sino convencional, tiene un
cero relativo. Por ejemplo: coeficiente de inteligencia, temperatura, puntuación
obtenida en una escala, etc.
Variables de Razón
Estas variables comprenden a la vez todos los casos anteriores, distinción, orden,
distancia y origen único natural; el valor se expresa con un número real tiene un
Tipos de datos.-
cero absoluto. Por ejemplo: edad, peso, ingresos, número de hijos, producción,
Clasificación
accidentes de tránsito, etc. de datos según su naturaleza
Escala de Medición
Cualitativa Nominal
Ordinal
Niveles de Medición.-
EJERCICIOS RESUELTOS:
En los ejercicios 1 al 4 determine si el valor dado es un estadístico o un parámetro.
1.-Tamaño de la familia. Se selecciona una muestra de hogares y el número promedio (media)
de personas por familia es de 2,58 (según datos de la Oficina censal Peruana).
2.-Política. En la actualidad, el 42% de los gobernadores regionales del Perú son de izquierda.
3.-Titanic. En un estudio de los 2223 pasajeros del “Titanic”, se encontró que 706 sobrevivieron
cuando se hundió.
4.- Audiencia televisiva. Se selecciona una muestra de ciudadanos peruanos y se descubre que
la cantidad de tiempo promedio (media) que ven la televisión es de 4,6 horas al día
Respuesta: 1.Estadístico 2.Parámetro 3.-Parámetro 4.-Estadístico
9
5.- a) Lugar de residencia
b) Número de vecinos de un edificio.
c) Profesiones de empleados.
d) Número de llamadas telefónicas.
e) Consumo de gasolina cada 200 km.
Respuesta: a) Cualitativa, b) Cuantitativa discreta c) Cualitativa d) Cuantitativa discreta e)
Cuantitativa continua.
6.-Con el fin de conocer la mejor forma de viajar de una población han preparado una encuesta.
Algunas de las preguntas trataron sobre: N° de días de viaje, dinero empleado, número de
equipajes, zonas geográficas, medios de transporte, naturaleza del viaje (negocios, turismo, salud
etc.) y Numero de personas.
Respuesta:
V. Cualitativa: Zonas geográficas, medios de transporte y naturaleza del viaje.
V. Cuantitativa discreta: N° De días, N° De equipajes y N° De personas.
V. Cuantitativa continua: Dinero empleado.
Ejercicios Propuestos:
En los ejercicios 1 a 8 determine cuál de los cuatro niveles de medición (nominal, ordinal, de
intervalo o de razón) es el más apropiado.
1.-Maratón en Pucallpa. Los números en las camisetas de los corredores de maratones.
2.-Producto de consumo. Las calificaciones que da la revista Somos de "la mejor compra”:
recomendado, no recomendado".
3.-NSS. Los números de seguridad social.
4.-Encuesta de bebidas. El número de respuestas "si' recibidas cuando se les preguntó a 500
estudiantes si alguna vez se habían embriagado en la universidad.
5.-Cigarras. Los años de aparición de cigarras: 1936; 1953; 1970; 1987 y 2004.
6.-Mujeres ejecutivas. Los salarios de mujeres que son directoras generales de corporaciones.
7.- Calificaciones. Calificaciones de las películas de una estrella, dos estrellas, tres estrellas y
cuatro estrellas.
8.-Temperaturas. Las temperaturas actuales en las ciudades del Perú.
9.-Las autoridades de la Universidad han realizado un estudio para conocer la opinión de los
padres de familia de los estudiantes en general, respecto a las nuevas carreras que se vienen
ofertando. Para ello, durante la semana de matrículas se aplicó una encuesta a 860 padres de
familia elegidos aleatoriamente, dentro de las instalaciones del campus universitario, donde se
obtuvo como resultado que el 87% de los encuestados se manifestaron en total acuerdo por la
innovación en carreras profesionales que se viene impulsando (las respuestas iban de
“Totalmente en desacuerdo” a “Totalmente de acuerdo”). De estudios anteriores se sabía que
sólo el 55% de los padres de familia de los estudiantes de esta casa superior de estudios apoyaban
la iniciativa de fomentar nuevas carreras en años pasados.
Del enunciado anterior, indique:
a)Población y parámetro:________________________________________________
b)Muestra y estadístico: ________________________________________________
c)Variable: ___________________________________________________________
d)Tipo de variable:_____________________________________________________
e)Nivel de medición:____________________________________________________
f)Unidad estadística:
10.- Responda las siguientes preguntas:
I. Al 99.561% de actas contabilizadas, el candidato Pedro Castillo sería el virtual presidente de la
república, recibió el 50.172% de los 18,791,075 229 votos emitidos. El conjunto de todos esos
votos es la población a considerar. ¿El 50.172% es un parámetro o un estadístico?
II. En el inciso (I) indica el total de votos emitidos en la elección presidencial del 2021. ¿Estos
valores son cualitativos, cuantitativos discretos o cuantitativos continuos?
III. ¿Qué nivel de medida tiene la variable en función del Inciso (II)?
A) Estadístico, cualitativos, nominal
B) Parámetro, cuantitativo discreto, intervalo
C) Estadístico, cuantitativo discreto, escala
D) Parámetro, cuantitativo continuo, escala
E) Parámetro, cuantitativo discreto, razón
Referencias bibliográficas consultadas y/o enlaces recomendados
Bejarano, M. (1995) Estadística descriptiva, probabilidades y lineamientos para la elaboración del
protocolo de investigación en ciencias de la Salud. Universidad Peruana Cayetano Heredia.
10