Nothing Special   »   [go: up one dir, main page]

Unidad N1 Estadistica Descriptiva 1ra Parte 1

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 29

Simbología y Nomenclatura

Símbol Nombre
o
Xi Valor i-ésimo de un variable
X min Valor mínimo de un variable
X max Valor máximo de una variable
N Cantidad de valores de la variable o número de observaciones
fai Frecuencia absoluta: Cantidad de veces que aparece una variable
Fai Frecuencia absoluta acumulada por izquierda
Gai Frecuencia absoluta acumulada por derecha
fri Frecuencia relativa: Cociente entre la frecuencia absoluta y el número de
observaciones
Fr i Frecuencia relativa acumulada por izquierda
Gr i Frecuencia relativa acumulada por derecha
fri % Frecuencia relativa porcentual
Fr i % Frecuencia relativa porcentual acumulada por izquierda
Gr i % Frecuencia relativa porcentual acumulada por derecha
Ls Límite superior de un intervalo
Li Límite inferior de un intervalo
a Amplitud de un intervalo
Xi Punto medio del intervalo o marca de clase
PM i
X́ Media aritmética o promedio
Me Mediana
Mo Moda: valor de la variable que tiene la mayor frecuencia
Pk Percentil de orden “k”
R Rango o recorrido de un conjunto de valores de la variable
2
Sx Variancia o Varianza
Sx Desvío estándar
C.V. Coeficiente de variación

Distinción de simbología cuando trabajamos con la población y la muestra

Medidas Muestr Población


a
Media o Promedio X́ µ
Mediana me Me
Modo mo Mo
Variancia o Varianza S2 σ²
Desvío S σ
Probabilidad p P / π
LA ESTADÍSTICA

Algo de Historia...

"La necesidad de poseer datos cifrados sobre la población y sus condiciones


materiales de existencia han debido hacerse sentir desde que se establecieron
sociedades humanas organizadas.

Desde los comienzos de la civilización han existido formas sencillas de


estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles,
rocas, palos de madera y paredes de cuevas para contar el número de personas,
animales o ciertas cosas. Hacia el año 3000 a.C. los Babilonios usaban ya pequeñas
tabillas de arcilla para recopilar datos en tablas sobre la producción agrícola y los
géneros vendidos o cambiados mediante trueque. Los egipcios ya analizaban los datos
de la población y la renta del país mucho antes de construir pirámides. Los libros
bíblicos de números y crónicas incluyen, en algunas partes, trabajos de estadística. El
primero contiene dos censos de la población de Israel y el segundo describe el
bienestar material de las diversas tribus judías. En China existían registros numéricos
similares con anterioridad al año 2000 a.C. Los griegos clásicos realizaban censos
cuya información se utilizaba hacia el 594 a.C. para cobrar impuestos.

El Imperio romano fue el primer gobierno que recopiló una gran cantidad de
datos sobre la población, superficie y renta de todos los territorios bajo su control; a
continuación, y por orden de Carlomagno, en el año 762 se realiza un inventario

2
minucioso de las propiedades de la Iglesia. Después de la conquista normanda de
Inglaterra en 1066, el rey Guillermo I el Conquistador encargó numerosos inventarios
o censos realizados en Francia, cuya información se recoge en el Domesday Book
(1086). Los Reyes Católicos ordenaron a Alonso de Quintanilla en 1482 el recuento de
fuegos (hogares) de las provincias de Castilla.

En el siglo XVII se delimitaron claramente los conceptos relativos a las bases y


a los medios de los estudios estadísticos, formándose dos escuelas: “escuela
descriptiva alemana” a la que se le debe el nombre de Estadística, y “escuela de los
aritméticos políticos”.

La primera fue fundada por Hermann Conring (1606-1681) y su trabajo fue


continuado por Gottfried Achenwall (1719-1772), que publicó Elementos de la
Estadística de los Estados de Europa. Los fundadores de la escuela de los aritméticos
políticos fueron John Graunt (1620-1674), que publica en 1662 Natural and Political
Observations made upon the Bills of Mortality (Comentarios sobre las partidas de
defunción en Londres), en el que se trata de relacionar fenómenos biológicos y
sociales, y sir William Petty (Romsy, Hampshire, 1923-Londres, 1687), en 1690 publica
political Arithmetic analizando datos demográficos de educación. Esta escuela fue más
allá de la descripción; puso en evidencia ciertas evidencias estadísticas; por ejemplo,
la que existía entre la relación del número de nacimiento masculinos con el de
femeninos. Un poco más tarde, el astrónomo Edmund Halley (1656-1742) presenta la
primera tabla de mortalidad que se puede considerar como base de los estudios
contemporáneos. En dicho trabajo se intenta establecer el precio de las anualidades a
satisfacer a las compañías de seguros.

En el siglo XIX, la estadística entra en una nueva fase de su desarrollo con la


generalización del método para estudiar fenómenos de las ciencias naturales y
sociales. Los investigadores aceptaron la necesidad de reducir la información a valores
numéricos para evitar posibles ambigüedades”1

“Desde inicios de la década de 1980 y hasta la actualidad, se ha puesto un


interés en el mejoramiento de la calidad en la industria de todo el mundo. Se ha dicho y
escrito mucho acerca del “milagro industrial” japonés que comenzó a mediados del
siglo XX. Los japoneses fueron capaces de tener éxito donde otras naciones fallaron; a
saber, en la creación de un entorno que permita la manufactura de productos de alta
calidad. Gran parte del éxito japonés se atribuye al uso de métodos estadísticos y del
pensamiento estadístico entre el personal gerencial”2

INTRODUCCIÓN

¿Qué es la Estadística? ¿Para qué se estudia? ¿Dónde se aplica?

1
Extraído del texto: Estadística de M José Asencio Rubio y otros. Editorial Mc Graw Hill
2
Extraído del texto: Probabilidad y Estadística de Walpole – Meyers – Meyers –Ye Editorial Pearson
Prentice Hall

3
“Se emplean técnicas estadísticas en casi todas las fases de la vida. Se diseñan
encuestas para recabar los primeros informes en un día de elecciones y pronosticar el
resultado de una elección. Se hacen muestreos de consumidores para obtener
información para predecir preferencias de productos.

Un requisito previo para un examen de la teoría de estadística es una definición


de estadística y un enunciado de sus objetivos. El Webster`s new Collegiate Dictionary
define estadística como “rama de las matemáticas que estudia la recolección, análisis,
interpretación y presentación de masas de información numérica”. Stuart y Ord (1991)
expresan: “Estadística es la rama del método científico que estudia los datos obtenidos
por contar o medir las propiedades de poblaciones”. Rice (1995), comentando sobre
experimentación y aplicaciones estadísticas, expresa que la estadística se “ocupa
esencialmente de procedimientos para analizar información, en especial que en algún
sentido vago tenga un carácter aleatorio” Freund y Walpole (1987), entre otros, ven la
estadística como una disciplina que abarca “la ciencia de basar inferencias en datos
observados y todo el problema de tomar decisiones frente a una incertidumbre”. Y
Mood, Graybill y Boes (1974) definen la estadística como “la tecnología del método
científico” y agregan que la estadística se ocupa de:

1. el diseño de experimentos e investigaciones


2. inferencia estadística.

Un examen superficial de estas definiciones sugiere una falta importante de


acuerdo, pero todas poseen elementos comunes. Cada descripción implica que los
datos se recolectan, con la inferencia como objetivo. Cada una requiere seleccionar un
subconjunto de un gran conjunto de datos, ya sea existente o conceptual, para inferir
las características del conjunto completo. Todos los autores implican que la estadística
es una teoría de información, siendo la inferencia su objetivo”3

En síntesis, la Estadística es una rama de las matemáticas que se ocupa de


recoger, analizar y extraer información relevante y útil del conjunto de datos obtenidos;
esta información aparece en forma de números, porcentajes o a través de gráficos. Su
nombre alude al enorme interés por los asuntos del Estado: empadronamiento, censos de
poblaciones, índice de natalidad, índice de mortalidad, etc.

Se estudia la Estadística para aplicar sus conceptos como ayuda en la toma de


decisiones ante situaciones de incertidumbre, justificándola científicamente.

Los principios estadísticos se emplean en una gran variedad de situaciones, para


describir valores de datos económicos, políticos, de la industria y, también, en el ámbito
de las ciencias sociales, psicológicas, biológicas y físicas. La Estadística se ha
convertido en un método efectivo para estas ciencias, sirve como herramienta para
relacionar y analizar dichos datos, así como establecer descripciones, predicciones,

3
Extraído del texto: Estadística Matemática con aplicaciones Wackerley – Mendenhall – Scheaffer
Editorial. Cengage Learning

4
comparaciones y generalizaciones sobre una población a partir de los datos obtenidos de
una muestra.

Su introducción en el mundo científico se debe a la importancia indiscutible para


el desarrollo de todas las ciencias. Algunos ejemplos son:

 Ciencias económicas y sociales: censos, tierras cultivadas de pastos, bosques,


producción total de sustancias alimentarias, coeficiente de natalidad y
mortalidad, paro obrero, nivel de vida, estudio de mercados, opiniones públicas,
etc. Los economistas observan varios índices del estado de la economía en un
período y usan la información para pronosticar las condiciones de la economía
en el futuro.
 Control de calidad en la producción industrial: la fabricación en serie no permite
el control de todas las piezas producidas; existen métodos estadísticos para
mantener la calidad de producción dentro de unos límites de tolerancia
admitidos. Los ingenieros muestrean la característica de calidad de un producto
y diversas variables de procesos controlables para identificar variables claves
relacionadas con la calidad de un producto
 Literatura: la frecuencia de frases de cierta longitud, la frecuencia de verbos, etc.
han permitido determinar la paternidad de ciertas obras literarias.
 Medicina: Médicos investigadores realizan experimentos para determinar él
efecto de diversos medicamentos y condiciones ambientales controladas en seres
humanos para inferir el tratamiento adecuado para varias enfermedades en
distintos países, análisis de la curva de crecimiento, cómo contrastar la eficacia
comparada de dos medicamentos contra el SIDA.
 Meteorología: cómo establecer las zonas de mayor índice de pluviometría.
 Tecnología: cómo estimar la duración de vida de un componente hardware de un
ordenador. Aparatos electrónicos recién manufacturados se muestrean antes de
enviarlos para decidir si se embarcan o se mantiene lotes individuales.

Las técnicas estadísticas desempeñan un importante papel para alcanzar la meta


de cada una de estas situaciones prácticas.

El uso de los ordenadores, la rápida computación de los datos recogidos en


disciplinas como la Medicina, la Meteorología, la Sociología y otras ciencias permiten
la mejor aplicación de métodos estadísticos; es posible realizar un sondeo con miles de
cuestionarios. La estadística se presta para las aplicaciones operacionales e
investigativas, siendo no solamente en los experimentos de laboratorio, sino que
también lo es en los estudios fuera de él.

La Estadística incluye la planeación y ejecución de las encuestas, la descripción


y el análisis de los resultados y la formulación de las predicciones con base en esos
resultados.

Empleo de datos científicos

5
“El uso de métodos estadísticos en la manufactura, el desarrollo de productos
alimenticios, el software para computadoras, los medicamentos y muchas otras áreas
implican el acopio de información o datos científicos. Por supuesto que la obtención de
datos no es algo nuevo, ya que se ha realizado por más de mil años. Los datos se han
recabado, resumido, reportado y almacenado para su examen cuidadoso. Sin embargo,
hay una diferencia profunda entre recabar información científica y la estadística
inferencial. Esta última ha recibido atención legítima durante las últimas décadas.

La estadística inferencial generó un número enorme de “herramientas” de


métodos estadísticos que utilizan los profesionales de la estadística. Los métodos
estadísticos se diseñan para contribuir al proceso de realizar juicios científicos frente a
la incertidumbre y a la variación. Dentro del proceso de manufactura la densidad de
producto de un material específico no siempre será la misma. De hecho, si se trata de
un proceso discontinuo en vez de uno continuo, habrá variación en la densidad de
material no sólo entre los lotes (variación de un lote a otro) que salen de la línea de
producción, sino también dentro de ellos. Los métodos estadísticos se utilizan para
analizar datos de procesos como el anterior, para tener una mejor orientación respecto
de dónde realizar mejoras a la calidad del proceso mismo.

Ejemplo: En un estudio biomédico de un nuevo fármaco que reduce la


hipertensión, 85% de los pacientes experimentaron alivio; mientras que se reconoce
que, por lo general, el medicamento “viejo” o actual alivia a un 80% de los pacientes
que sufren hipertensión crónica. No obstante, el nuevo fármaco es más caro de
elaborar y quizás ocasione algunos efectos colaterales. ¿Debería adoptarse el nuevo
medicamento? Se trata de un problema que a menudo se encuentra (a veces con mucha
mayor complejidad) en la relación entre las empresas farmacéuticas y la OMS. De
nuevo, necesita tomarse en cuenta la variación. El valor 85% se basa en cierto número
de pacientes seleccionados para el estudio. Tal vez si se repitiera el estudio a nuevos
pacientes ¡el número observado de “éxitos” sería el 75%! Se trata de una variación
natural de un estudio a otro que debe tomarse en cuenta para el proceso de toma de
decisiones. Es evidente que tal variación es importante porque la variación de un
paciente a otro es endémica al problema (endémico/ca: relativo a la endemia y
endemia: enfermedad habitual en una región o un país).

Variabilidad en los datos científicos

En el ejemplo presentado los métodos estadísticos empleados tienen que ver con
la variabilidad y en cada caso la variabilidad que se estudia se encuentra en datos
científicos. Si no hubiera variabilidad de un paciente a otro inherente a la respuesta al
medicamento (es decir, si siempre el fármaco causara alivio o no), la vida sería muy
sencilla para los científicos de la industria farmacéutica y para la OMS y los
estadísticos no serían necesarios en el proceso de toma de decisiones. La estadística
inferencial ha originado un gran número de métodos analíticos que permiten efectuar
análisis de datos obtenidos de sistemas como el que se describió anteriormente, lo cual
refleja la verdadera naturaleza de la ciencia que conocemos como estadística

6
inferencial; a saber, el uso de técnicas que nos permiten ir más allá de sólo reportar
datos, ya que nos permiten obtener conclusiones (o inferencias) sobre el sistema
científico. Los estadísticos usan leyes fundamentales de probabilidad e inferencia
estadística para sacar conclusiones respecto de los sistemas científicos. La información
se recoleta en forma de muestra, o agrupaciones de observaciones (en otra unidad se
introduce el proceso de muestreo).

Las muestras se reúnen a partir de la población, que son agrupaciones de todos


los individuos o elementos individuales de un tipo específico. A veces una población
representa un sistema científico. Por ejemplo, un fabricante de tarjetas para
computadoras quizás desee eliminar defectos. Un proceso de muestreo implicaría la
recolección de información de 50 tarjetas de computadora tomadas aleatoriamente
durante el proceso. Aquí, la población serían todas las tarjetas de computadoras
producidas por la empresa en un período específico. En un experimento con fármacos
se toma una muestra de pacientes y a cada uno se le administra un medicamento
específico para reducir la presión sanguínea. El interés se enfoca en la obtención de
conclusiones sobre la población de quienes sufren hipertensión. Si se logra una mejoría
en el proceso de producción de las tarjetas para computadoras y se reúne una segunda
muestra de tarjetas, cualesquiera conclusiones que se obtengas respecto de la
efectividad del cambio en el proceso debería extenderse a toda la población de tarjetas
para computadora que se produzcan bajo el “proceso mejorado”.

A menudo, es muy importante el acopio de datos científicos en forma


sistemática, cuando la planeación ocupa un lugar importante en la agenda. En
ocasiones la planeación está, por necesidad, bastante limitada. Con frecuencia nos
enfocamos en ciertas propiedades o características de los elementos u objetos de la
población. Tal característica tiene importancia de ingeniería específica o, digamos,
biológica para el “cliente”: el científico o el ingeniero que busca aprender algo acerca
de la población”4

LENGUAJE ESTADÍSTICO

DETERMINACIÓN DE LO QUE SE DEBE SABER ¿Cómo se estudia?

El método estadístico es un proceso para obtener, representar y analizar las


características o los valores numéricos para una mejor toma de decisiones en situaciones
de incertidumbre.

Los pasos para seguir una metodología estadística son los siguientes:

 Definición cuidadosa del problema;


 Definición de un plan para la recolección de información de las unidades de
observación;

4
Extraído del texto: Probabilidad y Estadística de Walpole – Meyers – Meyers –Ye Editorial Pearson
Prentice Hall

7
 Recolección, resumen y representación de las observaciones o de sus valores
numéricos;
 Análisis de los resultados;
 Divulgación escrita de las conclusiones, de modo que éstas sean fácilmente
comprensibles por quien las vaya a utilizar en la toma de decisiones.

Entre las características del método estadístico, se mencionan:

 Es la única manera de tratar con una gran cantidad de observaciones o de


valores;
 Se aplica solamente a las observaciones reducibles a una forma cuantitativa;
 Sucede lo mismo tanto para las ciencias humanas y sociales como para las
ciencias tecnológicas;
 Es objetivo; aunque los resultados están influenciados (no debiera ser) por la
inescapable interpretación subjetiva.

Un comentario anecdótico: “Una universidad estadounidense se anunciaba


diciendo que la tercera parte de sus alumnas graduadas se casan con profesores de la
universidad. Se comprobó que sólo tres alumnas se habían graduado” …

“Es evidente que para sacar conclusiones hay que tener en cuenta el tamaño
de la comunidad sobre el que se está afirmando el hecho.”

A la estadística no le interesa sacar conclusiones con respecto a las unidades


individuales de observación, sino sobre grupos o conjuntos, porque su objetivo es el
estudio de la llamada población (también llamada universo) la cual puede ser finita o
infinita. En estadística, el término población tiene un sentido más amplio, ya que puede
estar formado por personas, cosas, áreas geográficas, períodos temporales…por
ejemplo: alumnos de un colegio o institutos, empleados de un taller o fábrica, piezas
producidas en una fábrica, series temporales (desde 1990 hasta el 2000), provincias de
la República Argentina, etc.

POBLACIÓN: en la práctica, consiste en la totalidad de las unidades de observación


(comúnmente personas, objetos o eventos) sobre los cuales se desea tomar una decisión.

Completar la
frase

“El total de alumnos inscriptos en nuestro Instituto Superior de Formación Docente


para el presente ciclo lectivo es de……………………………...”

La población finita es aquella en la cual el número de unidades de


observación puede ser contado y es limitado.

Ejemplos de población finita

8
 Alumnos matriculados en las escuelas estatales y escuelas privadas.
 Todas las declaraciones juradas del impuesto a las ganancias para la AFIP.
 Todas las personas que compran teléfono celular;

Una población es infinita si la cantidad de unidades observables es ilimitada


o su composición es tal, que las unidades de la población no pueden ser contadas .

Ejemplos de población infinita

 El conjunto de medidas de un experimento repetido indefinidamente, puesto que


no hay límite para el número de veces que se pueda medir;
 Los gases, los líquidos y algunos sólidos tales como el talco, puesto que las
unidades no pueden identificarse ni contarse

Individuo: cada una de las unidades elementales sobre las que se realiza el estudio. Un
individuo puede ser algo con existencia real o bien abstracta. Por ejemplo: un alumno,
un empleado, una pieza fabricada, un mes, un año, una provincia.

Tamaño de la población: es el número de individuos o unidades que forman la


población. Es muy importante a la hora de la investigación estadística. Para una
población finita ese tamaño se designa con la letra N.

Carácter: es el aspecto, fenómeno, rasgo o cualidad que se va a estudiar en cada uno de


los individuos. A las distintas posibilidades del carácter se les llama modalidad si no se
expresan numéricamente, y valor en caso contrario. Estas posibilidades tienen que ser
incompatibles dos a dos, ya que cada individuo debe pertenecer a una sola. El número
de modalidades o valores de un carácter puede variar según la información que se quiere
recoger. En la población se realiza una encuesta observando a todas las unidades sobre
una o más características factibles de estudio; también se identifica un área de cobertura
que es aquella que, físicamente, limita a las unidades de observación que se desea
estudiar.

Ejemplos de áreas de cobertura

 Alumnos de nuestro Instituto


 Empleados de un taller
 Provincias de la República Argentina

Al describir una población de deben diferenciar la unidad de observación de las


características de esa población. Una unidad de observación es un objeto (o grupos de
objetos del cual se recolectan datos y que puede tener muchas características, aunque el
interés recaiga usualmente sobre apenas una o algunas de ellas, cuyos valores se anotan
y sobre los cuales se aplican principios estadísticos.

9
Ejemplos de unidad de observación y características

 Alumnos del Instituto, los cuales presentan muchas características, en las que
están: altura, sexo, edad, etc.
 De los empleados de un taller podemos estudiar: sexo, la productividad, número
de hijos, grupo sanguíneo, etc…
 De las piezas producidas en una fábrica podemos estudiar: el tamaño, la calidad,
el peso, etc…
 En las series temporales podemos hacer un estudio sobre: el número y
procedencia de los turistas, ingresos obtenidos, etc…
 De las provincias de Argentina podemos realizar estudios sobre: capacidad
hotelera, cantidad y vacantes de universidades, número de accidentes de tráfico,
etc…

COMENZANDO A ESTUDIAR, EN LA PRÁCTICA, A UNA POBLACIÓN:


CENSO Y MUESTREO

Si la población es pequeña, es razonable observarla toda y esto se llama censo.


(El censo es el examen de todas las unidades de observación de una población).

Pero, examinar una población entera no es siempre viable; en la mayoría de los


casos hay escasez de tiempo y de recursos (humanos o financieros, por ejemplo) o el
censo es impracticable. Es posible entrevistar y anotar lo que piensan 44 personas que
estén en una reunión, pero no obtener y registrar en un tiempo razonable, la opinión de
todos los seguidores del encuentro final de un campamento de fútbol en un gran estadio.
Fuera de esto, el mundo está cambiando constantemente y, por lo tanto, nunca las
observaciones reflejarán, de manera completamente precisa, las condiciones reales y
actuales de todas las unidades de observación.

“El Instituto Nacional de Estadística y Censos (INDEC) presenta los


Resultados Provisionales correspondientes al Censo Nacional de Población, Hogares

y Viviendas.
Investiga sobre la
historia de los censos en
Argentina

Por esos motivos, el estudio estadístico se inicia con la selección de parte de una
población, llamada muestra, (conjunto de unidades de observación seleccionadas de una
población o subconjunto de individuos de la población sobre los que se realiza el
estudio para trasponer las conclusiones a toda la población) constituida por n unidades
de observación y la cual debe tener las mismas características de la población, el

10
estudio estadístico se puede realizar a toda la población o a una parte seleccionada de
ella utilizando distintos criterios (tipos de muestreo) más adelante se profundizarán
estos conceptos.

Este proceso recibe el nombre de muestreo, (proceso por el cual una muestra de
unidades de la población es seleccionada y observada) el cual comprende por lo menos
dos etapas: la selección de las unidades y el registro de las observaciones. El tamaño de
la muestra que debe ser extraída de la población es el que minimiza los costos del
muestreo, pudiendo ser hasta de tamaño 1. El instrumento más utilizado para recolectar
los datos es el cuestionario. Un cuestionario consiste en un conjunto de preguntas
respecto a una o más características a medir. Debe ser congruente con el planeamiento
del problema e hipótesis.

Muestras Aleatorias:

Es claro que la confiabilidad de las conclusiones que se obtengan acerca de una


población depende de que la muestra se haya elegido de manera adecuada, de tal modo
que represente lo mejor posible a la población, y uno de los problemas más importante
de la inferencia estadística es, precisamente, cómo elegir una muestra.

Una manera de hacer esto cuando se trata de poblaciones finitas es asegurarse


de que cada miembro de la población tenga la misma posibilidad de pertenecer a la
muestra, lo que suele conocerse como muestreo aleatorio. El muestreo aleatorio,
cuando se trata de poblaciones relativamente pequeñas, puede lograrse sacando números
de la suerte o, lo que es equivalente, mediante el uso de una tabla de números aleatorios
especialmente elaborada para tal propósito.

Como la inferencia de una población no puede ser segura a partir de una


muestra, en cualquier enunciado o conclusión debe emplearse el lenguaje de la
probabilidad.

EVALUACIÓN NUMÉRICA DE LAS UNIDADES DE OBSERVACIÓN CON


LA AYUDA DE LAS ESCALAS DE MEDIDAS

Hay dos tipos básicos de datos:

 Los obtenidos de una población cualitativa;


 Los obtenidos de una población cuantitativa.

CLASES DE VARIABLES

En la estadística, la variable es la atribución de un valor (numérico o


alfanumérico) a cada característica de una unidad de observación. Cuando una
característica o variable no es numérica, se denomina variable cualitativa o atributo.

Ejemplos de variable cualitativa

11
 Sexo;
 Religión;
 Nacionalidad;
 Color de ojos;

Una variable cualitativa se expresa en categorías.

Ejemplos de categorías de variables cualitativas

 En el sexo: masculino o femenino;


 En la religión: católica, anglicana, judía, budista, musulmana, etc.;
 En la nacionalidad: argentina, uruguaya, italiana, alemana, estadounidense, etc.;
 En el color de los ojos: castaños, celestes, verdes, azules;

Cuando los datos son cualitativos, el interés se concentra normalmente en la


cantidad o en la proporción de cada categoría en relación con el total.

Ejemplificar y
completar la
frase
“En nuestro Instituto el …..%. son ………………………….

Cuando puede ser expresada numéricamente, la variable estudiada se


denomina variable cuantitativa.

Ejemplos de variables cuantitativas

 Cantidad de hermanos o hijos de cada alumno o empleados


 Cantidad de horas que estudia un alumno
 Cantidad de horas que trabaja un empleado
 Altura y peso de los alumnos o empleados
 Duración de una batería del celular.

Las variables cuantitativas pueden ser discretas o continuas. Las variables


discretas sólo pueden tomar determinados valores y son el resultado de un conteo (es
decir, son aquellas variables cuyo conjunto de valores posibles es finito). Las variables
continuas pueden tomar cualquier valor dentro de un determinado rango de valores, y
son el resultado de una medición.

Ejemplos de variables cuantitativas discretas

 Cantidad de hermanos o hijos de cada alumno o empleado


 Cantidad de asignaturas que desaprueba un alumno

12
Observemos que no se puede hablar de 2,4 hermanos, ni de 3,8 materias
desaprobadas por los alumnos. Los números fueron obtenidos a partir de un conteo.

Por otro lado, las variables continuas son aquellas cuyo conjunto de valores
posibles están en un intervalo de números reales, resultado de una medición con
cualquier grado de exactitud.

Ejemplos de variables cuantitativas continuas

 Peso y la altura de los alumnos o empleados (medidos en kilogramos y metros)


 Tiempo de duración de la batería de un celular (expresado en horas)

LAS ESCALAS O NIVELES DE MEDICIÓN QUE CARACTERIZAN LAS


UNIDADES DE OBSERVACIÓN

Pueden usarse cuatro escalas o niveles de medición que caracterizan las unidades
de una población. Ellas son: nominal, ordinal, intervalar (intervalos) y razón.

1) Escala o nivel de medición nominal: En este nivel hay dos o más categorías del
ítem o la variable. Las categorías no tienen orden ni jerarquías. Lo que se mide
(objetos, personas, etc.) se coloca en una u otra categorías, lo cual indica tan sólo
dos categorías: masculino y femenino. Ninguna de las categorías implica
mayores jerarquías que la otra. Las categorías únicamente reflejan diferencias en
la variable. No hay orden de mayor a menor.
Si les asignamos una etiqueta o un símbolo a cada categoría, esto
identificaría exclusivamente a la categoría. Por ejemplo:

* = Masculino

Z = Femenino

Si usamos numerales, es lo mismo:

1= masculino 2 = Masculino

es igual a

2= Femenino 1= Femenino

Los números utilizados en este nivel de medición tienen función


puramente de clasificación y no se pueden manipular de manera aritmética. Por
ejemplo, la afiliación religiosa es una variable nominal; si pretendiéramos operarla
de forma aritmética se presentarían situaciones tan ridículas como ésta:

1. Católico
2. Judío 1+2=3
3. Protestante ¿Un católico + un judío = un protestante?

13
4. Musulmán (no tiene sentido)
5. otros

Las variables nominales pueden incluir dos categorías (dicotómicas), o


bien, tres o más categorías (categóricas). Ejemplos de variables nominales
dicotómicas serán el género de una persona, el veredicto de un jurado (culpable o
no culpable) y el tipo de escuela a la que asiste (privada-pública); y como ejemplos
de variables nominales categóricas tendríamos la afiliación política (partido A,
partido B , etc.) la licenciatura elegida por un estudiante, el grupo étnico, el
departamento, la provincia o el estado de nacimiento, la clase de material de
construcción (“no” su resistencia, ésta sería otra variable), tipo de medicamento
suministrado (“no” la dosis, que sería una variable distinta), bloques de mercado
(asiático, latinoamericano, comunidad europea, etc.) y el canal de televisión
preferido.

2) Escala o nivel de medición ordinal: En este nivel hay varias categorías, pero
además mantienen un orden de mayor a menor. Las etiquetas o los símbolos de
las categorías sí indican jerarquías. Por ejemplo, el prestigio ocupacional en
Argentina podría medirse por diversas escalas que reordenan las profesiones de
acuerdo con su prestigio, por ejemplo:
Valor de escala Profesión
90 Ingeniero Químico
80 Científico de ciencias naturales (excluyendo la química)
60 Actor común
50 Operador de estaciones eléctricas de potencia
02 Manufacturero de tabaco

Los números (símbolos de categorías) definen posiciones, en el ejemplo:


90 es más que 80, 80 más que 60, 60 más que 50 y así sucesivamente. Sin
embargo, las categorías no están ubicadas a intervalos iguales (no hay un
intervalo común): No podríamos decir con exactitud que entre un actor (60) y un
operador de estaciones eléctricas (50) existe la misma distancia en prestigio que
entre un científico de ciencias naturales (80) y un ingeniero químico (90). Al
parecer, en ambos casos la distancia es 10, pero no es una distancia real. Otra
escala clasificó el prestigio de dichas profesiones de la siguiente manera:

Valor de escala Profesión


98 Ingeniero Químico
95 Científico de ciencias naturales (excluyendo la química)
84 Actor común
78 Operador de estaciones eléctricas de potencia
13 Manufacturero de tabaco

14
Aquí la distancia entre un actor (84) y un operador de estaciones (78) es
seis, y la distancia entre un ingeniero químico (98) y un científico de ciencias
naturales (95) es de tres.
Otro ejemplo sería la posición jerárquica en la empresa:

Presidente 10
Vicepresidente 9
Director general 8
Gerente de área 7
Subgerente o superintendente 6
Jefe 5
Empleado A 4
Empleado B 3
Empleado C 2
Intendencia 1

Sabemos que el presidente (10) es más que el vicepresidente (9), éste más
que el director general (8), a su vez este último más que el gerente (7) y así
sucesivamente; pero no se precisa en cada caso cuánto más. Tampoco se
utilizan las operaciones aritméticas básicas: no podríamos decir que
4 (empleado A) + 5 (jefe) = 9 (vicepresidente), ni que 10 (presidente) : 5
(jefe) = 2 (empleado C).

Sería absurdo, no tiene sentido. Otros ejemplos de este nivel serían: la


medición por rangos de las preferencias de marcas de bebidas refrescantes con
gas (gaseosas o sodas), autopercepción del grado de dolor de cabeza y
jerarquización de valores (en primer lugar, en segundo lugar, en tercero).
Otro ejemplo sería: Al verificarse el comportamiento de una persona o actividad,
para lo cual hay cinco categorías, con el fin de facilitar la codificación un
número a cada desempeño: (5) óptimo, (4) bueno, (3) regular, (2) malo y (1)
pésimo. Un 4 indica un mejor desempeño que un 3, pero no implica,
necesariamente, que se tenga un desempeño dos veces mejor que quien obtuvo
2.

3) Escala o nivel de medición por intervalos: Además del orden se establecen


intervalos iguales en la medición. Las distancias entre categorías son las mismas
a lo largo de toda la escala, por lo que hay un intervalo constante, una unidad de
medida. A las características se les atribuyen valores que no solamente permiten
comparar el orden, sino que también permiten evaluar la variación numérica
entre las características.
Por ejemplo, en una prueba de resolución de problemas matemáticos (30)
problemas de igual dificultad). Si Ana resolvió 10, Laura resolvió 20 y Camila,
30. La distancia entre Ana y Laura es igual a la distancia entre Laura y Camila.
Sin embargo, el cero en la medición es un cero arbitrario, no es real, ya

15
que se asigna arbitrariamente a una categoría el valor cero y a partir de ésta se
construye la escala. Un ejemplo clásico en ciencias naturales es la temperatura,
que puede medirse en grados centígrados y Fahrenheit. El cero es arbitrario,
pues no implica que en realidad haya cero (ninguna) temperatura (incluso en
ambas escalas el cero es diferente). El valor cero no indica la ausencia del
atributo.
Cabe agregar que diversas mediciones de estudio del comportamiento
humano no son verdaderamente de intervalos (por ejemplo, escalas de actitudes,
pruebas de inteligencias y de otros tipos); pero se acercan a este nivel de
medición y se suele tratarlas como si fueran mediciones de intervalo. Esto se
hace porque este nivel de medición permite utilizar operaciones aritméticas
básicas y algunas estadísticas modernas, que de otro modo no se utilizarían.
Aunque algunos investigadores no están de acuerdo con suponer tales
mediciones como si fueran de intervalos. El producto interno bruto o producto
nacional bruto estaría en este estadio.
4) Escala o nivel de medición de razón: En este nivel, además de tenerse todas las
características del nivel de intervalos (períodos iguales entre categorías, y
aplicación de operaciones aritméticas básicas y sus derivaciones), el cero es
real y absoluto (no es arbitrario). Cero absolutos implican que hay un punto en la
escala donde está ausente o no existe la propiedad medida.

Las características se ordenan y la variación entre ellas puede ser


comparada si existe un cero natural para la escala de medición. Ejemplos de
estas mediciones serían la exposición a la televisión (en minutos), el número de
hijos, las ventas de un producto, los metros cuadrados de construcción, ingresos
(monedas), presión arterial, etc. Si se considera una situación en la cual se
obtuvieron los siguientes pesos, en kilogramos: 5,0; 5,1; 5,3 y 5,4. La variación
de 5 kilogramos es de 0,1 kilogramos, que es la misma variación que hay entre
5,3 kilogramos y 5,4 kilogramos y existe un cero natural para la escala, es decir
0 kilogramos.

El hecho de que una variable sea expresada numéricamente no significa que ésta
sea necesariamente cuantitativa, pues la clasificación de la variable depende de cómo
fue medida y no del modo en el cual se manifiesta. Por ejemplo, para la variable peso de
un boxeador, si este fuera registrado por el peso encontrado en la balanza, la variable
sería cuantitativa continúa; por otro lado, si el peso fuera clasificado según las
categorías del boxeo, la variable sería cualitativa ordinal.

LO QUE DEBE HACERSE CON LOS VALORES DE LAS


CARACTERÍSTICAS DE LAS UNIDADES DE LA MUESTRA:

UNA VISIÓN SISTÉMICA DE LA ESTADÍSTICA

A partir de los valores obtenidos en la muestra, comienza a describirse para así


poder pensar en la población como un todo, generalizando para ella el conjunto de datos

16
proveniente de la muestra. Las actividades exploratorias de las informaciones obtenidas
identifican a la llamada estadística descriptiva (parte de la Estadística que describe los
aspectos importantes de un conjunto de características observadas), la cual se ocupa de
la descripción, organización y resumen de las observaciones obtenidas, para discernir
sobre el comportamiento de una población con base en el comportamiento de la
muestra.

Generalizar para la población lo que se observó en la muestra caracteriza a la


inferencia estadística (parte de la Estadística que emplea una muestra para sacar
conclusiones generales con respecto a las características de una población).

Un ejemplo son las encuestas preelectorales que se hacen en nuestro país, en las
que no se le pregunta la intención de voto a todos los habitantes, sino a una parte
(muestra) correctamente elegida y que represente a toda la población.

La palabra inferencia tiene en Estadística dos significados:

 Conclusiones extraídas a partir de valores o evidencias;


 Procesos para llegar a esas conclusiones.

Como las informaciones provienen de un conjunto menor que la población, se


cometen errores al hacer una inferencia. Estos errores pueden ser cuantificados, así
como la probabilidad (número que mide la incertidumbre acerca de la ocurrencia de
determinada situación. Vulgarmente, se le conoce como “chance”) de cometerlos, la
cual, además de tratar con situaciones influenciadas por factores no controlados por el
analista, proporciona un modelo racional para tratar con la variabilidad inherente a la
naturaleza y también con las situaciones relacionadas con el azar. El conocimiento de
las probabilidades relacionadas con una situación, suministra la base para el desarrollo
de las técnicas de la toma de decisiones, explica el funcionamiento de esas técnicas, e
indica la manera en que las conclusiones pueden ser presentadas e interpretadas
correctamente.

“La probabilidad que un alumno viva a 20 cuadras a la redonda del Instituto es del
85%.”

Es importante enfatizar que la estadística descriptiva y las probabilidades son


herramientas para la inferencia estadística, la cual interpreta de dos maneras los
resultados obtenidos a partir de la muestra tomada de una población: o haciendo una
estimación con respecto al valor desconocido de una característica de la población, o
realizando una verificación de esa característica sobre la cual se afirma tener un
determinado valor.

Así, el nombre Estadística tiene varios significados, por ejemplo, Estadísticas


puede considerarse como constituida por tres áreas siguientes: la estadística descriptiva,
el cálculo de las probabilidades y la inferencia estadística.

17
Como su nombre lo indica, la Estadística descriptiva tiene como finalidad
describir las unidades de observación recolectadas en la muestra. Ésta permite hacer
comentarios sencillos, de la manera más informativa posible, empleando métodos
numéricos y gráficos. La interpretación de los resultados no está incluida en el ámbito
de la estadística descriptiva, eso es función de la Inferencia Estadística.

ANÁLISIS EXPLORATORIO DE LOS DATOS

El análisis exploratorio de los datos es la fase inicial del proceso de estudio de


los elementos recolectados en las muestras. En esta etapa de la evaluación, se emplean
técnica que resumen y clasifican al conjunto de datos recogidos para obtener las
informaciones pertinentes que serán en la fase final del proceso, la llamada inferencia
estadística, también conocida como análisis confirmatorio de los datos.

La exploración o evaluación analítica de los datos de la muestra es un enfoque


para el análisis de los mismos, utilizando una variedad de técnicas gráficas, con los
siguientes objetivos:

 tener el mejor conocimiento posible sobre un conjunto de datos de una muestra;


descubrir las estructuras básicas de la organización de la población;
 identificar anomalías y datos dispersos;

18
 desarrollar modelos matemáticos adecuados para el cálculo de probabilidades y
 la inferencia estadística.

Una vez recolectados los datos de todas las variables contenidas en determinado
estudio, el paso siguiente consiste en descubrir lo que esos datos tienen que decir con
respecto a lo que se está investigando. Hojear una larga lista de datos no permite extraer
ninguna conclusión, es preciso usar mediciones, tablas o gráficos que resuman y
muestren el comportamiento de las variables, permitiendo interpretaciones prácticas. En
otras palabras, deben emplearse técnicas que muestren las informaciones (son datos que
pasaron por algún tipo de análisis, de tal manera que se vuelven útiles) contenidas en las
variables.

En la vida diaria, vemos que los periódicos, las revistas y los artículos técnicos
publican, frecuentemente, noticias relacionadas con porcentajes, medias aritméticas,
tablas y gráficos, que son recursos destinados a complementar la presentación de un
hecho o justificar un argumento.

Investiga en diarios,
revistas o artículos
científicos que contengan
información estadística.

DESCRIPCIÓN DE LA MUESTRA: ESTADÍSTICA DESCRIPTIVA

Como su nombre lo indica, La Estadística Descriptiva tiene como finalidad


describir las unidades de observación recolectadas en la muestra. Ésta permite hacer
comentarios sencillos, de la manera más informativa posible, empleando métodos
numéricos y gráficos. La interpretación de los resultados no está incluida en el ámbito
de la estadística descriptiva; ella es función de la inferencia estadística.

Una vez que hemos observado y recogido los datos, bien a través de encuestas,
bien con bases de datos ya almacenados, debemos resumir la información de forma
adecuada y útil para su posterior estudio.

COMENZANDO A ORGANIZAR LOS VALORES DE LAS UNIDADES


MUESTRALES

Necesidad de organizar los datos e interpretarlos

19
Cuando se colocan en forma de lista o tabular, los valores de la muestra son
llamados los datos brutos de la muestra. Pero aún si estuvieran agrupados de la manera
en la que fueron recolectados, sería difícil, por ejemplo, localizar los valores menores y
mayores, o decidir si los valores están concentrados o dispersos. Basta, por ejemplo
colocarlos en orden creciente (o decreciente) para tener una primera idea de la posición
relativa de esos valores. Esa lista ordenada se llama la lista de la muestra.

Las tablas resumen informaciones de las muestras y son presentadas en un


formato que permite sacar conclusiones más fácilmente, aunque de manera limitada,
con respecto al conjunto total de categorías o valores. Las tablas pueden formarse sin
pérdida o con pérdida de la información.

Tabla de frecuencias sin pérdida de la información

Para que no se pierda la información, se hace un listado de todos los valores o


categorías de la muestra o de la población, una en cada línea, enumerándose las veces
que aparecen, incluyendo las repeticiones, y se cuenta la cantidad de veces que aparece
cada valor; esta cantidad recibe el nombre de frecuencia absoluta. Por esta razón, las
tablas presentan valores o categorías y sus frecuencias y se las llama tablas de
frecuencias (reorganización de los valores en orden creciente o decreciente de magnitud,
en tal forma que una característica de la población es subdividida en clases o categorías,
indicándose la cantidad de veces en las que se presenta cada clase y relacionando el
valor o clase de valor con la frecuencia de su aparición).

Al realizar el recuento y la organización de los datos obtenidos aparecen los


conceptos que se mencionan a continuación:

Frecuencia absoluta ( fai ): es el número de individuos que presentan una modalidad o


valor. Indica el número de veces que aparece cada valor de la variable.

Propiedades de fai

1. La frecuencia absoluta es un número entero mayor o igual a cero fai ≥ 0


2. La suma de las frecuencias absolutas es igual al número de observaciones
∑ fai=n

Frecuencia absoluta acumulada por izquierda ( Fai ¿ : es la suma de las frecuencias


absolutas, una vez ordenados los valores, hasta la que ocupa el lugar k
k
Fai=∑ fai
i=1

Propiedades de Fai

20
1. La frecuencia absoluta acumulada por izquierda es un número entero mayor o
igual a cero Fai ≥ 0
2. Las frecuencias absolutas acumuladas por izquierda forman una sucesión finita
no decreciente comprendida entre 0 y n
0 ≤ Fa1 ≤ Fa2 ≤ Fa3 ≤ …≤ Fas=n

Frecuencia relativa ( fri): es el cociente entre los individuos que presentan una
modalidad o valor y el número total de individuos de la población o muestra sobre la
que se está realizando el estudio.

Xi
fri= donde: X i es el valor o modalidad de la variable
n

n es el número de individuos

Propiedades de fr i

1. La frecuencia relativa es un número comprendido entre 0 y 1 0 ≤ fr i ≤ 1


2. La suma de las frecuencias relativas es igual a 1 ∑ fr i=1

Frecuencia relativa acumulada por izquierda ( Fr i ¿ : es la suma de las frecuencias


relativas, una vez ordenados los valores, hasta la que ocupa el lugar k.
k
Fr i=∑ fri
i=1

Propiedades de Fr i

1. La frecuencia relativa acumulada por izquierda es un número comprendido entre


0 y 1 0 ≤ Fr i ≤1
2. Las frecuencias relativas acumuladas por izquierda forman una sucesión finita
no decreciente comprendida entre 0 y 1
0 ≤ Fr 1 ≤ Fr 2 ≤ Fr 3 ≤ … ≤ Fr s=1

Frecuencia relativa porcentual ( fri %): es la frecuencia relativa multiplicada por 100.
Representa el tanto por ciento de individuos que presentan dicha modalidad o valor.

fri %=100 · fri

Teniendo en cuenta las características de las variables que estamos estudiando,


realizamos el agrupamiento de datos de una u otra forma:

21
 Si el carácter es cualitativo, observamos y contamos el número de
individuos de la población que presentan cada una de las distintas
modalidades del carácter.
 Si el carácter es cuantitativo, ya sea discreto o continuo y según el
número de valores distintos que presenta la variable en estudio:
o Observamos y contamos el número de individuos de la población que
presentan cada uno de los distintos valores del carácter o variable.
o Observamos y contamos el número de individuos de la población que
presentan distintos valores de la variable pertenecientes a cada uno de
los intervalos de clase en los que agrupamos los valores de la variable
(cada valor sólo puede pertenecer a una clase)

Tabla de frecuencias con pérdida de información

Cuando hay una gran cantidad de categorías o valores individuales con gran
amplitud total, la tabla sin pérdida de información puede ser muy grande, siendo
entonces necesario un resumen de los datos, para los cuales el intervalo de los posibles
valores está dividido en subintervalos, conocidos como clases, con un límite inferior y
uno superior (llamados límite inferior de clase y límite superior de clase), lo que dará
como resultado una pérdida de información, pues los valores originales ya no aparecen
individualmente. Para cada clase, la cantidad de datos en ésta es anotada, es la llamada
frecuencia absoluta de la clase. Un requisito esencial para una tabla de frecuencias es
que las clases sean mutuamente excluyentes y exhaustivas. Es decir, cada valor en el
conjunto de datos debe pertenecer a una y solamente a una de las clases. Una
característica deseable, pero no esencial, es que las clases tengan la misma amplitud de
clase, es decir, que todos los intervalos de clase tengan igual amplitud o extensión.

Los intervalos de clase, exceptuando quizá los de los extremos, deber ser de la
misma amplitud. En todo caso, el número de intervalos depende del número de datos y
de la diferencia entre el valor mayor y el valor menor, que más adelante llamaremos
recorrido o rango. También viene determinado por la precisión buscada. En caso de no
ser los intervalos de la misma amplitud, la información estadística puede quedar
distorsionada.

En los casos en que la variable sea agrupada, en la primera columna aparecen los
distintos intervalos, llamados intervalos de clase. En la tabla se define una nueva
columna, en la que aparece la marca de clase que es el punto medio del intervalo.

Intervalos Marca de fai Fai fri fri % Fr i


clase

22
Totales

Series Cronológicas: Son tablas estadísticas que recogen observaciones de un mismo


carácter a lo largo de un período de tiempo, que se suele dar en años o incluso en meses.
Son muy utilizadas en Geografía y Economía.

PRESENTACIÓN VISUAL AL PÚBLICO DE LA MUESTRA O LA


POBLACIÓN: CONSTRUCCIÓN DE GRÁFICOS

Los gráficos facilitan la visualización de los valores y son ampliamente


utilizados en la representación de los datos estadísticos. Cuando se elabora cualquier
clase de gráfico se pierde información, pues no existen más las observaciones
originales. Sin embargo, frecuentemente esa pérdida de información es pequeña
comparada con la concisión y la facilidad de interpretación. De todos modos, cuando se
saquen conclusiones sobre una población a partir de los gráficos, hay que tener en
cuenta un redoblado cuidado.

La representación gráfica de una serie de datos permite, al mismo tiempo, una


visión general y alguna caracterización particular de la población por medio de una
correspondencia entre categorías o valores y una determinada figura geométrica, de tal
manera que cada valor o categoría está representado(a) proporcionalmente.

Se debe resaltar que es conveniente, por motivos estéticos, considerar, en la


elaboración de los gráficos, los siguientes aspectos:

 el gráfico, en conjunto, debe encuadrarse en un rectángulo de dimensiones que


lo hagan agradable a la vista;
 las figuras no deben ser ni muy grandes ni muy angostas, obedeciendo al gusto
estético;
 finalmente, el gráfico, por su objetivo de simplificar, debe contener solamente
algunas divisiones de la escala vertical; las líneas horizontales deben ser pocas,
de tal manera que lo hagan agradable para la lectura e interpretación.

Los elementos complementarios de un gráfico son:

 título general que indique la situación estudiada, la época y el sitio;


 las escalas y las respectivas unidades de medida;
 la indicación de las convenciones adoptadas (generalmente cuando representan
el resultado de las observaciones de una misma situación en dos o más regiones
o en fechas diferentes);
 la fuente de información de donde se extrajeron los valores.

23
La estética y la corrección científica deben contribuir para escoger las escalas, de
tal manera que la apariencia del gráfico sea adecuada para sacar conclusiones con
respecto a la situación en que esté siendo analizada.

Generalmente los gráficos deben ser presentados con la escala de ordenadas (eje
vertical) partiendo de cero, con el fin de que las comparaciones visuales entre las
sucesivas marcaciones en el eje vertical puedan ser hechas correctamente. Sin embargo,
la escala puede comenzarse con cualquier otro valor cuando se desee, pero si de
comparar los datos se trata, hay que resaltar las variaciones existentes entre éstos.

Existe una gran variedad de formas de presentación de los valores numéricos,


todos destinados a llamar la atención sobre ellos. Los gráficos más usados comúnmente
serán detallados a continuación.

DESCRIPCIÓN DE LOS DATOS CUALITATIVOS

Para estas clases de datos, los gráficos más utilizados son los de barras, o de
columnas y los de sectores.

Nota: Las imágenes que ilustran cada tipo de gráfico, fueron extraídas de
los Trabajos Prácticos realizados por alumnos de la cursada anterior.

Gráfico de barras

Un gráfico de barras ilustra comparaciones entre categorías; estas son


organizadas verticalmente, pues los valores de disponen horizontalmente para destacar
la comparación de los valores y dar menos énfasis al tiempo

En este gráfico, es indiferente el orden de presentación de los rectángulos, por


tratarse de una serie ordenada, según una característica cualitativa: en estos casos, no
hay, en general, un orden único, técnica y lógicamente admisible, pudiendo existir
diversos órdenes, correspondientes a diferentes criterios.

Una variante de esta clase de gráfico es el de barras yuxtapuestas, que representa


la relación entre los valores o categorías individuales y el total.

24
Gráfico de columnas

Un gráfico de columnas muestra las alteraciones que sufren los datos en un


intervalo de tiempo o ilustra comparaciones entre categorías, las cuales son
organizadas de manera horizontal; los valores figuran en la escala vertical para destacar
la variación a lo largo del tiempo.

En el gráfico de columnas, también es indiferente el orden de presentación de los


rectángulos por tratarse de una serie ordenada según una característica cualitativa.

En estos casos, no hay, en general, un orden, técnica y lógicamente admisible,


pudiendo presentarse ordenaciones diferentes, correspondientes a criterios diferentes.

Una variante de esta clase de gráficos es el de las columnas yuxtapuestas, el cual


representa la relación que hay entre los valores o categorías individuales y el total.

25
Gráfico de sectores

Impropiamente llamado pizza o torta. Cada categoría corresponderá a una


división o a un sector de un círculo; de allí proviene el nombre de gráfico por sectores,
generalmente utilizado cuando se intenta comparar el total de cada categoría con el
conjunto total. Cuando el objetivo de la representación fuere el análisis de la
participación de cada categoría en relación con el total, la representación por sectores es
la adecuada porque permite establecer la comparación entre los valores (sectores) y el
total.

Son gráficos en los que a cada valor o modalidad se le asigna un sector circular
de área proporcional a la frecuencia que representan. Se utilizan si el carácter es
cualitativo o cuantitativo discreto sin agrupar.

26
DESCRIPCIÓN DE LOS DATOS CUANTITATIVOS

Los gráficos más utilizados son el gráfico de puntos y el histograma.

Gráfico de puntos

El gráfico de puntos es el adecuado para ilustrar el comportamiento de los


valores individuales en relación con el conjunto de esos valores. Se traza una línea
horizontal con una escala para la variable cuantitativa, pues el valor numérico de cada
medida del conjunto de datos está representado sobre la escala horizontal por un punto;
cuando los valores se repiten, los puntos son colocados uno encima del otro, formando
una pila en aquella localización particular, en la cual se hace una lista de los valores de
la variable que interesa.

Histogramas

El histograma es el adecuado para ilustrar el comportamiento de los valores


agrupados en clases, siendo, sencillamente, un gráfico de columnas compuesto por
varios rectángulos adyacentes, que representan a la tabla de frecuencias con pérdida de
información de un conjunto de valores. En la escala horizontal se marcan los intervalos
de clase, y cada intervalo es la base de cada rectángulo; en la escala vertical se marcan
las alturas de los rectángulos, las cuales son las respectivas frecuencias de las clases.

Si utilizamos las frecuencias acumuladas el gráfico se realiza de forma análoga,


salvo que la proporcionalidad es entre las frecuencias acumuladas y las alturas de los
rectángulos, ya sean los intervalos de la misma amplitud o no.

27
Polígonos de Frecuencias

Son gráficos lineales que se utilizan en el caso de una variable cuantitativa. Para
realizar estos polígonos unimos los puntos medios de las bases superiores del diagrama
de barras o columnas y del histograma según sea la variable agrupada o no agrupada.

Polígono de Frecuencias Acumuladas

En el caso de representar las frecuencias acumuladas se unen los puntos medios


de las bases superiores del diagrama de barras, si la variable es no agrupada, y los
vértices superiores derechos de los rectángulos si se trata de una variable agrupada.

28
Cada vez que veas este icono debes ir a la carpeta de herramientas, para trabajar con la
computadora y ayudarte con la bibliografía indicada

Con el Excel confeccionar una


hoja de cálculo, para las tablas de
Carpeta de frecuencias y realizar los gráficos
Herramientas con los datos recogidos de la
encuesta

Bibliografía Consultada

o Paulo Afonso Lopes : Probabilidad & Estadística. Prentice Hall.


o Loreanao Abellanas Rapún: Matemática 1. Editorial Mc Graw Hill.
o M. José Asencio Rubio y otros: Estadística. Editorial Mc Graw Hill.
o Lic. Fernando P Blanco y Lic. Lidia B Lojo: Módulos teóricos y
prácticos de Enseñanza de la Estadística Descriptiva. Cátedra de la
Licenciatura en la Enseñanza de la Matemática (CAECE).
o Walpole – Meyers – Meyers –Ye: Probabilidad y Estadística Editorial
Pearson Prentice Hall.
o Wackerley – Mendenhall – Scheaffer Estadística Matemática con
aplicaciones Editorial. Cengage Learning
o Roberto Hernández Sampieri- Carlos Fernández Collado y Pilar Baptista
Lucio. Metodología de la Investigación (Quinta edición) Editorial: Mc
Grawn Hill

29

También podría gustarte