Mathematics">
Nothing Special   »   [go: up one dir, main page]

Tarea1 Grupo3

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 13

Estadística descriptiva (para agrarias) (300043)

Fase 2- Identificación de variables estadísticas

Natalia Mejia Aviles (1007558601)

Elizabeth Nieto López (1080650317)

Grupo: 3

Claudia Parra Cortes (Tutor)

Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente ECAPMA

Tecnólogo en Saneamiento Ambiental

Universidad Nacional Abierta y a Distancia UNAD


Fase 2- Identificación de variables estadísticas

1. Explicar en sus propias palabras:


a. Qué es una variable cuantitativa continua.
Una variable cuantitativa continúa, es aquella en la que se pueden asumir números
incontables de valores; es decir, valores indeterminados entre los valores consecutivos de la
variable; sirven para medir la información requerida que en dado caso suelen ser números
enteros, es decir números decimales.

b. Qué es una variable cuantitativa discreta.


Una variable cuantitativa discreta, es aquella en donde no existen valores intermedios entre
dos valores consecutivos de una variable; es decir, que no acepta cualquier valor,
simplemente acepta aquellos que pertenecen al conjunto de esta misma o aquella que puede
tomar únicamente un número de valores finito.

c. Qué es una variable cualitativa nominal.


Una variable cualitativa nominal, es aquella que asume los valores que se representan en
categorías sin importar el orden estas mismas; se expresan cualidades o condiciones que
pueden ser nominales u ordinales.

d. Qué es una variable cualitativa ordinal.


Una variable cualitativa ordinal, es aquella en la que se pueden tomar distintos valores
ordenados en donde se sigue una escala establecida; es decir, que los datos tienen un orden.

e. Cuál es la diferencia entre media poblacional y media muestral.


La diferencia es en que en la media poblacional es el valor esperado de la población; es
decir, una medida de tendencia central para una distribución de probabilidad de una
variable que se caracteriza por ser aleatoria y la media muestral, es un estadístico que se
calcula a partir de un conjunto de valores de una variable aleatoria.

f. Qué es la varianza de una población. ¿Cómo se obtiene?


La varianza de una población, es una medida que se utiliza para representar la variabilidad
de un conjunto de datos con respecto a la medida aritmética de este mismo; esta se calcula
y se obtiene a partir de la suma de los residuos elevados al cuadrado y divididos entre el
total de las observaciones.

g. Qué es desviación estándar. ¿Cómo se obtiene?


La desviación estándar, es aquella que mide la dispersión de una distribución de datos; es
una medida que se utiliza para cuantificar la variación o la dispersión de un conjunto de
datos numéricos que se obtiene a partir de una fórmula de desviación estándar, en la cual se
representa la suma de las diferencias al cuadrado entre cada observación, la medida y el
número total de observaciones, en donde se resta la medida de los valores de cada
observación individual para calcular las diferencias.

h. Qué es la Regla de Sturges ¿para qué sirve?


La regla sturges, es aquella que se utiliza como un criterio cuando se quiere realizar un
histograma de frecuencias y se calcula el número de intervalos necesarios para representar
fielmente los datos.

i. Qué es frecuencia absoluta.


La frecuencia absoluta es el número de veces que se repite dicho evento durante un
experimento o una muestra estadística; es decir, un determinado valor en un estudio
estadístico.

j. Qué es frecuencia relativa.


La frecuencia relativa, es cuando se calcula el cociente de la frecuencia absoluta de algún
valor de la población, entre el total de valores que componen a esta misma.

k. Qué es frecuencia relativa acumulada.


La frecuencia relativa acumulada, es el cociente entre la frecuencia absoluta acumulada de
un determinado valor y el número total de datos, es decir el total de la muestra.

l. ¿Cuál es la diferencia entre una tabla de frecuencias absolutas de una variable


continua y de una discreta?
En la tabla de frecuencia de variable continua, se presenta el punto de mayor importancia a
la determinación de un número de intervalos o clases que la conformen; en el caso de
variables discretas, es una tabla de distribución de frecuencias que siguen los alineamientos
establecidos para una variable continua, en donde no existen intervalos ni marcas de clase
lo cual ayuda a la simplificación y la construcción de la tabla.

m. Qué es un Boxplot o diagrama de cajas. ¿Para qué sirve?


El diagrama de cajas, es aquel que permite visualizar y comparar la distribución de
tendencia central de aquellos valores numéricos mediante cuartiles; es un método que
representa gráficas de una serie de datos numéricos a través de sus cuartiles; a simple vista
la mediana y los cuartiles de los datos, además de que se pueden representar valores
atípicos en ellos.

n. ¿En qué tipo de variables se usa el histograma?


En histograma se aplica y se usa en las variables continuas, ya que en esa se observan
aquellas variables que se pueden tomar como un valor real entre dos valores fijos que
determinan su rango.
o. ¿En qué tipo de variables se usa el gráfico de barras?
Los gráficos de barras se utilizan en las variables cualitativas o discretas, ya que es una
representación gráfica de un eje cartesiano de aquellas frecuencias dadas.

p. Rellene el siguiente cuadro con 10 ejemplos cada una, de variables continuas,


discretas y cualitativas:

VARIABLE CUANTITATIVA CUANTITATIVA CUALITATIVA


CONTINUA DISCRETA O CATEGÓRICA
1. Número de páginas Número de hijos de Características de
de un libro una familia una persona u
objeto
2. Ancho de una pelota Cantidad o números Color de ojos
de dedos de la mano
3. Peso de una persona Número de personas Color de pelo
que van a un paseo
4. Estatura de una Número de sillas en Genero
persona una fiesta
5. Distancia que viaja un Número de personas Estado civil
avión que visitan un lugar
6. Tiempo que esperas Número o cantidad Color favorito
en una fila de animales que hay
en una granja
7. La distancia que Número de libros en Marca de un
recorre un objeto un estante producto
8. Velocidad de una Número de puertas Tipo de sangre de
moto que hay en una casa una persona
9. El tiempo que Cantidad de Profesionales de la
demora en llegar un semáforos que hay salud
domicilio en una ciudad
10. La cantidad de azúcar Edad en años Sexo de una persona
que consumen las
personas al día
Punto 2

a. Media muestral.
b. Varianza.
c. Desviación estándar.
d. Rango de datos.
e. Rango intercuartílico.
f. Realice un cuadro donde presente la tabla de frecuencias absolutas,
frecuencias relativas, frecuencias absolutas acumuladas y frecuencias
relativas acumuladas.
g. Diagrama de cajas (Boxplot).
h. Histograma de la frecuencia relativa.

Datos
55.7 43 73.8 61.4 54.9
62.6 50.5 52.9 64.9 27.5
58.7 76.8 55.1 53.3 42.8
51.3 49.3 58.4 57.2 65
67.8 60.7 23.6 57.1 59.4
57.2 57.4 69.4 78 60.8
40.3 34.4 61.5 72.1 50
58.1 60.6 53.7 44.8 74.8
47.7 52.7 49.1 67.9 37.4
68.8 51.6 58.8 37.9 64.5

Parámetros
No datos 50
Valor máximo 78
Valor mínimo 23.6
Rango 54.4
Intervalos 6.657570114 7
Amplitud 8.171149393 8
Intervalo
s
N L. L. M. de Frec Frec. Frec. Frec. Frec.
O. inferior superio la . Abs. Relativa Relat. Porcent.
r clase Abs Acum Acum Acum
1 23.6 31.6 27.6 2 2 0.04 0.04
2 31.6 39.6 35.6 3 5 0.06 0.1
3 39.6 47.6 43.6 4 9 0.08 0.18
4 47.6 55.6 51.6 13 22 0.26 0.44
5 55.6 63.6 59.6 16 39 0.32 0.76
6 63.6 71.6 67.6 7 45 0.14 0.9
7 71.6 79.6 75.6 5 50 0.1 1
0

Frecuencia
relativa
1 0
2 0.04
3 0.06
4 0.08
5 0.26
6 0.32
7 0.14
8 0.1
9 0
0.35

0.3

0.25

0.2

0.15

0.1

0.05

0
1 2 3 4 5 6 7 8 9

Valores

PUNTO 3

Para resolver este ejercicio, primero debemos organizar los datos en orden
ascendente:
1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5,
5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8

a) Media muestral: Para calcular la media muestral, sumamos todos los valores y
luego dividimos entre la cantidad de elementos:
Media muestral = (1 + 1 + 1 + ... + 8) / 50 = 197 / 50 ≈ 3.94

b) Mediana: La mediana es el valor que se encuentra en el centro de los datos


ordenados. En este caso, como tenemos 50 elementos, la mediana será el promedio de
los valores centrales:
Mediana = (4 + 4) / 2 = 4

c) Moda: La moda es el valor que aparece con mayor frecuencia en los datos:
Moda = 4

d) Varianza: Para calcular la varianza, necesitamos restar la media a cada valor,


elevar al cuadrado el resultado, sumar todos los cuadrados y luego dividir entre la
cantidad de elementos:
Varianza = [(1 - 3.94)² + (1 - 3.94)² + (1 - 3.94)² + ... + (8 - 3.94)²] / 50 ≈ 5.12

e) Desviación estándar: La desviación estándar es la raíz cuadrada de la varianza:


Desviación estándar = √(5.12) ≈ 2.26

f) Rango intercuartílico: El rango intercuartílico se calcula restando el tercer cuartil


(Q3) al primer cuartil (Q1). Para encontrar estos valores, primero necesitamos
determinar los límites de los cuartiles:
Q1 = (n + 1) / 4 = (50 + 1) / 4 = 12.75 Q3 = 3 * (n + 1) / 4 = 3 * (50 + 1) / 4 = 38.25

Luego, encontramos los valores correspondientes a los límites de los cuartiles:


Q1 = El valor que ocupa la posición 12.75 en los datos ordenados ≈ 2.25 Q3 = El valor que
ocupa la posición 38.25 en los datos ordenados ≈ 6.75

Finalmente, calculamos el rango intercuartílico:


Rango intercuartílico = Q3 - Q1 = 6.75 - 2.25 = 4.5

G) Tabla de frecuencias:

Valor Frecuencia Frecuencia Frecuencia Frecuencia


absoluta relativa absoluta relativa
acumulada acumulada
1 8 0.16 8 0.16
2 7 0.14 15 0.30
3 5 0.10 20 0.40
4 14 0.28 34 0.68
5 8 0.16 42 0.84
6 11 0.22 53 1.06
7 4 0.08 57 1.14
8 2 0.04 59 1.18
i) Gráfico de frecuencia relativa:

0.35

0.3

0.25

0.2

0.15

0.1

0.05

0
1 2 3

Valores

En el gráfico de frecuencia relativa, en el eje vertical se representa la frecuencia relativa y


en el eje horizontal se muestra cada valor. Cada "X" representa la frecuencia relativa para
cada valor correspondiente.

PUNTO 4
a) Tabla de frecuencias de la variable cualitativa nominal:

Cultivo Frecuencia Frecuencia Frecuencia Frecuencia


absoluta relativa absoluta relativa
acumulada acumulada
Papa 17 0.34 17 0.34
Maíz 6 0.12 23 0.46
Trigo 9 0.18 32 0.64
Arveja 5 0.10 37 0.74
Otro 8 0.16 45 0.90
Ninguno 5 0.10 50 1.00
b) Gráfico de frecuencia relativa de la variable cualitativa nominal:
0.45

0.4

0.35

0.3

0.25

0.2

0.15

0.1

0.05

0
Papa Maiz Trigo Arveja Otro Ninguno

Cultivo

En el gráfico de frecuencia relativa, en el eje vertical se representa la frecuencia


relativa y en el eje horizontal se muestra cada categoría de cultivo. Cada "X"
representa la frecuencia relativa para cada categoría correspondiente.
PUNTO 5

a) Tabla de frecuencias de la variable cualitativa ordinal:

Nivel de Frecuencia Frecuencia Frecuencia Frecuencia


estudios absoluta relativa absoluta relativa
acumulada acumulada
Primaria 22 0.44 22 0.44
Secundaria 18 0.36 40 0.80
Profesional 7 0.14 47 0.94
técnico
Profesional 4 0.08 51 1.00
universitario

b) Gráfico de frecuencia relativa de la variable cualitativa ordinal:

Nivel de estudio
0.6

0.5

0.4

0.3

0.2

0.1

0
Primaria Secundaria Profesional Tecnico Profesional universitario

Nivel de estudio

En el gráfico de frecuencia relativa, en el eje vertical se representa la frecuencia


relativa y en el eje horizontal se muestra cada categoría de nivel de estudios. Cada
"X" representa la frecuencia relativa para cada categoría correspondiente.
Conclusiones
En la presente actividad, se desarrollaron actividades que ayudaron a diferenciar
entre variables de tipo cuantitativo discreto, cuantitativo continuo y cualitativas para
su correcto procesamiento estadístico; esto para calcular las principales medidas de
tendencia central y de dispersión para realizar tablas de frecuencia y se
desarrollaron sus respectivos puntos para representar y explicar de manera clara
cada uno de lo anterior.
Referencias bibliográficas

Balzarini Mónica, Di Rienzo Julio, Tablada Margot, Gonzalez Laura, Bruno


Cecilia, Córdoba Mariano, Walter Robledo y Casanoves Fernando.
2015. Estadística y biometría: ilustraciones del uso de InfoStat en problemas de
agronomía. Tablas y gráficos de frecuencias: pag. 11-20. Medidas de tendencia
central y dispersión: pag. 30-42.
https://www.researchgate.net/publication/293811237_Estadistica_y_biometria_ilust
raciones_del_uso_de_InfoStat_en_problemas_de_agronomia

Cáceres, L. (2020). OVI Medidas de resumen. Biblioteca virtual


UNAD. https://repository.unad.edu.co/handle/10596/33960

García, P. A. (2014). La interpretación de los datos: Una introducción a la


estadística aplicada. Biblioteca virtual UNAD. Medidas de posición y dispersión y
su procesamiento en R: pág. 9-17. https://elibro-
net.bibliotecavirtual.unad.edu.co/es/ereader/unad/48802

Matus, R., Hernández, M., García, E. Franco, M. (2010). Estadística. Instituto


Politécnico Nacional. Biblioteca virtual UNAD. Pág. 1-15. https://elibro-
net.bibliotecavirtual.unad.edu.co/es/ereader/unad/76119

Mendoza, H., Bautista, G. R. (2002). Probabilidad y Estadística. Universidad


Nacional de Colombia, sede
Bogotá. http://red.unal.edu.co/cursos/ciencias/2001065/html/un1/cont_102_02.html

Ova Unidad 1- Tipos de variable estadísticas


https://campus121.unad.edu.co/ecapma44/mod/hvp/view.php?id=1468

Romero, E. (2016). Estadística para todos: análisis de datos: estadística


descriptiva, teoría de la probabilidad e inferencia. Difusora Larousse - Ediciones
Pirámide. Biblioteca virtual UNAD. Medidas de posición: pág. 41-55. Medidas de
dispersión: pág. 57-69. https://elibro-
net.bibliotecavirtual.unad.edu.co/es/ereader/unad/49136

También podría gustarte