Nothing Special   »   [go: up one dir, main page]

Mest1 U1 A1 Rooh PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 25

Página 1 de 25

Carrera:
LICENCIATURA EN MATEMÁTICAS
Materia:
Estadística I.
U1-A1:

Media, moda y mediana.


Grupo:
MT-MEST1-2001-B2-001
Alumno:
Rolando Ortiz Herbas
Matrícula:
ES18210414044

Maestro:
Claudio Ramón Rodríguez Mondragón.
Página 2 de 25

1.- Investiga: (realiza una descripción de media cuartilla de cada inciso)


a) Estadística.

“La Estadística es la rama de las Matemática que se encarga del estudio de los
métodos, recolección de información e interpretación de ésta en forma adecuada.
También se encarga del análisis de la información y la toma de decisiones con base
en los resultados de este análisis.” (UNADM, 2020, Pag. 6 )

b) Estadística descriptiva.

“La Estadística descriptiva es aquella rama o área de estudio de la Estadística que


se encarga del conocimiento de los métodos adecuados para la recolección de
datos, de la organización, presentación y descripción de toda la información
numérica y describir las características principales de una población que es objeto
de estudio.

La Estadística descriptica emplea métodos que le permiten resumir los principales


aspectos de los valores de la muestra de la población elegida. Asimismo, se basa en
cálculos numéricos y gráficos para sus fines. Las gráficas de barras, el gráfico
circular, los pictogramas, los histogramas, los diagramas de árbol, entre otros son
valiosas herramientas para presentar los resultados obtenidos.” (UNADM, 2020, Pag.
7)

c) Estadística inferencial.

Por lo general la estadística cumple 2 funciones

• El análisis descriptivo en forma cuantitativa de las características


observadas de un evento que es de interés de estudiarlo.

• La inferencia estadística que principalmente es la generalización a


toda una población, de los estadísticos obtenidos de una muestra. Una
muestra es un sub-conjunto de la población.

d) Probabilidad.

Si 𝜀 es un experimento aleatorio y S un espacio muestral asociado con 𝜀.


Con cada evento A asociamos un número real, designado con 𝑃(𝐴) y llamado
probabilidad de A, el cual satisface las siguientes propiedades:

• 0 ≤ 𝑃(𝐴) ≤ 1
• 𝑃(𝑆) = 1
Página 3 de 25

• Si A y B son eventos que se excluyen mutuamente, 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) +


𝑃(𝐵).
Un ejemplo de probabilidad es el lanzamiento de un dado y podemos definir
un evento 𝜀 que será que un dado sea un numero par después del
lanzamiento, aquí tenemos:

𝐴 = 𝑒𝑙 𝑑𝑎𝑑𝑜 𝑟𝑒𝑠𝑢𝑙𝑡𝑎 𝑝𝑎𝑟 = { 2,4,6}


S = es el espacio muestral es = {1,2,3,4,5,6}
3 1
La probabilidad de A 𝑃(𝐴) = =2
6

e) Combinatoria.

La combinatoria es un área muy amplia de las matemáticas, que incluye


diferentes métodos de conteo como las combinaciones , permutaciones ,
funciones generatrices , permutaciones y transposiciones, clases cíclicas y
otros.
La combinatoria también incluye la teoría de grafos, con conceptos como
caminos hamiltonianos, longitudes de camino, coloreado de grafos. Un área
muy importante que tiene mucha aplicación en la computación son los
arboles y en particular los arboles binarios balanceados.

La optimización mediante uso de los grafos es también un área de la


combinatoria . Algunos de los métodos son el Branch and bound y la
optimización en arborescencia. Temas como camino mínimo y máximo en
grafos, tiene aplicación directa en problemas de transporte y flujo.
(Kaufmann, 1971)

f) Series de tiempo.

También llamadas series temporales y/o también series cronológicas.

Los datos atemporales son los que se obtienen de investigaciones aisladas,


no periódicas es decir que se producen una vez, dos veces o varias, pero no
se vuelven a producir.

Los datos temporales son aquellos que se van registrando a medida que se
va produciendo, en un estricto orden cronológico. En la vida diaria
encontramos muchos eventos de este tipo, por ejemplo: nacimientos, ventas
de una empresa y otros.

“Una serie de tiempo o serie temporal es un conjunto de observaciones que


son de interés de estudio, los cuales se toman en diferentes periodo de
tiempo como ser : diario, semanal, mensual u otro.” (Martínez, 2012)
Página 4 de 25

g) Software Estadístico “R”

El lenguaje estadístico R es de distribución libre, bajo licencia GNU. Se


puede ejecutar en diferentes ambientes como Windows, Mac y Linux.

R fue creado en 1992 en Nueva Zelanda por Ross Ihuka y Robert Gentleman
y la intención era de hacer un lenguaje didáctico de fácil aprendizaje para los
alumno de introducción a la Estadística en la Universidad de Nueva Zelanda.

Decidieron adoptar la sintaxis similar al lenguaje S , pero con una semántica


un poco diferente. A modo de broma inicialmente se le llamo R por las
iniciales de los nombres de los 2 autores , pero con el tiempo se quedo con
ese nombre.

Este lenguaje se usa principalmente para aplicaciones estadísticas y también


para graficar los diferentes resultados obtenidos. (R, 2014)

2.- Investiga:
a) La historia de la Estadística.

Por lo general se piensa que la estadística es algo nuevo porque ahora casi
todo se fundamenta en el manejo de grandes cantidades de información a
estudiar y a procesar para obtener información útil.

Las primeras actividades de la antigüedad eran el conteo o censo de la


población con objeto de cobrar impuestos es así como en China el
emperador Yao (2,239 Antes de la era Común) dispuso la elaboración de un
censo.
También podemos encontrar en el Pentateuco en el Libro de Números donde
se hace un conteo de las personas en edad para alistarse para una batalla.
Es de llamar la atención que no se contaba directamente a las personas, sino
que cada persona aportaba medio Shekel ( moneda vigente en ese tiempo) y
se hacia el conteo de las monedas. (Segal-Compilación, 2014)

b) Culturas de la antigüedad que tengan registros estadísticos de sus


poblaciones.

En la edad media que termina en el año 1453, con la caída de


Constantinopla, se destaco por su actividad mercantil, industrial , artística y
arquitectónica. Y a partir del avance en las matemáticas y la filosofía.
Página 5 de 25

Blas Pascal (1623-1662) , matemático francés, hacia un viaje en compañía


de un jugador profesional conocido como caballero Meré, quien era una
persona apasionada por el juego de cartas y de los dados. Este caballero
pensó que había encontrado una falsedad en los números al analizar el
juego de dados.

c) Menciona a los grandes matemáticos de todos los tiempos que


establecieron a la Estadística como herramienta al servicio del hombre.

Abraham de Moivre(1667-1754) efectuo un vital aporte al observar que


cuando de medía una distancia astronómica, siempre se cometía errores por
exceso y por defecto, por mas perfecto que sea el instrumento de medición.
Al graficar estos errores se distribuían en forma de campana, ideando a partir
de la distribución de los errores la función de probabilidad normal.

Johann Bernoulli (1667-1748) , estudió la distribución binomial y las


frecuencias relativas.

Tomas Bayes(1702-1761) el cual era reverendo, contribuyo con el teorema


de probabilidad condicional.
El Italiano Jooseph Lagrange (1736-1813) unificó en unión con Thoma Bayes
la probabilidad, compilando la primera teoría general de las probabilidades.

Solo por mencionar otros que aportaron a la probabilidad y estadística fueron:


Pierre Simon Laplace, Simeon Denis Poisson . En el siglo XX , el ingles Karl
Pearson, en rusia Andrei Marko y Chevishev.

d) En la actualidad, menciona cinco estudios científicos en los cuales la


estadística es una ciencia fuerte e indispensable.

1) Astronomia, probabilidad de que haya vida en el universo.


2) Medicina, estimación del tiempo que hay que aplicar un tratamiento radio
activo a una persona con cancer.
3) Simulación, generación de variables aleatorias, según una distribución de
probabilidad dada para su estudio en computadora.
4) Teoría de Juegos, determinar criterios para que en un juego de 2 personas
, uno de ellos tenga una probabilidad grande de ganar ( enfoque
empresarial).
5) Administración-Empresarial, determinar criterios de aceptación de un lote
grande de piezas mediante la inspección de una muestra.
Página 6 de 25

e) Investiga 10 procesos científicos modernos, en donde la estadística


estudia estadística descriptiva

1) Análisis de tiempo de duración de una parte de una maquinaria.


2) Análisis de riesgo en los prestamos hipotecarios de un Banco.
3) Análisis del comportamiento de cliente de un Supermercado, que
productos se venden a la vez o están correlacionados.
4) Identificar comportamientos de Clientes de una empresa.
5) Determinar si una medicina cura realmente una enfermedad.
6) Determinar los accidentes de transito en un mes y determinar que meses
son los que tienen mas accidentes de transito.

f) Investiga 10 procesos científicos modernos, en donde la estadística


estudia estadística inferencial.
1) Pruebas de aceptación o rechazo de lotes de materiales.
2) Determinar el tamaño de una muestra para que las inferencias de la
población tengan un error del 5%.
3) Estudios de confiabilidad de componentes, por ejemplo tiempo de
duración.

g) Investiga 10 procesos de la vida del hombre moderno donde se


analizan datos a través de las Series de Tiempo.

1) Tiempo promedio entre un resfrio y otro de las personas.


2) Tiempo que un hombre debe tomar una medicina con objeto de sanar una
enfermedad.
3) Determinar tiempos en los que el sol produce llamaradas gigantes.
4) Estimar el valor de las exportaciones para 2022, estableciendo limites de
confianza del 95%
5) El numero de pasajeros estimado, que viaje por via aérea, para 2022 .

3.- Responde:

¿Cuál es la estadística paramétrica? Menciona 3 ejemplos de métodos


paramétricos.

Estadística paramétrica, es la aplicación de la inferencia estadística , sobre


los fundamentos de las distribuciones conocidas.

Ejemplo de métodos paramétricos:

1) Procesos de nacimiento y muerte.


Página 7 de 25

2) Teoría de colas ( 1 fila y multifila)


3) Errores en mediciones de piezas fabricadas.

¿Cuál es la estadística no paramétrica? Menciona algún método no


paramétrico.
Estadística no paramétrica, es la aplicación de la inferencia estadística ,
sobre los fundamentos de las distribuciones desconocidas.

Método no paramétrico:

Determinar el tiempo en que se debe aplicar un tratamiento de cobalto a un


paciente con cáncer.

¿Comenta el por qué la estadística, depende los estudios de


probabilidad?

La Estadística depende de la probabilidad porque los eventos a estudiar de


deben acomodar a una distribución de probabilidad para su estudio.

¿Por qué la Estadística y la Probabilidad van de la mano?

La estadística estudia eventos que ya hay ocurrido ( a posteriori) y se


acompaña de la probabilidad para estudiar eventos a priori.

La descripción de los eventos de interés de estudio nos permiten obtener


graficas y a partir de estas suponer que distribución de probabilidad de
adapta para su estudio.

4.- Definir:

Inferir:
A partir de datos de una muestra deducir comportamientos de una
población con una probabilidad de error determinada. Lógicamente la
muestra es un subconjunto de la población.

Muestra:
Una muestra es un subconjunto de la población, es un pequeño grupo
seleccionado de la totalidad de elementos. (UNADM, 2020)

Población.
Página 8 de 25

Una población es un conjunto de cosas, objetos, individuos u otros , que


tienen una característica común. La población es el objeto de estudio.

5.- Realiza un cuadro comparativo y/u organizativo de:


Fórmulas de Medidas de Tendencia Central y Medidas de Dispersión, para
población y muestra, y para datos agrupados y no agrupados.

Datos sin Agrupar Datos Agrupados

Media 𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝒏 ∑𝑘𝑖=1 𝑥𝑖 ∗ 𝑓𝑖
̅=
𝒙 𝑥̅ =
𝒏 𝑛

Mediana 1) se ordena los datos de menor a mayor 1) Determinar la Clase donde se busca la Me
2) se determina el numero de datos n , si
es un numero par o impar. 𝑛
𝑘𝑖 =
2
3) Si en Impar se determina la posición de
𝑛
la mediana como: ( − 𝑛𝐹𝑖−1 ) 𝑐𝑖
𝑛 𝑀𝑒 = 𝐿𝑖 + 2
𝑝 =⌊ ⌋+1 𝑓𝑖
2
La mediana es entonces:
𝑴𝒆 = 𝒙𝒑
Si n es par entonces :
𝑛
𝑝=⌊ ⌋
2
𝒙𝒑 + 𝒙𝒑+𝟏
𝑴𝒆 =
𝟐

Moda 1) ordenar el conjunto de datos a estudiar


𝒙𝟏, 𝒙𝟐, … , 𝒙𝒏 𝑓𝑖 − 𝑓𝑖−1
𝑀𝑜 = 𝐿𝑖 + ( ).𝑐
El dato que tenga mas repeticiones es la (𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 ) 𝑖
Moda.

El conjunto de datos puede tener 1 moda o


mas de 1.
Para la población: Para la población:
Varianza ∑(𝑥𝑖 − 𝑥̅ )2 ∑(𝑥𝑖 − 𝑥̅ )2 𝑓𝑖
𝑉(𝑥) = 𝑉(𝑥) = 𝑆 2 =
𝑛 𝑛
𝑛
Covarianza 1
𝐶𝑜𝑣(𝑥, 𝑦) = ∑ 𝑥𝑖 𝑦𝑖 − 𝑥̅ 𝑦̅
𝑛
𝑖=1

Desviación 𝑠 = √𝑉(𝑥) 𝑠 = √𝑉(𝑥)


Estándar

Desviación ∑𝑛𝑖=1|𝑥𝑖 − 𝑥̅ | ∑𝑛𝑖=1|𝑥𝑖 − 𝑥̅ |. 𝑓𝑖


Media 𝐷𝑥̅ = 𝐷𝑥̅ =
𝑛 𝑛
Página 9 de 25

1) datos ordenados de menor a mayor


Cuartil 𝒙𝟏, 𝒙𝟐, … , 𝒙𝒏 Determinar la posición de la clase,
Determinar la posición, 𝒌𝒏
𝒌𝒏 𝑷𝒐𝒔 𝒅𝒆 𝑸𝒌 : , ∀𝒌 = 𝟏, 𝟐, 𝟑
𝑷𝒐𝒔 𝒅𝒆 𝑸𝒌 : , ∀𝒌 = 𝟏, 𝟐, 𝟑 𝟒
𝟒
Si Pos es entero exacto 𝑘𝑛
− 𝐹𝑖−1
Entonces 𝑸𝒌 = 𝒙𝒑𝒐𝒔 . 𝑄𝑘 = 𝐿𝑖 + ( 4 ) 𝑐𝑖
𝑓𝑖
Si Pos es de la forma i.d
Entonces tenemos que hacer una
interpolación
𝑸𝒌 = 𝒙𝒊 + 𝒅(𝒙𝒊+𝟏 − 𝒙𝒊 )

Tenemos que : 𝑸𝟐 = 𝑴𝒆

Decil 1) datos ordenados de menor a mayor Determinar la posición de la clase,


𝒙𝟏, 𝒙𝟐, … , 𝒙𝒏 𝒌𝒏
Determinar la posición, 𝑷𝒐𝒔 𝒅𝒆 𝑫𝒌 : , ∀𝒌 = 𝟏, . . , 𝟗
𝟏𝟎
𝒌𝒏
𝑷𝒐𝒔 𝒅𝒆 𝑫𝒌 : , ∀𝒌 = 𝟏, . . , 𝟗 𝑘𝑛
𝟏𝟎 − 𝐹𝑖−1
Si Pos es entero exacto 𝐷𝑘 = 𝐿𝑖 + (10 ) 𝑐𝑖
Entonces 𝑫𝒌 = 𝒙𝒑𝒐𝒔 . 𝑓𝑖

Si Pos es de la forma i.d


Entonces tenemos que hacer una
interpolación
𝑫𝒌 = 𝒙𝒊 + 𝒅(𝒙𝒊+𝟏 − 𝒙𝒊 )

1) datos ordenados de menor a mayor Determinar la posición de la clase,


Percentil 𝒙𝟏, 𝒙𝟐, … , 𝒙𝒏 𝒌𝒏
Determinar la posición, 𝑷𝒐𝒔 𝒅𝒆 𝑷𝒌 : , ∀𝒌 = 𝟏, . . , 𝟗𝟗
𝟏𝟎𝟎
𝒌𝒏
𝑷𝒐𝒔 𝒅𝒆 𝑷𝒌 : , ∀𝒌 = 𝟏, . . , 𝟗𝟗 𝑘𝑛
𝟏𝟎𝟎 − 𝐹𝑖−1
Si Pos es entero exacto 𝑃𝑘 = 𝐿𝑖 + ( 100 ) 𝑐𝑖
Entonces 𝑷𝒌 = 𝒙𝒑𝒐𝒔 . 𝑓𝑖

Si Pos es de la forma i.d


Entonces tenemos que hacer una
interpolación
𝑷𝒌 = 𝒙𝒊 + 𝒅(𝒙𝒊+𝟏 − 𝒙𝒊 )

Coeficiente de 𝑠 𝑠
𝐶𝑣 = ( ) ∗ 100 𝐶𝑣 = ( ) ∗ 100
Variación 𝑥̅ 𝑥̅

6.- Investiga la definición de:


Página 10 de 25

Media, Mediana, Moda, Varianza, Covarianza, Desviación estándar,


Desviación media, Desviación típica, Medidas de posición, Cuartil, Percentil,
Decil, Coeficiente de variación, Diagrama de caja. Coeficiente de correlación,
Coeficiente de determinación, Regresión lineal, diagrama de dispersión,
Distribución de probabilidad, Función de probabilidad, Función de
distribución, Función de densidad de probabilidad.

Para realizar la tabla siguiente, se consultaron varios textos que a


continuación se referencian.

Datos sin Agrupar Datos Agrupados

Media 𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝒏 ∑𝑘𝑖=1 𝑥𝑖 ∗ 𝑓𝑖
̅=
𝒙 𝑥̅ =
𝒏 𝑛

Mediana 1) se ordena los datos de menor a mayor 1) Determinar la Clase donde se busca la Me
2) se determina el numero de datos n , si
es un numero par o impar. 𝑛
𝑘𝑖 =
2
3) Si en Impar se determina la posición de
𝑛
la mediana como: ( − 𝑛𝐹𝑖−1 ) 𝑐𝑖
𝑛 𝑀𝑒 = 𝐿𝑖 + 2
𝑝 =⌊ ⌋+1 𝑓𝑖
2
La mediana es entonces:
𝑴𝒆 = 𝒙𝒑
Si n es par entonces :
𝑛
𝑝=⌊ ⌋
2
𝒙𝒑 + 𝒙𝒑+𝟏
𝑴𝒆 =
𝟐

Moda 1) ordenar el conjunto de datos a estudiar


𝒙𝟏, 𝒙𝟐, … , 𝒙𝒏 𝑓𝑖 − 𝑓𝑖−1
𝑀𝑜 = 𝐿𝑖 + ( ).𝑐
El dato que tenga mas repeticiones es la (𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 ) 𝑖
Moda.

El conjunto de datos puede tener 1 moda o


mas de 1.
∑(𝑥𝑖 − 𝑥̅ )2
Varianza 𝑉(𝑥) = ∑(𝑥𝑖 − 𝑥̅ )2 𝑓𝑖
𝑛 𝑉(𝑥) = 𝑆 2 =
Para el caso de una muestra tomamos: 𝑛
Para el caso de una muestra tomamos:
∑(𝑥𝑖 − 𝑥̅ )2 ∑(𝑥𝑖 − 𝑥̅ )2 𝑓𝑖
𝑉(𝑥) = 𝑉(𝑥) = 𝑆 2 =
𝑛−1 𝑛−1
𝑛
Covarianza 1
𝐶𝑜𝑣(𝑥, 𝑦) = ∑ 𝑥𝑖 𝑦𝑖 − 𝑥̅ 𝑦̅
𝑛
𝑖=1

Desviación
Página 11 de 25

Estándar 𝑠 = √𝑉(𝑥) 𝑠 = √𝑉(𝑥)

Desviación ∑𝑛𝑖=1|𝑥𝑖 − 𝑥̅ | ∑𝑛𝑖=1|𝑥𝑖 − 𝑥̅ |. 𝑓𝑖


Media 𝐷𝑥̅ = 𝐷𝑥̅ =
𝑛 𝑛

1) datos ordenados de menor a mayor


Cuartil 𝒙𝟏, 𝒙𝟐, … , 𝒙𝒏 Determinar la posición de la clase,
Determinar la posición, 𝒌𝒏
𝒌𝒏 𝑷𝒐𝒔 𝒅𝒆 𝑸𝒌 : , ∀𝒌 = 𝟏, 𝟐, 𝟑
𝟒
𝑷𝒐𝒔 𝒅𝒆 𝑸𝒌 : , ∀𝒌 = 𝟏, 𝟐, 𝟑
𝟒
Si Pos es entero exacto 𝑘𝑛
− 𝐹𝑖−1
Entonces 𝑸𝒌 = 𝒙𝒑𝒐𝒔 . 𝑄𝑘 = 𝐿𝑖 + ( 4 ) 𝑐𝑖
𝑓𝑖
Si Pos es de la forma i.d
Entonces tenemos que hacer una
interpolación
𝑸𝒌 = 𝒙𝒊 + 𝒅(𝒙𝒊+𝟏 − 𝒙𝒊 )

Tenemos que : 𝑸𝟐 = 𝑴𝒆

Decil 1) datos ordenados de menor a mayor Determinar la posición de la clase,


𝒙𝟏, 𝒙𝟐, … , 𝒙𝒏 𝒌𝒏
Determinar la posición, 𝑷𝒐𝒔 𝒅𝒆 𝑫𝒌 : , ∀𝒌 = 𝟏, . . , 𝟗
𝟏𝟎
𝒌𝒏
𝑷𝒐𝒔 𝒅𝒆 𝑫𝒌 : , ∀𝒌 = 𝟏, . . , 𝟗 𝑘𝑛
𝟏𝟎 − 𝐹𝑖−1
Si Pos es entero exacto 𝐷𝑘 = 𝐿𝑖 + (10 ) 𝑐𝑖
Entonces 𝑫𝒌 = 𝒙𝒑𝒐𝒔 . 𝑓𝑖

Si Pos es de la forma i.d


Entonces tenemos que hacer una
interpolación
𝑫𝒌 = 𝒙𝒊 + 𝒅(𝒙𝒊+𝟏 − 𝒙𝒊 )

1) datos ordenados de menor a mayor Determinar la posición de la clase,


Percentil 𝒙𝟏, 𝒙𝟐, … , 𝒙𝒏 𝒌𝒏
𝑷𝒐𝒔 𝒅𝒆 𝑷𝒌 : , ∀𝒌 = 𝟏, . . , 𝟗𝟗
Determinar la posición, 𝟏𝟎𝟎
𝒌𝒏
𝑷𝒐𝒔 𝒅𝒆 𝑷𝒌 : , ∀𝒌 = 𝟏, . . , 𝟗𝟗 𝑘𝑛
𝟏𝟎𝟎 − 𝐹𝑖−1
Si Pos es entero exacto 𝑃𝑘 = 𝐿𝑖 + ( 100 ) 𝑐𝑖
Entonces 𝑷𝒌 = 𝒙𝒑𝒐𝒔 . 𝑓𝑖

Si Pos es de la forma i.d


Entonces tenemos que hacer una
interpolación
𝑷𝒌 = 𝒙𝒊 + 𝒅(𝒙𝒊+𝟏 − 𝒙𝒊 )

Coeficiente de 𝑠 𝑠
𝐶𝑣 = ( ) ∗ 100 𝐶𝑣 = ( ) ∗ 100
Variación 𝑥̅ 𝑥̅
Página 12 de 25

Diagrama de
Caja

Este diagrama muestra el Valor Máximo y


mínimo, que son los bigotes , la caja
muestra los 3 Cuartiles y la media
aritmética. Este diagrama es del ejercicio 7
problema 1.

Coeficiente de 𝐶𝑜𝑣(𝑥, 𝑦)
Correlación 𝜌(𝑥, 𝑦) =
√𝑣𝑎𝑟(𝑥). 𝑣𝑎𝑟(𝑦)

Coeficiente de
Determinación

Una vez que se ha determinado que hay


Regresión una posible dependencia lineal entre 2
Lineal conjuntos de datos , se requiere
determinar la recta lineal que mejor
represente el estado.

𝐶𝑜𝑣(𝑥, 𝑦)
𝑦 − 𝑦̅ = (𝑥 − 𝑥̅ )
𝑣𝑎𝑟(𝑥)

Dados 2 conjuntos de datos el Diagrama


Diagrama de de dispersión muestra en los ejes
Dispersión coordenados ortogonales x y y , los valores
de las variables.
Sea X una variable aleatoria y el rango de
Distribución valores {𝒙𝟏, 𝒙𝟐, … , 𝒙𝒏, … . }
de
Probabilidad 𝑨 𝒄𝒂𝒅𝒂 𝒙𝒊 𝒍𝒆 𝒂𝒔𝒐𝒄𝒊𝒂𝒓𝒆𝒎𝒐𝒔 𝒖𝒏𝒂
𝒑𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅 𝒑(𝒙𝒊 ) 𝒄𝒐𝒏 𝟎 ≤ 𝒑(𝒙𝒊 ) ≤ 𝟏

Esta asociación o par ordenado :

(𝒙𝒊 , 𝒑(𝒙𝒊 )) 𝒍𝒆 𝒍𝒍𝒂𝒎𝒂𝒎𝒐𝒔


𝑫𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒄𝒊ó𝒏 𝒅𝒆 𝒑𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅

Si X es una variable aleatoria discreta con


Función de rango de valores
Distribución {𝒙𝟏, 𝒙𝟐, … , 𝒙𝒏, … . }
La función de distribución (de
probabilidad) de X se define para todo
𝒙 ∈ ℝ como:

𝑭(𝒙) = 𝑷(𝑿 ≤ 𝒙) = ∑ 𝒇(𝒖)


𝒖≤𝒙

De forma continua:
Página 13 de 25

𝒙
𝑭(𝒙) = 𝑷(𝑿 ≤ 𝒙) = ∫ 𝒇(𝒙)𝒅𝒙
−∞

Función de densidad de probabilidad


Función de Discreta.-
densidad de Si X es una variable aleatoria discreta y el
Probabilidad recorrido de X consta de valores
𝒙𝟏, 𝒙𝟐, … , 𝒙𝒏
A cada 𝒙𝒊 asociamos un numero
p(𝒙𝒊 )=P(X=𝒙𝒊 ), llamado probabilidad de
𝒙𝒊 . Los números p(𝒙𝒊 ) deben satisfacer:
i) 𝒑(𝒙𝒊 ) ≥ 𝟎 , ∀ 𝒊

ii)∑𝒏𝒊=𝟏 𝒑(𝒙𝒊 ) = 𝟏

Función de densidad de probabilidad


continua.-

Con X es una variable aleatoria continua,


si existe una función f, llamada de
densidad de probabilidad (fdp) de X y
satisface las siguientes 2 condiciones:

i)𝑓(𝑥) ≥ 0 , ∀ 𝑥

ii) ∫−∞ 𝑓(𝑥)𝑑𝑥 = 1.

7.- Desarrollo de problemas:

Problema 1:

Calcula todas las medidas de tendencia central y de dispersión, que


analizaste en el pdf de la Unidad 1, del curso de Estadística I.

Este ejercicio lo resolveré en la modalidad de datos no agrupados en Excel y


verificaré usando SPSS.
1.1) Primeramente ordenaré los datos de menor a mayor para posteriores cálculos lo
cual nos da:
Página 14 de 25

𝟏. 𝟐)𝑴𝒂𝒙 = 𝟗 , 𝑴𝒊𝒏 = 𝟐 , 𝑹𝒂𝒏𝒈𝒐 = 𝑴𝒂𝒙 − 𝑴𝒊𝒏 = 𝟗 − 𝟐 = 𝟕


1.3) La Mediana como es un numero impar de datos , calculamos la posición como:
𝟏𝟑
𝑷𝒐𝒔 = ⌊ ⌋+𝟏 =𝟔+𝟏 = 𝟕
𝟐
𝑬𝒏𝒕𝒐𝒏𝒄𝒆𝒔 𝒍𝒂 𝒎𝒆𝒅𝒊𝒂𝒏𝒂 𝒆𝒔𝒕𝒂 𝒆𝒏 𝒍𝒂 𝒑𝒐𝒔𝒊𝒄𝒊ó𝒏 𝟕 𝒅𝒆 𝒍𝒐𝒔 𝒅𝒂𝒕𝒐𝒔 𝒐𝒓𝒅𝒆𝒏𝒂𝒅𝒐𝒔, 𝒍𝒐 𝒄𝒖𝒂𝒍 𝒅𝒂

𝑴𝒆𝒅𝒊𝒂𝒏𝒂 = 𝟓 .
1.4) La moda es el dato que mas se repite y puede ser uni-modal o multi-modal. En
este caso tenemos que:
Moda = 5 y 7 , que es bi-modal.
1.5) La media aritmética es:
∑13
𝑖=1 𝑥𝑖 2 + 4 + 7 + 7 + 5 + 9 + 5 + 8 + 3 + 5 + 7 + 3 + 2 67
𝑥̅ = = = = 𝟓. 𝟏𝟓𝟑𝟖
13 13 13
1.6) La Varianza muestral la cálculamos como:

2
∑13
𝑖=1(𝑥𝑖 − 𝑥̅ )
2
(2 − 5.15)2 + (4 − 5.15)2 + ⋯ + (2 − 5.15)2
𝑉(𝑥) = 𝑆 = = = 5.308
13 − 1 12
1.7) La Desviación Típica es :

𝒔 = √𝑽(𝒙) = 𝟐. 𝟑𝟎𝟒

1.8) El coeficiente de variación es:


𝒔 𝟐. 𝟑𝟎𝟒
𝑪𝑽 = ( ) ∗ 𝟏𝟎𝟎 = ( ) ∗ 𝟏𝟎𝟎 = 𝟒𝟒. 𝟕𝟎𝟒
̅
𝒙 𝟓. 𝟏𝟓𝟑𝟖
1.9) Cuartiles (David, 2011)

i) 𝑄1 (cuartil 1)
𝒌𝒏 𝟏∗𝟏𝟑
𝑳𝒂 𝒑𝒐𝒔𝒊𝒄𝒊ó𝒏 𝒅𝒆𝒍 𝒄𝒖𝒂𝒓𝒕𝒊𝒍 𝑸𝟏 𝒆𝒔 ∶ = = 𝟑. 𝟐𝟓
𝟒 𝟒

𝑪𝒐𝒎𝒐 𝒍𝒂 𝒑𝒐𝒔𝒊𝒄𝒊ó𝒏 𝒆𝒔 𝒖𝒏 𝒏ú𝒎𝒆𝒓𝒐 𝒄𝒐𝒏 𝒇𝒓𝒂𝒄𝒄𝒊ó𝒏 𝒅𝒆𝒄𝒊𝒎𝒂𝒍 𝒆𝒍 𝒄𝒖𝒂𝒓𝒕𝒊𝒍 𝒆𝒔𝒕𝒂 𝒆𝒏𝒕𝒓𝒆 𝒍𝒐𝒔

𝒗𝒂𝒍𝒐𝒓𝒆𝒔 𝒅𝒆 𝒍𝒂 𝒑𝒐𝒔𝒊𝒄𝒊ó𝒏 𝟑 𝒚 𝟒, 𝒑𝒐𝒓 𝒍𝒐 𝒒𝒖𝒆 𝒔𝒆 𝒕𝒊𝒆𝒏𝒆 𝒒𝒖𝒆 𝒔𝒆 𝒕𝒊𝒆𝒏𝒆 𝒒𝒖𝒆 𝒉𝒂𝒄𝒆𝒓 𝒖𝒏𝒂

𝒊𝒏𝒕𝒆𝒓𝒑𝒐𝒍𝒂𝒄𝒊ó𝒏 𝒅𝒆𝒇𝒊𝒏𝒊𝒅𝒂 𝒑𝒐𝒓 𝒍𝒂 𝒇𝒐𝒓𝒎𝒖𝒍𝒂 ∶


Página 15 de 25

𝑸𝟏 = 𝒙𝒊 + 𝒅(𝒙𝒊+𝟏 − 𝒙𝒊 ) 𝒄𝒐𝒏 𝒖𝒏𝒂 𝒑𝒐𝒔𝒊𝒄𝒊ó𝒏 𝒅𝒆 𝒍𝒂 𝒇𝒐𝒓𝒎𝒂 𝒊. 𝒅

𝑸𝟏 = 𝟑 + 𝟎. 𝟐𝟓(𝟑 − 𝟑) = 𝟑 , 𝒆𝒏𝒕𝒐𝒏𝒄𝒆𝒔 𝑸𝟏 = 𝟑

ii) 𝑄2 (𝑐𝑢𝑎𝑟𝑡𝑖𝑙 2) 𝑞𝑢𝑒 𝑒𝑠 𝑖𝑔𝑢𝑎𝑙 𝑎 𝑙𝑎 𝑀𝑒𝑑𝑖𝑎𝑛𝑎


𝒌𝒏 𝟐 ∗ 𝟏𝟑 𝟐𝟔
= = = 𝟔. 𝟓 , 𝒑𝒐𝒓 𝒐𝒃𝒔𝒆𝒓𝒗𝒂𝒄𝒊ó𝒏 𝒗𝒆𝒎𝒐𝒔 𝒒𝒖𝒆 𝒔𝒊 𝒊𝒏𝒕𝒆𝒓𝒑𝒐𝒍𝒂𝒎𝒐𝒔
𝟒 𝟒 𝟒
𝒏𝒐𝒔 𝒅𝒂 𝒆𝒍 𝒎𝒊𝒔𝒎𝒐 𝒗𝒂𝒍𝒐𝒓, 𝒆𝒏𝒕𝒐𝒏𝒄𝒆𝒔 𝑸𝟐 = 𝟓

ii) 𝑄3 (𝑐𝑢𝑎𝑟𝑡𝑖𝑙 3)
𝒌𝒏 𝟑 ∗ 𝟏𝟑 𝟑𝟗
= = = 𝟗. 𝟕𝟓 , 𝒆𝒏𝒕𝒐𝒏𝒄𝒆𝒔 𝑸𝟑 = 𝟕
𝟒 𝟒 𝟒
1.10) Deciles: (solo cálculamos 1)
𝒌𝑵 𝟏∗𝟏𝟑
La posición del 𝑫𝟏 = = = 𝟏. 𝟑, 𝒆𝒏𝒕𝒐𝒏𝒄𝒆𝒔 𝑫𝟏 = 𝟐.
𝟏𝟎 𝟏𝟎

1.11) Percentiles:(solo calculamos 1)


𝒌𝑵 𝟓𝟎∗𝟏𝟑
La posición del 𝑷𝟓𝟎 = 𝟏𝟎𝟎 = = 𝟔. 𝟓, 𝒆𝒏𝒕𝒐𝒏𝒄𝒆𝒔 𝑷𝟓𝟎 = 𝟓
𝟏𝟎𝟎

Los mismos cálculos en Excel nos da lo siguiente:

La grafica de Caja y bigotes es :(indica Max,Min,Cuartiles y Media)


Página 16 de 25

Como el Bigote es mas corto en el Min=2, esto quiere decir que los datos están mas concentrados
en el cuartil 𝑄1.
El mismo ejercicio realizado en SPSS nos da:
Página 17 de 25

Problema 2:
Observa la siguiente tabla de datos ordenada por intervalos:
Página 18 de 25

Calcula todas las medidas de tendencia central y dispersión que estudiaste


en el pdf de la Unidad 1, del curso de Estadística 1.

Presento la solución de este problema en Excel y adjunto Tenemos:

Problema 3:
Dado los datos: (no agrupados)
Página 19 de 25

a) Ordénalos por intervalos.


b) Calcula todas las medidas de tendencia central y dispersión que
conozcas. Apóyate en el pdf de la Universidad.

3.1) Determinamos el Máximo , Mínimo y Rango

Max = 24 y Min=1 entonces el Rango = Max-Min = 24-1 =23

3.2) Aquí tenemos n=42 y determinaremos el numero de intervalos que


tendrá la tabla con la formula de Sturges (Martínez, 2012, Pag. 48)

ortiz, R. (2020). Logica. Cdmx: Propia.

𝒌 = 𝟏 + 𝟑. 𝟑𝟐𝟎 ∗ 𝐥𝐨𝐠(𝒏) = 𝟏 + 𝟑. 𝟑𝟐𝟎 ∗ 𝐥𝐨𝐠(𝟒𝟐) = 𝟔. 𝟑𝟖 ≈ 𝟔

La amplitud de los intervalos determinamos

𝑹𝒂𝒏𝒈𝒐 𝟐𝟑
𝒄= = = 𝟑. 𝟖𝟑 ≈ 𝟒
𝒌 𝟔
En la tabla, el intervalo [1,5) nos indica 1 ≤ 𝑦 < 5

Calculos en Excel:
Página 20 de 25

Problema 4.

Se realiza una investigación en un Bachillerato tecnológico a 165


adolescentes de 15 a 17 años, donde se les preguntó, el número de horas a
la semana (de lunes a domingo) que pasan viendo videos en la nueva red
social Tik Tok.
Los resultados arrojaron los siguientes datos (horas a la semana)
Página 21 de 25

Con los datos expuestos, Calcular y/o elaborar:


a) Ordénalos por intervalos.
b) La media. Moda, Mediana, Rango, Varianza, Desviación estándar,
Desviación media y Coeficiente de variación.
c) Tabla de frecuencias con la información que creas sea la más
conveniente, Diagrama circular, Gráfica de barras, Gráfica de ojiva
ascendente.
d) Realiza una conclusión de la información que observas en la gráfica
de barras. ¿Encuentras alguna característica que se puede analizar?
e) ¿Cómo se le llamaría a la forma de la distribución de datos en gráfica
de barras?

4.1) Determinamos el Máximo , Mínimo y Rango

Max = 62 y Min=17 entonces el Rango = Max-Min = 62-17 =45

4.2) Aquí tenemos n=154 y determinaremos el numero de intervalos que


tendrá la tabla con la formula de Sturges (Martínez, 2012, Pag. 48)

𝒌 = 𝟏 + 𝟑. 𝟑𝟐𝟎 ∗ 𝐥𝐨𝐠(𝒏) = 𝟏 + 𝟑. 𝟑𝟐𝟎 ∗ 𝐥𝐨𝐠(𝟏𝟓𝟒) = 𝟖. 𝟐𝟔 ≈ 𝟖

La amplitud de los intervalos determinamos


Página 22 de 25

𝑹𝒂𝒏𝒈𝒐 𝟒𝟓
𝒄= = = 𝟓. 𝟔𝟐𝟓 ≈ 𝟔
𝒌 𝟖
Los Cálculos realizados en Excel són :

Graficas :
Página 23 de 25

Horas/semana en Tik Tok

50

45

40

35
Numero de personas

30

25

20

15

10

0
20 26 32 38 44 50 56 62
Horas /Semana en Tik Tok

Diagrama de Ojiva Ascendente


180
Horas Semana en Tik Tok Acumuladas

150 154
160 144
140 124
120
93
100

80

60 46
40

20 9
2
0
20 26 32 38 44 50 56 62
Marca No. de Personas

Datos calculados con SPSS


Página 24 de 25

Se puede observar que los cálculos realizados en Excel mediante el uso de


las formulas vistas en el curso, són muy próximas a los cálculos realizados en
SPSS. Esta diferencia básicamente se debe a que los cálculos en forma
agrupada usa las marcas de clase.

Conclusiones.-

Se puede afirmar que esta información se aproxima mucho a una distribución


normal :

𝑁(𝜇, 𝜎) = 𝑁(38.26 , 8.51)

También podemos afirmar que en promedio las personas ven 38.26


horas/semana Tik Tok. El 25% de las personas ven menos de 33.78
horas/semana.

Un Coeficiente de Varianza = 22.25% que es menor del 25%, nos indica que
los datos són homogéneos.
Página 25 de 25

Bibliografía
Crespo, R. (2013). Formulas y apuntes de Estadística aplicada. Madrid España: Cisolog.

David, P. (2011). Medidas de Posición. Obtenido de Medidas de Posición:


http://estadisticapasoapaso.blogspot.com/2011/09/los-cuartiles.html

El pensante. (23 de abril de 2016). educacion.elpensante.com. Obtenido de


educacion.elpensante.com: https://educacion.elpensante.com/muestra-
representativa-estadistica/

Kaufmann, A. (1971). Introducción a la combinatoria y sus aplicaciones. Barcelona España:


Compañia Editorial Continental, S.A.

Martínez, C. (2012). Estadística y muestreo. Bogota Colombia: Ecoe Ediciones.

Meyer, P. (1992). Probabilidad y Aplicaciones Estadísticas. Delaware U.S.A.: Fondo Educativo


Interamericano.

Patricia Kuby, R. J. (2012). Estadística Elemental. Cdmx México: CENGAGE.

R, E. a. (2014). Sergio Santana, Mateos Farfan. Cdmx Mexico: UNESCO.

Real Academia Española. (12 de abril de 2012). dle.rae.es. Obtenido de dle.rae.es:


https://dle.rae.es/inferir

Segal-Compilación, R. (2014). Torat Emet. Buenos Aires Argentina: Keter Torá.

UNADM, M. (2020). Estadística I - Estadistica descriptiva. Cdmx: Unad.

Zalazar, C. P., & Del castillo, S. G. (2018). Conceptos Basicos de Estadistica. Mexico .

También podría gustarte