Estadística inferencial aplicada
5/5
()
Información de este libro electrónico
Relacionado con Estadística inferencial aplicada
Libros electrónicos relacionados
Estadística inferencial Calificación: 5 de 5 estrellas5/5Introducción al análisis estadístico multivariado aplicado: Experiencia y casos en el Caribe colombiano Calificación: 5 de 5 estrellas5/5Estadística Descriptiva y Probabilidad Calificación: 5 de 5 estrellas5/5Introducción a la estadística matemática Calificación: 5 de 5 estrellas5/5Manual de estadística no paramétrica aplicada a los negocios Calificación: 0 de 5 estrellas0 calificacionesEstadística descriptiva para datos categóricos Calificación: 0 de 5 estrellas0 calificacionesEstadística aplicada a la ingeniería y los negocios Calificación: 4 de 5 estrellas4/5Cómo entender estadística fácilmente Calificación: 4 de 5 estrellas4/5Introducción a la estadística con aplicaciones en Ciencias Sociales Calificación: 4 de 5 estrellas4/5Estadística multivariada: inferencia y métodos Calificación: 0 de 5 estrellas0 calificacionesAnálisis estadístico de datos categóricos Calificación: 0 de 5 estrellas0 calificacionesPrincipios de estadística aplicada Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la teoría de la probabilidad Calificación: 4 de 5 estrellas4/5Estadística básica para los negocios Calificación: 0 de 5 estrellas0 calificacionesProbabilidad y estadística: un enfoque teórico-práctico Calificación: 4 de 5 estrellas4/5Análisis estadístico de datos multivariados Calificación: 5 de 5 estrellas5/5Procesos estocásticos con aplicaciones Calificación: 5 de 5 estrellas5/5Econometría aplicada usando stata 13 Calificación: 4 de 5 estrellas4/5Diseño de Experimentos [Métodos y Aplicaciones] Calificación: 0 de 5 estrellas0 calificacionesMétodos Bioestadísticos Calificación: 5 de 5 estrellas5/5Bioestadística Calificación: 2 de 5 estrellas2/5Econometría fundamental Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la matemática discreta Calificación: 5 de 5 estrellas5/5Métodos numéricos Calificación: 5 de 5 estrellas5/5Métodos cuantitativos 4a Ed. Herramientas para la investigación en salud Calificación: 4 de 5 estrellas4/5Ecuaciones diferenciales Calificación: 4 de 5 estrellas4/5Métodos cuantitativos 3a. Ed. Herramientas para la investigación en salud Calificación: 0 de 5 estrellas0 calificacionesRazonamiento cuantitativo Calificación: 0 de 5 estrellas0 calificacionesIntroducción al análisis de supervivencia avanzada Calificación: 0 de 5 estrellas0 calificacionesIntroducción a los análisis estadísticos en R Calificación: 0 de 5 estrellas0 calificaciones
Matemática para usted
El hombre que calculaba Calificación: 5 de 5 estrellas5/5Matemáticas básicas 2ed. Calificación: 4 de 5 estrellas4/5Matemáticas básicas 4ed Calificación: 5 de 5 estrellas5/5Probabilidad y estadística: un enfoque teórico-práctico Calificación: 4 de 5 estrellas4/5Estadística básica: Introducción a la estadística con R Calificación: 5 de 5 estrellas5/5Dignos de ser humanos: Una nueva perspectiva histórica de la humanidad Calificación: 4 de 5 estrellas4/5Razonamiento Lógico Matemático para la toma de decisiones Calificación: 4 de 5 estrellas4/5Excel de la A a la Z: El Manual Práctico Paso a Paso de Microsoft Excel para Aprender Funciones Básicas y Avanzadas, Fórmulas y Gráficos con Ejemplos Fáciles y Claros Calificación: 0 de 5 estrellas0 calificacionesEl método Seis Sigma: Mejore los resultados de su negocio Calificación: 4 de 5 estrellas4/5Literatura infantil Calificación: 4 de 5 estrellas4/5Estadística descriptiva, regresión y probabilidad con aplicaciones Calificación: 5 de 5 estrellas5/5Cálculo integral: Técnicas de integración Calificación: 4 de 5 estrellas4/5Introducción a las matemáticas Calificación: 3 de 5 estrellas3/5La enfermedad de escribir Calificación: 4 de 5 estrellas4/5Operaciones Con Fracciones Calificación: 0 de 5 estrellas0 calificacionesInteligencia matemática Calificación: 4 de 5 estrellas4/5Calculatrix: 85 trucos de velocidad con los números Calificación: 5 de 5 estrellas5/5Álgebra e introducción al cálculo Calificación: 1 de 5 estrellas1/5¿Soy yo normal?: Filias y parafilias sexuales Calificación: 5 de 5 estrellas5/5La Física - Aventura del pensamiento Calificación: 5 de 5 estrellas5/5El gran teatro del mundo Calificación: 5 de 5 estrellas5/5La pasión del poder Calificación: 5 de 5 estrellas5/5CeroCeroCero: Cómo la cocaína gobierna el mundo Calificación: 4 de 5 estrellas4/5Introducción a la geometría (2ª edición) Calificación: 5 de 5 estrellas5/5Gane: Estrategias para jugar en la lotería Calificación: 0 de 5 estrellas0 calificacionesPitágoras y su teorema Calificación: 4 de 5 estrellas4/5Álgebra lineal Calificación: 4 de 5 estrellas4/5Introducción a la geometría Calificación: 5 de 5 estrellas5/5Álgebra clásica Calificación: 0 de 5 estrellas0 calificacionesEl libro del porqué: La nueva ciencia de la causa y el efecto Calificación: 2 de 5 estrellas2/5
Categorías relacionadas
Comentarios para Estadística inferencial aplicada
1 clasificación0 comentarios
Vista previa del libro
Estadística inferencial aplicada - Martín Díaz Rodríguez
colaboración.
Capítulo 1
Distribuciones continuas
Introducción
En este texto presentamos una serie de casos (problemas de aplicación) que pueden ser resueltos utilizando técnicas estadísticas de uso frecuente en cursos de pregrado e incluso en los primeros semestres en cursos de postgrado. Los tres problemas de aplicación que se presentan en la siguiente sección no son más que un pretexto para desarrollar toda la teoría básica de estadística inferencial de un curso de pregrado.
Al terminar este capítulo se espera que el estudiante tenga un manejo correcto de las diferentes distribuciones continuas estudiadas, además de poder calcular probabilidades utilizando estas distribuciones a través de las tablas de sus distribuciones.
1.1 Resumen
En la sección 1.3, se presentan tres problemas de aplicación y una serie de preguntas que se espera sean respondidas a medida que se avanzan en el desarrollo de los temas.
En la sección 1.4, se presentan las distribuciones de algunas variables aleatorias discretas y continuas así como también sus propiedades, demostraciones de algunas propiedades y se calculan probabilidades utilizando estas distribuciones.
En la subsección 1.4.10, se presenta la definición de familia exponencial de distribuciones, como un caso general de varias de las distribuciones estudiadas, además se plantean un par de ejemplos en el caso uniparamétrico y otro tanto en el caso multiparamétrico; en ambos casos las distribuciones presentadas son la binomial y la normal.
Terminamos el desarrollo teórico del capítulo con la presentación de los teoremas; desiguadad de Markov, desigualdad de Chebyshev, sus demostraciones, la definición de convergencia en distribución, en probabilidad, casi segura y en media, teoremas sobre ley fuerte de los grandes números, ley débil de los grandes números y el teorema del límite central.
Cerramos el capítulo con un taller en el que se formulan una serie de preguntas relacionadas con los temas teóricos desarrollados.
Previo a cada tema, se formulan preguntas relacionadas con el tema a desarrollar inmediatamente después de la pregunta.
El siguiente mapa conceptual muestra la forma como serán desarrollados los temas en este capítulo.
Figura 1.1.1. Mapa conceptual de los problemas de aplicación y su relación con la estadística
1.2 Problemas de aplicación
En esta sección presentamos los tres problemas de aplicación, que mencionamos a continuación.
Problema de aplicación 1 A la Asociación Colombiana de Ciencias Económicas le preocupa la escasez de profesionales en este campo que parece se dará en un futuro no lejano en la ciudad de Barranquilla; ellos creen que ese problema está relacionado con los factores: grado de satisfacción con la profesión, grado de satisfacción con el trabajo y grado de satisfacción salarial. Para determinar la influencia de estos tres factores en esa posible escasez futura, se ha contratado un estudio con una firma especializada en pronósticos. Como parte de este estudio se pidió a 50 profesionales de ciencias económicas de la ciudad que indicaran su grado de satisfacción con respecto al trabajo, el salario y las oportunidades de ascenso.
Figura 1.2.1. Grado de satisfacción
Se reunieron los datos en la tabla que se presenta a continuación:
Tabla 1.2.1 Grado de satisfacción en ciencias económicas
Tabla 1.2.2 Grado de satisfacción en ciencias económicas, continuación
Además los datos anteriores fueron clasificados según la profesión en: administrador, contador y economista. A continuación se presentan los datos anteriores ya clasificados por profesión:
Tabla 1.2.3 Grado de satisfacción por profesión
Se quiere identificar las características generales del grupo de profesionales en general y en particular en cada profesión y presentar los resúmenes de interés que permitan valorar las variables en estudio, como son: grado de satisfacción con el trabajo (Trabajo), grado de satisfacción con el salario (Salario) y grado de satisfacción con el ascenso (Ascenso).
Si se quiere hacer un análisis desde el punto de vista estadístico, se deberían tener en cuenta los siguientes interrogantes:
1. Con base en estas variables ¿qué aspecto del trabajo satisface más a los profesionales de esta ciencia?, ¿cuál parece ser el que menos lo satisface?, ¿en cuál de las tres variables se deben introducir mejoras para estimular a más personas a vincularse a la formación como profesionales en las distintas ramas de las ciencias económicas?
2. ¿Cuál de las tres variables parece generar mayor diferencia de opinión entre estos profesionales? ¿Cuál de las variables parece tener mayor cohesión entre ellos?
3. ¿Qué se puede decir acerca de la satisfacción de estos profesionales según su tipo de profesión? ¿Cuál rama de las ciencias económicas parece tener los mejores niveles de satisfacción?
4. Considere la variable Ascenso como una variable categórica (cualitativa), haga lo mismo con el grado de satisfacción del salario (Salario), ¿es el grado de satisfacción del ascenso independiente del grado de satisfacción en salario?
5. Considere la variable Trabajo como una variable categórica (cualitativa), haga lo mismo con el grado de satisfacción en el salario, ¿es el grado de satisfacción del trabajo independiente del grado de satisfacción del salario?
6. Considere la variable Ascenso como una variable categórica (cualitativa), haga lo mismo con el grado de satisfacción en el trabajo, ¿es el grado de satisfacción en el ascenso independiente del grado de satisfacción en trabajo?
7. Considere el grado de satisfacción en salario como una variable cuantitativa, ¿se ajustan los valores de la variable grado de satisfacción en el salario a los valores de una variable con distribución normal?
8. Considere el grado de satisfacción en el ascenso como una variable cuantitativa, ¿se ajustan los valores de la variable grado de satisfacción en el ascenso a los valores de una variable con distribución normal?
9. Considere el grado de satisfacción en el trabajo como una variable cuantitativa, ¿se ajustan los valores de la variable grado de satisfacción en el trabajo a los valores de una variable con distribución normal?
10. Considere el grado de satisfacción en salario y grado de satisfacción en ascenso como variables cuantitativas. En cada una de las profesiones analizadas, determine si el grado de satisfacción en salario es función del grado de satisfacción en el ascenso.
11. Considere el grado de satisfacción en salario y grado de satisfacción en el trabajo como variables cuantitativas. En cada una de las profesiones analizadas, determine si el grado de satisfacción en el salario es función del grado de satisfacción en el trabajo.
12. Considere el grado de satisfacción en salario y grado de satisfacción en ascenso como variables cuantitativas, determine si el grado de satisfacción en salario es función del grado de satisfacción en ascenso en las ciencias económicas.
13. Con base en los resultados anteriores, cree usted, ¿hay razones para que la Asociación Colombiana de Ciencias Económicas esté preocupada?
Problema de aplicación 2 Se quiere saber entre dos procedimientos para enseñar estadística descriptiva, con cuál se obtiene un mejor rendimiento por parte de los estudiantes. Para averiguarlo, se escogieron aleatoriamente dos grupos de 54 estudiantes cada uno de una institución educativa; en el primer grupo se utilizó el procedimiento tradicional de enseñanza, mientras que en el segundo grupo se usó el procedimiento experimental. En cada grupo se aplicó al inicio del curso un cuestionario que abordaba seis temas de estadística descriptiva y en cada tema se hicieron cuatro preguntas, cada pregunta con solo dos opciones de respuesta (falso o verdad) y luego al final del curso se hicieron las mismas preguntas formuladas de manera diferente (algunas invertidas). Los resultados obtenidos utilizando el programa estadístico IBM Statistics SPSS 25 se muestran en la tabla siguiente; donde con E denotamos los estudiantes que pertenecen al grupo experimental y con C, los que pertenecen al grupo control, con 0 denotamos las preguntas con respuestas incorrectas y con 1, las preguntas respondidas correctamente. Al final del curso en el grupo control, un estudiante no se presentó a la prueba.
Tabla 1.2.4 Respuestas correctas o incorrectas al inicio del curso
Tabla 1.2.5 Respuestas correctas o incorrectas al final del curso
Las preguntas de interés en este problema son:
1. ¿Al inicio del curso son homogéneos los dos grupos en relación con el conocimiento que tienen de los temas de estadística descriptiva a estudiar?
2. ¿Al final del curso son homogéneos los dos grupos en relación con el conocimiento de los temas de estadística descriptiva estudiados?
3. Con base en los resultados obtenidos en las tablas, ¿aprendieron los estudiantes con el procedimiento tradicional de enseñanza?
4. Con base en los resultados obtenidos en las tablas, ¿aprendieron los estudiantes con el procedimiento experimental de enseñanza?
5. Si son homogéneos al inicio del curso los dos grupos, ¿con cuál procedimiento obtuvieron mejores resultados los estudiantes? ¿es decir, cuál de los grupos tuvo un mejor desempeño académico en términos generales?
6. ¿En cuál de los seis temas evaluados tuvieron un mejor desempeño académico los grupos?
7. ¿En cuál de los seis temas evaluados cree usted se deben introducir mejoras o estrategias diferentes (en cada grupo) a las aquí aplicadas para que los estudiantes tengan un mejor desempeño académico?, es decir, ¿cuál de los seis temas es el más crítico en cuanto a bajo rendimiento académico en cada grupo y entre grupos?
8. Con base en los resultados anteriores, describa las características más importantes que tienen los grupos en relación con los temas evaluados.
Problema de aplicación 3 Se quiere saber entre dos procedimientos para enseñar estadística descriptiva, con cuál se obtiene un mejor rendimiento por parte de los estudiantes. Para averiguarlo, se escogieron aleatoriamente dos grupos de 54 estudiantes cada uno de una institución educativa; en el primer grupo se utilizó el procedimiento tradicional de enseñanza, mientras que en el segundo grupo se usó el procedimiento experimental. En cada grupo se aplicó al inicio del curso un cuestionario que abordaba, seis temas de estadística descriptiva y en cada tema se hicieron cuatro preguntas de desarrollo, cada pregunta con nota mínima de 0 y máxima de 5; y luego al final del curso se hicieron las mismas preguntas formuladas en problemas de aplicación con características similares a los presentados en el cuestionario inicial. Los resultados de las notas obtenidas por temas, en cada grupo, son las que se muestran en la tabla siguiente; donde con E denotamos los estudiantes que pertenecen al grupo experimental y con C, los del grupo control.
Tabla 1.2.6 Resultados por tema de los exámenes antes de iniciar el curso
Tabla 1.2.7 Resultados por tema de los exámenes al final del curso
Las preguntas de interés en este problema son:
1. ¿Al inicio del curso son homogéneos los dos grupos en relación con el conocimiento que tienen de los temas de estadística descriptiva a estudiar?
2. ¿Al final del curso son homogéneos los dos grupos en relación con el conocimiento de los temas de estadística descriptiva estudiados?
3. Con base en los resultados obtenidos, ¿aprendieron los estudiantes con el procedimiento tradicional de enseñanza?
4. Con base en los resultados obtenidos, ¿aprendieron los estudiantes con el procedimiento experimental de enseñanza?
5. Si son homogéneos al inicio del curso los dos grupos, ¿con cuál procedimiento obtuvieron mejores resultados los estudiantes?, es decir, ¿cuál de los grupos tuvo un mejor desempeño académico en términos generales?
6. ¿En cuál de los seis temas evaluados tuvieron un mejor desempeño académico los grupos?
7. ¿En cuál de los seis temas evaluados cree usted hay que introducir mejoras o estrategias diferentes (en cada grupo) a las aquí aplicadas para que los estudiantes tengan un mejor desempeño académico?
8. Con base en los resultados anteriores describa las características más importantes que tienen los grupos en relación con los temas evaluados.
Problemas de estas características son los que queremos abordar en este texto y presentar una propuesta de solución desde el punto de vista estadístico, para lo cual necesitaremos una serie de conceptos estadísticos que iremos mencionando en cada uno de los pasos en el proceso de solución del problema que iniciaremos a partir del capítulo 2.
En este primer capítulo presentamos un repaso sobre algunas funciones de densidad para variables aleatorias continuas en una dimensión, como también algunos conceptos sobre convergencia en distribución y variables aleatorias, conceptos que juegan un papel fundamental en el buen desarrollo y comprehension de los conceptos estadísticos que se presentan en este texto.
Los lectores interesados solo en un curso de estadística inferencial pueden omitir el resto de este capítulo, sin pérdida de generalidad, ya que, como se dijo antes, esto es solo un repaso sobre algunos temas de probabilidad. Otros lectores podrían estar interesados en el enunciado de los teoremas, para recordar algunas propiedades, mientras que otros, además del enunciado, en sus demostraciones; así que en ese sentido se tienen diferentes opciones de lectura para el resto de este primer capítulo.
1.3 Distribuciones continuas de interés
En esta sección presentamos las distribuciones continuas y sus propiedades.
Figura 1.3.1. Mapa conceptual para las distribuciones continuas
¿Qué se puede decir del rendimiento académico de un curso de estadística I, si se sabe que el grupo tuvo una media de 4.0 con una varianza de 0.25, en una universidad donde la nota mínima y máxima son 0 y 5, respectivamente?
A continuación un esquema que muestra el contenido de esta sección.
1.3.1 Distribución Normal
Definición 1.3.1 Distribución Normal. Sea X una variable aleatoria continua, se dice que X tiene una distribución normal, si y solo si, su función de densidad viene dada por:
con parámetros μ y σ.
En la gráfica 1.3.2 se muestra la curva de distribución de una variable con distribución normal. Como se puede ver, esta gráfica es simétrica con respecto al parámetro χ, que es precisamente su media, como se menciona en el teorema siguiente.
Figura 1.3.2. Distribución normal
1.3.2 Propiedades de la distribución normal
Teorema 1.3.1 Sea X una variable con distribución normal con parámetros μ y σ, entonces
Demostración
Basta hallar la función generadora de momento, MX(t) = E(eXt), para esta variable aleatoria alrededor del origen y calcular la primera y segunda derivada y evaluarla en t = 0.
El numerador del exponente e, en la última integral a la derecha del signo igual, se puede expresar de la siguiente manera
sacando factor comun 2x en el segundo y tercer término.
Sumando y restando el cuadrado de (a) para completar un trinomio cuadrado perfecto con los dos primeros términos de la última expresión, se tiene
que al simplicarlo queda de la siguiente manera
Reemplazando (c) en (a) y teniendo en cuenta que los dosúltimos términos de (c) no dependen de X en el integrando, se tiene
Pero (d) en la expresión anterior es igual a 1, por ser esta la distribución de densidad de una variable normal con media σ²t + μ y varianza σ², o sea, que la función generadora de momento para una variable con distribución normal con media χ y varianza σ² es
Observe que a partir de la función generadora de momento se puede demostrar que la media de una variable con distribución normal es μ y que su varianza es σ², para ello basta hallar la primera derivada de MX(t) y evaluarla en t = 0; y para la varianza, calcular la segunda derivada de MX(t) evaluarla en t = 0 y luego recordar que V(X) = M''X(0) – (M'X(0))².
entonces al evaluar a M'X(t) en t = 0, se tiene M'X(0) = μ.
Para el caso de la varianza, como
entonces
Teorema 1.3.2 Si X es una variable con distribución normal con media μ, entonces su curva de distribución es simétrica con respeco a μ.
Demostración
Este resultado es evidente, ya que al evaluar la función de densidad de la variable aleatoria X, en los puntos μ − x y μ + x, se tienen los mismos resultados, es decir f(μ − x) = f(μ + x), para todo x∈R.
Nota 1 Si μ = 0 y σ² = 1; se dice que X tiene distribución normal estándar con función de densidad:
en cuyo caso la función generadora de momento viene dada así:
La gráfica de la función de densidad de una variable con distribución normal estándar es la que se muestra en la figura 1.3.3.
Figura 1.3.3. Distribución normal estándar
Se observa en la misma que su media es cero, es decir, μ = 0 y que en el intervalo abierto (−4, 4), se encuentra básicamente, el 100 % delárea bajo la curva de su distribución (p = 1).
En este texto simbolizaremos con la letra Z cuando una variable tenga distribución normal estándar.
El cálculo de probabilidades de una variable con distribución normal estándar, generalmente se realiza utilizando tablas de su distribución. Estas tablas se encuentran en la mayoría de los libros de probabilidad y estadística. Si quisieramos calcular la probabilidad de que una variable con distribución normal estándar esté entre −4 y 0, es decir, P(−4 ≤ Z ≤ 0), es claro que esta probabilidad es igual a 0,5; ver en la figura 1.3.3 que elárea a la izquierda de cero es la mitad delárea total bajo la curva, por ser esta una curva simétrica con respecto a su media. Ahora si lo que queremos es calcular la probabilidad de que la variables Z tome valores menores o iguales que 1,88, es decir, P (Z ≤ 1.88), basta hallar elárea bajo la curva de distribución de la variable Z a la izquierda del valor 1,88 que se muestra en la figura 1.3.4; una opción razonable, es utilizar una tabla de la distribución normal estándar (ver la tabla 1.3.1 en la que se muestran valores de la distribución normal estándar). En esa tabla se muestra en la primera columna los valores de la variable Z con una cifra decimal, es decir, en el caso 1,88, en esa primera columna debemos buscar el valor 1,8 y en la primera fila se muestran los valores correspondientes a las centésimas de la variable Z, es decir, en este caso, tendríamos que buscar en esa primera fila el valor 0,08; para hallar la probabilidad pedida, basta desplazarse hacia la derecha por la fila que contiene a 1,8 y luego hacer los mismo hacía abajo sobre la columna que contiene a 0,08, el número en la intersección de esas dos líneas es el valor en probabilidad para elárea a la izquierda de 1,88, que en este caso es 0,97 (si se toma con dos cifras decimales).
Tabla 1.3.1 Área a la izquierda de un valor de Z dado
Figura 1.3.4. Área a la izquierda de 1.88 en la distribución normal estándar
El siguiente teorema muestra un procedimiento para convertir cualquier variable con distribución normal en una variable con distribución normal estándar.
Teorema 1.3.3 Sea X una variable con distribución normal con media μ y varianza σ², entonces la variable
tiene distribución normal estándar.
Demostración
Sea FZ la función de distribución para Z y fX la función de densidad para X, entonces
derivando a FZ con respecto a z, en la expresión (a), se tiene que
pero X tiene distribución normal con media μ y varianza σ², es decir, y además por lo que X = σZ + μ, entonces
la cual es precisamente la función de densidad de una variable con distribución normal estándar.
El teorema anterior dice que toda variable con distribución normal se puede transformar en una variable con distribución normal estándar, restándole a esta variable su media y luego dividiendo esta diferencia entre la raíz cuadrada de la varianza; es decir, entre su desviación estándar. Este teorema permite calcular probabilidades de valores de variables aleatorias con distribución normal a través de los valores correspondientes de variables aleatorias con