Science">
Nothing Special   »   [go: up one dir, main page]

Estadistica Inferencial 2 Investigacion Unidad 1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 17

Índice

Introducción........................................................................................................... 1

Unidad I: Regresión lineal múltiple. ..................................................................... 2

1.1 Regresión lineal múltiple. ............................................................................... 2

1.1.1 Pruebas de hipótesis en regresión lineal múltiple. ................................... 4

1.1.2 Intervalos de confianza y predicción en regresión múltiple. .................... 7

1.1.3 Uso de un software estadístico. .................................................................. 9

1.2 Regresión no lineal. ..................................................................................... 11

Conclusión ........................................................................................................... 14

Glosario ................................................................................................................ 15

Bibliografía........................................................................................................... 16
Introducción

Página | 1
Unidad I: Regresión lineal múltiple.
1.1 Regresión lineal múltiple.

La regresión lineal múltiple es la gran técnica estadística para comprobar


hipótesis y relaciones explicativas. Una de las condiciones que se deben cumplir
para poder aplicar la regresión lineal múltiple es que la variable dependiente
(resultado) debe ser escalar (numérica) o bien ordinal de más de 5 categorías, es
decir, las categorías de la variable dependiente deben tener un orden interno o
jerarquía.

Por ejemplo: nivel de ingresos, peso, número de hijos, justificación del aborto en
una escala de 1-nunca a 10-siempre.

La regresión lineal múltiple permite generar un modelo lineal en el que el valor de la


variable dependiente o respuesta (Y) se determina a partir de un conjunto de
variables independientes llamadas predictores (X1, X2, X3…). Es una
extensión de la regresión lineal simple, por lo que es fundamental comprende resta
última. Los modelos de regresión múltiple pueden emplearse para predecir el valor
de la variable dependiente o para evaluar la influencia que tienen los
predictores sobre ella (esto último se debe que analizar con cautela para
no malinterpretar causa-efecto)

La regresión lineal múltiple trata de ajustar modelos lineales o linealizables entre


una variable dependiente y más de unas variables independientes. La regresión
lineal es una técnica estadística destinada a analizar las causas de por qué pasan
las cosas. A partir de los análisis de regresión lineal múltiple podemos: identificar
que variables independientes (causas) explican una variable dependiente
(resultado).

Los modelos de regresión múltiple estudian la relación entre I una variable de interés
Y (variable respuesta o dependiente) y I un conjunto de variables explicativas o

El modelo de regresión que involucra más de una variable regresadora o regresiva


se llama modelo de regresión múltiple. Como ejemplo, supóngase que la vida eficaz

Página | 2
de una herramienta de corte depende de la velocidad y del ángulo de corte. Un
modelo de regresión múltiple que podría describir esta relación es:

Donde “y” representa la vida de la herramienta, “x1”, la rapidez de corte y, “x2”, el


ángulo de corte. Este es un modelo de regresión lineal múltiple con dos regresores.

El parámetro β0 define la ordenada al origen del plano, algunas veces llamamos a


β1 y β2 coeficientes de regresión parciales.

La variable dependiente o respuesta “y” puede relacionarse con “k” variables


independientes. El modelo:

A partir de los análisis de regresión lineal múltiple podemos:


• Identificar que variables independientes (causas) explican una variable
dependiente (resultado).
• Comparar y comprobar modelos explicativos.
• Predecir valores de una variable, es decir, a partir de unas características
predecir de forma aproximada un comportamiento o estado.

Página | 3
1.1.1 Pruebas de hipótesis en regresión lineal múltiple.

Una prueba de hipótesis


es una regla que especifica si se
puede aceptar o rechazar una
afirmación acerca de una
población dependiendo de la
evidencia proporcionada por
una muestra de datos.

Una prueba de hipótesis


examina dos hipótesis opuestas
sobre una población: la hipótesis nula y la hipótesis alternativa. La hipótesis nula es
el enunciado que se probará. Por lo general, la hipótesis nula es un enunciado de
que "no hay efecto" o "no hay diferencia". La hipótesis alternativa es el enunciado
que se desea poder concluir que es verdadero de acuerdo con la evidencia
proporcionada por los datos de la muestra.

Con base en los datos de muestra, la prueba determina si se puede rechazar la


hipótesis nula. Usted utiliza el valor p para tomar esa decisión. Si el valor p es menor
que el nivel de significancia (denotado como α o alfa), entonces puede rechazar la
hipótesis nula.

Una hipótesis estadística es una afirmación sobre los valores de los parámetros de
una población o proceso, que es susceptible de probarse a partir de la información
contenida en una muestra representativa que es obtenida de la población.

La regresión lineal es una técnica estadística destinada a analizar las causas de por
qué pasan las cosas. A partir de los análisis de regresión lineal múltiple podemos:
identificar que variables independientes (causas) explican una variable dependiente
(resultado).

Página | 4
El propósito de la prueba de hipótesis no es cuestionar el valor calculado del
estadístico (muestral), sino hacer un juicio con respecto a la diferencia entre
estadístico de muestra y un valor planteado del parámetro.

La hipótesis global más importante sobre un modelo de regresión múltiple consiste


en ver si la regresión es significativa. Esto se logra probando la siguiente hipótesis:

Página | 5
Página | 6
1.1.2 Intervalos de confianza y predicción en regresión múltiple.

Estos son un rango de valores, derivado de los estadísticos de la muestra,


que posiblemente incluya el valor de un parámetro de población desconocido.
Debido a su naturaleza aleatoria, es poco probable que dos muestras de una
población en particular generen intervalos de confianza idénticos.

Estimación de punto: Este valor individual estima un parámetro de población


usando los datos de su muestra.

Margen de error: La estimación está sujeta a error de muestreo aleatorio. El


margen de error cuantifica este error e indica la precisión de su estimación

En los modelos de regresión múltiple con frecuencia es conveniente construir


estimaciones de intervalos de confianza para los coeficientes de regresión. Por
ejemplo, a partir de la siguiente tabla es claro que un estimador por intervalos de
cada coeficiente en lo individual está dado por:

Página | 7
También es posible obtener un intervalo de confianza con respecto a la respuesta
media en un punto particular, digamos X10, X20, XK… está dado por:

El intervalo de confianza se determina calculando una estimación de punto y luego


determinando su margen de error.

Predicción de regresión.

• Regresión Simple: Se presenta cuando una variable independiente ejerce


influencia sobre otra variable dependiente. Ejemplo: Y = f(x).
• Regresión Múltiple: Se presenta cuando dos o más variables independientes
influyen sobre una variable dependiente. Ejemplo: Y = f (x, w,).

La ecuación de Predicción de Regresión Simple permite hacer predicciones de una


variable en función de otra. La posibilidad de predicción aumenta si utilizamos más
de una variable predictora. Para resolver esta cuestión se define la ecuación de
Regresión Múltiple (puntuaciones directas):

Y=A + B_1X_1+B_2X2

Xi: Variable predictora (o explicativa).

Bi: Coeficiente de la variable predictora Xi.

A: Interceptal o constante

Página | 8
1.1.3 Uso de un software estadístico.

El uso del Software en la


Estadística es muy importante;
ya que en la mayoría de los
casos nos facilita los cálculos
Matemáticos y la elaboración
de gráficos y muchas otras
cosas. Estos softwares
contienen en su mayoría todas
las aplicaciones Estadísticas que se necesitan para hacer trabajos de Investigación
Estadística. También existen software para áreas específicas de la Estadística, que
son creados por especialistas de esas áreas, tal es el caso del área de Diseño de
Experimentos; los cuales contienen aplicaciones específicas para el estudio de los
Diseños Experimentales. En el Análisis de los Diseños Experimentales resulta de
gran importancia la utilización de un software, ya sea de uso general o de uso
específico; ya que facilita la obtención de la Tabla de Análisis de Varianza, gráficos
importantes, etc.

¿Qué es un software?

Es el nexo de unión entre el hardware y el hombre. Es un conjunto de programas


que acorta la barrera de lenguaje entre hombre y máquina estableciendo
procedimientos de comunicación entre ambos.

Tipos de software.

• De sistema: Es el software básico o sistema operativo.


• De aplicación: Facilitan la realización de tareas específicas.
• Software estadístico: Es un programa informático especialmente diseñado para
resolver problemas en el área de la estadística.

Existen muchos programas que no son especialmente estadísticos pero que


pueden hacer algunos cálculos aplicables en estadística aplicada. Estos

Página | 9
programas han impulsado y siguen impulsando la labor de los investigadores que
desean utilizar la estadística como apoyo en su trabajo.

Ventajas: La potencia de cálculo de un ordenador puede ayudar a un investigador


a realizar cientos o miles de contrastes de hipótesis en un tiempo muy reducido.

Inconvenientes: En los programas más complejos se necesita tener conocimientos


de programación, así como para realizar los cálculos más laboriosos.

Ejemplos de softwares estadísticos:

• Minitab: Es un programa de computadora diseñado para ejecutar funciones


estadísticas básicas y avanzadas. Combina lo amigable del uso de Microsoft
Excel con la capacidad de ejecución de análisis estadísticos.
• Stata: Es utilizado principalmente por instituciones académicas y
empresariales dedicadas a la investigación, especialmente en economía,
sociología, ciencias políticas, biomedicina y epidemiologia. Stata permite, entre
otras funcionalidades, la gestión de datos, el análisis estadístico, el trazado de
gráficos y las simulaciones.
• Statgraphics: Statgraphics es un paquete de estadística que realiza y explica
funciones básicas y avanzados de estadística.
• PSPP: Es una aplicación de software libre para el análisis de datos. Se
presenta en modo gráfico y está escrita en el lenguaje de programación C. Usa
la biblioteca científica GNU para sus rutinas matemáticas, y plotulits para la
generación de gráficos. Es un remplazo libre para el software propietario SPSS

Página | 10
1.2 Regresión no lineal.

La regresión no lineal es un método para encontrar un modelo no lineal para la


relación entre la variable dependiente y un conjunto de variables independientes. A
diferencia de la regresión lineal tradicional, que está restringida a la estimación de
modelos lineales, la regresión no lineal puede estimar modelos con relaciones
arbitrarias entre las variables independientes y las dependientes. Esto se lleva a
cabo usando algoritmos de estimación iterativos. Tenga en cuenta que este
procedimiento no es necesario para los modelos polinómicos simples de la forma
Y= A + BX**2. Definiendo W = X**2, obtenemos un modelo lineal simple, Y = A +
BW.

Ejemplo. ¿Puede pronosticarse la población basándose en el tiempo Un diagrama


de dispersión muestra que parece haber una estrecha relación entre la población y
el tiempo, pero la relación es no lineal y por eso exige la utilización de los métodos
de estimación especiales del procedimiento Regresión no lineal? Creando una
ecuación adecuada, como la del modelo logístico de crecimiento poblacional,
podemos obtener una buena estimación del modelo, lo que nos permitirá hacer
predicciones sobre la población para épocas que no se han sido medidas.

Estadísticos. Para las iteraciones: estimaciones de los parámetros y suma de


cuadrados residual. Para los modelos: suma de cuadrados para regresión, residual,
total corregido y no corregido, estimaciones de los parámetros, errores estándar
asintóticos y matriz de correlaciones asintóticas de estimaciones de los parámetros.

En estadística, la regresión no lineal es un problema de inferencia para un modelo


tipo:

y=f(x , θ)+ε
Basado en datos multidimensionales x, y, donde f es alguna función no lineal
respecto a algunos parámetros desconocidos θ. Como mínimo, se pretende obtener
los valores de los parámetros asociados con la mejor curva de ajuste
(habitualmente, con el método de los mínimos cuadrados). Con el fin de determinar

Página | 11
si el modelo es adecuado, puede ser necesario utilizar conceptos de inferencia
estadística tales como intervalos de confianza para los parámetros, así como
pruebas de bondad de ajuste.

El objetivo de la regresión no lineal se puede clarificar al considerar el caso de la


regresión polinomial, la cual es mejor no tratar como un caso de regresión no lineal.
Cuando la función f toma la forma:

f(x)=a x2+bx +c

La función f es no lineal en función de x pero lineal en función de los parámetros


desconocidos a, b, y c. Este es el sentido del término "lineal" en el contexto de la
regresión estadística. Los procedimientos computacionales para la regresión
polinomial son procedimientos de regresión lineal (múltiple), en este caso con dos
variables predictoras x y x2. Sin embargo, en ocasiones se sugiere que la regresión
no lineal es necesaria para ajustar polinomios. Las consecuencias prácticas
de esta mala interpretación conducen a que un procedimiento de optimización no
lineal sea usado cuando en realidad hay una solución disponible en términos de
regresión lineal. Paquetes (software) estadísticos consideran, por lo general, más
alternativas de regresión lineal que de regresión no lineal en sus procedimientos.
Página | 12
Consideraciones sobre datos de regresión no lineal

• Datos. Las variables dependientes e independientes deben ser cuantitativas.


Las variables categóricas, como la religión, la mayoría de edad o el lugar de
residencia, han de recodificarse como variables binarias (dummy) o como otro
de los tipos de variables de contraste.
• Supuestos. Los resultados son válidos sólo si se ha especificado una función
que describa con precisión la relación entre las variables independientes y las
dependientes. Además, la elección de buenos valores iniciales es muy
importante. Incluso si se ha especificado la forma funcional correcta para el
modelo, si no utiliza valores iniciales adecuados, puede que su modelo no
logre converger o puede que obtenga una solución que sea óptima localmente
en vez de una que sea óptima globalmente.
• Procedimientos relacionados. Muchos modelos que en un principio parecen
ser no lineales pueden ser transformados en un modelo lineal, el cual pueda
ser analizado usando el procedimiento Regresión lineal. Si no está seguro de
cuál es el modelo adecuado, el procedimiento Estimación curvilínea puede
ayudarle a identificar relaciones funcionales útiles que estén presentes en los
datos.

La regresión no lineal genera


una ecuación para describir la
relación no lineal entre una
variable de respuesta continua y
una o más variables predictoras
y predice nuevas
observaciones. Utilice la
regresión no lineal en lugar de
la regresión de mínimos
cuadrados ordinarios cuando no pueda modelar adecuadamente la relación con
parámetros lineales. Los parámetros son lineales cuando cada término del modelo
es aditivo y contiene solo un parámetro que multiplica el término.

Página | 13
Conclusión

xD

Página | 14
Glosario

• Regresión lineal: Es una técnica de modelado estadístico que se emplea para


describir una variable de respuesta continua como una función de una o varias
variables predictoras. Puede ayudar a comprender y predecir el comportamiento
de sistemas complejos o a analizar datos experimentales, financieros y
biológicos.
• Muestreo: Es una herramienta de la investigación científica. Su función básica
es determinar que parte de una realidad en estudio (población o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha población.
• Rango: Es el intervalo entre el valor máximo y el valor mínimo; por ello, comparte
unidades con los datos. Permite obtener una idea de la dispersión de los datos,
cuanto mayor es el rango, aún más dispersos están los datos (sin considerar la
afectación de los valores extremos).
• Intervalo: Es cada uno de los rangos de valores en que se ha decidido agrupar
parcialmente los datos con el propósito de hacer un resumen de ellos.
• Distribución: Función que representa las probabilidades que definen una
variable o un fenómeno aleatorios.
• Parámetros: es un número que se obtiene a partir de los datos de una muestra
estadística. Los parámetros estadísticos también se conocen como estadísticos
descriptivos.
• Variable: Magnitud que puede tener un valor cualquiera de los comprendidos en
un conjunto.
• Muestra: Es un subconjunto de datos perteneciente a una población de datos.
Estadísticamente hablando, debe estar constituido por un cierto número de
observaciones que representen adecuadamente el total de los datos.
• Inferencia: Es el conjunto de métodos que permiten inducir, a través de una
muestra estadística, el comportamiento de una determinada población. La
inferencia estadística, estudia entonces como, a través de la aplicación de dichos
métodos sobre los datos de una muestra, se pueden extraer conclusiones sobre
los parámetros de la población de datos.
Página | 15
Bibliografía

Galarza, T. C. (04 de Octubre de 2016). Prezi.com. Obtenido de Estadística :


https://prezi.com/8djuuagwtoor/estadistica/

Garcia, H. (2018). StuDocu. Obtenido de INTERVALOS DE CONFIANZA Y


PREDICCIÓN EN REGRESIÓN MULTIPLE: https://www.studocu.com/es-
mx/document/instituto-tecnologico-de-veracruz/seguridad-funcionamiento-y-
riesgo-ambiental/1121/17379505

IBM Corporation. (2021). IBM. Obtenido de Regresión no lineal:


https://www.ibm.com/docs/es/spss-statistics/SaaS?topic=regression-
nonlinear

López, F. J. (03 de Octubre de 2017). Economipedia. Obtenido de Inferencia


Estadística: https://economipedia.com/definiciones/inferencia-
estadistica.html

Minitab 18. (26 de Enero de 2022). Soporte Minitab 18. Obtenido de Explicación
Regresión no lineal: https://support.minitab.com/es-mx/minitab/18/help-and-
how-to/modeling-statistics/regression/supporting-topics/nonlinear-
regression/understanding-nonlinear-regression/

Súarez, I. M. (13 de Noviembre de 2021). Monografías.com. Obtenido de


Conceptos básicos de estadística descriptiva e inferencial:
https://www.monografias.com/trabajos96/conceptos-basicos-estadistica-
descriptiva-e-inferencial/conceptos-basicos-estadistica-descriptiva-e-
inferencial.shtml

Página | 16

También podría gustarte