PAPIME Manual Curso R
PAPIME Manual Curso R
PAPIME Manual Curso R
de anlisis estadstico R
de anlisis estadstico R
Mxico 2009
Contenido
Pg.
Presentacin 1
Captulo 1
1.1. Introduccin 3
1.3. Documentacin de R 4
Captulo 2
Captulo 3
Exploracin de datos 17
3.3. Histogramas 19
3.4. Ejemplo en R 20
Captulo 4
Inferencia estadstica 27
4.6. Ejemplos 32
Ejemplo 4.6.2. 34
Ejemplo 4.6.3. 37
4.7. Ejercicios 40
Captulo 5
5.2. Ejemplo 1 43
ii
Captulo 6
0 y 1 58
6.4. Interpretando a
6.5. Correlacin 60
6.8. Ejemplo 61
Bibliografa 69
iii
iv
Presentacin
Este material es una gua prctica para realizar anlisis estadstico de datos, utilizando el
software de anlisis estadstico R. Con ese fin se hace una revisin del entorno y el
lenguaje en un formato de curso, donde se describe a detalle cmo utilizar y aplicar
algunas de las muchas opciones disponibles, quedando una gran cantidad de ellas
todava por analizar.
Utilizando el paquete RCmdr, una herramienta que genera una interfaz de usuario tipo
Windows, nos enfocamos al uso del software y en cada seccin se indica cmo realizar
el anlisis correspondiente. A travs de ejemplos se dan algunos criterios que apoyan la
interpretacin de resultados.
1
2
Captulo 1
1.1. Introduccin
R es una versin de uso libre del lenguaje S y consiste en un ambiente para el cmputo
de anlisis estadsticos. Con un lenguaje de programacin propio, proporciona una
amplia variedad de tcnicas grficas y estadsticas. Ofreciendo a los usuarios avanzados
un entorno de programacin muy completo que les permite agregar nuevas
herramientas mediante la creacin de nuevas funciones. S y R han cambiado la forma
de analizar, visualizar y manejar los datos. Lo que probablemente los hacen los dos
lenguajes ms utilizados en la investigacin estadstica.
- R es un GNU, que se puede distribuir con licencia GLP o General Public (la
filosofa y objetivos del proyecto GNU se pueden ver en www.gnu.org.
3
Qu es, dnde se obtiene y cmo se instala
http://cran.r-project.org/bin
http://cran.r-project.org/bin/windows/base
http://cran.r-project.org/bin/windows/base/R.2.9.2-win32.exe
el cual es un programa ejecutable que instalar el sistema y los paquetes base, para que
funcione el R.
Adems del sistema base hay un conjunto de paquetes que extienden la funcionalidad
de R, los cuales se describen en la seccin 1.4.
1.3. Documentacin de R
2. Writing R extensions
3. R data import/export
4
Qu es, dnde se obtiene y cmo se instala
http://cran.r-project.org/doc/contrib/Burns-unwilling_S.pdf o
NOTA: Hay que recordar que R tiene como origen S, as que todo lo que funcione en S,
funciona tambin para R.
http://cran.r-project.org/other-docs.html o
http://cran.r-project.org/doc/contrib/rdebuts_es.pdf.
http://lark.cc.ukans.edu/~pauljohn/R/statsRus.html
1.3.5. Algunos otros como el sitio de J. Faraway, de Practical Regresin and ANOVA
using R, en:
http://cran.r-project.org/other-docs.html o
http://www.stat.lsa.umich.edu/~faraway/book/.
5
Qu es, dnde se obtiene y cmo se instala
La instalacin depende del sistema operativo en el que se est trabajando, para el caso
de Windows, sta se puede realizar desde el CRAN (seleccionando un sitio espejo),
aunque es ms recomendable bajar los archivos comprimidos desde un sitio espejo y
trabajar con la opcin Install package(s) from local zip files (figura 1.1.).
El primer paquete que se debe bajar e instalar es el Rcmdr, una vez instalado se
carga (Load) de la lista de paquetes disponibles, como se muestra en la figura 1.2.
6
Qu es, dnde se obtiene y cmo se instala
Al momento de cargar Rcmdr se despliega una lista de todos los paquetes R que se
necesitan para su adecuado funcionamiento, los cuales se deben bajar e instalar
siguiendo el procedimiento ya descrito.
7
Qu es, dnde se obtiene y cmo se instala
8
Captulo 2
9
Entorno Rcmdr y manejo de datos
10
Entorno Rcmdr y manejo de datos
Aqu se van a revisar slo algunas de las opciones que aparecen en el men de Rcmdr.
Para lo cual se trabajan algunos ejemplos, que muestran como ingresar los datos y
trabajar las diferentes opciones de anlisis.
11
Entorno Rcmdr y manejo de datos
Para generar el archivo se deben considerar dos variables: una llamada Carrera de tipo
Character y otra de nombre Alumnos de tipo Numeric, entonces se tienen 2
columnas con 7 datos cada una.
Lo cual se logra con la opcin del men: Datos -> Nuevos datos
12
Entorno Rcmdr y manejo de datos
Despus de eso hay que ingresar los datos y almacenarlos en disco, de otra manera
habra que teclearlos cada vez que se vaya a utilizar.
Y despus seguir los dilogos que se despliegan hasta tener los datos en un archivo tipo
texto, en la carpeta seleccionada.
13
Entorno Rcmdr y manejo de datos
El siguiente paso es seguir los dilogos para ubicar el archivo texto que previamente se
export y que ahora se va a importar. Al tener los datos en el entorno de Rcmdr, ya se
puede empezar a trabajar con ellos.
Otra opcin ms prctica es tener los datos en Excel e importarlos a Rcmdr, con la
secuencia que se presenta de la figura 2.10. a la 2.1.3.
14
Entorno Rcmdr y manejo de datos
Figura 2.13. Se debe seleccionar la hoja en que vienen los datos, que
generalmente es la hoja1.
Los datos se pueden revisar con el botn <editar datos> o <visualizar datos>, en cuyo
caso es importante cerrar la ventana de datos antes de realizar cualquier otra
actividad, de lo contrario da la sensacin de que R se pasma.
Para empezar a trabajar con R, se van a realizar unos grficos de histograma. Por lo que
se define la secuencia: Grficas -> Histogramas, y aparece una caja de dilogo para
definir la o las variables a trabajar.
20
10
0
Ejemplo01$Alumnos
15
Entorno Rcmdr y manejo de datos
16
Captulo 3
Exploracin de datos
Este primer paso se basa en la exploracin grfica de los datos, para contestar
preguntas como:
17
Exploracin de datos
Las herramientas bsicas son algunos grficos de uso comn. Como los de caja y
bigote, los de tallo y hojas, as como los clsicos histogramas.
Estas grficas se han vuelto muy populares, ya que ofrecen mucha informacin de
manera compacta. Muestran el rango de los datos, la dispersin a travs del rango
intercuartlico y la mediana como medida de tendencia central.
Estos diagramas fueron desarrollados por John Tukey en 1977. Permiten observar la
distribucin de los datos originales y son muy tiles para resumir y describir, sobre todo
cuando no se rebasan los cien datos.
18
Exploracin de datos
3.3. Histogramas
19
Exploracin de datos
Grficos como los histogramas de frecuencia muestran, tanto el valor central como la
distribucin de los datos y nos proporcionan una idea de la normalidad de la variable.
3.4. Ejemplo en R
Gnero M M M F F M F M M F
Peso 89 93 96 64 68 98 69 102 95 60
Gnero F M F M M F F M M F
Peso 49 75 54 79 81 56 59 84 85 60
Gnero M M F M F F M M M M
Peso 94 88 59 84 58 58 81 79 77 74
Gnero F M M F M F M F M M
Peso 51 72 73 54 78 55 77 58 81 83
Gnero F M F M M F F M M M
Peso 71 92 60 85 98 66 65 108 88 92
20
Exploracin de datos
Actividades
1. Generar el nuevo conjunto de datos.
2. Definir el nombre y tipo de variables.
3. teclear los datos.
Para generar el archivo se deben considerar dos variables: una llamada Gnero de tipo
Character y otra de nombre Peso de tipo Numeric, entonces se tienen 2 columnas
con 50 datos cada una.
Una vez que ya se tienen los datos, no hay que olvidar guardar el archivo. Y ahora si ya
se tienen los datos listos para anlisis
21
Exploracin de datos
90 100
peso
80
F M
gnero
22
Exploracin de datos
23
Exploracin de datos
- Utilizando los datos, de los siguientes ejercicios, explorar las opciones grficas y
descriptivas de Rcmdr. Haciendo grficos Boxplot; de Tallo y hojas e Histogramas.
30 40 35 50 50 55 50 35 35 60
45 45 20 50 55 70 45 60 30 45
35 50 20 45 75 55 55 45 35 30
25 40 25 45 50 55 40 40 40 40
15 40 25 35 35 50 50 30 50 35
75 97 71 65 84 27 99 91 99 82
96 58 94 43 10 10 91 10 94 43
74 73 68 54 50 49 81 10 97 76
10 94 79 80 82 71 88 88 47 73
71 99 86 10 84 93 77 98 44 10
Qu tan buenas son las calificaciones y qu se puede decir de este grupo de alumnos?
24
Exploracin de datos
Planta industrial A
15.8 22.7 26.8 19.1 18.5 14.4 8.3 25.9 26.4 9.8
22.7 15.2 23.0 29.6 21.9 10.5 17.3 6.2 18.0 22.9
24.6 19.4 12.3 15.9 11.2 14.7 20.5 26.6 20.1 17.0
22.3 27.5 23.9 17.5 11.0 20.4 16.2 20.8 13.3 18.1
Planta industrial B
27.8 29.1 23.9 24.4 21.0 27.3 14.8 20.9 21.7 15.8
18.5 22.2 10.7 25.5 22.3 12.4 16.9 31.6 22.4 24.6
16.5 27.6 23.0 27.1 12.0 20.6 19.7 19.9 26.5 21.4
28.7 23.1 16.2 26.7 13.7 22.0 17.5 21.1 34.8 31.5
25
26
Captulo 4
Inferencia estadstica
27
Inferencia estadstica
Uno de los ejemplos ms simples, pero nada estadstico, es lo que hacen quienes
cocinan ya que a travs de pequeas probadas saben si un guiso est o no en su
punto, esto previa homogenizacin del contenido de la cazuela y sin consumir todo su
contenido.
28
Inferencia estadstica
1
f ( y) = e 2
2
Donde se puede ver que la distribucin queda totalmente representada por dos
parmetros: (la media) y (la desviacin estndar). Con las siguientes propiedades.
29
Inferencia estadstica
1 2 [ z ]2
1
f ( z) = e
2
Cada conjunto de datos genera una distribucin con sus propios valores de , y f(y),
adems es difcil que el valor estimado a partir de la media sea exactamente , por lo
que es comn establecer intervalos de confianza en los que se espera que el verdadero
valor se encuentre entre un lmite inferior (LI) y uno superior (LS). Valores que al
representarse en la distribucin, como rea bajo la curva, indican una probabilidad.
30
Inferencia estadstica
De la misma forma el valor de -2.5756 < Z < 2.5756 delimita el 99%, con un
complemento de 1% que dividido entre 2 corresponde al 0.5% (0.01)/2 = 0.005), lo
interesante es que al asociar estos valores a los datos muestrales se pueden establecer
intervalos de confianza para estimar los valores poblacionales.
31
Inferencia estadstica
4.6. Ejemplos
32
Inferencia estadstica
Solucin
El primer paso consiste en establecer el par de hiptesis, en otras palabras: quin es
Ho y quin es Ha?
No realizar clculo alguno si no sabe contra que hiptesis se est trabajando
2. Seguir la secuencia
Estadsticos -> Medias -> Prueba t para una media
Resultados
One Sample t-test
data: Datos$Nitrgeno
t = -14.9766, df = 5, p-value = 2.403e-05
alternative hypothesis: true mean is not equal to 9.55
95 percent confidence interval:
9.081344 9.218656
sample estimates:
mean of x
9.15
33
Inferencia estadstica
Pregunta
Se tiene o no evidencia de que el valor promedio es de 9.55?
Tambin se puede hacer el anlisis con relacin a la cantidad de error contenido en los
datos, 2.0403e-05 = 0.000020403, que es el tamao del error que podra cometer si
rechazo Ho, en este caso 0.002403%, mucho menor que el 5%, el tamao de error
aceptado por convencin.
Ejemplo 4.6.2. Se analiz el contenido de silicio de una muestra de agua por dos
mtodos independientes, en un intento por mejorar la precisin de la determinacin. De
acuerdo a los siguientes datos.
34
Inferencia estadstica
Solucin
El primer paso consiste en establecer el par de hiptesis, en otras palabras: quin es
Ho y quin es Ha?
Ha: 1 2 o 1 2 0
Ho: 12 = 22 o 12 = 1 y Ha: 12 22 o 1 1
2 2
2 2 2
Este par de hiptesis permite probar que las precisiones son diferentes.
2
2
2
2
Este ltimo par de hiptesis permite probar que el mtodo modificado (2) tiene menos
variabilidad (mayor precisin) que el mtodo original (1).
3. Seguir la secuencia:
4. Seguir la secuencia:
35
Inferencia estadstica
5. Seguir la secuencia:
Resultados
sample estimates:
mean in group modificado mean in group original
149.0 143.6
> tapply(Datos$ppm, Datos$mtodo, var, na.rm=TRUE)
modificado original
8.5 66.8
36
Inferencia estadstica
Sujeto 1 2 3 4 5 6 7 8 9 10 11
Antes 7.6 9.9 8.6 9.5 8.4 9.2 6.4 9.9 8.7 10.3 8.3
Despus 14.7 14.1 11.8 16.1 14.7 14.1 13.2 14.9 12.2 13.4 14.0
37
Inferencia estadstica
Solucin
3. Seguir la secuencia
38
Inferencia estadstica
39
Inferencia estadstica
4.7. Ejercicios
Mitad 66 88 75 90 63 58 75 82 73 84 85 93 70 82 90
Fin 73 91 78 86 69 67 75 80 76 89 81 96 76 90 97
40
Captulo 5
Media total
41
Anlisis de varianza y diseos de experimentos
Ec. (1)
Ec. (2)
Ec. (3)
42
Anlisis de varianza y diseos de experimentos
Sigue siendo un diseo de una va pero hay alguna fuente con un gradiente de
variacin, que influye o afecta en el experimento, por lo tanto hay que cuantificar su
efecto y eliminarlo de la varianza dentro de tratamientos, para evitar que nos conduzca
a valores bajos de F y se llegue a conclusiones errneas.
5.2. Ejemplo 1
43
Anlisis de varianza y diseos de experimentos
Tratamiento
(Kg N/Ha)
0 104 114 140
90
50 134 130 144 174
100 146 142 152 156
150 147 160 160 163
200 131 148 154 163
Solucin
2. Seguir la secuencia:
Datos -> Modificar variables de los datos activos -> Convert numeric variables to factor
44
Anlisis de varianza y diseos de experimentos
5. Seguir la secuencia:
Esto quiere decir que se debe conseguir el paquete mvtnorm e instalarlo, antes de lograr que se
despliegue el dilogo de ANOVA y empezar a tener resultados.
45
Anlisis de varianza y diseos de experimentos
Resultados
Aqu Pr(>F) equivale al p-value y esto indica que se rechaza Ho, entonces al
menos un par de medias es diferente, PERO CUALES?
Estas son las medias de cada tratamiento, aqu se aprecia cul es la menor y
la mayor, pero hay aportar evidencia estadstica de esta diferencia.
46
Anlisis de varianza y diseos de experimentos
47
Anlisis de varianza y diseos de experimentos
p Bonf p adj
Tratamiento50-Tratamiento0 0.063 0.042
Tratamiento100-Tratamiento0 0.032 0.022
Tratamiento150-Tratamiento0 0.006 0.005
Tratamiento200-Tratamiento0 0.032 0.023
Tratamiento100-Tratamiento50 1.000 0.997
Tratamiento150-Tratamiento50 1.000 0.785
Tratamiento200-Tratamiento50 1.000 0.997
Tratamiento150-Tratamiento100 1.000 0.925
Tratamiento200-Tratamiento100 1.000 1.000
Tratamiento200-Tratamiento150 1.000 0.925
> plot(.Pairs)
> remove(.Pairs)
48
Anlisis de varianza y diseos de experimentos
Tukey contrasts
Tratamiento50-Tratamiento0 ( )
Tratamiento100-Tratamiento0 ( )
Tratamiento150-Tratamiento0 ( )
Tratamiento200-Tratamiento0 ( )
Tratamiento100-Tratamiento50 ( )
Tratamiento150-Tratamiento50 ( )
Tratamiento200-Tratamiento50 ( )
Tratamiento150-Tratamiento100 ( )
Tratamiento200-Tratamiento100 ( )
Tratamiento200-Tratamiento150 ( )
-40 -20 0 20 40 60 80
Aqu valdra la pena, realizar un grfico de cajas, por cada tratamiento, que puede
apoyar la conclusin final. El cual, a estas alturas del partido, es un hecho que Ud.
apreciable lector, ya sabe cmo se hace.
160
140
Lechuga
120
100
Tratamiento
El criterio prctico es: los tratamientos cuyas cajas se interceptan son iguales
y los que no, pues entonces son diferentes. Lo mejor es concluir con base en
los resultados de la prueba de Tukey.
49
Anlisis de varianza y diseos de experimentos
Lote
1 2 3 4 5
23.46 23.59 23.51 23.28 23.29
23.48 23.46 23.64 23.40 23.46
23.56 23.42 23.46 23.37 23.37
23.39 23.49 23.52 23.46 23.32
23.40 23.50 23.49 23.39 23.38
5.3.2.. Para probar 4 dietas diferentes sobre el incremento en peso de cerdos se tienen
los siguientes datos.
Peso de los cerdos (Kgs)
Dieta 1 Dieta 2 Dieta 3 Dieta 4
60.8 68.7 102.6 87.9
57.0 67.7 102.1 84.2
65.0 74.7 100.2 83.1
58.6 66.3 96.5 85.7
61.7 69.8 90.3
50
Anlisis de varianza y diseos de experimentos
Sujeto
Distancia (pies) 1 2 3 4 5
4 10 6 6 6 6
6 7 6 6 1 6
8 5 3 3 2 5
10 6 4 4 2 3
51
Anlisis de varianza y diseos de experimentos
52
Captulo 6
Y = f ( X ) = 0 + 1 X
Donde:
0 ordenada al origen
1 pendiente
53
Anlisis de Regresin Lineal
En un anlisis de regresin lineal simple, el problema es encontrar los valores que mejor
estimen a los parmetros 0 y 1 . A partir de una muestra aleatoria.
M
Yn = 0 + 1 X n + n
donde:
Y1 1 X1 1
Y2 1 X 2 0 2
M = + = Y = X +
M 1 M
Y 1 X n
n n
54
Anlisis de Regresin Lineal
cuadrados es:
n n
(Yi Y$i )2 = (Yi $0 $1 X i )2
i =1 i =1
n
El problema ahora es encontrar los valores de $0 y $1 tales que (Yi 0 1 X i ) sea
2
i =1
mnimo.
Solucin:
n
Si Q = (Yi 0 1 X i ) , entonces
2
i =1
Q n
= 2 (Yi 0 1 X i ) = 0 (1)
0 i =1
Q n
= 2 (Yi 0 1 X i ) ( X i ) = 0 (2)
1 i =1
(NOTA: las derivadas parciales se igualan a cero para determinar los puntos crticos, que
sern mnimos). Esto conduce a las Ecuaciones Normales de Mnimos Cuadrados
n n
Y
i =1
i = n 0 + 1 X i
i =1
n n n
X iYi = 0 X i + 1 X i2
i =1 i =1 i =1
X t X = X t Y
de donde
55
Anlisis de Regresin Lineal
= ( X t X) 1 ( X t Y)
n n n n
Yi X i2 X i X i Yi
i= i =1 i =1 i =1
b0 = 2
n
n
n X i2 X i
i =1 i =1
n n n
n X iYi - X i Yi
i =1 i= i =1
b1 = 2
n n
n X i2 X i
i =1 i =1
1) Yi Y desviacin total
3) Yi Y$i error
56
Anlisis de Regresin Lineal
Yi Y = (Yi Y ) + (Yi Y i )
Ha: i 0
Fuente g.l. SC CM FC Ft
de
variacin
Regresin 1 SCReg CMReg CM Re g F1 ,1,n 2
CM Error
Error n2 SCError CMError
Residual
Total n1 SCTotal
57
Anlisis de Regresin Lineal
0 y 1
6.4. Interpretando a
Ho: 1 = 0
Caso 1.- Ho: 1 = 0 No se rechaza. Es decir que la pendiente es cero o que no
58
Anlisis de Regresin Lineal
Caso 2.- Ho: 1 = 0 se rechaza (es decir, si hay pendiente o en otras palabras si
b). El modelo puede tener un trmino lineal ms, quizs un trmino cuadrtico.
Y
Figura 6.5. La relacin entre X y Y no es lineal.
ajustar un modelo sin 0 , siempre y cuando exista experiencia previa o teora que
sugiera que la recta ajustada debe pasar por el origen y que existan datos alrededor del
origen para mejorar la informacin sobre 0 .
59
Anlisis de Regresin Lineal
6.5. Correlacion
1) r [-1,1]
3) 1 > 0 r>0
1 < 0 r < 0
1 = 0 r = 0
donde, r 2 [0,1]
60
Anlisis de Regresin Lineal
Las tcnicas de diagnstico son esenciales para detectar desacuerdos entre el modelo y
los datos para los cuales se ajusta ste. Esto se hace a travs del anlisis de los
residuos.
Los supuestos que se hacen del estudio del anlisis de regresin son:
La relacin entre Y y X es lineal.
Los errores tienen media cero
Los errores tienen varianza constante 2.
Los errores no estn correlacionados (son independientes).
Los errores se distribuyen normalmente.
Las posibles violaciones al modelo se pueden detectar a travs de los residuos y son:
Evidencias que sugieren que la forma del modelo no es la apropiada.
Presencia de casos extraordinarios (outliers) en los datos.
Evidencia que sugieren varianza no constante.
Evidencia de que la distribucin de los errores no proviene de una distribucin
normal.
Autocorrelacin, que se define como la falta de independencia de los residuos
(errores).
6.8. Ejemplo
61
Anlisis de Regresin Lineal
Y X1 X2
100 7 28
104 11 27
106 13 29
109 15 31
115 16 26
118 18 24
123 20 20
131 23 18
136 25 22
139 28 20
150 33 19
151 34 17
153 39 14
158 41 12
159 42 14
164 44 13
1. Seguir la secuencia:
130
120
110
100
10 20 30 40
X1
62
Anlisis de Regresin Lineal
160
150
140
Y
130
120
110
100
15 20 25 30
X2
63
Anlisis de Regresin Lineal
Call:
lm(formula = Y ~ X1, data = regre01)
Residuals:
Min 1Q Median 3Q Max
-4.2100 -2.2784 -0.3152 2.6094 4.7640
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 86.17092 1.87143 46.05 < 2e-16 ***
X1 1.80260 0.06661 27.06 1.73e-13 ***
Este ltimo valor indica que hay un buen ajuste lineal entre la variable Y y la
variable X1.
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.106 on 14 degrees of freedom
Multiple R-Squared: 0.9812, Adjusted R-squared: 0.9799
F-statistic: 732.3 on 1 and 14 DF, p-value: 1.726e-13
Call:
lm(formula = Y ~ X2, data = regre01)
Residuals:
64
Anlisis de Regresin Lineal
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 202.819 7.051 28.76 7.46e-14 ***
X2 -3.381 0.325 -10.40 5.73e-08 ***
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 7.676 on 14 degrees of freedom
Multiple R-Squared: 0.8854, Adjusted R-squared: 0.8772
F-statistic: 108.2 on 1 and 14 DF, p-value: 5.732e-08
Call:
lm(formula = Y ~ X1 + X2, data = regre01)
Residuals:
Min 1Q Median 3Q Max
-3.7098 -2.3772 -0.8203 1.7529 5.1548
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 101.1684 11.9726 8.450 1.22e-06 ***
X1 1.5875 0.1818 8.731 8.48e-07 ***
65
Anlisis de Regresin Lineal
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.041 on 13 degrees of freedom
Multiple R-Squared: 0.9833, Adjusted R-squared: 0.9807
F-statistic: 382.8 on 2 and 13 DF, p-value: 2.798e-12
66
Anlisis de Regresin Lineal
Los siguientes datos son parte de un estudio grande conducido por el Dr. Rick Linthurst
de la Universidad estatal de North Carolina. El propsito de la investigacin fue
identificar las principales caractersticas del suelo que influyen en la produccin de
biomasa area en el pasto de pantano Spartina alterniflora en el estuario del Cabo de
Miedo en North Carolina.
67
Anlisis de Regresin Lineal
68
Bibliografa
Cervantes, S. A., Rivera, G. P. y De la Paz L. J. M., 2004, SPSS. Una Herramienta para
el Anlisis Estadstico de Datos, FES Zaragoza UNAM, Mxico, 77 pp.
Freund, J. E. y Simon, G. A., 1992, Estadstica Elemental, Prentice Hall, Inc. U.S.A.
69
Bibliografa
70
Manejo prctico del software
de anlisis estadstico R
1. Edicin
www.sisal.unam.mx
enlinea.zaragoza.unam.mx/biomat