Estadistica Descriptiva
Estadistica Descriptiva
Estadistica Descriptiva
1.- INTODUCCIÓN.
Y
y1 … Yj … yp Total
X
X1 n11 n1j n1p n1.
. . … . … . .
xi ni1 nij nip nk.
. . … . … . .
Xk nk1 … nkj … nkp ni.
Total n.1 … n.j … n.p n..
Y
B1 … Bj … Bp Total
X
A1 n11 n1j n1p n1.
. . … . … . .
Ai ni1 nij nip nk.
. . … . … . .
Ak nk1 … nkj … nkp ni.
Total n.1 … n.j … n.p n..
Distribuciones marginales:
ni.
f i. =
N
Propiedades:
n. j
f. j =
N
Propiedades:
Y F.a.m. F.r.m.
Y1 … Yj … Yq
X
X1 n11 n1j n1q n1. f1.
. . . . . .
… …
. . . . . .
Xi ni1 nij niq ni. fi .
. . . . . .
… …
. . . . . .
Xp np1 … npj … npq np. fp.
F.a.m. n.1 … n.j … n.q N 1
F.r.m. f.1 … f.j … f.q 1
Distribuciones condicionadas:
=1,2…p, siendo:
n
f i j = ij
n. j
X nij fi j
X1 n1j f1 j
. .
…
. .
Xi nij fi j
. .
…
. .
Xp npj f pj
Total n.j 1
i.
Y Y1 … Yj … Yq Total
Xi ni1 nij … niq ni.
f ji f1i … f ji … f qi 1
Propiedades:
p q
∑ fi j = 1
i =1
y ∑f
j =1
j
i
=1
f ij = f i. f ji = f. j f i j
h k
mrs = ∑∑ ( xi − x) r ( yi − y ) s nij
i =1 j =1
A) Covarianza:
Se hace necesario introducir medidas que hagan relación a la
distribución conjunta. De entre ellas, la de mayor interés en todo análisis
estadístico es la covarianza Sxy, que se define como m11, siendo su fórmula:
h k
1
S xy =
N
∑∑ ( x − x) ( y − y) n
i =1 j =1
i i ij
Λ
1 h k
S xy
= ∑∑ ( xi − x)( yi − y)nij
N − 1 i=1 j =1
a = y − xSxy / Sx 2
b = Sxy / Sx 2
c = x − ySxy / Sy 2
d = Sxy / Sy 2
y − y = ( x − x) Sxy / Sx 2 y x − x = ( y − y ) Sxy / Sy 2
h k
S xy ∑∑ ( x − x)( y
i =1 j =1
i j − y )nij
r= =
SxS y h h
∑ (x
i =1
i − x) 2 ∑ ( y − y ) 2
i =1
6∑ d i2
ρ = 1− i
N3 − N
Donde d i = X i − Yi A este coeficiente también se le conoce como
D) Variables independientes:
Hay casos en los que parece razonable intentar resumir toda la nube de
puntos obtenida mediante una recta, con la que se trataría de formalizar la idea
de que existe una cierta relación lineal entre los valores de X y de Y. Una de las
variables jugará el papel de la variable independiente (X) y la otra
desempeñará el papel de dependiente de la primera (Y). La recta de regresión
de Y sobre X es la recta y= a + bx que minimiza el error cuadrático medio
(E.C.M.):
1 n
E.C.M . = ∑ ( yi − a − bxi ) 2
n i=1
Con la recta de regresión se intentar encontrar la recta que mejor
representa la nube de puntos, en el sentido de minimizar la media de los
1 n ⎛⎜ ⎞
2
⎛ cov x , y ⎞ n cov x ,i n
= ∑ ( yi − y ) + ⎜⎜
n i=1 ⎜
2
⎟⎟ ∑ ( xi − x) 2 − 2 ∑ (x − x)( y − y) ⎟⎟ =
⎝ υ x ⎠ i=1 υx i i
⎝ i =1
⎠
(cov x , y ) 2 ⎛ (cov x , y ) 2 ⎞
= υy − = υ y ⎜1 − ⎟
υx ⎜ υ υ ⎟
⎝ x y ⎠
10 10
8 8
6 6
4 4
2 2
0 0
0 50 100 150 0 5 10 15
r próximo a 1 r próximo a -1
10
9
8
7
6
5
4
3
2
1
0
0 50 100 150
r =0
9
8
7
6
5
y = 0,8301x
4
R2 = 0,9903
3
2
1
0
20 29 35 42 55 64 71 86 94 101
Hay ocasiones en que la nube de puntos se puede aproximar mejor a una función
logarítmica (y= ln x) o a una función exponencial ( y = aebx ) con lo que tendremos bien
una regresión logarítmica o bien una regresión exponencial.
n(∑ XY ) − (∑ X )(∑ Y )
r=
n ∑ X 2 − (∑ X ) 2 n ∑ Y 2 − (∑ Y ) 2
INTERSECCION.EJE(y;x) INTERSECCION.EJE(B2:B11;A2:A11)
Da la ordenada en el origen de la línea de regresión de y sobre x; es
decir: a = Y − b X
PRONOSTICO(z;y;x) PRONOSTICO(2;B2:B11;A2:A11)
Halla la predicción según la línea de regresión de y sobre x para el valor
z de la variable independiente
CRECIMIENTO(y;x;z:constante)CRECIMIENTO(A2:A8;B2:B8;B9:B11;0)
Halla las predicciones según según la línea de ajuste de x e y
exponencial (y = bmx) para los valores de la variable independiente
expresados en la variable z. constante es 1 ,o 0 según se considere
constante o no el modelo. Si no se especifica vale 1.
ERROR.TIPICO.XY(y;x) ERROR.TIPICO(B2:B11;A2:A11)
Devuelve el error típico del valor de y previsto para cada x de la
regresión. El error típico es una medida de la cuantía de error en el
pronóstico del valor de y para un valor individual de x. su valor viene
dado por:
⎡ 1 ⎤⎡ [ ]
n(∑ xy ) − (∑ x )(∑ y ) ⎤
2
⎥ ⎢n∑ y − (∑ y ) −
2
S yv = ⎢ 2
⎥
⎣ n(n − 2 ) ⎦ ⎢⎣ n∑ x 2 − (∑ x )
2
⎥⎦
para indicar si los datos del rango de entrada están organizados en filas o en
columnas. Si la primera fila del rango de entrada contiene rótulos, hay que
activar de verificación rótulos en la primera fila o viceversa si se hayan en la
primera columna. En cuanto a las opciones de salida, en el rango campos de
salida hay que introducir la referencia correspondiente a la celda superior
izquierda de la tabla de resultados (matriz de correlaciones). Microsoft Excell
sólo completará media tabla, ya que la correlación entre dos rangos de datos
es independiente del orden en que se procesen dichos rangos. Las celdas de la
tabla de resultados con coordenadas de filas y de columnas iguales contendrán
el valor 1, ya que cada conjunto está perfectamente correlacionado consigo
mismo. Los resultados se pueden insertar en la hoja actual, en una hoja nueva
del libro actual o en un libro nuevo según se desee.
X Y Z X Y Z
2 4 2 X 1
3 5 4 Y 0,9899319 1
6 10 6 Z 0,98021232 0,98302129 1
8 11 7
10 15 10
VARIABLES
COVARIANZA
X Y Z
2 4 2 X Y Z
3 5 4 X 5,6875
6 10 6 Y 12 9,25
8 11 7 Z 7,96 10,8 3,6875
10 15 10
BIBLIOGRAFÍA.