Tema 3 PDF
Tema 3 PDF
Tema 3 PDF
1 Introducción
Hasta ahora hemos estudiado herramientas que nos permiten describir las caracterı́sticas de un único
carácter. Sin embargo, en muchos casos prácticos, es necesario estudiar conjuntamente dos o más
caracteres, ası́ como la relación que hay entre ellos.
De ahora en adelante supondremos que sobre cada individuo se miden u observan dos caracteres X
e Y , o equivalentemente, que sobre cada individuo se observa el carácter bidimensional (X, Y ). Cada
observación vendrá dada por un par (xi , yi ), 1 ≤ i ≤ n, y por tanto ahora los datos observados serán
los n pares (x1 , y1 ), (x2 , y2 ), ..., (xn , yn ). Denotaremos por x1 , ..., xk a las k modalidades distintas
observadas del carácter X; y por y1 , ..., yp a las p modalidades distintas observadas del carácter Y .
En general k y p no tienen porqué coincidir.
X 3 2 4 2 1 2 5 2 3 2
Y 2 5 4 3 3 4 4 3 2 3
La frecuencia relativa conjunta del par (xi , yj ), que denotaremos fij , es la proporción de veces
que se observa dicho par, es decir,
nij
fij = , 1 ≤ i ≤ k, 1 ≤ j ≤ p.
n
Se tiene que
p
k X
X
fij = 1
i=1 j=1
1
La frecuencia (absoluta) marginal de xi , que denotaremos ni. , es el número de veces que X
presenta dicha modalidad. Se tiene que
p k
X X
ni. = nij , 1 ≤ i ≤ k, ni. = n
j=1 i=1
Estas frecuencias se representan en una tabla llamada tabla de frecuencias conjuntas o tabla
de doble entrada como sigue
Distribución conjunta de (X, Y )
X\Y y1 y2 ... yp
x1 n11 n12 ... n1p n1.
x2 n21 n22 ... n2p n2.
.. .. .. . . . ..
. . . . .. .
xk nk1 nk2 ... nkp nk.
n.1 n.2 ... n.p n
Nótese que las frecuencias marginales son las frecuencias de cada carácter, sin tener en cuenta el
otro:
Distribución marginal de X Distribución marginal de Y
2
Son distribuciones de un carácter, y por tanto tiene sentido, para cada una de ellas, calcular las
medidas estudiadas anteriormente. Ası́, si X e Y son variables hablaremos de la media marginal de
2
la variable X, x, la varianza marginal de la variable X, SX , la media marginal de la variable Y , y, y
2
la varianza marginal de la variable Y , SY .
Ejemplo 2.1 La tabla de frecuencias conjuntas con los datos del ejemplo 1.1 es
X\Y 2 3 4 5
1 0 1 0 0 1
2 0 3 1 1 5
3 2 0 0 0 2
4 0 0 1 0 1
5 0 0 1 0 1
2 4 3 1 10
3 Distribuciones condicionadas
De los n individuos en el estudio hay n.j con Y = yj . Podemos estar interesados en estudiar el
carácter X en este subconjunto de los datos originales. A la distribución de frecuencias del carácter
X en este subconjunto, definido por aquellos individuos con Y = yj , se le denomina distribución
de X condicionada a Y = yj . En esta distribución X presenta las modalidades x1 , x2 , ..., xk con
frecuencias (absolutas) condicionadas
Se tiene que
k
X k
X
ni/Y =yj = n.j , fi/Y =yj = 1.
i=1 i=1
3
Ejemplo 3.1 Con los datos del ejemplo 1.1, la distribución de frecuencias de X condicionada a
Y = 3 es
X/Y = 3 ni/Y =3 fi/Y =3
1 1 1/4
2 3 3/4
3 0 0
4 0 0
5 0 0
4 1
Existen p distribuciones condicionadas del carácter X correspondinetes a las distintas modalidades
de Y :
X/Y = y1 , X/Y = y2 , ..., X/Y = yp
Análogamente podemos considerar la distribución de Y condicionada a X = xi , que presenta las
modalidades y1 , y2 , ..., yp con frecuencias (absolutas) condicionadas
nj/X=xi = nij , 1 ≤ j ≤ p,
y frecuencias relativas condicionadas
nij
fj/X=xi = , 1 ≤ j ≤ p,
ni.
verificando que
p p
X X
nj/X=xi = ni. , fj/X=xi = 1.
j=1 j=1
Distribución de Y condicionada a X = xi , Y /X = xi
Y /X = xi nj/X=xi fj/X=xi
y1 ni1 ni1 /ni.
y2 ni2 ni2 /ni.
.. .. ..
. . .
yp nip nip /ni.
ni. 1
4
4 Relación entre las distribuciones
Relación 1. Se tiene que
nij nij ni.
fij = = × = fi. × fj/X=xi
n ni. n
nij n.j
= × = f.j × fi/Y =yj
n.j n
es decir, la frecuencia relativa conjunta es igual a la frecuencia marginal por la condicionada.
Relación 2. Si X es una variable, entonces
p
X
x̄ = f.j x|Y =yj
j=1
k
X
Análogamente, si Y es una variable, ȳ = fi. y|X=xi .
i=1
Relación 3. Si X es una variable, entonces
p p
X X ¡ ¢2
2 2
SX = f.j SX|Y =yj
+ f.j x − x|Y =yj
j=1 j=1
k
X k
X
Análogamente, si Y es una variable, SY2 = fi. SY2 |X=x + fi. (y − y|X=xi )2 .
i
i=1 i=1
5 Covarianza
Dada una variable bidimensional (X, Y ), definimos la covarianza entre X e Y como
n k p
1X 1 XX
SXY = (xi − x)(yi − y) = (xi − x)(yj − y)nij
n i=1 n i=1 j=1
Propiedades
2
1. Cov(aX + b, cY + d) = acSXY . 4. V ar(X + Y ) = SX + SY2 + 2SXY .
2
2. Cov(aX + bY, Z) = aSXZ + bSY Z . 5. V ar(X − Y ) = SX + SY2 − 2SXY .
2
3. SXX = SX . 6. |SXY | ≤ SX SY , con igualdad sii Y = a + bX,
para algunos a, b ∈ R.
5
Y Y
6 Independencia
Diremos que dos caracteres X e Y son independientes si
ni. × n.j
fij = fi. × f.j ⇔ nij = para todo i, j.
n
Si existe un i y un j que no cumplan la ecuación anterior, entonces las variables no son independientes.
Para que se dé la independencia ha de cumplirse la igualdad para todos los i, j.
Obsérvese que si X e Y son independientes, entonces las filas de la tabla de doble entrada son
todas proporcionales entre sı́, y lo mismo les ocurre a las columnas: son todas proporcinales entre sı́.
Propiedad 1. Si X e Y son independientes entonces las p distribuciones condicionadas X/Y = y1 ,
X/Y = y2 , ..., X/Y = yp son todas iguales entre sı́ y coinciden con la distribución marginal de X,
es decir, las frecuencias relativas coinciden:
nij ni. × n.j ni.
fi/Y =yj = = = = fi.
n.j n × n.j n
X\Y y1 y2 y3 y4
x1 3 5 2 4
x2 6 10 4 8
x3 12 20 8 16
6
Veámoslo a través de las distribuciones condicionadas X/Y = yj :
X/Y = y1 ni/Y =y1 fi/Y =y1 X/Y = y2 ni/Y =y2 fi/Y =y2
x1 3 3/21 = 1/7 x1 5 5/35 = 1/7
x2 6 6/21 = 2/7 x2 10 10/35 = 2/7
x3 12 12/21 = 4/7 x3 20 20/35 = 4/7
21 1 35 1
X/Y = y3 ni/Y =y3 fi/Y =y3 X/Y = y4 ni/Y =y4 fi/Y =y4
x1 2 2/14 = 1/7 x1 4 4/28 = 1/7
x2 4 4/14 = 2/7 x2 8 8/28 = 2/7
x3 8 8/14 = 4/7 x3 16 16/28 = 4/7
14 1 28 1
7 Dependencia funcional
Se dice que X depende funcionalmente de Y si a cada yj le corresponde una única modalidad xi
de X, es decir, si para cada j existe un único i con nij 6= 0, en otras palabras, en cada columna de
la tabla de doble entrada hay una única frecuencia conjunta no nula
7
Si X depende funcionalmente de Y , entonces las distribuciones X/Y = yj son degeneradas, es
decir, existe una única modalidad de X con fi/Y =yj 6= 0. Ası́, si X es una variable
2
x|Y =yj = xi , SX|Y =y
= 0.
j
8 Problemas
1. Se considera la variable bidimensional (X, Y ), cuya tabla de frecuencias viene dada por:
X\Y 1 2 4 6
1 2 0 1 1
3 3 1 0 1
5 0 1 0 5
Calcular:
P P
(a) i j nij ,
(c) x, y, Sxy .
F 3 4 6 7 5 8 7 3 5 4 8 5 5 8 8 8 5
L 5 5 8 7 7 9 10 4 7 4 10 5 7 9 10 5 7
8
3. Para estudiar la relación existente entre el peso y la estatura se tomó una muestra de 60 indivi-
duos, agrupándose los valores en intervalos. Se obtuvo la siguiente tabla:
P\E 1.55-1.65 1.65-1.75 1.75-1.85
50-55 2 1 0
55-60 2 2 1
60-65 1 3 2
65-70 1 10 8
Calcular:
(a) Distribución marginal del peso y la altura.
(b) Media y varianza marginales del peso y la altura.
4. Las 130 agencias de una entidad bancaria presentaban los siguientes datos correspondientes a
las variables:
X: saldo medio de las cuentas (en euros).
Y: proporción de cuentas a plazo fijo.
9
6. Dada una variable estadı́stica bidimensional (X, Y ), hallar la varianza de X + Y y de X − Y .
¿Qué ocurre cuando X e Y son independientes?
7. Sea (X, Y ) una variable bidimensional cuyas frecuencias absolutas conjuntas vienen recogidas
en la siguiente tabla:
X\Y y1 y2
-2 2 2
0 a 1
3 2 2a
8. La siguiente tabla muestra las frecuencias relativas conjuntas de la distribución de una variable
bidimensional (X, Y ).
Y
-1 0 1
X
0 4z t t
1 z t 3z
2 z 3z/2 3z/2
10