Science">
Nothing Special   »   [go: up one dir, main page]

Interpretación Del Test de Chi-Cuadrado

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 4

Rev Chil Pediatr 2007; 78 (4): 414-417 BIOESTADÍSTICA

BIOESTATISTICS

χ2)
Interpretación del test de Chi-cuadrado (χ
en investigación pediátrica

JAIME CERDA L.1, LUIS VILLARROEL DEL P.2

1. Pediatra, Programa de Especialidad en Salud Pública. Departamento de Salud Pública, Facultad de Medicina,
Pontificia Universidad Católica de Chile.
2. Doctor en Estadística. Departamento de Salud Pública, Facultad de Medicina, Pontificia Universidad Católica de Chile.

ABSTRACT

Interpretation of Chi-square test in pediatric investigation


Qualitative variables are often used in pediatric research, for example, newborn gender (male, female) or
malnutrition level (lesser, moderate, severe). In order to determine the association or independence of two
qualitative variables with a certain level of significance, a frequently used statistical tool is available: chi–
square test (χ2). The present article explains the theoretical background of the test, the methodology
employed for calculating the χ2 statistic and its correct interpretation, exemplifying these concepts using a
real investigation. In simple terms, chi–square test (χ2) compares the results observed in an investigation
with a set of expected results calculated under the assumption that both variables are independent from
each other. The difference between the observed and expected results is summarized in the value of the χ2
statistic, which has an associated p–value; according to its magnitude, the independence hypothesis is
either supported or rejected. In consequence, the application of the chi–square test (χ2) allows the
investigator to determine if two variables are associated or are mutually independent, an affirmation that
can be statistically sustained.
(Key words: Chi–square, statistics, investigation, pediatrics).
Rev Chil Pediatr 2007; 78 (4): 414-417

RESUMEN

Numerosos protocolos de investigación en pediatría trabajan con variables de tipo cualitativo, por
ejemplo, sexo del recién nacido (masculino, femenino) o grado de desnutrición (leve, moderado, severo).
Para determinar la asociación o independencia de dos variables cualitativas con un cierto grado de
significancia, se dispone de una herramienta estadística frecuentemente utilizada, el test de chi–cuadrado
(χ2). El presente artículo explica el fundamento teórico del test, la metodología de cálculo del estadístico χ2
y su correcta interpretación, ejemplificando estos conceptos mediante una investigación real. En términos
simples, el test de chi–cuadrado (χ2) contrasta los resultados observados en una investigación con un
conjunto de resultados teóricos, estos últimos calculados bajo el supuesto que las variables fueran

Trabajo recibido el 4 de abril de 2007, devuelto para corregir el 07 de mayo de 2007, segunda versión el 24 de mayo de
2007, aceptado para publicación el 18 de junio de 2007.

Correspondencia a:
Dr. Jaime Cerda L.
E-mail: jcerdal@gmail.com

414 Revista Chilena de Pediatría - Julio-Agosto 2007


TEST DE CHI CUADRADO

independientes. La diferencia entre los resultados observados y esperados se resume en el valor que
adopta el estadístico χ2, el cual tiene asociado un valor–p, por debajo del cual se acepta o rechaza la
hipótesis de independencia de las variables. De esta forma, al someter los resultados de una investigación
al test de chi–cuadrado (χ2) el investigador puede afirmar si dos variables en estudio están asociadas o
bien son independientes una de la otra, afirmación que cuenta con un sustento estadístico.
(Palabras clave: χ2, estadística, investigación, pediatría).
Rev Chil Pediatr 2007; 78 (4): 414-417

Introducción test de χ2 compara los resultados observados


con resultados teóricos, estos últimos calcula-
En investigación pediátrica, frecuentemente dos bajo el supuesto que las variables fuesen
se trabaja con variables de tipo cualitativo (tam- independientes entre sí, es decir, bajo el su-
bién conocidas como variables categóricas) ta- puesto que H0 fuese verdadera. Si los resulta-
les como sexo, grado de desnutrición o “niños dos observados difieren significativamente de
mayores de 10 años” (variable cuantitativa los resultados teóricos, es decir, difieren de H0,
transformada en cualitativa). Los valores que es posible rechazar H0 y afirmar que H1 es
toman estas variables se resumen en “tablas de verdadera, concluyendo que las variables están
frecuencias”, las cuales permiten ordenarles y asociadas. Por el contrario, si los resultados
comparar su ocurrencia. Si el interés del inves- observados y teóricos no difieren significati-
tigador es establecer la relación (asociación o vamente, se confirma la veracidad de H0 y se
independencia) entre dos variables, los datos se afirma que las variables son independientes2,3.
disponen en “tablas de contingencia”, las cua- Mediante el siguiente ejemplo, tomado de una
les incluyen en sus columnas los distintos nive- investigación real, se ilustrarán estos concep-
les que adopta la primera variable (ej. masculi- tos.
no, femenino) y en sus filas los distintos niveles
que adopta la segunda variable (ej. desnutrición Ejemplo
leve, desnutrición moderada y desnutrición se- Waisman y colaboradores describieron en
vera). 1998 la epidemiología de los accidentes infanti-
Para determinar la asociación o indepen- les ocurridos en la Región Centro Cuyo, Argen-
dencia de dos variables cualitativas, en 1.900 tina4. Uno de sus objetivos fue determinar si
Pearson introdujo el test de chi–cuadrado (χ2), existía alguna asociación entre la tasa de inci-
herramienta estadística ampliamente difundida dencia de consultas por accidentes y la esta-
en investigación biomédica1. Este test contras- ción del año. Para ello, compararon la propor-
ta dos hipótesis, una hipótesis nula o hipótesis ción de consultas por accidentes en invierno y
de independencia de las variables (H0) y una en verano. La tabla 1 resume sus observacio-
hipótesis alternativa o hipótesis de asociación nes.
de las variables (H1). En términos simples, el Si la variable “tipo de consulta” fuese inde-

Tabla 1. Tabla de contingencia de las variables “tipo de consulta” y “estación del año”4

Tipo de consulta Invierno Verano Total

Accidentes 1 418 (a) 2 221 (b) 3 639


No accidentes 20 133 (c) 14 269 (d) 34 402
Total 21 551 16 490 38 041
Tasa de incidencia § 6,6% 13,5% 9,6%
§ Tasa de incidencia = (consultas por accidentes/consultas totales) × 100

Volumen 78 - Número 4 415


CERDA J. y col.

pendiente de la variable “estación del año”, la diferencias en valores positivos. La siguiente


tasa de incidencia de consultas por accidentes fórmula entrega el valor del estadístico: χ2 =
en ambas estaciones deberían ser iguales. En el [(a–a’)2/a’] + [(b–b’)2/b]’ + [(c–c’)2/c’] + [(d–
ejemplo, se observa que la tasa de incidencia de d’)2/d’]. Utilizando los valores observados y
consultas por accidentes en verano es superior teóricos del ejemplo, el valor de estadístico χ2
a la registrada en invierno (13,5% vs 6,6%), por es el siguiente:
lo tanto, es posible afirmar que las variables χ2 = [(1.418–2.062)2/2.062] + [(2.221–
“tipo de consulta” y “estación del año” están 1.577)2/1.577] + [(20.133–19.489)2/19.489] +
asociadas, más ignoramos si esta asociación es [(14.269–14.913)2/14.913] = 512,5. A mayor
estadísticamente significativa. Para objetivar la valor del estadístico χ2, mayor es la diferencia
asociación entre las dos variables, se utiliza el entre los valores observados y teóricos, por
test de χ2. consiguiente, más alejados están los valores
La hipótesis nula (H0) del test de χ2 apoya la observados de los valores calculados bajo el
independencia de las variables, en otras pala- supuesto que las variables fuesen independien-
bras, el “tipo de consulta” es independiente de tes (H0 verdadera). En consecuencia, a mayor
la “estación del año”. Por el contrario, la hipó- valor del estadístico χ2, mayor es el grado de
tesis alternativa (H1) apoya la asociación de las asociación entre las variables (H1 verdadera).
variables, es decir, el “tipo de consulta” se El siguiente paso consiste en evaluar si el
asocia a la “estación del año”. El test de χ2 valor que toma el estadístico χ2 es significativo.
contrasta los resultados observados con valo- Para ello, se utiliza la tabla de distribución
res teóricos, estos últimos calculados bajo el probabilística de χ2, la cual es dependiente de
supuesto que H0 es verdadera. Por consiguien- los “grados de libertad” (estimador del número
te, se deben calcular los valores teóricos de la de categorías independientes en un test particu-
tabla de contingencia asumiendo que la propor- lar o experimento estadístico). En una tabla de
ción de consultas por accidentes en invierno y contingencia de “r” filas y “k” columnas, los
verano son iguales entre sí e iguales a la pro- grados de libertad son igual al producto del
porción de consultas por accidentes totales número de filas menos 1 (r–1) por el número de
(9,6%). En la tabla 2 se presentan los valores columnas menos 1 (k–1). Para el caso de va-
teóricos que toman las variables asumiendo la riables dicotómicas, es decir, variables que to-
veracidad de H0. Nótese que los valores totales man solamente dos niveles (como las del ejem-
no cambian, sólo lo hacen los valores de los plo), los grados de libertad son igual a 1. En la
niveles que toma cada variable (a’, b’, c’ y d’). tabla de distribución probabilística de χ2, se
El estadístico χ2 dimensiona cuánto difieren ubica en la fila correspondiente al número de
los valores observados (tabla 1) de los valores grados de libertad el valor del estadístico χ2,
teóricos (tabla 2). Se calcula sumando el valor determinándose su valor–p. En el ejemplo, el
del cuadrado de la diferencia del valor observa- estadístico χ2 (512,5) con 1 grado de libertad
do en cada casilla y su valor teórico, dividido tiene un valor–p menor a 0,005. Esto significa
por el valor teórico. La razón para elevar las que existe una probabilidad menor a 0,005 de
diferencias al cuadrado es convertir todas las obtener frecuencias como las observadas en

Tabla 2. Valores teóricos de las variables bajo el supuesto de que H0 es verdadera

Tipo de consulta Invierno Verano Total

Accidentes 2 062 (a’) 1 577 (c’) 3 639


No Accidentes 19 489 (b’) 14 913 (d’) 34 402
Total 21 551 16 490 38 041
Tasa de incidencia § 9,6% 9,6% 9,6%
§ Tasa de incidencia = (consultas por accidentes/consultas totales) × 100

416 Revista Chilena de Pediatría - Julio-Agosto 2007


TEST DE CHI CUADRADO

caso de ser H0 verdadera; en consecuencia, se Existen numerosos programas computacio-


rechaza H0 en favor de H1, apoyando la asocia- nales capaces de realizar el test de χ2, sin
ción entre las variables. embargo, su cálculo es útil solamente cuando lo
Existen algunas consideraciones importan- realiza un investigador familiarizado con su sig-
tes inherentes al test de χ2. En primer lugar, es nificado estadístico e interpretación. El presen-
un test de tipo no dirigido (test de planteamiento te artículo abordó aspectos generales relacio-
bilateral), es decir, solamente determina la aso- nados a este test, siendo necesario para una
ciación o independencia de dos variables cuali- comprensión más acabada del mismo el estudio
tativas, sin informar el sentido ni la magnitud de personal de estos conceptos en mayor profun-
dicha asociación. Para conocer estos atributos, didad. Un buen punto de partida es construir
una vez establecida la asociación entre las va- tablas de contingencia a partir de los datos
riables deben calcularse medidas de riesgo, por reportados en artículos de investigación, calcu-
ejemplo, odds ratio. En segundo lugar, es im- lar el valor del estadístico χ2 para cada una de
portante destacar que el test de χ2 siempre ellas y determinar su significancia estadística.
determina la asociación o independencia de dos Esta práctica seguramente aportará al lector
variables cualitativas, sin embargo, cada una de una mejor comprensión de los resultados del
las variables puede tener más de dos niveles. estudio.
Un ejemplo de esta situación sería estudiar la
asociación entre la variable “nivel socioeco-
nómico”, (alto, medio y bajo) y la variable “gru- Referencias
po sanguíneo Rh positivo” (A, B, AB y 0). En
este caso, la tabla de contingencia será de 3 × 4, 1.- Pearson K: On a criterion that a given system of
por consiguiente, los grados de libertad (g.l.) se deviations from the probable in the case of correlated
system of variables is Duch that it can be reasonably
calculan según la fórmula g.l. = (3-1) × (4-1) = 6. supposed to have arisen from random sampling.
Por último, para realizar el test de χ2 los valores Philosophical Magazine 1900; 50: 157-75.
que toman los niveles de las variables deben 2.- Bewick V, Cheek L, Ball J: Statistics review 8:
cumplir una serie de condiciones numéricas; qualitative data – tests of association. Critical Care
como norma general, se exigirá que el 80% de 2004; 8: 46-53.
3.- Pita S, Pértega S: Asociación de variables cualitati-
las celdas en una tabla de contingencia tengan vas: test de chi–cuadrado. Disponible en www.fisterra.
valores esperados mayores de 5. Así, en una com [Consultado el 21/03/07].
tabla de dos por dos será necesario que todas 4.- Waisman I, Núñez J, Sánchez J: Epidemiología de los
las celdas verifiquen esta condición; en caso accidentes en la infancia en la Región Centro Cuyo.
contrario, se deben aplicar herramientas esta- Rev Chil Pediatr 2002; 73: 404-14.
5.- Pértega S, Pita S: Asociación de variables cualitati-
dísticas tales como el test exacto de Fisher, vas: el test exacto de Fisher y el test de Mcnemar.
cuya explicación excede el propósito de esta Disponible en www.fisterra.com [Consultado el 21/03/
publicación3,5. 07].

Volumen 78 - Número 4 417

También podría gustarte