Medicine">
Nothing Special   »   [go: up one dir, main page]

MSP Utea Eval. Validez y Fiabilidad de Las Pruebas Diagnosticas y de Cribado

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 65

EVALUACIÓN DE LA VALIDEZ Y FIABILIDAD DE LAS PRUEBAS

DIAGNÓSTICAS Y DE CRIBADO (TAMIZAJE-ESCRINING-


DESCARTE,ETC.)

Mg. Claudio Quintana Espinoza


¿Es buena la prueba rápida para detectar el COVID 19?
¿Identifica realmente a las personas que están enfermas
y a las que no?
¿ Que hago si salgo positivo ante una prueba ?
¿Qué hago si sin tener lka enfermedad salgo positivo?
¿Qué hago si teniendo una enfermedad salgo negativo?
Para comprender cómo se transmite y se desarrolla una
enfermedad y para proporcionar una asistencia sanitaria
efectiva y apropiada, es necesario diferenciar las personas
de la población que padecen una enfermedad de las que no
la tienen. Esto es un desafío importante, tanto en el ámbito
clínico centrado en la asistencia al paciente como en el
ámbito de la salud pública, en el que se consideran
programas de prevención secundaria dirigidos a la
intervención y detección precoz de la enfermedad y en el
que se realizan estudios etiológicos que proporcionan la
base para la prevención primaria.
VARIACIÓN BIOLÓGICA
DE LAS POBLACIONES HUMANAS
Cuando se utiliza una prueba para diferenciar entre individuos con resultados
normales y anormales, es importante comprender cómo se distribuyen las
características en las poblaciones humanas.
¿Como se distribuyen las características de la
población?
1. DISTRIBUCIÓN BINOMIAL DE LA
POBLACIÓN

Muestra la distribución de los resultados de la prueba de la tuberculina en una población. En el eje horizontal se
muestra tamaño de induración (el diámetro del área de induración en el punto de inyección, en milímetros) y en el eje
vertical se indica el número de individuos. Un grupo numeroso se centra en el valor de 0 mm (no induración) y otro
grupo se centra próximo a los 20 mm de induración. Este tipo de distribución, en el que existen dos picos, se
denomina curva bimodal. La distribución bimodal permite la separación de individuos que no tenían experiencia
previa con la tuberculosis (individuos sin induración, representados en la izquierda) de los que si la tenían (aquellos
con alrededor de 20 mm de induración, representados en la derecha). Aunque algunos individuos se encuentran en la
«zona gris» en el centro y pueden pertenecer a cualquiera de las curvas, la mayoría de la población puede
diferenciarse con facilidad utilizando las dos curvas. Por tanto, cuando una característica posee una distribución
bimodal, es relativamente fácil separar la mayoría de la población en dos grupos (p. ej. Enfermos y no enfermos,
poseedores de cierto trastorno o anomalía y no poseedores de dicho trastorno o anomalía).
2. DISTRIBUCIÓN UNIMODAL
DE LA POBLACIÓN

Sin embargo, la mayoría de las características humanas no presentan generalmente una distribución bimodal.
En la figura 5-2 se muestra la distribución de las presiones arteriales sistólicas en un grupo de varones. En esta
figura no existe una curva bimodal; lo que observamos en una curva unimodal (con un solo pico).
Por tanto, si queremos separar a los sujetos del grupo que son hipertensos de los que no lo son, se debe
establecer un nivel de corte para la presión arterial por encima del cual las personas se consideran hipertensas y
por debajo del cual se consideran normotensas. No existe un valor exacto de presión arterial que diferencie a los
sujetos normotensos de los hipertensos. Aunque podemos elegir un punto de corte para establecer la
hipertensión basándonos en consideraciones estadísticas, lo ideal es que quisiéramos elegir el punto de corte
basado en información biológica; es decir, queremos saber que una presión por encima del valor de corte
elegido se asocia con un mayor riesgo de sufrir posteriormente una enfermedad, como ictus o infarto de
miocardio, que deriven en un desenlace mortal.
Validez de las pruebas de cribado

La validez de una prueba se define como su capacidad para diferenciar


entre los que tienen una enfermedad y los que no la tienen.
La validez posee dos componentes: Sensibilidad y especificidad.

La sensibilidad de la prueba, se define como la capacidad de la prueba


para identificar correctamente a aquellos que SI tienen la enfermedad.
La especificidad de la prueba, se define como la capacidad de la
prueba para identificar correctamente a aquellos que NO tiene la
enfermedad.
Pruebas con resultados dicotómicos
(positivo o negativos)
¿QUÉ CALIDAD TUVO LA PRUEBA?
1° ¿Qué capacidad tuvo la prueba de identificar correctamente a aquello que tenían la enfermedad?

SENSIBILIDAD: Proporción de individuos enfermos que fueron identificados correctamente como «positivos» para la prueba, fue
de 80/100 o del 80%

2° ¿Identificó la prueba correctamente a aquellos que no tenían la enfermedad?

ESPECIFICIDAD: Proporción de personas no enfermas que son identificadas correctamente como «negativos» por la
prueba, es por tanto de 800/900 o del 89%

**De hecho, estamos comparando nuestros resultados de la prueba con algún «método de referencia», una
fuente externa de «verdad» referente al estado de la enfermedad de cada individuo de la población.
Comparación de los resultados de una prueba dicotómica
(resultados positivos o negativos) con el estado real de la
enfermedad.
Problemas de los falsos positivos:
Necesitarán ser exploradas de nuevo con pruebas mas sofisticadas y caras.
Carga sobre el sistema de asistencia sanitaria.
Ansiedad y preocupación inducidas en las personas a las que se informa que el resultado de la prueba ha
sido positivo.
Etiquetación como «positivas» por la prueba de cribado, nunca se libran por completo de dicha etiqueta,
incluso aunque los resultados de evaluaciones posteriores sean negativos.
Por ejemplo, los niños identificados como «positivos» en un programa a de cribado de cardiopatía fueron
tratados como discapacitados por los padres y el personal de la escuela.
Problemas de los falsos negativos:
Si una persona presenta la enfermedad pero es informada incorrectamente de que los resultados de la
prueba son negativos, en caso de que se trate de una enfermedad grave para la que se dispone de
intervenciones efectivas, el problema es realmente grave. Por ejemplo, si la enfermedad es un tipo de
cáncer que es curable únicamente en sus etapas más iniciales, un resultado falso negativo puede
representar una sentencia de muerte virtual.
Pruebas de variables continuas
(Glucemia, presión arterial…donde no hay simplemente resultados positivos y negativos)
EJEMPLO:
Prueba de glicemia

Punto negros= 20 Diabéticos


Puntos grises= 20 No diabéticos
Ningún valor separa claramente a los dos grupos (solapamiento)

Entonces debemos seleccionar un punto de corte:


Positivos a los que queden por encima del corte.
Negativos a los que queden por debajo del corte.

5-3-B Nivel de corte elevado:


Muchos diabéticos no se identificarán
La mayoría de los no diabéticos se identificaran correctamente
Sensibilidad 5/20 = 25%
Especificidad 18/20 = 90%

5-3-C Nivel de corte bajo:


Muy pocos diabéticos serán diagnosticados erróneamente.
Gran proporción de los no diabéticos resultarán positivos.
Sensibilidad 17/20=85%
Especificidad 6/20=30%
Datos reales sobre la distribución de las concentraciones de glucosa en sangre en diabéticos y en no diabéticos.
Si fijamos el nivel de corte en 80 mg/dl,
identificaremos a todos los diabéticos:
Sensibilidad alta: 100%
Especificidad baja: Consideraremos a
muchos no diabéticos como positivos.

Si fijamos el nivel de corte en 200 mg./dl


Todos los no diabéticos como negativos.
Especificidad 100%
Sensibilidad baja: No detectaremos a los
verdaderos diabéticos
DILEMA: El punto de corte tiene que ver con los falsos positivos y verdaderos negativos, no
nos da una distribución tetracórica, sino dos grupos: un grupo de personas con resultados
positivos en la prueba y otro grupo con resultados negativos.
USO DE PRUEBAS MÚLTIPLES
USO DE PRUEBAS MÚLTIPLES
A menudo pueden realizarse varias pruebas de cribado en los
mismos individuos, ya sea secuencialmente o simultáneamente. En
esta sección se describen los resultados de estos abordajes.

PRUEBAS SECUENCIALES (dos fases)


PRUEBAS SIMÚLTANEAS
PRUEBAS SECUENCIALES (dos fases)
En las pruebas de cribado secuenciales o en dos etapas, por lo general se realiza primero una prueba menos cara, menos invasiva o
menos incómoda, y aquellos en los que el resultado es positivo son vueltos a citar para realizar pruebas adicionales con una prueba
más cara, más invasiva o más incómoda, que puede tener más sensibilidad y especificidad.

Es de esperar que, citando únicamente a aquellos positivos en la primera prueba de cribado para realizar pruebas adicionales, se
reduzca el problema de los falsos positivos.
Ejercicio en clases:
Puntúa 20 puntos la culminación al 100%
Construir las dos tablas tetracóricas
y calcular la sensibilidad y especificidad neta
Sensibilidad neta utilizando dos pruebas simultaneas
La primera pregunta que nos planteamos es: ¿Cuál es la sensibilidad neta, si se utilizan la
prueba A y la prueba B simultáneamente? Para considerar a una persona positiva y, por
tanto, poder incluirla en el numerador para calcular la sensibilidad neta de las dos pruebas
utilizadas simultáneamente, dicha persona debe ser identificada como positiva por la prueba
A, la prueba B o ambas.
Entonces calculamos la sensibilidad con ambas pruebas:
La prueba B tiene una sensibilidad
del 90%, por lo que identificó al 90%
del los 160 que identificó la prueba A
(144)
Con el fin de calcular el numerador para la sensibilidad neta, no podemos
sumar simplemente el número de personas identificadas como positivas con
la prueba A y el número de personas identificadas como positivas con la
prueba B, pues algunas personas fueron identificadas como positivas con
ambas pruebas. Estas personas se representan en el área de solapamiento
entre ambos círculos, y no debemos contarlas dos veces (fig. 5-8).
¿Cómo determinar cuántas personas dieron resultado positivo en ambas
pruebas?
La prueba A posee una sensibilidad del 80% y, por tanto, identifica como
positivas al 8O% de las 200 personas que tienen la enfermedad (160
personas).
La prueba B posee una sensibilidad del 90% y, por tanto, identifica como
positivas al 90% de las mismas 160 personas que fueron identificadas por la
prueba A (144 personas). Por tanto, cuando empleamos simultáneamente las
pruebas A y B, 144 personas son identificadas como positivas con ambas
pruebas.
Recordemos que la prueba A identificó correctamente como positivas a 160
personas con Ia enfermedad.

Como 144 de las mismas fueron identificadas por ambas pruebas, 160 - 144 = 16
personas fueron identificadas correctamente solo con la prueba A.

La prueba B identificó correctamente como positivas a 180 de las 200 personas con
la enfermedad. Como 144 de las mismas fueron identificadas por ambas pruebas,
I80 - 144 = 36 personas fueron identificadas correctamente solo con la prueba B.

Por tanto, como se observa en la figura 5- 8F, cuando se emplean simultáneamente


las pruebas A y B, la sensibilidad neta será :

SENSIBILIDAD NETA = 16+144+36/200 =196/200= 98%


Especificidad neta utilizando dos pruebas
simultáneas
La siguiente pregunta que debemos plantearnos es:
¿ Cuál es la especificidad neta si se emplean las pruebas A y B
simultáneamente?
Para poder incluir a una persona en el numerador para calcular la
especificidad neta de las dos pruebas utilizadas simultáneamente,
dicha persona debe ser identificada como negativa por ambas
pruebas. Con el fin de calcular el numerador para la especificidad
neta, necesitamos por tanto determinar cuántas personas presentaron
resultados negativos en ambas pruebas.
¿Cómo hacemos
esto?
VALOR PREDICTIVO DE UNA PRUEBA
Hasta ahora nos hemos preguntado cómo es de buena la prueba para
identificar a las personas que tienen la enfermedad y a las que no la tienen.
Este punto es importante, especialmente cuando se realizan pruebas de
cribado en poblaciones de la comunidad.
Este es el denominado Valor Predictivo Positivo (VPP) de la prueba.

¿Cuál es la probabilidad de que dicho paciente tenga la enfermedad? = VALOR PREDICTIVO POSITIVO
¿Qué proporción de los pacientes con resultados positivos en la prueba tienen realmente la
enfermedad en cuestión? = VALOR PREDICTIVO POSITIVO
Relación entre el valor predictivo
positivo y la prevalencia de la enfermedad
La prevalencia mayor de una enfermedad en la población cribada ha causado un
aumento importante del VALOR PREDICTIVO POSITIVO utilizando la misma prueba.
CLARAMENTE LA MAYOR PARTE DE LA GANANCIA DEL VALOR
PREDICTIVO SE PRODUCE CUANDO AUMENTA LA PREVALENCIA DE LA
ENFERMEDA EN LOS CASOS EN QUE LA PREVALENCIA ES BAJA.
¿Por qué debe interesarnos la relación entre el valor
predictivo y la prevalencia de la enfermedad?

Cuanto más elevada sea la prevalencia de una enfermedad, mayor será


el valor predictivo.

Por tanto, un programa a de cribado es más productivo y eficiente si se


dirige a una población objetivo de alto riesgo. El cribado de una
población completa para una enfermedad relativamente infrecuente
puede suponer un gasto importante de recursos y puede lograr la
detección de pocos casos previamente no detectados en relación con la
cantidad de esfuerzo empleado.
Sin embargo, se puede identificarse un subgrupo de alto riesgo y el
cribado puede centrarse en ese subgrupo, es probable que el programa a
sea mucho más productivo.
¿Quién tenía razón en este ejemplo? La respuesta es que tanto el internista general como
el gastroenterólogo tenían razón. El internista emitió su valoración del valor predictivo
basándose en su experiencia en su práctica médica general, una población con una
prevalencia baja de enfermedades gastrointestinales graves. Por otra parte, el
gastroenterólogo emitió su valoración del valor predictivo de la prueba basándose en su
experiencia de pacientes remitidos, una consulta en la que la mayoría de los pacientes son
remitidos debido a la posibilidad de que padezcan una enfermedad gastrointestinal grave
(una población con una prevalencia elevada).
FIABILIDAD (REPETIBILIDAD)
DE LAS PRUEBAS
Consideremos otro aspecto de la valoración de las pruebas diagnósticas
y de cribado: si una prueba es fiable o repetible. ¿ Los resultados
obtenidos podrían reproducirse si se repitiese la prueba? Claramente,
con independencia de la sensibilidad y la especificidad de una prueba, si
los resultados de la prueba no son reproducibles, el valor y la utilidad de
la prueba son mínimos.
Factores que contribuyen a la variación entre los resultados de la
prueba:
1. Variación intraindividual (variaciones en un mismo individuo).
2. Variación intraobservador (variación en la lectura de los resultados de
la prueba por el mismo observador)
3. Variación interobservador (variación entre varias personas que
analizan los resultados de la prueba).
1.- Variación intraindividual
2. Variación
intraobservador
3. Variación inter observador:

Otra consideración importante es la variación entre observadores. Dos examinadores a


menudo no obtienen el mismo resultado. El grado de concordancia o discordancia entre
observadores es un aspecto importante, ya sea si consideramos una exploración física,
pruebas de laboratorio u otras técnicas de evaluación de características humanas.
¡¡¡Por lo tanto, necesitamos ser capaces de expresar el grado de
concordancia en términos cuantitativos.!!!

1.- Porcentaje de concordancia.(> % mejor)

2.- Estadístico de Kappa, Landis y Koch sugieren:

Kappa > 0,75 Concordancia excelente más allá del azar.


Kappa < de 0,40 Concordancia baja.
Kappa 0,40 - 0,75 Concordancia de intermedia a buena.
Cálculo del porcentaje (%) de concordancia
Variación de lectura de dos radiólogos, para calcular el porcentaje de concoradancia
se considerarán las radiografías en las cuales coincidieron ambos.
El valor elevado en d puede representar un desacuerdo significativo en los observadores, entonces no tener en cuenta a los sujetos
etiquetados como negativos por ambos observadores (celdilla d) y para identificar a sujetos como positivos o negativos, calcular el
porcentaje de concordancia utilizando como denominador únicamente a los sujetos considerados anormales por al menos uno de
los observadores (celdillas a, b y c)
Estadística de Kappa

Podemos hallar el porcentaje de acuerdo observado.


El máximo que pueden estar de acuerdo es 100% (acuerdo total de los 2 observadores)
por lo tanto el denominado será: 100% - Porcentaje de acuerdo esperado al azar.
Ejemplo: Concordancia más allá del azar entre las
observaciones de los 2 anatomopatólogos de la
clasificación histológica de 75 muestras de carcinoma
amicrocítico .
Calcular el estadístico de Kappa.
1.- Partimos de la comparación de 2 anatomopatólogos al subclasificar 75 casos observados.
2.- Calculamos el porcentaje de acuerdo entre ambos anatomopatólogos.
3.- Calculamos el acuerdo esperado por ambos solo al azar.
60% de 44 = 26.4
60% de 31 = 18.6
Luego 40% de 31 = 12.4
Entonces % de acuerdo esperado al azar sería: 51.7%
reemplazando en la fórmula:
Kappa = 90.7% - 51.7%/100% - 51.7% = 39%//48.3% = 0.81
Interpretación
Estadístico de Kappa, Landis y Koch sugieren:

Kappa > 0,75 Concordancia excelente más allá del azar.


Kappa < de 0,40 Concordancia baja.
Kappa 0,40 - 0,75 Concordancia de intermedia a buena.

Por lo tanto: Existe una concordancia excelente más allá del


azar entre las observaciones de los 2 anatomopatólogos.
RELACIÓN ENTRE VALIDEZ Y FIABILIDAD

Ejemplo: Escala de valores para glicemia con un valor verdadero indicado.


Curva estrecha con resultados muy fiables (repetibles) pero se alejan del valor
verdadero, por tanto no son válidos
Escala de valores para glicemia con un valor verdadero indicado.

Curva ancha centrada sobre el valor real , podemos decir que son válidos, pero para un solo grupo (es decir
tienden a agruparse alrededor del valor verdadero
Lo ideal es que claramente los resultados sean válidos y
fiables
CONCLUSIÓN

Hemos estudiado la validez de las pruebas diagnósticas y de cribado


analizando la sensibilidad y la especificidad, el valor predictivo y la
fiabilidad o repetibilidad. Claramente, con independencia de la
sensibilidad y la especificidad de una prueba, si sus resultados no
pueden repetirse, la prueba es poco útil.

Por tanto, todas estas características deben tenerse en cuenta cuando se


valora una prueba, junto con la finalidad para la que se quiere utilizar
dicha prueba.

También podría gustarte