Teorema de Bayes Si los sucesos Ai son una partición y B un suceso tal que p(B) ¹ 0 Demostración Aplicaciones
Diagnóstico médico (en general clasificaciones no biunívocas): El diagnóstico consiste en establecer la enfermedad de un paciente, a partir de una serie de síntomas. Pero los síntomas y las enfermedades no están ligados de un modo biunívoco.
Llamemos Ei al conjunto de enfermedades
E1: tuberculosis pulmonar; E2 :cáncer de pulmón; E3: bronquitis obstructiva; etc. y Si a los síntomas y síndromes asociados con las mismas. S1: tos; S2: estado febril; S3: hemotisis; etc. La información accesible en los libros de patología, o en un archivo de historias clínicas es del tipo. Para E1: algunos (digamos el 20%) tienen hemotisis; muchos (80%) tienen tos; etc. y lo mismo para las demás enfermedades.
En términos de probabilidad condicionada, esta información es
p(S3|E1) = 0,2; p(S1|E1) = 0,8 etc. para diagnosticar la tuberculosis se ha de evaluar, para los síntomas que presenta el paciente p(E1|Si) para lo que se puede usar el teorema de Bayes si las enfermedades forman una partición (son mutuamente excluyentes y se consideran todas las enfermedades compatibles con el síntoma) y se conocen sus prevalencias. Nótese que un mismo conjunto de síntomas podría dar lugar a un diagnóstico diferente en poblaciones en las que las prevalencias fueran diferentes.
Pruebas diagnósticas: Supóngase una prueba diagnóstica, por ejemplo nivel de glucosa en sangre, en ayunas, para diagnosticar la diabetes. Se considera que la prueba es positiva si se encuentra un nivel por encima de un cierto valor, digamos 120 mg/l.
Para evaluar la prueba, (habrá que hacerlo para distintos valores de corte) se somete a la misma a una serie de individuos diabéticos diagnosticados por otro procedimiento (el patrón de oro o "gold standar") y a una serie de individuos no diabéticos. Los resultados se pueden representar en una tabla de doble entrada
Si la prueba fuera perfecta b=c=0, desgraciadamente nunca ocurre. Se denomina coeficiente falso-positivo (CFP) al cociente c/t, y es una estimación de la probabilidad condicionada p(+|NE), se denominacoeficiente falso-negativo (CFN) al cociente b/u, y es una estimación de la probabilidad condicionada p(-|E). Estos dos coeficientes cuantifican los dos errores que la prueba puede cometer y caracterizan a la misma. Simétricamente, los coeficientes que cuantifican los aciertos son la sensibilidad, p(+|E), y la especificidad p(-|NE).
Cuando la prueba se usa con fines diagnósticos (o de "screening") interesa calcular p(E|+) y/o p(NE|-).
Como E y NE son una partición, usando el Teorema de Bayes y
Nótese que ambas dependen de la prevalencia de la enfermedad: una prueba diagnóstica que funciona muy bien en la clínica Mayo, puede ser inútil en el Hospital Ramón y Cajal.
Ejemplo 9:
una prueba diagnóstica para la diabetes tiene un CFP de 4% y un CFN del 5%. Si la prevalencia de la diabetes en la población donde se usa es del 7% ¿cuál es la probabilidad de que sea diabético un individuo en el que la prueba dé positiva? y ¿de que no lo sea uno en el que dé negativo?
p(+|NE) = 0,04 Þ p(-|NE) = 0,96
p(-|E) = 0,05 Þ p(+|E) = 0,95 p(E) = 0,07 Þ p(NE) = 0,93 y
Pruebas en serie: Cuando se aplican pruebas en serie, para cada prueba p(E) y p(NE), serán la p(E|+) y p(NE|+) de la prueba anterior (si dio positiva) o p(E|-) y p(NE|-) si dio negativa.
A esta se añade un suceso B cuya ocurrencia proporciona cierta información, porque las probabilidades de ocurrencia de B son distintas según el suceso Ai que haya ocurrido. Conociendo que ha ocurrido el suceso B, la fórmula del teorema de Bayes nos indica como modifica esta información las probabilidades de los sucesos Ai. Ejemplo: Si seleccionamos una persona al azar, la probabilidad de que sea diabética es 0,03. Obviamente la probabilidad de que no lo sea es 0,97. Si no disponemos de información adicional nada más podemos decir, pero supongamos que al realizar un análisis de sangre los niveles de glucosa son superiores a 1.000 mg/l, lo que ocurre en el 95% de los diabéticos y sólo en un 2% de las personas sanas. ¿Cuál será ahora la probabilidad de que esa persona sea diabética? La respuesta que nos dá el teorema de bayes es que esa información adicional hace que la probabilidad sea ahora 0,595. Vemos así que la información proporcionada por el análisis de sangre hace pasar, la probabilidad inicial de padecer diabetes de 0,03, a 0,595. Evidentemente si la prueba del análisis de sangre hubiese sido negativa, esta información modificaría las probabilidades en sentido contrario. En este caso la probabilidad de padecer diabetes se reduciría a 0,0016.
Teorema de Bayes
El teorema de Bayes es un procedimiento para obtener probabilidades condicionales (probabilidades de ocurrencia de acontecimientos condicionadas a la ocurrencia de otros acontecimientos). La expresión del teorema de Bayes para dos variables discretas es:
Para variables que toman más de dos valores, la expresión es:
El teorema de Bayes da respuesta a cuestiones de tipo causal, predictivas y de diagnóstico. En las cuestiones causales queremos saber cuál es la probabilidad de acontecimientos que son la consecuencia de otros acontecimientos. En las cuestiones predictivas queremos saber cuál es la probabilidad de acontecimientos dada información de la ocurrencia de los acontecimientos predictores. En las cuestiones de tipo diagnóstico queremos saber cuál es la probabilidad del acontecimiento (o acontecimientos) causales o predictivos dado que tenemos información de las consecuencias. Para resumir, en las situaciones causales o predictivas desconocemos las consecuencias y tenemos evidencia de las causas. Por el contrario, en las situaciones de diagnóstico desconocemos las causas y tenemos evidencia de las consecuencias.
Ejemplo
Unos psicólogos especializados en el tratamiento de trastornos de personalidad están interesados en diagnosticar el trastorno que afecta un paciente, en el que observan un conjunto de síntomas que indican que el paciente podría sufrir el trastorno A o el trastorno B. Además saben que los porcentajes de individuos afectados por los trastornos A, B o ningún trastorno son 10, 30 y 70. También saben que el porcentaje de individuos afectados por el trastorno A y que muestran el síntoma X es igual al 60%, el porcentaje de individuos que sufren el trastorno B y muestran el síntoma X es el 30% y el porcentaje de individuos no afectados que muestran los síntomas de trastorno es el 10%. Resumiendo, la información que disponemos es:
la probabilidad de que el individuo padezca el trastorno A es 0.27. Las probabilidades de que esté afectado por el trastorno B o el C son:
La conclusión es que lo más probable es que el individuo padezca el trastorno B, pero es un valor moderado y los psicólogos piensan que hay que obtener más evidencia.
El teorema de Bayes es especialmente adecuado para actualizar las conclusiones a medida que disponemos de nueva información. Pasado un tiempo observan que el paciente muestra un nuevo síntoma (Y), y saben que presentan Y el 70% de los individuos que sufren el trastorno A, el 20% de los individuos que sufren B y el 10% de los individuos que padecen el trastorno C. Para obtener las probabilidades incorporando la nueva información hacemos que las probabilidades posteriores pasen a ser las probabilidades previas:
Una vez hechos los cálculos la probabilidad de que el individuo esté afectado por el trastorno A ha pasado de 0.27 a 0.62
|
viernes, 28 de abril de 2017
Bioestadística Clínica
Suscribirse a:
Enviar comentarios (Atom)
No hay comentarios:
Publicar un comentario