viernes, 28 de abril de 2017

Bioestadística Clínica



  Teorema de Bayes
Si los sucesos Ai son una partición y B un suceso tal que p(B) ¹ 0
Demostración
Aplicaciones
Diagnóstico médico (en general clasificaciones no biunívocas): El diagnóstico consiste en establecer la enfermedad de un paciente, a partir de una serie de síntomas. Pero los síntomas y las enfermedades no están ligados de un modo biunívoco.
Llamemos Ei al conjunto de enfermedades
E1: tuberculosis pulmonar; E:cáncer de pulmón; E3: bronquitis obstructiva; etc.
y Si a los síntomas y síndromes asociados con las mismas.
S1: tos; S2: estado febril; S3: hemotisis; etc.
La información accesible en los libros de patología, o en un archivo de historias clínicas es del tipo.
Para E1: algunos (digamos el 20%) tienen hemotisis; muchos (80%) tienen tos; etc.
y lo mismo para las demás enfermedades.
En términos de probabilidad condicionada, esta información es
p(S3|E1) = 0,2; p(S1|E1) = 0,8 etc.
para diagnosticar la tuberculosis se ha de evaluar, para los síntomas que presenta el paciente p(E1|Si) para lo que se puede usar el teorema de Bayes si las enfermedades forman una partición (son mutuamente excluyentes y se consideran todas las enfermedades compatibles con el síntoma) y se conocen sus prevalencias.
Nótese que un mismo conjunto de síntomas podría dar lugar a un diagnóstico diferente en poblaciones en las que las prevalencias fueran diferentes.
Pruebas diagnósticas: Supóngase una prueba diagnóstica, por ejemplo nivel de glucosa en sangre, en ayunas, para diagnosticar la diabetes. Se considera que la prueba es positiva si se encuentra un nivel por encima de un cierto valor, digamos 120 mg/l.
Para evaluar la prueba, (habrá que hacerlo para distintos valores de corte) se somete a la misma a una serie de individuos diabéticos diagnosticados por otro procedimiento (el patrón de oro o "gold standar") y a una serie de individuos no diabéticos. Los resultados se pueden representar en una tabla de doble entrada
  
Patrón de oro
 
  
NE
E
Prueba
-
a
b
r
+
c
d
s
 
t
u
Si la prueba fuera perfecta b=c=0, desgraciadamente nunca ocurre. Se denomina coeficiente falso-positivo (CFP) al cociente c/t, y es una estimación de la probabilidad condicionada p(+|NE), se denominacoeficiente falso-negativo (CFN) al cociente b/u, y es una estimación de la probabilidad condicionada p(-|E). Estos dos coeficientes cuantifican los dos errores que la prueba puede cometer y caracterizan a la misma. Simétricamente, los coeficientes que cuantifican los aciertos son la sensibilidad, p(+|E), y la especificidad p(-|NE).
Cuando la prueba se usa con fines diagnósticos (o de "screening") interesa calcular p(E|+) y/o p(NE|-).

Como E y NE son una partición, usando el Teorema de Bayes

y
Nótese que ambas dependen de la prevalencia de la enfermedad: una prueba diagnóstica que funciona muy bien en la clínica Mayo, puede ser inútil en el Hospital Ramón y Cajal. 
Ejemplo 9:
una prueba diagnóstica para la diabetes tiene un CFP de 4% y un CFN del 5%. Si la prevalencia de la diabetes en la población donde se usa es del 7% ¿cuál es la probabilidad de que sea diabético un individuo en el que la prueba dé positiva? y ¿de que no lo sea uno en el que dé negativo?
p(+|NE) = 0,04 Þ p(-|NE) = 0,96
p(-|E) = 0,05 
Þ p(+|E) = 0,95
p(E) = 0,07 
Þ p(NE) = 0,93

y
Pruebas en serie: Cuando se aplican pruebas en serie, para cada prueba p(E) y p(NE), serán la p(E|+) y p(NE|+) de la prueba anterior (si dio positiva) o p(E|-) y p(NE|-) si dio negativa.




Teorema de Bayes
El teorema de Bayes parte de una situación en la que es posible conocer las probabilidades de que ocurran una serie de sucesos Ai.
A esta se añade un suceso B cuya ocurrencia proporciona cierta información, porque las probabilidades de ocurrencia de B son distintas según el suceso Ai que haya ocurrido.
Conociendo que ha ocurrido el suceso B, la fórmula del teorema de Bayes nos indica como modifica esta información las probabilidades de los sucesos Ai.
Ejemplo: Si seleccionamos una persona al azar, la probabilidad de que sea diabética es 0,03. Obviamente la probabilidad de que no lo sea es 0,97.
Si no disponemos de información adicional nada más podemos decir, pero supongamos que al realizar un análisis de sangre los niveles de glucosa son superiores a 1.000 mg/l, lo que ocurre en el 95% de los diabéticos y sólo en un 2% de las personas sanas.
¿Cuál será ahora la probabilidad de que esa persona sea diabética?
La respuesta que nos dá el teorema de bayes es que esa información adicional hace que la probabilidad sea ahora 0,595.
Vemos así que la información proporcionada por el análisis de sangre hace pasar, la probabilidad inicial de padecer diabetes de 0,03, a 0,595.
Evidentemente si la prueba del análisis de sangre hubiese sido negativa, esta información modificaría las probabilidades en sentido contrario. En este caso la probabilidad de padecer diabetes se reduciría a 0,0016.


Teorema de Bayes
El teorema de Bayes es un procedimiento para obtener probabilidades condicionales (probabilidades de ocurrencia de acontecimientos condicionadas a la ocurrencia de otros acontecimientos). La expresión del teorema de Bayes para dos variables discretas es:
Para variables que toman más de dos valores, la expresión es:
El teorema de Bayes da respuesta a cuestiones de tipo causal, predictivas y de diagnóstico. En las cuestiones causales queremos saber cuál es la probabilidad de acontecimientos que son la consecuencia de otros acontecimientos. En las cuestiones predictivas queremos saber cuál es la probabilidad de acontecimientos dada información de la ocurrencia de los acontecimientos predictores. En las cuestiones de tipo diagnóstico queremos saber cuál es la probabilidad del acontecimiento (o acontecimientos) causales o predictivos dado que tenemos información de las consecuencias. Para resumir, en las situaciones causales o predictivas desconocemos las consecuencias y tenemos evidencia de las causas. Por el contrario, en las situaciones de diagnóstico desconocemos las causas y tenemos evidencia de las consecuencias.

Ejemplo
Unos psicólogos especializados en el tratamiento de trastornos de personalidad están interesados en diagnosticar el trastorno que afecta un paciente, en el que observan un conjunto de síntomas que indican que el paciente podría sufrir el trastorno A o el trastorno B. Además saben que los porcentajes de individuos afectados por los trastornos A, B o ningún trastorno son 10, 30 y 70. También saben que el porcentaje de individuos afectados por el trastorno A y que muestran el síntoma X es igual al 60%, el porcentaje de individuos que sufren el trastorno B y muestran el síntoma X es el 30% y el porcentaje de individuos no afectados que muestran los síntomas de trastorno es el 10%. Resumiendo, la información que disponemos es:
Sustituyendo en el teorema de Bayes:
la probabilidad de que el individuo padezca el trastorno A es 0.27. Las probabilidades de que esté afectado por el trastorno B o el C son:
La conclusión es que lo más probable es que el individuo padezca el trastorno B, pero es un valor moderado y los psicólogos piensan que hay que obtener más evidencia.
El teorema de Bayes es especialmente adecuado para actualizar las conclusiones a medida que disponemos de nueva información. Pasado un tiempo observan que el paciente muestra un nuevo síntoma (Y), y saben que presentan Y el 70% de los individuos que sufren el trastorno A, el 20% de los individuos que sufren B y el 10% de los individuos que padecen el trastorno C. Para obtener las probabilidades incorporando la nueva información hacemos que las probabilidades posteriores pasen a ser las probabilidades previas:
Una vez hechos los cálculos la probabilidad de que el individuo esté afectado por el trastorno A ha pasado de 0.27 a 0.62





Problemas de probabilidad resueltos:
1º Una mujer es hija de una portadora de la enfermedad de Duchenne. Dicha mujer tiene tres hijos varones sin la enfermedad. Calcular la probabilidad de que ella sea portadora de la enfermedad.
Solución
Si representamos por x el gen alterado y por el gen normal, el espacio muestral para el nacimiento de la mujer W ={xX, XX}, cada suceso elemental con la misma probabilidad (1ª ley de Mendel). Por tanto, si A = {xX} = {la mujer es portadora}, según la definición clásica de probabilidad p(A) = 1/2.
Si la mujer fuera portadora, los posibles genotipos para sus hijos son xX, xY, XX, XY, todos con la misma probabilidad. El espacio muestral para el nacimiento de un hijo varón es 
W ={xY, XY}, por tanto la probabilidad de que un hijo varón no tenga la enfermedad es 1/2 (también según la definición clásica). Cómo los genotipos de los sucesivos hijos son independientes (2ª ley de Mendel), y de acuerdo a la definición de independencia, la probabilidad de que los 3 hijos varones no tengan la enfermedad es (1/2)x(1/2)x(1/2) = 1/8. Obviamente si la mujer no fuera portadora, la probabilidad de que los 3 hijos varones no tengan la enfermedad es 1.
Como el suceso A = {la mujer es portadora} y su complementario A= {la mujer no es portadora} forman una partición, se puede aplicar el 
teorema de Bayes en relación con el suceso B = {los 3 hijos varones no tienen la enfermedad}

2º Una prueba diagnóstica para el cáncer uterino tiene un coeficiente falso-positivo de 0,05 y falso-negativo de 0,10. Una mujer con una probabilidad pre-prueba de padecer la enfermedad de 0,15 tiene un resultado negativo con la misma. Calcular la probabilidad de que no esté enferma.
Solución
Sea NE = {la mujer no está enferma}, + = {el resultado de la prueba es positivo} y - = {el resultado de la prueba es negativo}. La pregunta pide p(NE|-). Los datos que se dan son p(+|NE)=0,05; p(-|E)=0,10 y p(E)=0,15. Del primero se deduce que p(-|NE)=0,95 y del último p(NE)=0,85, por lo tanto aplicando el teorema de Bayes







 

No hay comentarios:

Publicar un comentario