AMIGOS PARA SIEMPRE: Bioestadística Clínica

Problemas de estadística resueltos

1º En una muestra aleatoria de 90 pacientes se mide el nivel de glucosa en sangre en ayunas. Se obtiene

= 132 mg/dl y s²=109. Construir el IC al 95% para m ¿Qué asunción se ha hecho?

Solución

Usando la fórmula general para cuando s² es desconocida

podemos, o bien mirar a las tablas de la t (o en un programa de ordenador) el valor de t_0,025 que para 89 grados de libertad (los grados de libertad son n - 1) es 1,99, o bien como n > 30 aproximar a la z y usar el valor 1,96.

Para poder usar esta fórmula es necesario que la variable sea normal. ¿es abusiva esta asunción? Ver, por ejemplo The normal distribution. Altman & Bland. BMJ 1995; 310:298.

2º Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos de riesgo. Se eligen aleatoriamente a 100 de ellos y se les suministra la vacuna; de ellos 10 pasan la gripe. Construir un IC al 95% para la probabilidad de pasar la gripe si se está vacunado. En los otros 100 pacientes sin vacunar la pasan 20. ¿Hay evidencia de que la vacuna es eficaz?

Solución

La fórmula para calcular IC para proporciones es

y aproximando p y q por sus estimaciones

es decir, hay una probabilidad del 95% de que la probabilidad de pasar la gripe si se está vacunado esté comprendida entre el 4% y el 16%. Para los no vacunados

Existe solapamiento, aunque pequeño, entre ambos intervalos; por tanto no podemos asegurar que la vacuna sea eficaz.

http://www.hrc.es/bioest/estadis_pro2sul.html#pro1

Contrastes de hipótesis

Una hipótesis estadística es una asunción relativa a una o varias poblaciones, que puede ser cierta o no. Las hipótesis estadísticas se pueden contrastar con la información extraída de las muestras y tanto si se aceptan como si se rechazan se puede cometer un error.

La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se representa por H₀. Rechazar H₀ implica aceptar una hipótesis alternativa (H₁).

La situación se puede esquematizar:

	H₀ cierta	H₀ falsa H₁ cierta
H₀ rechazada	Error tipo I (a )	Decisión correcta (*)
H₀ no rechazada	Decisión correcta	Error tipo II (b )

(*) Decisión correcta que se busca

a = p(rechazar H₀|H₀ cierta) b = p(aceptar H₀|H₀ falsa)
Potencia =1-b = p(rechazar H₀|H₀ falsa)

Detalles a tener en cuenta
1 a y b están inversamente relacionadas.
2 Sólo pueden disminuirse las dos, aumentando n.

Los pasos necesarios para realizar un contraste relativo a un parámetro q son:

1. Establecer la hipótesis nula en términos de igualdad

2. Establecer la hipótesis alternativa, que puede hacerse de tres maneras, dependiendo del interés del investigador

en el primer caso se habla de contraste bilateral o de dos colas, y en los otros dos de lateral (derecho en el 2º caso, o izquierdo en el 3º) o una cola.

3. Elegir un nivel de significación: nivel crítico para a

4. Elegir un estadístico de contraste: estadístico cuya distribución muestral se conozca en H₀ y que esté relacionado con q y establecer, en base a dicha distribución, la región crítica: región en la que el estadístico tiene una probabilidad menor que a si H₀ fuera cierta y, en consecuencia, si el estadístico cayera en la misma, se rechazaría H₀.

Obsérvese que, de esta manera, se está más seguro cuando se rechaza una hipótesis que cuando no. Por eso se fija como H₀ lo que se quiere rechazar. Cuando no se rechaza, no se ha demostrado nada, simplemente no se ha podido rechazar. Por otro lado, la decisión se toma en base a la distribución muestral en H₀, por eso es necesario que tenga la igualdad.

5. Calcular el estadístico para una muestra aleatoria y compararlo con la región crítica, o equivalentemente, calcular el "valor p" del estadístico (probabilidad de obtener ese valor, u otro más alejado de la H₀, si H₀fuera cierta) y compararlo con a.

Ejemplo:

Estamos estudiando el efecto del estrés sobre la presión arterial. Nuestra hipótesis es que la presión sistólica media en varones jóvenes estresados es mayor que 18 cm de Hg. Estudiamos una muestra de 36 sujetos y encontramos

1. Se trata de un contraste sobre medias. La hipótesis nula (lo que queremos rechazar) es:

2. la hipótesis alternativa

es un contraste lateral derecho.

3. Fijamos "a priori" el nivel de significación en 0,05 (el habitual en Biología).
4. El estadístico para el contraste es

y la región crítica T>t_a
Si el contraste hubiera sido lateral izquierdo, la región crítica sería T1-

_a
y si hubiera sido bilateral T1- _a_/2o T>t _a_/2
En este ejemplo t_(35)0,05=1,69.5. Calculamos el valor de t en la muestra

no está en la región crítica (no es mayor que 1,69), por tanto no rechazamos H₀.

Otra manera equivalente de hacer lo mismo (lo que hacen los paquetes estadísticos) es buscar en las tablas el "valor p" que corresponde a T=0,833, que para 35 g.l. es aproximadamente 0,20. Es decir, si H₀ fuera cierta, la probabilidad de encontrar un valor de T como el que hemos encontrado o mayor (¿por qué mayor? Porque la H₁ es que m es mayor , lo que produciría una media muestral mayor y por tanto mayor valor de t) es 0,20, dicho de otra manera la probabilidad de equivocarnos si rechazamos H₀ es 0,20, como la frontera se establece en 0,05 no la rechazamos.

Este valor crítico de 0,05 es arbitrario pero es la convención habitual. ¿Cuán razonable es?

Problema al respecto : en la hipótesis de que un mazo de cartas esté bien barajado, la probabilidad de que al sacar dos cartas sean, p.e.:1 el as de oros y 2 el rey de bastos es 1/40 x 1/39=0,000833.

Si hacemos la experiencia y obtenemos ese resultado ¿rechazaríamos la hipótesis de que el mazo está bien barajado? ¿Cuánto se parece esto a la lógica del contraste de hipótesis?

Volvamos al problema del estrés. Como no se rechaza H₀, se puede cometer un error tipo II. ¿Cuál es b ?. De hecho, sería la información relevante a comunicar en este estudio (la probabilidad del error que se pude cometer en él). Habitualmente, sin embargo, no se da porque los paquetes estadísticos no la calculan.
Para calcularla se debe concretar H₁, p.e. m = 20 (el criterio para este valor no es estadístico)

b =p(aceptar H₀|H₁ cierta)

Supongamos que el tamaño muestral sea suficientemente grande para poder aproximar t a z.

¿Cuándo se acepta H₀? si z £ 1,69

es decir, se acepta H₀ si

¿Qué probabilidad hay de encontrar

si m = 20 (zona verde del gráfico)? En esta hipótesis lo que se distribuye como una z es

contraste de hipótesis (también denominado test de hipótesis o prueba de significación) es un procedimiento para juzgar si una propiedad que se supone en una población estadística es compatible con lo observado en una muestra de dicha población. Fue iniciada por Ronald Fisher y fundamentada posteriormente por Jerzy Neyman y Karl Pearson.

Mediante esta teoría, se aborda el problema estadístico considerando una hipótesis determinada

H_{0}\,

y una hipótesis alternativa

H_{1}\,

, y se intenta dirimir cuál de las dos es la hipótesis verdadera, tras aplicar el problema estadístico a un cierto número de experimentos.

Está fuertemente asociada al concepto estadístico de potencia y a los conceptos de errores de tipo I y II, que definen respectivamente, la posibilidad de tomar un suceso falso como verdadero, o uno verdadero como falso.

Los tipos más importantes son los test centrados, de hipótesis y alternativa simple, aleatorizados, etc. Dentro de los tests no paramétricos, el más extendido es probablemente el test de la U de Mann-Whitney.

Se denomina hipótesis nula

H_{0}\,

a la hipótesis que se desea contrastar. El nombre de "nula" significa “sin valor, efecto o consecuencia”, lo cual sugiere que

H_{0}\,

debe identificarse con la hipótesis de no cambio (a partir de la opinión actual); no diferencia, no mejora, etc.

H_{0}\,

representa la hipótesis que mantendremos a no ser que los datos indiquen su falsedad, y puede entenderse, por tanto, en el sentido de “neutra”. La hipótesis

H_{0}\,

nunca se considera probada, aunque puede ser rechazada por los datos. Por ejemplo, la hipótesis de que dos poblaciones tienen la misma media puede ser rechazada fácilmente cuando ambas difieren mucho, analizando muestras suficientemente grandes de ambas poblaciones, pero no puede ser "demostrada" mediante muestreo, puesto que siempre cabe la posibilidad de que las medias difieran en una cantidad

\delta

lo suficientemente pequeña para que no pueda ser detectada, aunque la muestra sea muy grande.

A partir de una muestra de la población en estudio, se extrae un estadístico (esto es, una valor que es función de la muestra) cuya distribución de probabilidad esté relacionada con la hipótesis en estudio y sea conocida. Se toma entonces como región de rechazo al conjunto de valores que es más improbable bajo la hipótesis, esto es, el conjunto de valores para el que rechazaremos la hipótesis nula si el valor del estadístico observado entra dentro de él.

La probabilidad de que se obtenga un valor del estadístico que entre en la región de rechazo aún siendo cierta la hipótesis puede calcularse. De esta manera, se puede escoger dicha región de tal forma que la probabilidad de cometer este error sea suficientemente pequeña.

Siguiendo con el anterior ejemplo de la moneda trucada, la muestra de la población es el conjunto de los treinta lanzamientos a realizar, el estadístico escogido es el número total de caras obtenidas, y la región de rechazo está constituida por los números totales de caras iguales o superiores a 25. La probabilidad de cometer el error de admitir que la moneda está trucada a pesar de que no lo está es igual a la probabilidad binomial de tener 25 "éxitos" o más en una serie de 30 ensayos de Bernoulli con probabilidad de "éxito" 0,5 en cada uno, entonces: 0,0002, pues existe la posibilidad, aunque poco probable, que la muestra nos dé más de 25 caras sin haber sido la moneda trucada.

Un procedimiento de prueba es una regla con base en datos muestrales, para determinar si se rechaza

H_{0}\,

Ejemplo

Una prueba de

H_{0}\,

: p = 0.10 contra

H_{1}\,

: p < 0.10, podría estar basada en el examen de una muestra aleatoria de n = 200 objetos. Representamos con X el número de objetos defectuosos de la muestra, una variable aleatoria binomial; x representa el valor observado de X. si

H_{0}\,

es verdadera, E(X) = np = 200*(0.10) = 20, mientras, podemos esperar menos de 20 objetos defectuosos si

H_{1}\,

es verdadera. Un valor de x ligeramente debajo de 20 no contradice de manera contundente a

H_{0}\,

así que es razonable rechazar

H_{0}\,

solo si x es considerablemente menor que 20. Un procedimiento de prueba es rechazar

H_{0}\,

si x≤15 y no rechazar

H_{0}\,

de otra forma. En este caso, la región de rechazo está formada por x = 0, 1, 2, …, y 15.

H_{0}\,

no será rechazada si x= 16, 17,…, 199 o 200.

Un procedimiento de prueba se especifica por lo siguiente:

Un estadístico de prueba: una función de los datos muestrales en los cuales se basa la decisión de rechazar $H_{0}\,$ o no rechazar $H_{0}\,$ .
Una región de rechazo, el conjunto de todos los valores del estadístico de prueba para los cuales $H_{0}\,$ será rechazada.

Entonces, la hipótesis nula será rechazada si y solo si el valor observado o calculado del estadístico de prueba se ubica en la región de rechazo

En el mejor de los casos podrían desarrollarse procedimientos de prueba para los cuales ningún tipo de error es posible. Pero esto puede alcanzarse solo si una decisión se basa en un examen de toda la población, lo que casi nunca es práctico. La dificultad al usar un procedimiento basado en datos muestrales es que debido a la variabilidad en el muestreo puede resultar una muestra no representativa.

Un buen procedimiento es aquel para el cual la probabilidad de cometer cualquier tipo de error es pequeña. La elección de un valor particular de corte de la región de rechazo fija las probabilidades de errores tipo I y II. Estas probabilidades de error son representadas por α y β, respectivamente.

AMIGOS PARA SIEMPRE

Páginas

viernes, 28 de abril de 2017

Bioestadística Clínica

No hay comentarios:

Publicar un comentario

Datos personales

Archivo del blog