Problemas de estadística resueltos
1º En una muestra aleatoria de 90 pacientes se mide el nivel de glucosa en sangre en ayunas. Se obtiene = 132 mg/dl y s2=109. Construir el IC al 95% para m ¿Qué asunción se ha hecho?
Solución
Usando la fórmula general para cuando s2 es desconocida
podemos, o bien mirar a las tablas de la t (o en un programa de ordenador) el valor de t0,025 que para 89 grados de libertad (los grados de libertad son n - 1) es 1,99, o bien como n > 30 aproximar a la z y usar el valor 1,96.
Para poder usar esta fórmula es necesario que la variable sea normal. ¿es abusiva esta asunción? Ver, por ejemplo The normal distribution. Altman & Bland. BMJ 1995; 310:298.
2º Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos de riesgo. Se eligen aleatoriamente a 100 de ellos y se les suministra la vacuna; de ellos 10 pasan la gripe. Construir un IC al 95% para la probabilidad de pasar la gripe si se está vacunado. En los otros 100 pacientes sin vacunar la pasan 20. ¿Hay evidencia de que la vacuna es eficaz?
Solución
La fórmula para calcular IC para proporciones es
y aproximando p y q por sus estimaciones
es decir, hay una probabilidad del 95% de que la probabilidad de pasar la gripe si se está vacunado esté comprendida entre el 4% y el 16%. Para los no vacunados
Existe solapamiento, aunque pequeño, entre ambos intervalos; por tanto no podemos asegurar que la vacuna sea eficaz.
http://www.hrc.es/bioest/estadis_pro2sul.html#pro1
y si hubiera sido bilateral T
En este ejemplo t(35)0,05=1,69.5. Calculamos el valor de t en la muestra
no está en la región crítica (no es mayor que 1,69), por tanto no rechazamos H0.
Otra manera equivalente de hacer lo mismo (lo que hacen los paquetes estadísticos) es buscar en las tablas el "valor p" que corresponde a T=0,833, que para 35 g.l. es aproximadamente 0,20. Es decir, si H0 fuera cierta, la probabilidad de encontrar un valor de T como el que hemos encontrado o mayor (¿por qué mayor? Porque la H1 es que m es mayor , lo que produciría una media muestral mayor y por tanto mayor valor de t) es 0,20, dicho de otra manera la probabilidad de equivocarnos si rechazamos H0 es 0,20, como la frontera se establece en 0,05 no la rechazamos.
Este valor crítico de 0,05 es arbitrario pero es la convención habitual. ¿Cuán razonable es?
Problema al respecto : en la hipótesis de que un mazo de cartas esté bien barajado, la probabilidad de que al sacar dos cartas sean, p.e.:1 el as de oros y 2 el rey de bastos es 1/40 x 1/39=0,000833.
Si hacemos la experiencia y obtenemos ese resultado ¿rechazaríamos la hipótesis de que el mazo está bien barajado? ¿Cuánto se parece esto a la lógica del contraste de hipótesis?
Volvamos al problema del estrés. Como no se rechaza H0, se puede cometer un error tipo II. ¿Cuál es b ?. De hecho, sería la información relevante a comunicar en este estudio (la probabilidad del error que se pude cometer en él). Habitualmente, sin embargo, no se da porque los paquetes estadísticos no la calculan.
Para calcularla se debe concretar H1, p.e. m = 20 (el criterio para este valor no es estadístico)
Para calcularla se debe concretar H1, p.e. m = 20 (el criterio para este valor no es estadístico)
b =p(aceptar H0|H1 cierta)
Supongamos que el tamaño muestral sea suficientemente grande para poder aproximar t a z.
¿Cuándo se acepta H0? si z £ 1,69
es decir, se acepta H0 si
¿Qué probabilidad hay de encontrar si m = 20 (zona verde del gráfico)? En esta hipótesis lo que se distribuye como una z es
contraste de hipótesis (también denominado test de hipótesis o prueba de significación) es un procedimiento para juzgar si una propiedad que se supone en una población estadística es compatible con lo observado en una muestra de dicha población. Fue iniciada por Ronald Fisher y fundamentada posteriormente por Jerzy Neyman y Karl Pearson.
Mediante esta teoría, se aborda el problema estadístico considerando una hipótesis determinada y una hipótesis alternativa , y se intenta dirimir cuál de las dos es la hipótesis verdadera, tras aplicar el problema estadístico a un cierto número de experimentos.
Está fuertemente asociada al concepto estadístico de potencia y a los conceptos de errores de tipo I y II, que definen respectivamente, la posibilidad de tomar un suceso falso como verdadero, o uno verdadero como falso.
Los tipos más importantes son los test centrados, de hipótesis y alternativa simple, aleatorizados, etc. Dentro de los tests no paramétricos, el más extendido es probablemente el test de la U de Mann-Whitney.
Se denomina hipótesis nula a la hipótesis que se desea contrastar. El nombre de "nula" significa “sin valor, efecto o consecuencia”, lo cual sugiere que debe identificarse con la hipótesis de no cambio (a partir de la opinión actual); no diferencia, no mejora, etc. representa la hipótesis que mantendremos a no ser que los datos indiquen su falsedad, y puede entenderse, por tanto, en el sentido de “neutra”. La hipótesis nunca se considera probada, aunque puede ser rechazada por los datos. Por ejemplo, la hipótesis de que dos poblaciones tienen la misma media puede ser rechazada fácilmente cuando ambas difieren mucho, analizando muestras suficientemente grandes de ambas poblaciones, pero no puede ser "demostrada" mediante muestreo, puesto que siempre cabe la posibilidad de que las medias difieran en una cantidad lo suficientemente pequeña para que no pueda ser detectada, aunque la muestra sea muy grande.
A partir de una muestra de la población en estudio, se extrae un estadístico (esto es, una valor que es función de la muestra) cuya distribución de probabilidad esté relacionada con la hipótesis en estudio y sea conocida. Se toma entonces como región de rechazo al conjunto de valores que es más improbable bajo la hipótesis, esto es, el conjunto de valores para el que rechazaremos la hipótesis nula si el valor del estadístico observado entra dentro de él.
La probabilidad de que se obtenga un valor del estadístico que entre en la región de rechazo aún siendo cierta la hipótesis puede calcularse. De esta manera, se puede escoger dicha región de tal forma que la probabilidad de cometer este error sea suficientemente pequeña.
Siguiendo con el anterior ejemplo de la moneda trucada, la muestra de la población es el conjunto de los treinta lanzamientos a realizar, el estadístico escogido es el número total de caras obtenidas, y la región de rechazo está constituida por los números totales de caras iguales o superiores a 25. La probabilidad de cometer el error de admitir que la moneda está trucada a pesar de que no lo está es igual a la probabilidad binomial de tener 25 "éxitos" o más en una serie de 30 ensayos de Bernoulli con probabilidad de "éxito" 0,5 en cada uno, entonces: 0,0002, pues existe la posibilidad, aunque poco probable, que la muestra nos dé más de 25 caras sin haber sido la moneda trucada.
Un procedimiento de prueba es una regla con base en datos muestrales, para determinar si se rechaza .
- Ejemplo
- Una prueba de : p = 0.10 contra : p < 0.10, podría estar basada en el examen de una muestra aleatoria de n = 200 objetos. Representamos con X el número de objetos defectuosos de la muestra, una variable aleatoria binomial; x representa el valor observado de X. si es verdadera, E(X) = np = 200*(0.10) = 20, mientras, podemos esperar menos de 20 objetos defectuosos si es verdadera. Un valor de x ligeramente debajo de 20 no contradice de manera contundente a así que es razonable rechazar solo si x es considerablemente menor que 20. Un procedimiento de prueba es rechazar si x≤15 y no rechazar de otra forma. En este caso, la región de rechazo está formada por x = 0, 1, 2, …, y 15. no será rechazada si x= 16, 17,…, 199 o 200.
Un procedimiento de prueba se especifica por lo siguiente:
- Un estadístico de prueba: una función de los datos muestrales en los cuales se basa la decisión de rechazar o no rechazar .
- Una región de rechazo, el conjunto de todos los valores del estadístico de prueba para los cuales será rechazada.
Entonces, la hipótesis nula será rechazada si y solo si el valor observado o calculado del estadístico de prueba se ubica en la región de rechazo
En el mejor de los casos podrían desarrollarse procedimientos de prueba para los cuales ningún tipo de error es posible. Pero esto puede alcanzarse solo si una decisión se basa en un examen de toda la población, lo que casi nunca es práctico. La dificultad al usar un procedimiento basado en datos muestrales es que debido a la variabilidad en el muestreo puede resultar una muestra no representativa.
Un buen procedimiento es aquel para el cual la probabilidad de cometer cualquier tipo de error es pequeña. La elección de un valor particular de corte de la región de rechazo fija las probabilidades de errores tipo I y II. Estas probabilidades de error son representadas por α y β, respectivamente.
No hay comentarios:
Publicar un comentario