domingo, 7 de junio de 2015

Estadística

prueba de Bartlett se utiliza para probar si k muestras provienen de poblaciones con la misma varianza. A las varianzas iguales a través de las muestras se llama homocedasticidad u homogeneidad de varianzas. Algunas pruebas estadísticas, por ejemplo, el análisis de la varianza ANOVA, suponen que las varianzas son iguales en todos los grupos o muestras. La prueba de Bartlett se puede utilizar para verificar esa suposición.
La prueba de Bartlett es sensible a las desviaciones de la normalidad. Es decir, si las muestras provienen de distribuciones no normales, entonces la prueba de Bartlett puede ser simplemente para probar la no normalidad. La Prueba de Levene y la prueba de Brown-Forsythe son alternativas a la prueba de Bartlett que son menos sensibles a las desviaciones de la normalidad.1
La prueba lleva el nombre de Maurice Stevenson Bartlett.
La prueba de Bartlett se utiliza para probar la hipótesis nula, H_0 que todas las variaciones de población k son iguales frente a la alternativa de que al menos dos son diferentes.
Si hay k muestras con tamaño n_i y varianzas de las muestras S_i^2 entonces estadístico de prueba de Bartlett es:
X^2 = \frac{(N-k)\ln(S_p^2) - \sum_{i=1}^k(n_i - 1)\ln(S_i^2)}{1 + \frac{1}{3(k-1)}\left(\sum_{i=1}^k(\frac{1}{n_i-1}) - \frac{1}{N-k}\right)}
donde N = \sum_{i=1}^k n_i y S_p^2 = \frac{1}{N-k} \sum_i (n_i-1)S_i^2 es la estimación combinada de la varianza.
La estadística de prueba tiene aproximadamente una distribución \chi^2_{k-1}. Así, la hipótesis nula se rechaza si X^2 > \chi^2_{k-1,\alpha} (donde \chi^2_{k-1,\alpha} es el valor crítico de la cola superior para la distribución \chi^2_{k-1}).
La prueba de Bartlett es una modificación de la correspondiente prueba de razón verosimilitud diseñada para hacer que la aproximación a la distribución \chi^2_{k-1} sea mejor.



 prueba de Kruskal-Wallis (de William Kruskal y W. Allen Wallis) es un método no paramétrico para probar si un grupo de datos proviene de la misma población. Intuitivamente, es idéntico al ANOVA con los datos reemplazados por categorías. Es una extensión de la prueba de la U de Mann-Whitney para 3 o más grupos.
Ya que es una prueba no paramétrica, la prueba de Kruskal-Wallis no asume normalidad en los datos, en oposición al tradicionalANOVA. Sí asume, bajo la hipótesis nula, que los datos vienen de la misma distribución. Una forma común en que se viola este supuesto es con datos heterocedásticos.
  1. El estadístico está dado por: K = (N-1)\frac{\sum_{i=1}^g n_i(\bar{r}_{i\cdot} - \bar{r})^2}{\sum_{i=1}^g\sum_{j=1}^{n_i}(r_{ij} - \bar{r})^2}, donde:
    • n_{i} es el número de observaciones en el grupo i
    • r_{ij} es el rango (entre todas las observaciones) de la observación j en el grupo i
    • N es el número total de observaciones entre todos los grupos
    • \bar{r}_{i\cdot} = \frac{\sum_{j=1}^{n_i}{r_{ij}}}{n_i},
    • \bar{r} =(N+1)/2 es el promedio de r_{ij}.
      Note que el denominador de la expresión para K es exactamente \frac{(N-1)N(N+1)}{12}. Luego K = \frac{12}{N(N+1)}\sum_{i=1}^g n_i(\bar{r}_{i\cdot} - \bar{r})^2.
  2. Se puede realizar una corrección para los valores repetidos dividiendo K por 1 - \frac{\sum_{i=1}^G (t_{i}^3 - t_{i})}{N^3-N}, donde G es el número de grupos de diferentes rangos repetidos, y t_{i} es el número de observaciones repetidas dentro del grupo i que tiene observaciones repetidas para un determinado valor. Esta corrección hace cambiar a K muy poco al menos que existan un gran número de observaciones repetidas.
  3. Finalmente, el p-value (valor p) es aproximado por \Pr(\chi^2_{g-1} \ge K). Si algún n_{i} es pequeño (<5) la distribución de K puede ser distinta de la chi-cuadrado.







prueba de Levene1 es una prueba estadística inferencial utilizada para evaluar la igualdad de las varianzas para una variable calculada para dos o más grupos. Algunos procedimientos estadísticos comunes asumen que las varianzas de las poblaciones de las que se extraen diferentes muestras son iguales. La prueba de Levene evalúa este supuesto. Se pone a prueba la hipótesis nula de que las varianzas poblacionales son iguales (llamado homogeneidad de varianza ú homocedasticidad). Si el P-valor resultante de la prueba de Levene es inferior a un cierto nivel de significación (típicamente 0.05), es poco probable que las diferencias obtenidas en las variaciones de la muestra se hayan producido sobre la base de un muestreo aleatorio de una población con varianzas iguales. Por lo tanto, la hipótesis nula de igualdad de varianzas se rechaza y se concluye que hay una diferencia entre las variaciones en la población.
Algunos de los procedimientos que asumen normalmente homocedasticidad, para lo cual uno puede utilizar las pruebas de Levene, incluyen análisis de varianza y pruebas t.
La prueba de Levene se utiliza a menudo antes de que una comparación de medias. Cuando la prueba de Levene muestra significación, se debe cambiar a pruebas generalizadas (pruebas no paramétricas), libre de supuestos de homocedasticidad.
La prueba también puede ser utilizada como una prueba principal para responder a una pregunta independiente de si dos sub-muestras en una población dada tienen varianzas iguales o diferentes.

No hay comentarios:

Publicar un comentario