AMIGOS PARA SIEMPRE: Diagramas

Diagramas estadísticos

En el análisis de los datos, un correlograma es una imagen de la correlación de estadísticas. Por ejemplo, en el análisis de series temporales, el correlograma, también conocido como un gráfico de autocorrelación, es una representación gráfica de lasautocorrelaciones de la muestra

r_h\,

versus

h\,

(El tiempo).

Si se utiliza la Correlación cruzada , el resultado se llama una correlograma cruzado. El correlograma es una herramienta comúnmente usada para el control de aleatoriedad en un conjunto de datos . Esta aleatoriedad se determina calculando autocorrelaciones para los valores de datos en diferentes lapsos de tiempo. Si es al azar, tales autocorrelaciones deben estar cerca de cero para todos y todas las separaciones de retardo de tiempo. Si no es aleatoria, una o más de las autocorrelaciones seguidas serán significativamente diferente de cero.

Además, los correlogramas se utilizan en la etapa de identificación de la metodología de Box-Jenkins en modelos autorregresivos de media móvil de series temporales. Las autocorrelaciones deben estar al azar y cerca de cero, ya que si el analista no comprueba la aleatoriedad, la validez de muchas de las conclusiones estadísticas se vuelven sospechosas. La autocorrelación es una excelente manera de comprobar tal aleatoriedad.

Aplicaciones

El correlograma puede ayudar a proporcionar respuestas a las siguientes preguntas:

¿Son datos tomados al azar?
¿Está una observación relacionada con una observación de al lado?
¿Está una observación relacionada con una observación dos veces eliminada? (Etc.)
¿Es el tiempo observado una serie de ruido blanco ?
¿Es la serie de tiempo observada sinusoidal?
¿Es la serie de tiempo observada autorregresiva?
¿Qué modelo es apropiado para la serie de tiempo observada?
¿Es el modelo

Y = \mathrm{constant} + \mathrm{error}

válido y suficiente?

¿Es la fórmula válida? $s_{\bar{Y}}=s/\sqrt{N}$

cuarteto de Anscombe comprende cuatro conjuntos de datos que tienen las mismas propiedades estadísticas, pero que evidentemente son distintas al inspeccionar sus gráficos respectivos.

Cada conjunto consiste de once puntos (x, y) y fueron construidos por el estadístico F. J. Anscombe. El cuarteto es una demostración de la importancia de mirar gráficamente un conjunto de datos antes de analizarlos.

Para los cuatro conjuntos de datos:

Propiedad	Valor
Media de cada una de las variables x	9.0
Varianza de cada una de las variables x	11.0
Media de cada una de las variables y	7.5
Varianza de cada una de las variables y	4.12
Correlación entre cada una de las variables x e y	0.816
Recta de regresión	$y=3 + 0.5 x$

El primer gráfico (arriba a la izquierda) muestra lo que parece una relación lineal simple, correspondiente a dos variables correlacionadas cumpliendo con la suposición de normalidad. El segundo gráfico (arriba a la derecha) no está distribuido normalmente, aunque se observa relación entre los datos, esta no es lineal y el coeficiente de correlación de Pearson no es relevante. En la tercera gráfica (abajo a la izquierda) la distribución es lineal pero con una línea de regresión diferente de la que se sale el dato extremo que influye lo suficiente como para alterar la línea de regresión y disminuir el coeficiente de correlación de 1 a 0.816. Por último, la cuarta gráfica (abajo a la derecha) es un ejemplo de muestra en la que un valor atípico es suficiente para producir un coeficiente de correlación alto incluso cuando la relación entre las dos variables no es lineal.

Cuarteto de Anscombe
I		II		III		IV
x	y	x	y	x	y	x	y
10.0	8.04	10.0	9.14	10.0	7.46	8.0	6.58
8.0	6.95	8.0	8.14	8.0	6.77	8.0	5.76
13.0	7.58	13.0	8.74	13.0	12.74	8.0	7.71
9.0	8.81	9.0	8.77	9.0	7.11	8.0	8.84
11.0	8.33	11.0	9.26	11.0	7.81	8.0	8.47
14.0	9.96	14.0	8.10	14.0	8.84	8.0	7.04
6.0	7.24	6.0	6.13	6.0	6.08	8.0	5.25
4.0	4.26	4.0	3.10	4.0	5.39	19.0	12.50
12.0	10.84	12.0	9.13	12.0	8.15	8.0	5.56
7.0	4.82	7.0	7.26	7.0	6.42	8.0	7.91
5.0	5.68	5.0	4.74	5.0	5.73	8.0	6.89

Edward Tufte usó el cuarteto en la primera página del primer capítulo de su libro The Visual Display of Quantitative Information, para enfatizar la importancia de mirarlos datos antes de analizarlos.

curva de la bañera es un gráfica que representa los fallos durante el período de vida útil de un sistema omáquina. Se llama así porque tiene la forma una bañera cortada a lo largo.

En ella se pueden apreciar tres etapas:

Fallos iniciales: esta etapa se caracteriza por tener una elevada tasa de fallos que desciende rápidamente con el tiempo. Estos fallos pueden deberse a diferentes razones como equipos defectuosos, instalaciones incorrectas, errores de diseño del equipo, desconocimiento del equipo por parte de los operarios o desconocimiento del procedimiento adecuado.

Fallos normales: etapa con una tasa de errores menor y constante. Los fallos no se producen debido a causas inherentes al equipo, sino por causas aleatorias externas. Estas causas pueden ser accidentes fortuitos, mala operación, condiciones inadecuadas u otros.

Fallos de desgaste: etapa caracterizada por una tasa de errores rápidamente creciente. Los fallos se producen por desgaste natural del equipo debido al transcurso del tiempo.

Ésta es una de doce formas que se han tipificado sobre los modos de fallas de equipos, sistemas y dispositivos.

AMIGOS PARA SIEMPRE

Páginas

viernes, 16 de octubre de 2015

Diagramas

Diagramas estadísticos

Aplicaciones

No hay comentarios:

Publicar un comentario

Datos personales

Archivo del blog