viernes, 16 de octubre de 2015

Diagramas

Diagramas estadísticos

histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados, ya sea en forma diferencial o acumulada. Sirven para obtener una "primera vista" general, o panorama, de la distribución de la población, o la muestra, respecto a una característica, cuantitativa y continua, de la misma y que es de interés para el observador (como la longitud o la masa). De esta manera ofrece una visión en grupo permitiendo observar una preferencia, o tendencia, por parte de la muestra o población por ubicarse hacia una determinada región de valores dentro del espectro de valores posibles (sean infinitos o no) que pueda adquirir la característica. Así pues, podemos evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o concisión entre los valores de todas las partes que componen la población o la muestra, o, en contraposición, poder observar el grado de variabilidad, y por ende, la dispersión de todos los valores que toman las partes, también es posible no evidenciar ninguna tendencia y obtener que cada miembro de la población toma por su lado y adquiere un valor de la característica aleatoriamente sin mostrar ninguna preferencia o tendencia, entre otras cosas.
En el eje vertical se representan las frecuencias, es decir, la cantidad de población o la muestra, según sea el caso, que se ubica en un determinado valor o sub-rango de valores de la característica que toma la característica de interés, evidentemente, cuando este espectro de valores es infinito o muy grande el mismo es reducido a sólo una parte que muestre la tendencia o comportamiento de la población, en otras ocasiones este espectro es extendido para mostrar el alejamiento o ubicación de la población o la muestra analizada respecto de un valor de interés.
En general se utilizan para relacionar variables cuantitativas continuas, pero también se lo suele usar para variables cuantitativas discretas, en cuyo caso es común llamarlo diagrama de frecuencias y sus barras están separadas, esto es porque en el "x" ya no se representa un espectro continuo de valores, sino valores cuantitativos específicos como ocurre en un diagrama de barras cuando la característica que se representa es cualitativa o categórica. Su utilidad se hace más evidente cuando se cuenta con un gran número de datos cuantitativos y que se han agrupado en intervalos de clase.
Ejemplos de su uso es cuando se representan franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (no numéricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores.
Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.


Tipos De Histograma

  • Diagramas de barras simples
Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la frecuencia simple de la categoría que representa.
  • Diagramas de barras compuesta
Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, las cuales se representan así; la altura de la barra representa la frecuencia simple de las modalidades o categorías de la variable y esta altura es proporcional a la frecuencia simple de cada modalidad.
  • Diagramas de barras agrupadas
Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, el cual es representado mediante un conjunto de barras como se clasifican respecto a las diferentes modalidades.
  • Polígono de frecuencias
Es un gráfico de líneas que de las frecuencias absolutas de los valores de una distribución en el cual la altura del punto asociado a un valor de las variables es proporcional a la frecuencia de dicho valor.
  • Ojiva porcentual
Es un gráfico acumulativo, el cual es muy útil cuando se quiere representar el rango porcentual de cada valor en una distribución de frecuencias.
En los gráficos las barras se encuentran juntas y en la tabla los números poseen en el primer miembro un corchete y en el segundo un paréntesis, por ejemplo: (10-20) aunque existen algunas otras.

Construcción de un histograma

  • Paso 1
Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor.
  • Paso 2
Obtener todos los números de clases, existen 2 criterios para determinar el número de clases (o barras) –por ejemplo, la regla de Sturges. Sin embargo ninguno de ellos es exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo de cómo estén los datos y cuántos sean. Un criterio usado frecuentemente es que el número de clases debe ser aproximadamente a la raíz cuadrada del número de datos. Por ejemplo, la raíz cuadrada de 30 (número de artículos) es mayor que cinco, por lo que se seleccionan seis clases.
  • Paso 3
Establecer la longitud de clase: es igual al rango dividido por el número de clases.
  • Paso 4
Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en relación al resultado del PASO 2 en intervalos diferentes
  • Paso 5
Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se hace una gráfica de pastel, las bases de las barras son los intervalos de clases y la altura es la frecuencia de las clases. Si se unen los puntos medios de la base superior de los rectángulos se obtiene el polígono de frecuencias.

Ejemplos

Fotografía con su histograma
El histograma de una imagen representa la frecuencia relativa de los niveles de gris de la imagen. Las técnicas de modificación del histograma de una imagen son útiles para aumentar el contraste de imágenes con histogramas muy concentrados.Sea u una imagen de tamaño N×N, la función de distribución del histograma es:
Fu(l)=(\mbox{Numero de pixels } (i,j)\mbox{ tales que } u(i,j)\leq l)/N^2

Otros tipos de representaciones gráficas

Hay histogramas donde se agrupan los datos en clases, y se cuenta cuántas observaciones (frecuencia absoluta) hay en cada una de ellas. En algunas variables (variables cualitativas) las clases están definidas de modo natural, por ejemplo, sexo con dos clases: mujer, varón o grupo sanguíneo con cuatro: A, B, AB, O. En las variables cuantitativas, las clases hay que definir las explícita mente (intervalos de clase). Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y las frecuencias, absolutas o relativas, en el de ordenadas (eje vertical).
A veces es más útil representar las frecuencias acumuladas, o representar simultáneamente los histogramas de una variable en dos situaciones distintas.
Otra forma muy frecuente, de representar dos histogramas de la misma variable en dos situaciones distintas.
En las variables cuantitativas o en las cualitativas ordinales se pueden representar polígonos de frecuencia en lugar de histogramas, cuando se representa la frecuencia acumulativa, se denomina ojiva.






mapa coropléticomapa coropleto o mapa de coropletas, es un mapa temático en el que las regiones se colorean de un motivo que muestra una medida estadística, como puede ser la densidad de población o el ingreso por habitante. Este tipo de mapa facilita la comparación de una medida estadística de una región con la de otra o muestra la variabilidad de esta para una región dada.









media móvil es un cálculo utilizado para analizar un conjunto de datos en modo de puntos para crear series de promedios. Así las medias móviles son una lista de números en la cual cada uno es el promedio de un subconjunto de los datos originales.
Por ejemplo, si se tiene un conjunto de 100 datos el primer valor de la serie de medias móviles podría ser el promedio de los primeros 25 términos, luego el promedio de los términos 2 al 26, el tercer elemento de los términos 3 al 27 y así, hasta por último el promedio de los últimos 25 números del 76 al 100.
Una serie de medias móviles puede ser calculada para cualquier serie temporal. Se usa para demanda estable, sin tendencia ni estacionalidad; suaviza las fluctuaciones de plazos cortos, resaltando así las tendencias o ciclos de plazos largos.

Media móvil simple

La media móvil previa

Una media móvil simple (Moving Average) es la media aritmética de los n datos anteriores. En esta técnica elemental de predicción, cuanto más grande sea n, mayor será la influencia de los datos antiguos. En contrapartida, si se selecciona una n baja, se tendrán en cuenta datos más recientes para nuestra predicción.
De acuerdo a lo enunciado con anterioridad, concluimos que la elección de n influenciará decisivamente nuestra predicción. Dependiendo del tipo de datos de serie temporal analizados podremos adaptar eficazmente nuestra predicción a los mismos. Así, si se elige un n bajo, nuestra predicción tendrá una alta capacidad para responder rápidamente ante fluctuaciones o variaciones significativas en los datos de un período a otro. Sin embargo, la predicción en este caso estará altamente influenciada por efectos aleatorios. Por otro lado, la elección de un n muy alto provocará que, aunque se filtre la existencia de efectos aleatorios, nuestras predicciones presenten una adaptación lenta ante fluctuaciones significativas en los datos de períodos más recientes, pués dicha predicción estará teniendo en cuenta el valor de datos antiguos.
La simplicidad de esta técnica hace que sea objeto de críticas en lo que refiere a su consideración equitativa de datos recientes y datos antiguos, sobre todo cuando el objeto de la predicción son variables cuya variabilidad en el corto plazo es importante para obtener una predicción eficaz, v.gr: análisis de demanda, nº ventas, etc. Además, en presencia de una tendencia en la serie de datos, la media movil simple causa problemas de predicción.

La media móvil central

En lugar de utilizar sólo datos anteriores, se utilizan también datos posteriores a aquél del cual se quiere obtener la media.

Media móvil ponderada

Ponderación MMP n = 15
La media móvil ponderada es una media multiplicada por ciertos factores, que le dan determinado peso a determinados datos. La media móvil ponderada (Weighted Moving Average) desarrolla y mejora las aplicaciones de la media móvil simple. Se trata de la media aritmética de los n valores anteriores ponderados según diferentes criterios. De esta forma, se superan los inconvenientes que ofrece la técnica de media móvil simple pues, en función de las características de los datos analizados podremos decidir si darle mayor importancia a datos más antiguos o más recientes. Esta técnica será más eficiente que la media móvil simple a la hora de adaptar rápidamente el valor de la predicción a fluctuaciones en los datos recientes (v.gr: dándole una alta ponderación a los valores más nuevos).

Media móvil exponencial

Ponderación MME N=15
La media móvil exponencial es una media móvil ponderada exponencialmente. Se trata de la media aritmética de los n valores anteriores con factores de ponderación que decrecen exponencialmente. La ponderación para cada punto de datos más antiguo decrece exponencialmente, nunca llegando a cero. El gráfico a la derecha muestra un ejemplo de la disminución de la ponderación. Da mayor importancia a los datos más recientes. Esta técnica será más eficiente que la media móvil simple y la media móvil ponderada a la hora de adaptar rápidamente el valor de la predicción a fluctuaciones en los datos recientes (v.gr: dándole una alta ponderación a los valores más nuevos).

No hay comentarios:

Publicar un comentario