martes, 4 de abril de 2017

Estadística descriptiva

GRÁFICO



Un gráfico (o gráfica) es el recurso de representar los datos numéricos por medio de líneas, diagramas, dibujos, etc. La representación gráfica es un importante suplemento al análisis y estudio estadístico.

Gráficos
Los gráficos llaman la atención del lector y hacen que de un vistazo éste tenga una mayor comprensión de los datos. Un buen gráfico puede captar al lector para que a continuación lea todo el estudio. Si un estudio se compone únicamente de texto y tablas, posiblemente no todos los lectores lean el estudio.
Existen muchas clases de gráficas. Se pueden destacar los siguientes tipos:
ANUNCIOS

Gráfico lineal

El gráfico lineal (gráfico de líneas o diagrama lineal) se compone de una serie de datos representados por puntos, unidos por segmentos lineales. Mediante este gráfico se puede comprobar rápidamente el cambio de tendencia de los datos.
El diagrama lineal se suele utilizar con variables cuantitativas, para ver su comportamiento en el transcurso del tiempo. Por ejemplo, en las series temporales mensuales, anuales, trimestrales, etc.

Dibujo del gráfica lineal o diagrama lineal

Diagrama

Un diagrama es un tipo de representación gráfica que sirve para representar un conjunto de datos.
Según la RAE (Real Academia Española), un diagrama es un dibujo geométrico que sirve para demostrar una proposición, resolver un problema o representar de una manera gráfica la ley de variación de un fenómeno.
Existen diferentes tipos de diagramas, de los que se pueden destacar los siguientes:

Diagrama de barras

El diagrama de barras es un gráfico que se utiliza para representar datos de variables cualitativas o discretas. Está formado por barras rectangulares cuya altura es proporcional a la frecuencia de cada uno de los valores de la variable.

Dibujo del diagrama de barras
Las principales características del diagrama de barras son:
  • En el eje de abcisas se colocan las cualidades de la variable, si la variable es cualitativa, o los valores de dicha variable, si es discreta.
  • En el eje de ordenadas se colocan las barras proporcionales a la frecuencia relativa o absoluta del dato.
  • Las barras pueden ser horizontales o verticales, según donde se reflejen los valores de la variable.
  • Todas las barras deben tener el mismo ancho y no deben superponerse las unas con las otras.

Dibujo de los diagramas de barras con las barras verticales y horizontales

Diagrama circular

El diagrama circular (también llamado diagrama de sectores o diagrama de pastel) sirve para representar variables cualitativas o discretas. Se utiliza para representar la proporción de elementos de cada uno de los valores de la variable.
Consiste en partir el círculo en porciones proporcionales a la frecuencia relativa. Entiéndase como porción la parte del círculo que representa a cada valor que toma la variable.

Dibujo del diagrama circular.

Diagrama de Pareto

El diagrama de Pareto (también llamado diagrama ABC) fue creado por Vilfredo Pareto, para representar datos cualitativos. El italiano comprobó que el 20% de la población italiana acaparaban el 80% de riquezas y propiedades.
El principio de Pareto afirma que el 20% de las causas vitales originan alrededor del 80% de los efectos. O visto desde el punto de vista matemático, que el 20% de las categorías representan el 80% de las observaciones.
El diagrama de Pareto se construye siguiendo estos dos pasos:
  1. Ordenar los datos por frecuencia relativa o absoluta.
  2. Representar cada una de las categorías de la variable mediante un rectángulo proporcional a su frecuencia (como en el diagrama de barras).

Dibujo del diagrama de Pareto.

Diagrama de caja

El diagrama de caja es un gráfico utilizado para representar una variable cuantitativa (variable numérica). El gráfico es una herramienta que permite visualizar, a través de los cuartiles, cómo es la distribución, su grado de asimetría, los valores extremos, la posición de la mediana, etc. Se compone de:
  • Un rectángulo (caja) delimitado por el primer y tercer cuartil (Q1 y Q3). Dentro de la caja una línea indica dónde se encuentra la mediana (segundo cuartil Q2)
  • Dos brazos, uno que empieza en el primer cuartil y acaba en el mínimo, y otro que empieza en el tercer cuartil y acaba en el máximo.
  • Los datos atípicos (o valores extremos) que son los valores distintos que no cumplen ciertos requisitos de heterogeneidad de los datos.

Dibujo del diagrama de caja.

Diagrama de tallo y hojas

El diagrama de tallo y hojas (Stem-and-Leaf Diagram) es un semigráfico que permite presentar la distribución de una variable cuantitativa. Consiste en separar cada dato en el último dígito (que se denomina hoja) y las cifras delanteras restantes (que forman el tallo).

Dibujo del tallo y la hoja de un dato
Es especialmente útil para conjuntos de datos de tamaño medio (entre 20 y 50 elementos) y que sus datos no se agrupan alrededor de un único tallo. Con él podemos hacernos la idea de qué distribución tienen los datos, la asimetría, etc.

Dibujo del diagrama de tallo y hoja








Un histograma es una representación gráfica de datos agrupados mediante intervalos. Los datos provienen de una variables cuantitativas continuas. Gracias a él puedes hacerte rápidamente una idea de la distribución de los datos o muestra.
También cabe emplear variables cualitativas ordinales, siendo necesario que el número de datos sea alto.
Un histograma es un conjunto de rectángulos que representan las frecuencias absolutas de cada uno de los intervalos. Los intervalos abarcan todo el conjunto sin cortarse, de manera que un elemento está solo en un intervalo.

Dibujo del histograma
El histograma se construye de la manera siguiente:
  1. En el eje de abcisas se colocan los intervalos, de menor a mayor.
  2. En el eje de ordenadas se representan las frecuencias absolutas.
  3. Se dibujan rectángulos de anchura igual y proporcional al intervalo. La altura es la frecuencia absoluta. Los rectángulos son adyacentes pero no intersectan entre sí.

Ejemplo

ANUNCIOS

Tabla de los datos (rangos de edad y población) de una ciudad para construir el histograma
En una ciudad se realiza un estudio para observar la distribución de la población según la edad. La ciudad tiene censados 1.324.861 habitantes.
Para el estudio de la distribución de las edadesse va a construir un histograma en grupos decenales (intervalos de diez años).
  1. En el eje de abcisas se colocan los intervalos de edades (grupos decenales).
  2. En el eje de ordenadas se representa el número de personas que tienen ese rango de edad en la fecha del estudio (frecuencias absolutas).
  3. Se dibujan rectángulos de anchura igual y proporcional al intervalo (en nuestro caso todos tendrán la misma anchura) y de altura igual a la frecuencia absoluta.
El histograma resultante será el siguiente:

Dibujo del histograma en el ejemplo de la población de una ciudad distribuida en rangos de edad decenales (intervalos de diez años)

Polígono de frecuencias asociado a un histograma

Un polígono de frecuencias es un gráfico que se utiliza para variables cuantitativas discretas. Se representa mediante puntos que señalan la frecuencia absoluta de cada valor y líneas que unen los puntos consecutivos.
Se puede dibujar un polígono de frecuencias a partir de un histograma. Para ello se deben unir los puntos medios de las bases superiores de los rectángulos.

Dibujo del polígono de frecuencias a partir del histograma
También se puede construir un histograma o su polígono de frecuencias, colocando en ordenadas las frecuencias acumuladas.

No hay comentarios:

Publicar un comentario