martes, 4 de abril de 2017

Estadística descriptiva

MEDIDAS DE POSICIÓN NO CENTRAL



Las medidas de tendencia no central permiten conocer puntos característicos de una serie de valores, que no necesariamente tienen que ser centrales. La intención de estas medidas es dividir el conjunto de observaciones en grupos con el mismo número de valores.

Cuartiles

Los cuartiles son los tres valores que dividen una serie de datos ordenada en cuatro porciones iguales. El primer cuartil (Q1) deja a la izquierda el 25% de los datos. El segundo (Q2) deja a izquierda y derecha el 50% y coincide con la mediana. El tercero (Q3) deja a la derecha el 25% de valores. Los tres cuantiles son:

Formula de los cuartiles

Percentiles

ANUNCIOS

El percentil es una medida de posición no central. Los percentiles Pi son los 99 puntos que dividen una serie de datos ordenada en 100 partes iguales, es decir, que contienen el mismo número de elementos cada una. El percentil 50 es la mediana.
Sea (X1, X2,…,XN) una muestra de N elementos. El percentil Pi es:

Formula de los percentiles
Los percentiles están pensados para conjuntos de elementos de más de cien elementos.

CUARTILES


Distinguimos los casos en que los datos están agrupados en frecuencias y los que no lo están. Los datos también pueden estar agrupados en intervalos de valores.
Vayamos a datos no agrupados. Para el Q1 y Q3 hallaremos su posición mediante los siguientes pasos:
(N+1)/4 y 3(N+1)/4 pueden resultar números decimales. Por ejemplo, si el conjunto de datos es de 20 elementos, N=20, tendremos que el sujeto del primer cuartil es el (N+1)/4=(20+1)/4=21/4=5,25. ¿Qué hacemos en el caso de que nos de un número decimal?
Diferenciaremos dos casos:
  • Sin parte decimal: elegimos ese mismo sujeto. Por ejemplo, si el conjunto tiene 19 elementos, (N+1)/4=(19+1)/4=20/4=5, por lo que el primer cuartil será Q1=X5.
  • Con parte decimal: supongamos que el elemento es un número con parte decimal entre el sujeto i y el i+1. Sea un número de la forma i,d donde i es la parte entera y d la decimal. El cuartil será:

    Fórmula del primer y tercer cuartil que tienen parte decimal
Podéis ver un ejemplo práctico en el siguiente apartado.
El cálculo del segundo cuartil depende de si el número de sujetos N es par o impar. Al ser la mediana, se utiliza el procedimiento de cálculo de la mediana.

Ejemplo

ANUNCIOS

Sea un conjunto de la edad de los veinte integrantes (N=20) de un club. Supongamos que el conjunto está ordenado:

Dibujo del conjunto de la edad de los veinte integrantes de un club

Primer cuartil

El primer cuartil será el sujeto (N+1)/4=21/4=5,25. Como es decimal, el cuartil será un número entre el X5=28 y X6=29.

Dibujo de los elementos del conjunto utilizados para calcular el cuartil 1.
El número decimal es el 5,25, por lo que i=5 y d=0,25. El cuartil 1 es:

Ejemplo del cálculo del cuartil 1

Segundo cuartil

El segundo cuartil es la mediana. Al ser un conjunto con un número par de elementos, el cuartil es la media de los sujetos N/2=20/2=10 y N/2+1=20/2+1=11.

Dibujo de los elementos del conjunto utilizados para calcular el cuartil 2.
Es decir, será la media de X10=34 y X6=37.

Ejemplo del cálculo del cuartil 2

Tercer cuartil

El tercer cuartil es el sujeto 3(N+1)/4=63/4=15,75. Como el número es decimal, el cuartil estará entre X15=52 y X16=53.

Dibujo de los elementos del conjunto utilizados para calcular el cuartil 3.
El número decimal es el 15,75, por lo que i=15 y d=0,75. El cuartil 3 es:

Ejemplo del cálculo del cuartil 3






PERCENTILES



El percentil es una medida de posición no central. Los percentiles Pi son los 99 puntos que dividen una serie de datos ordenada en 100 partes iguales, es decir, que contienen el mismo número de elementos cada una. El percentil 50 es la mediana.
Sea (X1, X2,…,XN) una muestra de N elementos. El percentil Pi es:

Formula de los percentiles
Los percentiles están pensados para conjuntos de elementos de más de cien elementos.
Una aplicación muy conocida de los percentiles son las tablas de crecimiento de los niños, en las que se ubica el peso y la talla de un determinado niño dentro de su grupo de edad.


Las medidas de posición no centrales permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales:
Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados.
Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados.
Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.
Ejemplo: Vamos a calcular los cuartiles de la serie de datos referidos a la estatura de un grupo de alumnos (lección 2ª). Los deciles y centiles se calculan de igual manera, aunque haría falta distribuciones con mayor número de datos.

Variable
Frecuencias absolutas
Frecuencias relativas
(Valor)
Simple
Acumulada
Simple
Acumulada
xxxxx
1,20
1
1
3,3%
3,3%
1,21
4
5
13,3%
16,6%
1,22
4
9
13,3%
30,0%
1,23
2
11
6,6%
36,6%
1,24
1
12
3,3%
40,0%
1,25
2
14
6,6%
46,6%
1,26
3
17
10,0%
56,6%
1,27
3
20
10,0%
66,6%
1,28
4
24
13,3%
80,0%
1,29
3
27
10,0%
90,0%
1,30
3
30
10,0%
100,0%


1º cuartil: es el valor 1,22 cm, ya que por debajo suya se situa el 25% de la frecuencia (tal como se puede ver en la columna de la frecuencia relativa acumulada).
2º cuartil: es el valor 1,26 cm, ya que entre este valor y el 1º cuartil se situa otro 25% de la frecuencia.
3º cuartil: es el valor 1,28 cm, ya que entre este valor y el 2º cuartil se sitúa otro 25% de la frecuencia. Además, por encima suya queda el restante 25% de la frecuencia.
Atención: cuando un cuartil recae en un valor que se ha repetido más de una vez (como ocurre en el ejemplo en los tres cuartiles) la medida de posición no central sería realmente una de las repeticiones.

Medidas de posición no central
(Cuantiles)

Los cuantiles son aquellos valores de la variable, que ordenados de menor a mayor,  dividen a la distribución en partes, de tal manera que cada una de ellas contiene el mismo número de frecuencias.
Los cuantiles  más conocidos son:
a)    Cuartiles ( Qi )
Son valores de la variable que dividen a la distribución en 4 partes, cada una de las cuales engloba el 25 % de las mismas.  Se denotan de la siguiente forma: Q1 es el primer cuartil que deja a su izquierda el 25 % de los datos; Q2 es el segundo cuartil que deja a su izquierda el 50% de los datos, y Qes el tercer cuartil que deja a su izquierda el 75% de los datos.   (Q= Me) 
b)    Deciles ( Di)
Son los valores de la variable que dividen a la distribución en las partes iguales, cada una de las cuales engloba el 10 % de los datos. En total habrá 9 deciles.  (Q= D= Me )
 c)     Centiles o Percentiles ( Pi )
Son los valores que dividen a la distribución en 100 partes iguales, cada una de las cuales engloba el 1 % de las observaciones. En total habrá 99 percentiles.  (Q= D= Me = P50)

No hay comentarios:

Publicar un comentario