martes, 4 de abril de 2017

Estadística descriptiva

Medidas de dispersión

La varianza (S2) mide la dispersión de los datos de una muestra (X1,X2,…,XN) respecto a la media (x), calculando la media de los cuadrados de las distancias de todos los datos.

Fórmula de la varianza
Representación gráfica de la varianza
Al elevar las diferencias al cuadrado se garantiza que las diferencias absolutas respecto a la media no se anulan entre si. Además, resaltan los valores alejados.
Siempre se cumple que la varianza es mayor o igual que cero (S2 ≥ 0). La varianza es cero cuando todos los datos son el mismo (ejemplo: {1,1,1,1,1}).
Si en vez de tratarse de una muestra, la varianza se refiere a la población, el denominador será N.

Ejemplo

ANUNCIOS

Un médico de un instituto quiere realizar un estudio para ver si los alumnos de un centro tienen sobrepeso. Le interesaría calcular la varianza para ver como difieren los pesos respecto a la media. Para ello, se selecciona una muestra de doce alumnos de 14 o 15 años.

Tabla de los pesos de 12 alumnos de 14 o 15 años.
Se calcula la media de los pesos de los alumnos, y se obtiene que x = 53,5kg.
Una vez se sabe la media, se halla la diferencia de cada elemento respecto a esta, para calcular la dispersión de los datos.

Tabla con los cálculos necesarios para calcular la varianza.
Una vez se ha calculado el cuadrado de la diferencia de cada elemento con la media, ya se puede determinar la varianza (S2):

Cálculo de la varianza de las alturas mediante su fórmula.
El valor alto de la varianza confirma una de sus características: que es sensible a los valores que se separan bastante de la media.
A continación se puede observar un gráfico de las diferencias del peso de cada alumno respecto a la media:

Representación gráfica de la varianza en un ejemplo del peso de doce alumnos de un instituto.









La desviación típica es la medida de dispersión (S) asociada a la media. Mide el promedio de las desviaciones de los datos de una muestra (X1,X2,…,XN) de la media (x) en las mismas unidades de los datos. Dicho de otra forma, es un indicador de cómo tienden a estar agrupados los datos respecto a la media.

Fórmula de la desviación típica
Representación gráfica de la desviación típica
El cuadrado de la desviación típica es la varianza.
Cuando se trata de la desviación típica de una población, el denominador es N. Si se trata de una muestra, serà N-1.







El coeficiente de variación de Pearson (r) mide la variación de los datos respecto a la media, sin tener en cuenta las unidades en la que están.

Fórmula del Coeficiente de variación de Pearson
El coeficiente de variación toma valores entre 0 y 1. Si el coeficiente es próximo al 0, significa que existe poca variabilidad en los datos y es una muestra muy compacta. En cambio, si tienden a 1 es una muestra muy dispersa.
Para interpretar fácilmente el coeficiente, podemos multiplicarlo por cien para tenerlo en tanto por cien.

Ejercicios resueltos de la desviación típica

1.Hallar la desviación media, la varianza y la desviación típica de la series de números siguientes:
2, 3, 6, 8, 11.
12, 6, 7, 3, 15, 10, 18, 5.

2, 3, 6, 8, 11.

Media

media

Desviación típica

desviación típica
12, 6, 7, 3, 15, 10, 18, 5.

Media

media

Desviación típica

desviación típica

2.Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su consulta en el momento de andar por primera vez:
MesesNiños
91
104
119
1216
1311
148
151
Calcular la desviación típica.
xifiNixi · fii · fi
911981
104540400
11914991089
1216301922304
1311411431859
148491121568
1515015225
 50 6107526
varianza

3.El resultado de lanzar dos dados 120 veces viene dado por la tabla:
SumasVeces
23
38
49
511
620
719
816
913
1011
116
124
Calcular la desviación típica.
xifixi · fixi2 · fi
23612
382472
4936144
51155275
620120720
719133931
8161281024
9131171053
10111101100
11666726
12448576
 1208436633
media y varianza

4.Calcular la desviación típica de una distribución estadística que viene dada por la siguiente tabla:
 fi
[10, 15)3
[15, 20)5
[20, 25)7
[25, 30)4
[30, 35)2
 xifixi · fixi2 · fi
[10, 15)12.5337.5468.75
[15, 20)17.5587.51531.25
[20, 25)22.57157.53543.75
[25, 30)27.541103025
[30, 35)32.52652112.5
  21457.510681.25

Media

media

Desviación típica

varianza

5.Calcular la desviación típica de la distribución de la tabla:
 xifixi · fixi2 · fi
[10, 20)15115225
[20, 30)2582005000
[30,40)351035012 250
[40, 50)45940518 225
[50, 60)55844024 200
[60,70)65426016 900
[70, 80)75215011 250
  421 82088 050
media
desvición típica

6.Las alturas de los jugadores de un equipo de baloncesto vienen dadas por la tabla:
AlturaNº de Jugadores
[1.70, 1.75)1
[1.75, 1.80)3
[1.80, 1.85)4
[1.85, 1.90)8
[1.90, 1.95)5
[1.95, 2.00)2
Calcular la desviación típica
 xifiFixi · fixi2 · fi
[1.70, 1.75)1.725111.7252.976
[1.75, 1.80)1.775345.3259.453
[1.80, 1.85)1.825487.313.324
[1.85, 1.90)1.8758161528.128
[1.90, 1.95)1.9255219.62518.53
[1.95, 2.00)1.9752233.957.802
  23 42.92580.213

Media

media

Desviación típica

desviación

7.Dada la distribución estadística:
 fi
[0, 5)3
[5, 10)5
[10, 15)7
[15, 20)8
[20, 25)2
[25, ∞)6
Calcular la desviación típica.
 xifiFi
[0, 5)2.533
[5, 10)7.558
[10, 15)12.5715
[15, 20)17.5823
[20, 25)22.5225
[25, ∞) 631
  31 

Media

No se puede calcular la media, porque no se puede hallar la marca de clase del último intervalo.

Desviación típica

Si no hay media no es posible hallar la desviación típica.

No hay comentarios:

Publicar un comentario