GRÁFICOS - DIAGRAMAS Y ESTUDIOS DE LA ESTADÍSTICA - DESCRIPTIVA .-
Tratamiento por clases
Cuando en la población o muestra que estudiamos existen muchos valores diferentes, es conveniente, aún a costa de perder algo de información, dividir el intervalo de variación en una serie de subintervalos que cubran el total; a cada uno de ellos se le llama una clase, a sus extremos, extremos de clase, al punto medio de cada clase, marca de clase y a la diferencia entre sus extremos, amplitud de la clase.
En estos casos la tabla adopta una estructura como la del cuadro siguiente:
Clases
(intervalos)
|
Marcas de clase(mi)
|
Frecuencias absolutas......
de clase ½ acumuladas
|
Frecuencias relativas...
de clase ½ acumuladas
|
Mientras que en el caso del tratamiento individual la tabla quedaba perfectamente determinada por los posibles valores de los datos, en el de clases está claro que no sucede así, pues hay libertad para elegir el número de clase y los extremos de las mismas.
Los intervalos, en general, deben tener la misma amplitud.
Para decidir el nº de clases que se deben tomar conviene tener en cuenta que si éste es excesivo con respecto al número de datos, pueden aparecer irregularidades accidentales provenientes de pocas observaciones en algunas clases. Sin embargo, si se toma el número de clases demasiado reducido se producirá una pérdida importante de información.
Un criterio orientativo para decidir cuántas clases se deben tomar lo proporciona la siguiente fórmula empírica debida a Sturges: k = 1 + 3.3 log n
Ejemplo 12. Se ha pasado un test de 79 preguntas a 600 personas. El número de respuestas correctas se refleja en la siguiente tabla:
intervalos
|
mi
|
f.absoluta. puntual
|
f.absoluta acumulada
|
f.relativa. puntual
|
f.relativa. acumulado
|
[0, 10)
[10, 20)
[20. 30)
[30, 40)
[40, 50)
[50, 60)
[60, 70)
[70, 80)
|
5
15
25
35
45
55
65
75
|
40
60
75
90
105
85
80
65
600
|
40
100
175
265
370
455
535
600
|
1/15
1/10
1/8
3/20
7/40
17/120
2/15
13/120
1
|
1/15
1/6
7/24
53/120
37/60
91/120
107/120
1
|
Ejemplo 13. En una Caja de Reclutamiento se toma una muestra de tamaño 30 de los pesos de los mozos correspondientes a un cierto reemplazo, obteniéndose los siguientes datos medidos en kg:
71.9, 63.9, 62.3, 72.5, 78.0, 70.7, 71.4, 60.5, 60.9, 68.2, 88.5, 76.1, 82.1, 63.7, 79.8, 67.5, 50.1, 69.5, 66.1, 47.3, 72.1, 59.8, 93.7, 80.7, 61.2, 64.3, 53.7, 74.7, 96.3, 73.2.
Construir una tabla de frecuencias agrupando los datos en clases de la misma amplitud.
Solución
Si bien no es estrictamente necesario, en general, es conveniente ordenar los datos de menor a mayor. A continuación se presenta la misma muestra ordenada:
47.3, 50.1, 53.7, 59.8, 60.5, 60.9, 61.2, 62.3, 63.7, 63.9, 64.3, 66.1, 67.5, 68.2, 69.5, 70.7, 71.4, 71.9, 72.1, 72.5, 73.2, 74.7, 76.1, 78.0, 79.8, 80.7, 82.1, 88.5, 93.7, 96.3.
Como los valores extremos son 47.3 y 96.3 y el número de clases aconsejado para estos datos es 6 (aplicando la fórmula de Sturges), tomaremos 6 intervalos de amplitud 10, la tabla queda estructurada de la siguiente manera:
clases
|
Marcas de clase
|
frecuencias absolutas
de clase ½acumuladas
|
Frecuencias relativas
de clase ½acumuladas
| ||
45 -55
55 -65
65 -75
75 -85
85 -95
95 -105
|
50
60
70
80
90
100
|
3
8
11
5
2
1
|
3
11
22
27
29
30
|
0.1
0.266
0.366
0.166
0.066
0.033
|
0.1
0.366
0.733
0.900
0.966
1
|
30 0.997»1
Intervalos no solapados.
Si los datos recogidos están ya agrupados en intervalos no solapados, como por ejemplo:
Intervalo
|
ni
|
120-139
140-149
150-159
160-169
|
32
37
23
19
|
Es conveniente tomar unos intervalos que contengan a éstos, pero sin modificar las frecuencias. Esto es:
Intervalo
|
ni
|
[119,5-139,5)
[139,5-149,5)
[149,5-159,5)
[159,5-169,5)
|
32
37
23
19
|
Estos nuevos valores se llaman límites reales de la clase.
Observación. Las tablas nos dan una visión, de la característica que se está estudiando, mucho más clara que la que da la muestra, tal cómo se presenta inicialmente.
No hay comentarios:
Publicar un comentario