CONCEPTOS FUNDAMENTALES .-
- La matriz de datos
Habitualmente, la información primaria sobre los individuos, es decir, la forma más elemental en la que se expresan los datos es la de una matriz, en la que aparecen en la primera columna los individiios identificados de alguna manera y en las siguientes columnas las observaciones de los diferentes caracteres en estudio para cada uno de los individuos, tal y como aparece en la tabla 2.1. Dicha matriz recibe el nombre de matriz de datos.
Matriz de Datos carácter 1 carácter 2 . . . carácter p individuo 1 * * . . . * individuo 2 * * . . . * . . . . . . . . . . . . . . . individuo n * * . . . * Así, los datos correspondientes a una investigación llevada a cabo para el estudio de una posible contaminación radioactiva en un determinado lugar produjeron como resultado la matriz de datos, en donde se recogen las observaciones de los caracteres "edad", "sexo", "cáncer", "caída anormal del cabello" y "profesión" en los 100 individuos seleccionados en la muestra.Estudio de Contaminación Radioactiva edad sexo cáncer caida cabello profesión individuo 1 32 masculino no no agricultor individuo 2 29 femenino no no maestra . . . . . . . . . . . . . . . . . . individuo 100 61 masculino si si agricultor En algunas ocasiones se reserva el nombre de matriz de datos a la obtenida de la anterior eliminando la primera columna. - Clases de datos
Es habitual denominar a los caracteres variables estadísticas o simplemente variables, calificándolas de cualitativas o cuantitativas según sea el correspondiente carácter, y hablar de los valores de la variable al referirnos a sus modalidades, aunque de hecho solamente tendremos verdaderos valores numéricos cuando analicemos variables cuantitativas.En ocasiones, con objeto de facilitar la toma de los datos, el investigador los agrupa en intervalos. Así por ejemplo, resulta más sencillo averiguar cuantos individuos hay en una muestra con una estatura, por ejemplo, entre 1'70 y 1'80 que medirlos a todos, en especial si tenemos marcas en la pared cada 10 cm.Observemos, no obstante, que siempre se producirá una pérdida de información al agrupar los datos en intervalos y dado que hoy en día la utilización del ordenador suele ser de uso corriente, un agrupamiento en intervalos es en general desaconsejable.No obstante, por razones docentes admitiremos esta posibilidad, ya que precisamente el agrupamiento en intervalos traerá complicaciones adicionales en el cálculode algunas medidas representativas de los datos.Consideraremos, por tanto, tres tipos posibles de datos:
- Datos correspondientes a un carácter cualitativo
- Datos sin agrupar correspondientes a un carácter cuantitativo
- Datos agrupados en intervalos correspondientes a un carácter cuantitativo
No hay comentarios:
Publicar un comentario