AMIGOS PARA SIEMPRE: Bioestadística Clínica

Medidas descriptivas

Las medidas descriptivas son valores numéricos calculados a partir de la muestra y que nos resumen la información contenida en ella.

Medidas de posición

Las medidas de posición relativa se llaman en general cuantiles y se pueden clasificar en tres grandes grupos: Cuartiles, Deciles, percentiles.

Las medidas de posición como los cuartiles, quintiles y percentiles dividen a una distribución ordenada en partes iguales. Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.

a - Los Cuartiles (Qn): son los tres valores de la variable de una distribución que la dividen en cuatro partes iguales, es decir, al 25%, 50% y 75%. Para calcular el valor de uno de los cuatro Cuartiles, se utiliza la formula:

Q_k = k (n/4)

En donde:

Q_k = Cuartil número 1, 2, 3 ó 4

n = total de datos de la distribución.

Se advierte que la posición del segundo cuartil corresponde a la ubicación de la mediana, es decir que el segundo cuartil será siempre igual a la mediana.

Para calcular los cuartiles (datos no agrupados) debes seguir los siguentes pasos:

1º Se ordenan los datos de menor a mayor.

2º Se determina la posición que ocupa cada cuartil mediante la fórmula: Q_k = k (n/4)

Para que te quede más claro:

El primer cuartil (Q₁) es el valor de la variable que supera a lo más el 25 % de los datos y es superado por a lo más el 75 % de ellos en la distibución ordenada de menor a mayor.

El segundo cuartil (Q₂) es un valor que supera a lo más el 50 % de los datos y es superado por a lo más el 50 % de ellos, es decir, Q₂coincide con la mediana.

El tercer cuartil (Q₃) es un valor que supera a lo más al 75 % de los datos y es superado por a lo más el 25 % de ellos.

Ejemplo:

Dado el siguiente conjunto de datos: 2 ; 5 ; 9 ; 3 ; 13 ; 10 ; 11 ; 6 ; 7. ¿Cuál es el valor del tercer cuartil?

1° ordenamos los datos de menor a mayor:

2; 3; 5; 6; 7; 9; 10; 11; 13

n= 9

2º Se determina la posición que ocupa cada cuartil mediante la fórmula: Q_k = k (n/4)

Q₃ = 3 (9 /4)

Q₃ = 6,75; En caso de ser un número decimal se aproxima al entero más cercano superior , que sería 7. Este valor indica la posición del cuartil 3.

En nuestro caso el 7° valor sería :

2; 3; 5; 6; 7; 9; 10; 11; 13

Respuesta: el valor del tercer cuartil sería 10

b - Los Deciles: Corresponden a los 9 valores que dividen a estos en 10 partes igualeses decir, al 10%, al 20%... y al 90%. Los Deciles se designan por D₁, D₂,..., D₉

c- Los percentiles (Pn): son los noventa y nueve valores de la variable de una distribución que la dividen en cien partes iguales es decir, al 1%, al 2%... y al 99% de los datos. Los percentiles se designan por P₁, P₂,... P₉₉

P₅₀ coincide con la mediana.

El percentil p (P_p) es un valor de la variable tal que el p% de la muestra está por debajo y el (100_p) % está sobre.

Al tener una tabla de frecuencias, el percentil de orden K (P_k) se calcula siguiendo los siguientes pasos:

1° Se determina el intervalo al cual pertenece el percentil por calcular en la tabla de frecuencias:

en donde:

K = {1, 2, …, 99}

n es el número de datos. Si es decimal se aproxima al entero más cercano superior.

Buscamos este valor en la columna de la frecuencia acumulada. El cual es el primer valor de x cuya frecuencia acumulada sobrepasa el resultado de este cálculo.

2° Luego, Para calcular el percentil P_k correspondiente al k% de los datos se puede utilizar la siguiente fórmula:

Donde:

L_i es el límite inferior del intervalo donde se encuentra el k% de los datos.

a_i es la amplitud del intervalo donde se encuentra el k% de los datos.

fi es la frecuencia absoluta del intervalo donde se encuentra el k% de los datos.

F_i-1 es la frecuencia acumulada anterior al intervalo donde se encuentra el k% de los datos.

n es el total de datos.

Medidas De Dispersión

Las medidas de tendencia central ofrecen una idea aproximada del comportamiento de una serie estadística. No obstante, no resultan suficientes para expresar sus características: una misma media puede provenir de valores cercanos a la misma o resultar de la confluencia de datos estadísticos enormemente dispares. Para conocer en que grado las medidas de tendencia central son representativas de la serie, se han de complementar con medidas de dispersión como la varianza o la desviación típica.

Concentración y dispersión

Las medidas de centralización ayudan a determinar el «centro de gravedad» de una distribución estadística. Para describir el comportamiento general de la serie se necesita, sin embargo, una información complementaria para saber si los datos están dispersos o agrupados.

Así, las medidas de dispersión pueden definirse como los valores numéricos cuyo objeto es analizar el grado de separación de los valores de una serie estadística con respecto a las medidas de tendencia central consideradas.

Las medidas de dispersión son de dos tipos:

Medidas de dispersión absoluta: como recorrido, desviación media, varianza y desviación típica, que se usan en los análisis estadísticos generales.
Medidas de dispersión relativa: que determinan la dispersión de la distribución estadística independientemente de las unidades en que se exprese la variable. Se trata de parámetros más técnicos y utilizados en estudios específicos, y entre ellas se encuentran los coeficientes de apertura, el recorrido relativo, el coeficiente de variación (índice de dispersión de Pearson) y el índice de dispersión mediana.

La distribución normal, o campana de Gauss, es una función simétrica (con la media aritmética en el centro de la serie) con un grado de dispersión bajo (la mayoría de los valores están comprendidos dentro del valor de la desviación típica ).

Recorrido

La medida de dispersión más inmediata es el recorrido de la distribución estadística, también llamado rango o amplitud. Dada una serie de valores x1, x2, ..., xn, su recorrido es la diferencia aritmética entre el máximo y el mínimo de estos valores:

Desviación media

Como medida de dispersión más frecuentemente utilizada, la desviación media se define como la media aritmética de los valores absolutos de la desviación de cada valor de la variable con respecto a la media. Su formulación matemática es la siguiente:

Varianza y desviación típica

La desviación media no siempre suministra una idea clara del grado de separación entre los valores de una variable estadística. Para estudios científicos, se prefiere utilizar una pareja de parámetros relacionados que se conocen como varianza y desviación típica.

La varianza se define como el cociente entre la suma de los cuadrados de las desviaciones de los valores de la variable y el número de datos del estudio. Matemáticamente, se expresa como: