martes, 4 de abril de 2017

Estadística inferencial

MUESTREO ESTRATIFICADO


En el muestreo estratificado, los individuos se dividen en grupos o estratos. Cada elemento pertenece a un único estrato.
Dibujo del muestreo estratificado
La muestra se elige escogiendo en cada estrato un número representativo de individuos. La elección de los elementos en cada estrato se realiza mediante algún método de muestreo aleatorio simple o muestreo sistemático.
Suponemos que hay k estratos de tamaños N1N2,…, Nk, de forma que:
Fórmula de la suma de los elementos de los estratos en el muestreo estratificado
En cada estrato se toman n1n2,…, nk elementos para la muestra, de manera que se toman en total n individuos, es decir:
Fórmula de la suma de los elementos escogidos para la muestra en los estratos mediante el muestreo estratificado
ANUNCIOS

Se tomará una muestra que sea representativa del conjunto de la población. El número de individuos que se eligen de cada estrato se puede decidir mediante diversos criterios:
  1. Elección simple: se toman el mismo número de sujetos de cada uno de los k estratos. De cada estrato se seleccionarían n/k individuos. Este criterio no es recomendable cuando los estratos tienen diferente número de individuos.
  2. Elección proporcional al tamaño del estrato: el tamaño de la muestra en cada grupo es proporcional a los elementos de dicho grupo. En cada estrato se tomarán ni elementos, calculados mediante la fórmula:
    Fórmula del tamaño de la muestra en cada uno de los estratos siendo proporcional al tamaño de los estratos en el muestreo estratificado
    Por ejemplo, suponemos que estamos haciendo un estudio de la vista de la población de una ciudad. Suponemos que el 30% de la población lleva gafas y el 70% no. Mediante este método se escogería el 30% de la muestra de personas que lleven gafas y el 70% de los que no.
  3. Elección proporcional a la variabilidad del estrato: si se conoce la variabilidad de la característica que estamos tomando en cuenta en cada estrato, se toman los sujetos proporcionalmente a ella en cada grupo. En los grupos donde la varianza es mayor, se toman, por tanto, más sujetos.
    Fórmula del tamaño de la muestra en cada uno de los estratos siendo proporcional a la variabilidad de los estratos en el muestreo estratificado

Cuando utilizarlo

  • Se utiliza el método de muestreo estratificado cuando los elementos se dividen en estratos y estos estratos pueden ser diferenciales para la variable que se está estudiando.
    Por ejemplo, supongamos que hacen una encuesta para las elecciones en EEUU y se sabe que el candidato demócrata tiene mayor influencia en las mujeres que el candidato republicano. La muestra de la encuesta debería estratificarse en hombres y mujeres, puesto que sabemos que la variable género influye en la votación.
  • En las encuestas conocemos datos como la edad, sexo, nivel socioeconómico. Conviene que la muestre tenga una composición proporcional a los individuos de cada estrato.
  • Se utiliza el muestreo estratificado cuando los grupos o estratos son muy homogéneos internamente y diferentes entre ellos. Si los grupos son muy heterogéneos y no existen muchas diferencias entre ellos, es recomendable utilizar el muestreo por conglomerados.

Diferencia con el muestreo por cuotas

El muestreo estratificado se diferencia del muestreo por cuotas en que una vez se decide el número de sujetos que se van a elegir de cada estrato, en el método de muestreo estratificado se eligen los individuos aleatoriamente y en el muestreo por cuotas no.

El muestreo estratificado es uno de los tipos de muestreo probabilístico del que podemos hacer uso. Te invito a que sigas leyendo para conocer más de sus debilidades y fortalezas.
El muestreo estratificado es un procedimiento de muestreo en el que el objetivo de la población se separa en segmentos exclusivos, homogéneos (estratos), y luego una muestra aleatoria simple se selecciona de cada segmento (estrato). Las muestras seleccionadas de los diversos estratos se combinan en una una sola muestra. Este procedimiento de muestreo se refiere a veces cómo ” muestreo de cuota aleatorio”.

Pasos de selección para un muestreo estratificado

Hay ocho pasos principales en la selección de una muestra aleatoria estratificada:
  1.  Define la población objetivo.
  1.  Identifica la variable o variables de estratificación y determinar el número de estratos a usarse. Las variables de estratificación deben estar relacionados con el propósito de estudio. Si el propósito del estudio es hacer estimaciones de los subgrupos, las variables de estratificación deben estar relacionados con esos subgrupos. La disponibilidad de información auxiliar a menudo determina las variables de estratificación que se utilizan. Puede ser utilizada más de una variable de estratificación. Considera que a medida que el número de variables de estratificación aumenta, incrementa la probabilidad de que algunas de las variables cancelen los efectos de otras variables, no más de cuatro a seis variables de estratificación y no se deben utilizar más de seis estratos de una variable en particular.
  1.  Identifica un marco de muestreo existente o desarrolla un marco de muestreo que incluya información sobre la o las variables de estratificación para cada elemento de la población objetivo. Si el marco de la muestra no incluye la información en las variables de estratificación, la estratificación no sería posible.
  1.  Evalúa el marco de muestreo para la falta de cobertura, cobertura excesiva, múltiple, y la agrupación, y haz los ajustes cuando sea necesario.
  1.  Divide el marco de muestreo en estratos, categorías de la estratificación de la o las variables, creando un marco de muestreo para cada estrato. Dentro del estrato las diferencias deben reducirse al mínimo, y las diferencias entre los estratos deben maximizarse. Los estratos no deben estar superpuestos, en conjunto, debe constituir toda la población; estos deben ser independientes y mutuamente exclusivos del subconjunto de la población. Cada elemento de la población debe estar en un sólo estrato.
  1.  Asigna un número único a cada elemento.
  2. Determina el tamaño de la muestra para cada estrato. La distribución numérica de los elementos incluidos en la muestra a través de los diversos estratos determina el tipo de muestreo estratificado a implementar. Puede ser un muestreo proporcional estratificado o uno de los diversos tipos de muestreo estratificado desproporcionado.
  1.  Selecciona al azar el número específico de elementos de cada estrato. Al menos un elemento se debe seleccionar de cada estrato para la representación de la muestra; y por lo menos dos elementos deben ser elegidos de cada estrato para el cálculo del margen de error de las estimaciones calculadas a partir de los datos recogidos.

El muestreo estratificado proporcional

Hay dos subtipos principales de muestreo estratificado: el proporcional y el muestreo desproporcionado. En el muestreo estratificado proporcional, el número de elementos asignados a diversos estratos es proporcional a la representación de los estratos de la población objetivo; es decir, el tamaño de la muestra extraída de cada estrato es proporcional con el tamaño relativo de ese estrato de la población objetivo. La fracción de muestreo es aplicada a cada estrato, dando a cada elemento de la población la misma oportunidad para ser seleccionados. La muestra resultante es una muestra autoponderada. Este procedimiento de muestreo se utiliza cuando el propósito de la investigación es estimar los parámetros poblacionales.

Un ejemplo hipotético de asignación proporcional se presenta en la siguiente tabla:
REGIÓN DE MARKETINGPOBLACIÓNMUESTRA ESTRATIFICADA PROPORCIONAL
FRECUENCIAPORCENTAJEFRECUENCIAPORCENTAJE
Zona 11800033%39633%
Zona 26001%121%
Zona 31200022%26422%
Zona 42400044%52844%
Total54600100%1200100%
En este ejemplo, los elementos incluidos en la muestra se asignaron a través de las cuatro zonas de una región de marketing de manera que la proporción de elementos que se tomaron para la muestra de cada zona es idéntica a la proporción de elementos de cada zona de la población total. La fracción de muestreo en cada zona es el mismo 1 de 22 elementos. Cada zona está igualmente representada en la muestra.
Muchas veces el investigador no sólo desea estimar parámetros poblacionales sino también hacer análisis detallado dentro de un estrato relativamente pequeño y/o comparar los estratos entre sí. El muestreo estratificado proporcional puede no dar resultados en algunos de los estratos de este tipo de análisis. Tomando el ejemplo descrito en nuestra tabla,  no sería posible realizar un análisis detallado de los elementos de la zona 2  ya que sólo 12 de los elementos se encuentran en la muestra. Además, la comparación de los elementos de la zona 2 con las otras zonas serían dudoso. El muestreo estratificado proporcional no es una buena elección de muestreo para llevar a cabo este tipo de análisis. El muestreo estratificado desproporcional puede ser una mejor elección.

El muestreo estratificado desproporcionado

Este es un procedimiento de muestreo estratificado en que el número de elementos incluidos en la muestra de cada estrato no es proporcional a su representación en la población total. Los elementos de la población no tienen la misma oportunidad de ser incluidos en la muestra. La misma fracción de muestreo no se aplica a cada estrato. Por otra parte, los estratos tienen diferentes fracciones de muestreo, y como tal, este procedimiento de muestreo no es una selección equiprobable. Con el fin de estimar los parámetros de población, la composición poblacional debe utilizarse para compensar la desproporción en la muestra. Sin embargo, para algunos proyectos de investigación el muestreo estratificado desproporcionado puede ser más apropiado que el muestreo estratificado proporcional.
El muestreo estratificado desproporcionado puede ser dividido en tres subtipos con base a los propósitos de nuestra asignación, que por ejemplo podrían ser el facilitar el análisis dentro de los estratos o centrarse en la optimización de los costos, de la precisión o  la optimización de ambos: precisión y costos.
El objetivo de un estudio puede requerir de un investigador que lleve a cabo el análisis detallado de los estratos de la muestra. Si se utiliza la estratificación proporcional, el tamaño de la muestra de un estrato es muy pequeña; por lo que puede ser difícil de cumplir los objetivos del estudio. La asignación proporcional puede no producir un número suficiente de casos para este tipo de análisis detallado. Una opción es el sobremuestreo de los estratos pequeños o poco frecuentes. Tal sobremuestreo crearía una distribución desproporcionada de los estratos de la muestra cuando se compara a la población. Sin embargo, puede haber un número suficiente de casos para llevar a cabo el análisis de los estratos requerido por los objetivos del estudio.
Utilizando el ejemplo hipotético descrito en la tabla superior, si se desea llevar a cabo un análisis detallado de la zona 2, uno podría sobremuestrear elementos de esa zona; por ejemplo, en lugar de un muestreo de sólo 12 elementos, muestra 130 elementos. Con el fin de llevar a cabo un análisis más significativo, analiza de manera detallada la zona 2, el tamaño de la muestra para ese distrito debe ser mayor a 12 elementos. Los resultados de la distribución de los elementos en la muestra por zona pueden parecerse a la distribución presentada en la tabla siguiente:

REGIÓN DE MARKETINGPOBLACIÓNMUESTRA ESTRATIFICADA DESPROPORCIONAL
FRECUENCIAPORCENTAJEFRECUENCIAPORCENTAJE
Zona 11800033%35730%
Zona 26001%13011%
Zona 31200022%23820%
Zona 42400044%47539%
Total54600100%1200100%

Puntos fuertes y debilidades del muestreo estratificado

El muestreo estratificado tiene muchas de las fortalezas y debilidades asociadas con la mayoría de los procedimientos de muestreo de probabilidad cuando se comparan con los procedimientos de muestreo no probabilísticos. En comparación con el muestreo aleatorio simple, las fortalezas del muestreo estratificado incluyen:
  • Capacidad para estimar no sólo los parámetros de población, sino también para hacer inferencia dentro de cada estrato y las comparaciones entre los estratos. Datos suficientes sobre subgrupos de interés quizá no puedan ser capturados en el muestreo aleatorio simple. Las muestras estratificadas producen pequeños errores de muestreo al azar que los que son obtenidos con una muestra aleatoria simple del mismo tamaño de la muestra. Un muestreo estratificado dará lugar a una muestra que es al menos tan precisa como una muestra aleatoria simple del mismo tamaño de la muestra.
  • Las muestras estratificadas tienden a ser más representativas de una población debido a que se asegura de que los elementos de cada estrato en la población están representados en la muestra. El muestreo puede ser estratificado para asegurar que la muestra se extiende sobre subáreas geográficas y subgrupos de población.
  • Al usar el muestreo estratificado, se aprovecha el conocimiento que el investigador tiene sobre la población.
  • La utilización de un muestreo estratificado permite al investigador utilizar diferentes procedimientos de muestreo dentro de los diferentes estratos.

Fortalezas y debilidades del muestreo estratificado en comparación con el muestreo aleatorio simple


FortalezasDebilidades
A diferencia del muestreo aleatorio simple, el  muestreo estratificado:A diferencia del muestreo aleatorio simple, el  muestreo estratificado:
  • Tiene una mayor capacidad de hacer inferencia dentro   de un estrato y  comparaciones entre los estratos.
  • Requiere información sobre la proporción de la población total que pertenece a cada estrato.
  • Tiene errores de muestreo al azar un poco más pequeños para la muestras de mismo tamaño, por lo que requiere tamaños de muestra más pequeños para el mismo margen de error.
  • La información sobre las variables de estratificación es requerida para cada elemento de la población. Si dicha información no está disponible, puede ser costosa su compilación.
  • Obtiene una muestra más representativa porque se asegura de que los elementos de cada estrato son representado en la muestra.
  • Es más caro, consume tiempo, y es más complicado que el muestreo aleatorio simple.
  • Saca mayor provecho de los conocimientos que el investigador tiene sobre la población.
  • La selección de las variables de estratificación puede ser difícil si un estudio implica un gran número de variables.
  • El análisis de los datos recogidos es más complejo que el análisis de los datos recogidos a través del muestreo aleatorio simple.
  • Permite el análisis de los patrones dentro del estrato y la notificación separada de los resultados para cada uno de los estratos.
  • Si se utiliza la asignación desproporcionada, se requiere la ponderación para hacer estimaciones precisas de los parámetros de la población.

¿Cuál es la diferencia entre el estratificado, toma de muestras y muestreo por cuotas?

El muestreo estratificado y el muestreo por cuotas son algo similares uno de otro. Ambos implican la división de la población objetivo en categorías y luego la selección de un cierto número de elementos de cada categoría; ambos procedimientos tienen como objetivo principal la selección de una muestra representativa y/o la facilitación del análisis de subgrupos. Sin embargo, hay diferencias importantes. El muestreo estratificado utiliza un muestreo aleatorio simple. Se necesita un marco de muestreo para el muestreo estratificado, pero no para el muestreo por cuotas.
En resumen, considera la posibilidad de elegir el muestreo estratificado si:
  • Es posible dividir una población en dos o más estratos y construir un marco homogéneo de muestreo para cada estrato.
  • Algunos subgrupos de la población son muy diferentes de otros subgrupos.
  • Es muy importante reducir al mínimo el error de muestreo.
  • La población es heterogénea.
  • Se desea un análisis comparativo de los estratos.

No hay comentarios:

Publicar un comentario