MUESTRA ESTADÍSTICA
El mejor resultado para un proceso estadístico sería estudiar a toda la población. Pero esto generalmente resulta imposible, ya sea porque supone un coste económico alto o porque requiere demasiado tiempo.
Frente a la dificultad de hacer un censo (estudio de toda la población), se examina una muestra estadística que representará a la totalidad de los sujetos. Con los resultado obtenidos mediante la muestra, se intentará inferir las propiedades de todos los elementos, mediante la estadística inferencial.
La muestra elegida debe ser representativa de la población. Las muestras tienen un nivel de confianza de la bondad con la que representan a todos los sujetos, generalmente del 95% o superior.
Ejemplo
ANUNCIOS
Supongamos que se realiza un control de calidad en una fábrica que produce dvds en el transcurso de un día. Esta empresa produce un millón de dvds diarios por lo que sería imposible para los controladores examinarlos todos. Por ello, se elige una muestra de cien elementos para realizar dicho control.
Pero surge la siguiente pregunta: ¿Cómo elegimos la muestra?
Existen diferentes tipos de muestreo.
http://www.universoformulas.com/estadistica/descriptiva/muestra-estadistica/
Tipos de muestreo
ANUNCIOS
Las muestras pueden ser elegidas mediante diversas técnicas o procedimientos. Estas técnicas se clasifican según el según como sean elegidos los individuos. Se dividen en dos grandes grupos:
- Muestreo probabilístico (o muestreo aleatorio): proceso de selección de individuos de manera que cada sujeto tiene probabilidad positiva e independiente de ser seleccionado.
- Muestreo aleatorio simple: 1) todos los individuos tienen la misma probabilidad de ser elegidos, 2) las observaciones se realizan con reemplazamiento, de forma que la población es igual en todas las extracciones.
- Muestreo aleatorio estratificado: los individuos se dividen en grupos o estratos. La muestra se elige escogiendo en cada estrato un número representativo de individuos.
- Muestreo aleatorio sistemático: se utiliza en muestras ordenadas. Consiste en seleccionar al azar un elemento y a partir de él, incrementando un intervalo fijo, seleccionar toda la muestra.
- Muestreo aleatorio por conglomerados: la población está dividida en conglomerados naturales (provincias, ciudades,etc.). Se seleccionan algunos conglomerados y se toman en representación de toda la población.
- Muestreo no probabilístico (o muestreo no aleatorio): la selección de los individuos se basa en el criterio del investigador. No se conoce la probabilidad de que cada individuo sea elegido en la muestra.
- Muestreo por cuotas: se basa en seleccionar la muestra después de dividir la población en grupos o estratos. Los sujetos dentro de cada grupo se eligen por métodos no probabilísticos.
- Muestreo por conveniencia: consiste en seleccionar a los individuos que convienen al investigador para la muestra. Esta conveniencia se produce porque al investigador le resulta más fácil examinar a estos sujetos, ya sea por proximidad geográfica, por ser sus amigos, etc.
- Muestreo de bola de nieve (o muestreo por referidos): se realiza sobre poblaciones en las que no se conoce a sus individuos o es muy difícil acceder a ellos. Se llama muestreo de bola de nieve porque cada sujeto estudiado propone a otros, produciendo un efecto acumulativo parecido a una bola de nieve.
- Muestreo casual o accidental: los individuos son elegidos de manera casual, sin ningún juicio previo. Las personas que realizan el estudio eligen un lugar o un medio, y desde ahi realizan el estudio a los individuos de la población que accidentalmente se encuentren a su disposición.
- Muestreo discrecional (o muestreo por juicio): los sujetos se seleccionan a base del conocimiento y juicio del investigador.
muestra es un subconjunto de casos o individuos de una población. En diversas aplicaciones interesa que una muestra sea una muestra representativa y para ello debe escogerse una técnica de muestreo adecuada que produzca una muestra aleatoria adecuada ( se obtiene una muestra sesgada cuyo interés y utilidad es más limitado dependiendo del grado de sesgo que presente).
Introducción
Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma (una muestra representativa se denomina técnicamente muestra aleatoria). Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste (véanse las ventajas de la elección de una muestra, más abajo).
Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de toda la población porque el manejo de un menor número de datos provoca también menos errores en su manipulación. En cualquier caso, el conjunto de individuos de la muestra son los sujetos realmente estudiados.
El número de sujetos que componen la muestra suele ser bastante inferior a la población total, aunque suficiente grande como para que la estimación de los parámetros determinados tenga un nivel de confianza adecuado. Para que el tamaño de la muestra sea idóneo es preciso recurrir a su cálculo.
Otras definiciones relacionadas
Espacio muestral
El espacio muestral del que se toma una muestra concreta está formado por el conjunto de todas las posibles muestras que se pueden extraer de una población mediante una determinada técnica de muestreo.
Para una población finita de n individuos el espacio muestral está formado por subconjuntos posibles. En la práctica a veces se usan espacios muestrales idealizados con número infinito de puntos indexados por un conjunto variables reales.
Parámetro o Estadístico muestral
Un parámetro estadístico o simplemente un estadístico muestral es cualquier valor calculado a partir de la muestra, como por ejemplo la media, varianza o una proporción, que describe a una población y puede ser estimado a partir de una muestra. Un estadístico muestral es un tipo de variable aleatoria, y que como tal, tiene una distribución de probabilidad concreta, frecuentemente caracterizada por un conjunto finito de parámetros.
Estimación
Una estimación estadística es cualquier técnica para conocer un valor aproximado de un parámetro referido a la población, a partir de los estadísticos muestrales calculados a partir de los elementos de la muestra. Si se estima el suficiente número de parámetros puede aproximarse de manera razonable la distribución de probabilidad de la población para ciertas variables aleatorias.
Nivel de confianza
El nivel de confianza de una aseveración basada en la inferencia estadística es una medida de la bondad de la estimación realizada a partir de estadísticos muestrales. Usualmente se usan niveles de confianza para intervalos de confianza o bien p-valores que miden la probabilidad de errores de tipo I (probabilidad de rechazar una cierta hipótesis siendo que esta era correcta)
Ejemplo
Se tiene una población de 222.222 habitantes y se quiere conocer cuantos de ellos son hombres y cuantos de ellos son mujeres. Se conjetura que cerca del 50% son mujeres y el resto hombres, pero se quiere seleccionar una muestra para determinar cuantos hombres y mujeres hay en la muestra y a partir de ahí inferir el porcentaje exacto de hombres y mujeres en la población total. La descripción de una muestra, y los resultados obtenidos sobre ella, puede ser del tipo mostrado en el siguiente ejemplo:
Dimensión de la población: | 222.222 habitantes |
Probabilidad del evento: | Hombre o Mujer 50% |
Nivel de confianza: | 90% |
Desviación tolerada: | 5% |
Resultado | 196 |
Tamaño de la muestra: | 270 |
La interpretación de esos datos sería la siguiente:
- La población a investigar tiene 222.222 habitantes y queremos saber cuántos son hombres o mujeres.
- Estimamos en un 50% para cada sexo y para el propósito del estudio es suficiente un 90% de seguridad con un nivel entre 90 - 5 y 90 + 5.
- Generamos una tabla de 280 números al azar entre 1 y 222.222 y en un censo numerado comprobamos el género para los seleccionados.
Ventajas de la elección de una muestra
El estudio de muestras es preferible, en la mayoría de los casos, por las siguientes razones:
- Si la población es muy grande (en ocasiones, infinita, como ocurre en determinados experimentos aleatorios) y, por tanto, imposible de analizar en su totalidad.
- Las características de la población varían si el estudio se prolonga demasiado tiempo.
- Reducción de costos: al estudiar una pequeña parte de la población, los gastos de recogida y tratamiento de los datos serán menores que si los obtenemos del total de la población.
- Rapidez: al reducir el tiempo de recogida y tratamiento de los datos, se consigue mayor rapidez.
- Viabilidad: la elección de una muestra permite la realización de estudios que serían imposible hacerlo sobre el total de la población.
- La población es suficientemente homogénea respecto a la característica medida, con lo cual resultaría inútil malgastar recursos en un análisis exhaustivo (por ejemplo, muestras sanguíneas).
- El proceso de estudio es destructivo o es necesario consumir un artículo para extraer la muestra (ejemplos: vida media de una bombilla, carga soportada por una cuerda, precisión de un proyectil, etc.).
Descripción matemática de una muestra aleatoria
El uso de muestras para deducir fiablemente características de la población requiere que se trate con muestras aleatorias. Si la muestra estadística considerada no constituye una muestra aleatoria las conclusiones basadas en dicha muestra no son fiables y en general estarán sesgadas en algún aspecto.
En términos matemáticos, dada una variable aleatoria X con una distribución de probabilidad F, una muestra aleatoria de tamaño N es un conjunto finito de N variables independientes, con la misma distribución de probabilidad F.1
Otra forma más intuitiva, de entender una muestra es considerar que una muestra es una sucesión de N experimentos independientes de una misma cantidad. Es importante diferenciar una muestra de tamaño N, o más exactamente un muestreo de tamaño N, del resultado concreto de los N experimentos (que como conjunto de valores fijos, en sí mismo, no es una muestra). El concepto de muestra incluye de alguna manera el procedimiento escogido para obtener los datos (es decir, si las variables aleatorias consideradas son independientes entre sí, y si tienen la misma distribución).
En general, resulta muy fácil comprobar si una determinada muestra es o no aleatoria, cosa que sólo puede hacerse considerando otro tipo de muestreos aleatorios robustos que permitan decir si la primera muestra era aleatoria o no.
No hay comentarios:
Publicar un comentario