AMIGOS PARA SIEMPRE: ARTÍCULOS DE ESTADÍSTICA

El muestreo de conveniencia (también conocido como muestreo por agarre , muestreo accidental o muestreo de oportunidad ) es un tipo de muestreo no probabilístico que involucra que la muestra se extraiga de esa parte de la población que está cerca. Este tipo de muestreo es más útil para pruebas piloto .

Definición [ editar ]

Una muestra de conveniencia es un tipo de método de muestreo no probabilístico en el que la muestra se toma de un grupo de personas de fácil contacto o alcance. Por ejemplo, pararse en un centro comercial o una tienda de comestibles y pedirle a la gente que responda preguntas sería un ejemplo de una muestra de conveniencia. Este tipo de muestreo también se conoce como muestreo por muestreo o muestreo por disponibilidad. No hay otros criterios para el método de muestreo, excepto que las personas estén disponibles y dispuestas a participar. Además, este tipo de método de muestreo no requiere que se genere una muestra aleatoria simple, ya que el único criterio es si los participantes aceptan participar. ^[1]

Aplicaciones [ editar ]

El muestreo de conveniencia a menudo no se recomienda para la investigación debido a la posibilidad de errorde muestreo y la falta de representación de la población. Pero puede ser útil dependiendo de la situación. En algunas situaciones, el muestreo por conveniencia es la única opción posible. Por ejemplo, un estudiante universitario que está realizando un proyecto a término y quiere saber el consumo promedio de coca en esa ciudad universitaria el viernes por la noche, probablemente llamará a algunos de sus amigos y les preguntará cuántas latas de coca beben o irán a Una fiesta cercana para hacer una encuesta fácil. Siempre hay una compensación entre este método de muestreo rápido y precisión. Las muestras recolectadas pueden no representar la población de interés y, por lo tanto, ser una fuente de sesgo.

En el ejemplo anterior, si dicha ciudad universitaria tiene una población pequeña y está compuesta principalmente por estudiantes, y ese estudiante en particular elige una fiesta de graduación para la encuesta , entonces su muestra tiene una buena oportunidad de representar a la población. Un tamaño de muestra más grande reducirá la posibilidad de que ocurra un error de muestreo.

Otro ejemplo sería una empresa de juegos de azar que quiera saber cómo le está yendo al mercado uno de sus juegos un día después de su lanzamiento. Su analista puede optar por crear una encuesta en línea en Facebookpara calificar ese juego. El mayor desafío de este enfoque será llegar a las personas que juegan juegos. Como las redes sociales son un lugar vasto, siempre es difícil recopilar muestras de la población de interés. Es posible que la mayoría de las personas no estén interesadas o se tomen en serio la encuesta mientras la completan, lo que resulta en un error de muestreo. La encuesta puede mejorar mucho si el analista la publica en páginas de fans dedicadas a los amantes de los juegos. Él puede encontrar mucha más gente en ese grupo que estaría dispuesto a juzgar y calificar el juego de forma crítica.

Ventajas [ editar ]

El muestreo de conveniencia puede ser utilizado por casi cualquier persona y ha existido por generaciones. Una de las razones por las que se usa con más frecuencia es debido a las numerosas ventajas que proporciona. Este método es extremadamente rápido, fácil, fácilmente disponible y rentable, lo que hace que sea una opción atractiva para la mayoría de los investigadores. ^[2]

Recopilación de datos acelerada

Cuando el tiempo es esencial, muchos investigadores recurren al muestreo de conveniencia para la recopilación de datos , ya que pueden recopilar datos rápidamente y comenzar sus cálculos. ^[3] Es útil en investigaciones sensibles al tiempo porque se necesita muy poca preparación para usar el muestreo de conveniencia para la recopilación de datos. También es útil cuando los investigadores necesitan realizar una recopilación de datos piloto para obtener una comprensión rápida de ciertas tendencias o desarrollar hipótesis para futuras investigaciones. Al recopilar información rápidamente, los investigadores y los científicos pueden aislar tendencias en crecimiento o extrapolar información generalizada de la opinión pública local. ^[4]

Facilidad de investigacion

Para los investigadores que no buscan un muestreo preciso, pueden simplemente recopilar su información y pasar a otros aspectos de su estudio. Este tipo de muestreo se puede hacer simplemente creando un cuestionario y distribuyéndolo a su grupo objetivo. A través de este método, los investigadores pueden terminar fácilmente de recopilar sus datos en cuestión de horas, sin preocuparse de si se trata de una representación precisa de la población . ^[5] Esto permite una gran facilidad de investigación, lo que permite a los investigadores centrarse en analizar los datos en lugar de entrevistar y seleccionar cuidadosamente a los participantes.

Disponibilidad lista

Dado que la mayoría de los muestreos de conveniencia se recolectan con las poblaciones disponibles, los datos están disponibles para que el investigador los recopile. ^[6] Por lo general, no tienen que recorrer grandes distancias para recopilar los datos, sino simplemente extraer de cualquier entorno cercano. Tener un grupo de muestra disponible es importante para cumplir con las cuotas rápidamente, y le permite al investigador incluso realizar múltiples estudios de manera expedita. ^[7]

Rentabilidad

Uno de los aspectos más importantes del muestreo de conveniencia es su rentabilidad. Este método permite que los fondos se distribuyan a otros aspectos del proyecto. A menudo, este método de muestreo se utiliza para obtener financiamiento para un proyecto de investigación más amplio y completo. En este caso, los fondos aún no están disponibles para una encuesta más completa, por lo que se utilizará una selección rápida de la población para demostrar la necesidad del proyecto completado. ^[8]

Desventajas [ editar ]

Aunque el muestreo por conveniencia puede ser fácil de obtener, sus desventajas generalmente superan las ventajas. Esta técnica de muestreo puede ser más apropiada para un tipo de estudio y menos para otro.

Parcialidad

Los resultados del muestreo de conveniencia no se pueden generalizar a la población objetivo debido al posible sesgo de la técnica de muestreo debido a la subrepresentación de los subgrupos en la muestra en comparación con la población de interés. El sesgo de la muestra no se puede medir. Por lo tanto, las inferencias basadas en el muestreo de conveniencia deben hacerse solo sobre la muestra en sí. ^[9]

Poder

El muestreo de conveniencia se caracteriza con un poder insuficiente para identificar las diferencias de los subgrupos de población.

La precisión es una descripción de los errores aleatorios , una medida de la variabilidad estadística .

La exactitud tiene dos definiciones:

Más comúnmente, es una descripción de errores sistemáticos , una medida de sesgo estadístico ; la baja precisión causa una diferencia entre un resultado y un valor "verdadero". ISO llama a esto la verdad .
Alternativamente, ISO define la precisión como la descripción de una combinación de ambos tipos de error de observación (aleatorio y sistemático), por lo que la alta precisión requiere tanto alta precisión como alta exactitud.

En términos más simples, dado un conjunto de puntos de datos a partir de mediciones repetidas de la misma cantidad, se puede decir que el conjunto es preciso si los valores son cercanos entre sí, mientras que se puede decir que el conjunto es exacto si su promedio está cerca de El verdadero valor de la cantidad que se mide. En la primera definición, más común, los dos conceptos son independientes entre sí, por lo que se puede decir que un conjunto particular de datos es preciso o exacto, o ambos, o ninguno.

Definición técnica común [ editar ]

La precisión es la proximidad de los resultados de medición al valor verdadero; precisión es el grado en que las mediciones repetidas (o reproducibles ) en condiciones sin cambios muestran los mismos resultados.

En los campos de la ciencia y la ingeniería , la precisión de un sistema de medición es el grado de cercanía de las mediciones de una cantidad al valor real de esa cantidad . ^[1] La precisión de un sistema de medición, relacionada con la reproducibilidad y la repetibilidad , es el grado en que las mediciones repetidas en condiciones sin cambios muestran los mismos resultados . ^[1]^[2] Aunque las dos palabras precisión y exactitud pueden ser sinónimos en el uso coloquial , se contrastan deliberadamente en el contexto demétodo científico .

El campo de las estadísticas , donde la interpretación de las mediciones juega un papel central, prefiere utilizar los términos sesgo y variabilidad en lugar de precisión y exactitud: sesgo es la cantidad de imprecisión y variabilidad es la cantidad de imprecisión.

Un sistema de medición puede ser preciso pero no preciso, preciso pero no exacto, ninguno de los dos, o ambos. Por ejemplo, si un experimento contiene un error sistemático , aumentar el tamaño de la muestra generalmente aumenta la precisión pero no mejora la precisión. El resultado sería una serie de resultados coherente pero inexacta del experimento defectuoso. Eliminar el error sistemático mejora la precisión pero no cambia la precisión.

Un sistema de medición se considera válido si es preciso y exacto . Los términos relacionados incluyen sesgo ( efectos no aleatorios o dirigidos causados por un factor o factores no relacionados con la variable independiente ) y error (variabilidad aleatoria).

La terminología también se aplica a mediciones indirectas, es decir, valores obtenidos mediante un procedimiento computacional a partir de datos observados.

Además de la precisión y la precisión, las mediciones también pueden tener una resolución de medición , que es el cambio más pequeño en la cantidad física subyacente que produce una respuesta en la medición.

En el análisis numérico , la precisión es también la proximidad de un cálculo al valor verdadero; mientras que la precisión es la resolución de la representación, típicamente definida por el número de dígitos decimales o binarios.

En términos militares, la precisión se refiere principalmente a la precisión del fuego (o "justesse de tir"), la precisión del fuego expresada por la cercanía de un grupo de disparos en y alrededor del centro del objetivo. ^[3]

Cuantificación [ editar ]

En la instrumentación industrial, la precisión es la tolerancia de medición o transmisión del instrumento y define los límites de los errores cometidos cuando el instrumento se utiliza en condiciones normales de operación. ^[4]

Lo ideal es que un dispositivo de medición sea preciso y preciso, con mediciones cercanas y agrupadas en torno al valor real. La precisión y la precisión de un proceso de medición generalmente se establecen mediante la medición repetida de algún estándar de referencia rastreable . Dichos estándares se definen en el Sistema Internacional de Unidades (abreviado SI de French: Système international d'unités) y son mantenidos por organizaciones de estándares nacionales como el Instituto Nacional de Estándares y Tecnología de los Estados Unidos.

Esto también se aplica cuando las mediciones se repiten y promedian. En ese caso, el término error estándar se aplica correctamente: la precisión del promedio es igual a la desviación estándar conocida del proceso dividida por la raíz cuadrada del número de mediciones promediadas. Además, el teorema del límite central muestra que la distribución de probabilidad de las mediciones promediadas estará más cerca de una distribución normal que la de mediciones individuales.

Con respecto a la precisión podemos distinguir:

la diferencia entre la media de las mediciones y el valor de referencia, el sesgo . Establecer y corregir la desviación es necesario para la calibración .
El efecto combinado de eso y la precisión.

Una convención común en ciencia e ingeniería es expresar la precisión y / o la precisión implícitamente por medio de cifras significativas . Aquí, cuando no se indica explícitamente, se entiende que el margen de error es la mitad del valor del último lugar significativo. Por ejemplo, una grabación de 843.6 m, u 843.0 m, u 800.0 m implicaría un margen de 0.05 m (el último lugar significativo es el décimo lugar), mientras que una grabación de 8436 m implicaría un margen de error de 0.5 m ( Los últimos dígitos significativos son las unidades).

Una lectura de 8,000 m, con ceros finales y sin punto decimal, es ambigua; los ceros finales pueden o no ser considerados como cifras significativas. Para evitar esta ambigüedad, el número podría representarse en notación científica: 8.0 × 10 ³ m indica que el primer cero es significativo (por lo tanto, un margen de 50 m), mientras que 8.000 × 10 ³ m indica que los tres ceros son significativos, dando un margen de 0,5 m. Del mismo modo, es posible utilizar un múltiplo de la unidad de medida básica: 8.0 km es equivalente a 8.0 × 10 ³ m. De hecho, indica un margen de 0.05 km (50 m). Sin embargo, la confianza en esta convención puede llevar a una falsa precisión.Errores al aceptar datos de fuentes que no lo obedecen. Por ejemplo, una fuente que informa un número como 153,753 con precisión +/- 5,000 parece que tiene precisión +/- 0.5. Bajo la convención se habría redondeado a 154,000.

La precisión incluye:

repetibilidad : la variación que surge cuando se hacen todos los esfuerzos para mantener las condiciones constantes utilizando el mismo instrumento y operador, y se repite durante un corto período de tiempo; y
reproducibilidad : la variación que surge utilizando el mismo proceso de medición entre diferentes instrumentos y operadores, y durante períodos de tiempo más largos.

Definición ISO (ISO 5725) [ editar ]

Según la norma ISO 5725-1, la precisión consiste en la veracidad (la proximidad de los resultados de la medición al valor real) y la precisión (repetibilidad o reproducibilidad de la medición)

Un cambio en el significado de estos términos apareció con la publicación de la serie de estándares ISO 5725 en 1994, que también se refleja en la edición de 2008 del "BIPM International Vocabulary of Metrology" (VIM), ítems 2.13 y 2.14. ^[1]

De acuerdo con la norma ISO 5725-1, ^[5] el término general " precisión " se usa para describir la cercanía de una medida al valor real. Cuando el término se aplica a conjuntos de mediciones del mismo mensurando , implica un componente de error aleatorio y un componente de error sistemático. En este caso, la veracidad es la proximidad de la media de un conjunto de resultados de medición al valor real (verdadero) y la precisión es la concordancia entre un conjunto de resultados.

ISO 5725-1 y VIM también evitan el uso del término " sesgo ", especificado previamente en BS 5497-1, ^[6] porque tiene diferentes connotaciones fuera de los campos de la ciencia y la ingeniería, como en medicina y leyes.

Exactitud de un agrupamiento de objetivos según BIPM e ISO 5725

Baja precisión debido a mala precisión.
Baja precisión debido a la falta de veracidad

En la clasificación binaria [ editar ]

La precisión también se usa como una medida estadística de cómo una prueba de clasificación binaria identifica o excluye correctamente una condición. Es decir, la precisión es la proporción de resultados verdaderos (ambos verdaderos positivos y verdaderos negativos ) entre el número total de casos examinados. ^[7] Para aclarar el contexto mediante la semántica, a menudo se lo denomina "exactitud de Rand" o " índice de Rand ". ^[8]^[9]^[10] Es un parámetro de la prueba. La fórmula para cuantificar la precisión binaria es:

Precisión = (TP + TN) / (TP + TN + FP + FN)

donde: TP = Verdadero positivo; FP = Falso positivo; TN = Verdadero negativo; FN = Falso negativo

La fórmula para cuantificar la precisión binaria es: Precisión = (TP) / (TP + FP)

En la psicometría y la psicofísica [ editar ]

En psicometría y psicofísica , el término precisión se usa indistintamente con validez y error constante . Precisiónes sinónimo de fiabilidad y error variable . La validez de un instrumento de medición o prueba psicológica se establece mediante el experimento o la correlación con el comportamiento. La confiabilidad se establece con una variedad de técnicas estadísticas, clásicamente a través de una prueba de consistencia interna como el alfa de Cronbach para garantizar que los conjuntos de preguntas relacionadas tengan respuestas relacionadas, y luego la comparación de las preguntas relacionadas entre la población de referencia y la población objetivo. ^{Elcita requerida ]}

En simulación lógica [ editar ]

En la simulación lógica , un error común en la evaluación de modelos precisos es comparar un modelo de simulación lógica con un modelo de simulación de circuito de transistor . Esta es una comparación de las diferencias en la precisión, no en la precisión. La precisión se mide con respecto al detalle y la precisión se mide con respecto a la realidad. ^[11]^[12]

En sistemas de información [ editar ]

Los sistemas de recuperación de información, como las bases de datos y los motores de búsqueda web , se evalúan mediante diferentes indicadores , algunos de los cuales se derivan de la matriz de confusión , que divide los resultados en verdaderos positivos (documentos recuperados correctamente), verdaderos negativos (documentos correctamente no recuperados), falsos positivos (documentos recuperados incorrectamente) y falsos negativos (documentos incorrectamente no recuperados). Las métricas de uso común incluyen las nociones de precisión y recuperación . En este contexto, la precisión se define como la fracción de documentos recuperados que son relevantes para la consulta (verdaderos positivos divididos por verdaderos + falsos positivos), utilizando un conjunto de verdad fundamentalResultados relevantes seleccionados por los humanos. La recuperación se define como la fracción de documentos relevantes recuperados en comparación con el número total de documentos relevantes (verdaderos positivos divididos por verdaderos positivos + falsos negativos). Con menos frecuencia, se utiliza la métrica de precisión, se define como el número total de clasificaciones correctas (verdaderos positivos más verdaderos negativos) dividido por el número total de documentos.

Ninguna de estas métricas tiene en cuenta el ranking de resultados. La clasificación es muy importante para los motores de búsqueda web porque los lectores rara vez pasan de la primera página de resultados, y hay demasiados documentos en la web para clasificarlos manualmente en cuanto a si deben incluirse o excluirse de una búsqueda determinada. Agregar un punto de corte a un número particular de resultados toma en cuenta la clasificación hasta cierto punto. La precisión de la medida en k , por ejemplo, es una medida de precisión que se ve solo en los diez primeros resultados de búsqueda (k = 10). Las métricas más sofisticadas, como la ganancia acumulada descontada , toman en cuenta cada clasificación individual, y se usan más comúnmente cuando esto es importante.

La paradoja de la precisión es el hallazgo paradójico de que la precisión no es una buena métrica para los modelos predictivos cuando se clasifica en el análisis predictivo . Esto se debe a que un modelo simple puede tener un alto nivel de precisión pero ser demasiado crudo para ser útil. Por ejemplo, si la incidencia de la categoría A es dominante, encontrándose en el 99% de los casos, la predicción de que cada caso es de categoría A tendrá una precisión del 99%. La precisión y el recuerdo son mejores medidas en estos casos. ^[1]^[2]El problema subyacente es que hay un desequilibrio de clase entre la clase positiva y la clase negativa ^[3]. Las probabilidades previas para estas clases deben tenerse en cuenta en el análisis de errores. La precisión y la recuperación ayudan, pero la precisión también puede estar sesgada por los anteriores de clase muy desequilibrados en los conjuntos de pruebas.

El sesgo de aquiescencia es una categoría de sesgo de respuesta en la que los encuestados tienen una tendencia a estar de acuerdo con todas las preguntas o a indicar una connotación positiva. ^[1]^{[2] La} aquiescencia a veces se denomina "sí" y es la tendencia de un encuestado a estar de acuerdo con una afirmación cuando está en duda. Esto es particularmente en el caso de encuestas o cuestionarios que emplean truismos , tales como: "Es mejor dar que recibir" o "Nunca un prestamista ni un prestatario".

Douglas N. Jackson demostró su aquiescencia respondiendo en la escala F de California (una medida de autoritarismo), que contiene tales truismos. Creó una versión de clave inversa de la escala F de California, donde todos los elementos tenían el significado opuesto (consulte los dos ejemplos anteriores para ver un par de declaraciones tan contradictorias). Él administró tanto la versión original como la inversa de la escala F de California al mismo grupo de encuestados. Se podría esperar que la correlación entre estas dos escalas sea negativa, pero hubo una alta correlación positiva. Jackson interpretó esto como evidencia de la aceptación de la respuesta. Los encuestados simplemente estaban de acuerdo con las afirmaciones, independientemente del contenido.

Jackson y Messick, utilizando el análisis factorial, también demostraron que los dos factores principales que explican la mayoría de la variación de respuesta en el Inventario de personalidad multifásico de Minnesota(MMPI) fueron para la respuesta social y la aceptación ^[3] (esto también sería válido para el MMPI revisado -2).

Un enfoque para lidiar con la aceptación de las encuestas y cuestionarios es emplear un balance de elementos con claves positivas y negativas en términos del contenido deseado. Por ejemplo, al tratar de evaluar la depresión, sería una buena idea incluir también elementos que evalúen la felicidad y la satisfacción, etc. (elementos de clave inversa), además del contenido depresivo habitual.

AMIGOS PARA SIEMPRE

Páginas

martes, 2 de julio de 2019

ARTÍCULOS DE ESTADÍSTICA