la diferencia de riesgo (DR), el riesgo excesivo o el riesgo atribuible es la diferencia entre el riesgo de un resultado en el grupo expuesto y el grupo no expuesto. Se calcula como, dónde es la incidencia en el grupo expuesto, y Es la incidencia en el grupo no expuesto. Si el riesgo de un resultado aumenta con la exposición, se utiliza el término aumento absoluto del riesgo (IRA) y se calcula como. De manera equivalente, si la exposición disminuye el riesgo de un resultado, se utiliza el término reducción absoluta del riesgo (ARR) y se calcula como. [1] [2]
El inverso de la reducción del riesgo absoluto es el número necesario para tratar , y el inverso del aumento del riesgo absoluto es el número necesario para el daño .
Uso en informes [ editar
Se recomienda utilizar mediciones absolutas, como la diferencia de riesgo, junto con las mediciones relativas, al presentar los resultados de ensayos controlados aleatorios. [3] Su utilidad se puede ilustrar con el siguiente ejemplo de un fármaco hipotético que reduce el riesgo de cáncer de colon de 1 caso en 5000 a 1 caso en 10,000 durante un año. La reducción del riesgo relativo es de 0.5, mientras que la reducción del riesgo absoluto es de 0.0001. La reducción del riesgo absoluto refleja la baja probabilidad de contraer cáncer de colon en primer lugar, mientras que el informe de solo la reducción del riesgo relativo correría el riesgo de que los lectores exageren la efectividad del medicamento. [4]
Autores como Ben Goldacre creen que la diferencia de riesgo se presenta mejor como un número natural : el medicamento reduce 2 casos de cáncer de colon a 1 caso si trata a 10,000 personas. Los no-expertos comprenden fácilmente los números naturales, que se utilizan en el número necesario para tratar el enfoque. [5]
Inferencia [ editar ]
Grupo | ||
---|---|---|
Experimental (E) | Control (C) | |
Eventos (E) | EE | CE |
No-eventos (N) | ES | CN |
La estimación puntual de la diferencia de riesgo es
La distribución muestral de RD es aproximadamente normal, con error estándar.
los intervalo de confianza para el RD es entonces
Ejemplos numericos [ editar ]
Reducción de riesgo [ editar ]
Ejemplo de reducción de riesgo. | |||
---|---|---|---|
Grupo experimental (E) | Grupo de control (C) | Total | |
Eventos (E) | EE = 15 | CE = 100 | 115 |
No-eventos (N) | EN = 135 | CN = 150 | 285 |
Total asignaturas (S) | ES = EE + EN = 150 | CS = CE + CN = 250 | 400 |
Tasa de eventos (ER) | EER = EE / ES = 0.1, o 10% | CER = CE / CS = 0.4, o 40% |
Ecuación | Variable | Abbr. | Valor |
---|---|---|---|
CER - EER | reducción absoluta del riesgo | ARR | 0.3, o 30% |
(CER - EER) / CER | reducción del riesgo relativo | RRR | 0.75, o 75% |
1 / (CER - EER) | número necesario para tratar | NNT | 3,33 |
EER / CER | Radio de riesgo | RR | 0.25 |
(EE / EN) / (CE / CN) | proporción de probabilidades | O | 0.167 |
(CER - EER) / CER | Fracción prevenible entre los no expuestos. | PF u | 0.75 |
Aumento de riesgo [ editar ]
Ejemplo de aumento de riesgo | |||
---|---|---|---|
Grupo experimental (E) | Grupo de control (C) | Total | |
Eventos (E) | EE = 75 | CE = 100 | 115 |
No-eventos (N) | EN = 75 | CN = 150 | 285 |
Total asignaturas (S) | ES = EE + EN = 150 | CS = CE + CN = 250 | 400 |
Tasa de eventos (ER) | EER = EE / ES = 0.5, o 50% | CER = CE / CS = 0.4, o 40% |
Ecuación | Variable | Abbr. | Valor |
---|---|---|---|
EER - CER | aumento absoluto del riesgo | ARI | 0.1, o 10% |
(EER - CER) / CER | aumento del riesgo relativo | RRI | 0.25, o 25% |
1 / (EER - CER) | número necesario para dañar | NNH | 10 |
EER / CER | Radio de riesgo | RR | 1.25 |
(EE / EN) / (CE / CN) | proporción de probabilidades | O | 1.5 |
(EER - CER) / EER | Fracción atribuible entre los expuestos. | AF e | 0.2 |
prueba ABX es un método para comparar dos opciones de estímulos sensoriales para identificar diferencias detectables entre ellos. A un sujeto se le presentan dos muestras conocidas (muestra A , la primera referencia y muestra B , la segunda referencia) seguidas de una muestra desconocida X que se selecciona aleatoriamente de A o B. El sujeto debe identificar la X como una A o B. Si X no se puede identificar de manera confiable con un valor p bajo en un número predeterminado de ensayos, la hipótesis nula no se puede rechazar y no se puede demostrar que exista una diferencia perceptible entre A y B.
Las pruebas ABX pueden realizarse fácilmente como pruebas doble ciego , eliminando cualquier posible influencia inconsciente del investigador o el supervisor de la prueba. Debido a que las muestras A y B se proporcionan justo antes de la muestra X, la diferencia no debe distinguirse de la suposición basada en la memoria a largo plazo o la experiencia pasada. Por lo tanto, la prueba ABX responde si, en circunstancias ideales, se puede encontrar una diferencia perceptiva.
Las pruebas ABX se usan comúnmente en evaluaciones de métodos de compresión de datos de audio digital ; la muestra A suele ser una muestra sin comprimir, y la muestra B es una versión comprimida de A. Los artefactos de compresión audibles que indican una deficiencia en el algoritmo de compresión se pueden identificar con pruebas posteriores. Las pruebas ABX también se pueden usar para comparar los diferentes grados de pérdida de fidelidad entre dos formatos de audio diferentes a una tasa de bits determinada .
Las pruebas ABX se pueden utilizar para escuchar los componentes de entrada, procesamiento y salida, así como el cableado: prácticamente cualquier producto de audio o diseño de prototipo.
Historia [ editar ]
La historia de las pruebas y nombres de ABX se remonta a 1950 en un artículo publicado por dos investigadores de Bell Labs, WA Munson y Mark B. Gardner, titulado Estandarización de pruebas auditivas . [1]
La prueba ha evolucionado a otras variaciones, como el control del sujeto sobre la duración y la secuencia de las pruebas. Un ejemplo de ello fue el comparador ABX de hardware en 1977, construido por la compañía ABX en Troy, Michigan, y documentado por uno de sus fundadores, David Clark. [2]
La compañía ABX ahora está inactiva y los comparadores de hardware en general como ofertas comerciales se han extinguido. Existe una gran cantidad de herramientas de software, como el complemento Foobar ABX para realizar comparaciones de archivos. Pero las pruebas de equipos de hardware requieren la construcción de implementaciones personalizadas.
Pruebas de hardware [ editar ]
El equipo de prueba ABX que utiliza relés para alternar entre dos rutas de hardware diferentes puede ayudar a determinar si hay diferencias de percepción en los cables y componentes. Se pueden comparar las rutas de transmisión de video, audio y digital. Si la conmutación está controlada por un microprocesador, es posible realizar pruebas doble ciego.
Las comparaciones de audio a nivel de altavoz y de nivel de línea se podrían realizar en un dispositivo de prueba ABX que se ofrezca en venta como el comparador ABX por QSC Audio Products desde 1998 hasta 2004. Otras soluciones de hardware han sido fabricadas en forma privada por individuos u organizaciones para pruebas internas.
Confianza [ editar ]
Si solo se realizara un ensayo ABX, las suposiciones aleatorias incurrirían en un 50% de probabilidad de elegir la respuesta correcta, al igual que lanzar una moneda. Para hacer una declaración que tenga cierto grado de confianza , se deben realizar muchos ensayos. Al aumentar el número de ensayos, la probabilidad de afirmar estadísticamente la capacidad de una persona para distinguir A y B aumenta para un nivel de confianza dado. Un nivel de confianza del 95% se considera estadísticamente significativo . [3] La compañía QSC, en el manual del usuario del comparador ABX, recomendó un mínimo de diez pruebas de audición en cada ronda de pruebas. [4]
Número de intentos | 10 | 11 | 12 | 13 | 14 | 15 | dieciséis | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Numero minimo correcto | 9 | 9 | 10 | 10 | 11 | 12 | 12 | 13 | 13 | 14 | 15 | 15 | dieciséis | dieciséis | 17 | 18 |
QSC recomendó que no se realicen más de 25 ensayos, ya que la fatiga del sujeto puede establecerse, lo que hace que la prueba sea menos sensible (es menos probable que revele la capacidad real de discernir la diferencia entre A y B). [4] Sin embargo, se puede obtener una prueba más sensible combinando los resultados de varias de esas pruebas utilizando individuos separados o pruebas del mismo sujeto realizadas entre los descansos. Para un gran número de ensayos N totales, se puede reclamar un resultado significativo (uno con un 95% de confianza) si el número de respuestas correctas excede. Las decisiones importantes normalmente se basan en un mayor nivel de confianza, ya que un "resultado significativo" erróneo se reclamaría en una de 20 de estas pruebas simplemente por casualidad.
Pruebas de software [ editar ]
Los reproductores de audio foobar2000 y Amarok son compatibles con las pruebas ABX basadas en software, este último utiliza un script de terceros. Lacinato ABX es una herramienta de prueba de audio multiplataforma para Linux, Windows y Mac de 64 bits. Lacinato WebABX es una herramienta ABX de audio de navegador cruzado basada en la web. aveX es un software de código abierto desarrollado principalmente para Linux que también proporciona monitoreo de prueba desde una computadora remota. El parche ABX es una implementación ABX para Max / MSP . Se puede encontrar más software ABX en el sitio web de PCABXarchivado . Herramienta de evaluación de audio web Una herramienta de evaluación de audio basada en navegador, para ejecutar muchas pruebas diferentes, incluyendo AB o ABX, no requiere codificación, ya que hay una GUI basada en navegador para crear evaluaciones de prueba.
Posibles fallas [ editar ]
ABX es un tipo de prueba de elección forzada . Las elecciones de un sujeto pueden ser válidas, es decir, el sujeto realmente trató honestamente de identificar si X parecía más cercano a A o B. Pero los sujetos no interesados o cansados podrían elegir al azar sin siquiera intentarlo. Si no se detecta, esto puede diluir los resultados de otros sujetos que tomaron la prueba con atención y someten el resultado a la paradoja de Simpson, lo que da como resultado resultados resumidos falsos. Simplemente mirando los totales de resultados de la prueba ( m de n respuestas correctas) no puede revelar las ocurrencias de este problema.
Este problema se agudiza si las diferencias son pequeñas. El usuario puede frustrarse y simplemente aspirar a terminar la prueba votando al azar. En este sentido, las pruebas de elección forzada, como ABX, tienden a favorecer resultados negativos cuando las diferencias son pequeñas si no se usan los protocolos adecuados para protegerse contra este problema.
Las mejores prácticas requieren tanto la inclusión de controles como la selección de sujetos: [7]
Otros defectos incluyen la falta de capacitación de los sujetos y la familiarización con la prueba y el contenido seleccionado:
Otros problemas pueden surgir del equipo ABX en sí, como lo describe Clark, [2] donde el equipo proporciona una indicación , lo que permite al sujeto identificar la fuente. La falta de transparencia del accesorio ABX crea problemas similares.
Dado que las pruebas auditivas y muchas otras pruebas sensoriales dependen de la memoria a corto plazo , que dura solo unos segundos, es fundamental que el dispositivo de prueba permita al sujeto identificar segmentos cortos que puedan compararse rápidamente. Las fallas y fallos en los aparatos de conmutación también deben eliminarse, ya que pueden dominar o interferir con los estímulos que se están probando en lo que se almacena en la memoria a corto plazo del sujeto.
Alternativas [ editar ]
Algorítmico Audio Evaluación de compresión [ editar ]
Dado que las pruebas ABX requieren seres humanos para la evaluación de los códecs de audio con pérdida, requiere mucho tiempo y es costoso. Por lo tanto, se han desarrollado enfoques más baratos, por ejemplo , PEAQ , que es una implementación del ODG .
MUSHRA [ editar ]
En MUSHRA , al sujeto se le presenta la referencia (etiquetada como tal), un cierto número de muestras de prueba, una versión oculta de la referencia y una o más anclas. Una escala de CLASIFICACIÓN de 0-100 permite calificar diferencias muy pequeñas.
Pruebas de discriminación [ editar ]
Se utilizan métodos generales alternativos en las pruebas de discriminación , como la comparación pareada, el dúo-trío y la prueba de triángulos . De estos, las pruebas de dúo-trío y triángulo están particularmente cerca de las pruebas de ABX. Esquemáticamente:
- Duo-trio
- AXY: uno conocido, dos desconocidos (uno es igual a A, otro es igual a B), la prueba es cuál es el desconocido: X = A (e Y = B) o Y = A (y X = B).
- Triángulo
- XXY: tres incógnitas (dos son A y una es B o una es A y dos son B), prueba que es la impar: Y = 1, Y = 2 o Y = 3.
En este contexto, las pruebas ABX también se conocen como "dúo-trío" en el modo de "referencia equilibrada"; ambos conocidos se presentan como referencias, en lugar de uno solo.
No hay comentarios:
Publicar un comentario