viernes, 28 de abril de 2017

Bioestadística Clínica



Variable aleatoria
Una función que asocia un número real, perfectamente definido, a cada punto muestral.
A veces las variables aleatorias (v.a.) están ya implícitas en los puntos muestrales.
Ejemplo 1: Experiencia consistente en medir la presión sistólica de 100 individuos. Un punto muestral (resultado de un experimento) es ya un número (presión sistólica). La v.a. está implícita.
Ejemplo 2: En el ejemplo de la mujer portadora de hemofilia.
= {sss, ssn, sns, snn, nss, nsn, nns, nnn}
Se podría definir una variable que asignara a cada punto muestral el número de orden en el espacio muestral.
X: sss 1; ssn 2; sns 3;...
Pero otra posible v.a.: a cada punto muestral el número de s. X: sss 3; ssn 2; ...
Los conjuntos pueden ser:
discretos: número finito o infinito numerable de elementos.
continuos: número infinito no numerable de elementos.
Las v.a. definidas sobre espacios muestrales discretos se llaman v.a. discretas y las definidas sobre espacios muestrales continuos se llaman continuas.
Una v.a. puede ser continua, aunque nosotros sólo podamos acceder a un subconjunto finito de valores. P.e. la presión arterial es una v.a. continua pero sólo podemos acceder a un conjunto finito de valores por la limitación de los aparatos de medida.
En general, las medidas dan lugar a v.a. continuas y los conteos a v.a. discretas.
Inducción de la probabilidad a variables aleatorias
Las v.a permiten definir la probabilidad como una función numérica (de variable real) en lugar de como una función de conjunto como se había definido antes
Ejemplo 3: Tiramos una moneda 3 veces. Representamos cara por c y cruz por z.
W = {ccc, ccz, czc, zcc, czz, zcz, zzc, zzz}
La probabilidad de cada suceso elemental es 1/8. Por ejemplo p(ccc)=1/8, ya que la probabilidad de sacar cara en una tirada es 1/2 según la definición clásica y las tiradas son independientes.
Definimos la v.a. X: número de caras, que puede tomar los valores {0, 1, 2, 3}. Se buscan todos los puntos muestrales que dan lugar a cada valor de la variable y a ese valor se le asigna la probabilidad del suceso correspondiente.
x
Sucesos
px
0{zzz}1/8
1{czz, zcz, zzc}3/8
2{ccz, czc, zcc}3/8
3{ccc}1/8
A esta función se le denomina función densidad de probabilidad (fdp), que desgraciadamente "funciona" de distinta manera en las variables discreta que en las continuas. En el caso de las variables discretas, como en el ejemplo, es una función que para cada valor de la variable da su probabilidad.
Ejemplo 4: Supongamos la variable tipo histológico de un tumor, con los valores 1, 2, 3, 4. Si la fdp fuera
x
f(x)
10,22
20,27
30,30
40,21
significaría que la probabilidad del tipo 2 es 0,27, etc.
Para variables continuas la probabilidad de que una variable tome cualquier valor concreto es 0, por lo tanto la fdp sólo permite calcular la probabilidad para un intervalo del tipo (afdp.
Para las variables aleatorias de interés hay tablas, y programas de ordenador, donde buscar esos valores.
Distribución acumulativa o función de distribución
F(x) = p(X £ x)
Para el ejemplo 3
x
f(x)
F(x)
0
1/8
1/8
1
3/8
4/8
2
3/8
7/8
3
1/8
8/8
y para el ejemplo 4
x
f(x)
F(x)
1
0,22
0,22
2
0,27
0,49
3
0,30
0,79
4
0,21
1
Parámetros característicos de una fdp
Valor esperado o esperanza matemática o media
si X es una v.a. cualquier función de ella, h(x), es también una v.a., en consecuencia también se define este parámetro para una función de v.a.
Ejemplo 5: Se tira un dado. Se define como v.a. el número que sale ¿Cuál es su media?
La variable X puede tomar los valores 1, 2, ..., 6 y para todos ellos f(x) = 1/6. En consecuencia la media es
Observese que es un número que la v.a. no puede alcanzar. ¿Qué significa? No mucho.
Se define ahora una función sobre X: el premio: si sale 1 ó 2 se gana 100 ptas, si sale 3 se gana 500 y si sale 4, 5 ó 6 no se gana nada
Xh(x)
1100
2100
3500
40
50
60
¿Cuál es el valor medio de esta función?
¿qué significa? es el valor medio a la larga: si se juega un número grande de veces la ganancia final es como si en cada jugada se hubiera ganado 116,6 pts. Si la apuesta costara menos de eso el juego sería ventajoso para el jugador (así se enriqueció Voltaire), si costara más, para la banca. (llamar a ésto honestidad del juego le costó el puesto de ministro a Laplace).
Varianza:
Se define como:
aunque para el cálculo se suele usar esta otra fórmula equivalente:
¿Qué mide la varianza? Mide la dispersión de la variable alrededor de la media.

http://www.hrc.es/bioest/estadis_21.html



variable aleatoria es una función que asigna un valor, usualmente numérico, al resultado de un experimento aleatorio. Por ejemplo, los posibles resultados de tirar un dado dos veces: (1, 1), (1, 2), etc. o un número real (p.e., la temperatura máxima medida a lo largo del día en una ciudad concreta).
Los valores posibles de una variable aleatoria pueden representar los posibles resultados de un experimento aún no realizado, o los posibles valores de una cantidad cuyo valor actualmente existente es incierto (p.e., como resultado de medición incompleta o imprecisa). Intuitivamente, una variable aleatoria puede tomarse como una cantidad cuyo valor no es fijo pero puede tomar diferentes valores; una distribución de probabilidad se usa para describir la probabilidad de que se den los diferentes valores. En términos formales una variable aleatoria es una función definida sobre un espacio de probabilidad.
Las variables aleatorias suelen tomar valores reales, pero se pueden considerar valores aleatorios como valores lógicos, funciones o cualquier tipo de elementos (de un espacio medible). El término elemento aleatorio se utiliza para englobar todo ese tipo de conceptos relacionados. Un concepto relacionado es el de proceso estocástico, un conjunto de variables aleatorias ordenadas (habitualmente por orden o tiempo).

Definición de variable aleatoria

Concepto intuitivo

Una variable aleatoria puede concebirse como un valor numérico que está afectado por el azar. Dada una variable aleatoria no es posible conocer con certeza el valor que tomará está al ser medida o determinada, aunque sí se conoce que existe una distribución de probabilidad asociada al conjunto de valores posibles. Por ejemplo, en una epidemia de cólera, se sabe que una persona cualquiera puede enfermar o no (suceso), pero no se sabe cuál de los dos sucesos va a ocurrir. Solamente se puede decir que existe una probabilidad de que la persona enferme.
Para trabajar de manera sólida con variables aleatorias en general es necesario considerar un gran número de experimentos aleatorios, para su tratamiento estadístico, cuantificar los resultados de modo que se asigne un número real a cada uno de los resultados posibles del experimento. De este modo se establece una relación funcional entre elementos del espacio muestral asociado al experimento y números reales.

Definición formal

Una variable aleatoria (v.a.) X es una función real definida en el espacio de probabilidad, asociado a un experimento aleatorio.12
La definición formal anterior involucra conceptos matemáticos sofisticados procedentes de la teoría de la medida, concretamente la noción σ-álgebra o la de medida de probabilidad.3 4 Dado un espacio de probabilidad  y un espacio medible , una aplicación  es una variable aleatoria si es una aplicación -medible. En el uso ordinario, los puntos de  no son directamente observables, sólo el valor de la variable en el punto  por lo que el elemento probabilístico reside en el desconocimiento que se tiene del punto concreto  .
En la mayoría de usos práctios se tiene que el espacio medible de llegada es , quedando pues la definición de esta manera:
Dado un espacio de probabilidad  una variable aleatoria real es cualquier función -medible donde  es la σ-álgebra boreliana.

Rango de una variable aleatoria

Se llama rango de una variable aleatoria X y lo denotaremos RX, a la imagen o rango de la función , es decir, al conjunto de los valores reales que ésta puede tomar, según la aplicación X. Dicho de otro modo, el rango de un v.a. es el recorrido de la función por la que ésta queda definida:...

Ejemplos

Ejemplo 1
Supongamos que se lanzan dos monedas al aire. El espacio muestral, esto es, el conjunto de resultados elementales posibles asociado al experimento, es:
donde (c representa "sale cara" y x, "sale cruz"). Podemos asignar entonces a cada suceso elemental del experimento el número de caras obtenidas. De este modo se definiría la variable aleatoria X como la función
dada por
El recorrido o rango de esta función, RX, es el conjunto
Ejemplo 2
El nivel X de precipitación registrado un día concreto del año, en una ciudad por una estación meteorológica concreta. El espacio muestral que incluye todos los posibles resultados puede representarse por el intervalo . En este caso el espacio muestral es más complicado porque incluiría especificar el estado de la atmósfera completo (una aproximación sería describir el conjunto de posiciones y velocidades de todas las moléculas de la atmósfera, que sería una cantidad de información monumental o usar un modelo más o menos complejo en términos de variables macroscópicas, como los modelos meteorológicos usados actualmente).
Podemos revisar la serie histórica de precipitaciones y aproximar la distribución de probabilidad  de X y consturir una aproximación . Nótese que en este caso la distribución de probabilidad no es conocida, sólo se conoce la distribución muestral (la serie histórica) y se conjetura que la distribución real no se aleja mucho de esta aproximaxión . Si la serie histórica es suficientemente larga y representa un clima que no difiere significativamente del actual estas dos úlitmas funciones diferirán muy poco.

Caracterización de variables aleatorias

Tipos de variables aleatorias

Para comprender de una manera más amplia y rigurosa los tipos de variables, es necesario conocer la definición de conjunto discreto. Un conjunto es discreto si está formado por un número finito de elementos, o si sus elementos se pueden enumerar en secuencia de modo que haya un primer elemento, un segundo elemento, un tercer elemento, y así sucesivamente5 (es decir, un cojunto infinito numerable sin puntos de acumulación). Para variables con valores en  las variables aleatorias se clasifican usualmente en:
  • Variable aleatoria discreta: una v.a. es discreta si su recorrido es un conjunto discreto. La variable del ejemplo anterior es discreta. Sus probabilidades se recogen en la función de cuantía. (Véanse las distribuciones de variable discreta).
  • Variable aleatoria continua: una v.a. es continua si su recorrido es un conjunto no numerable. Intuitivamente esto significa que el conjunto de posibles valores de la variable abarca todo un intervalo de números reales. Por ejemplo, la variable que asigna la estatura a una persona extraída de una determinada población es una variable continua ya que, teóricamente, todo valor entre, pongamos por caso, 0 y 2,50 m, es posible.6 (Véanse las distribuciones de variable continua).
Las definiciones anteriores pueden generalizarse fácilmente a variables aleatorias con valores sobre  o . Esto no agota el tipo de variables aleatorias ya que el valor de una variable aleatoria puede ser también una partición, como sucede en el proceso estocástico del restaurante chino o el conjunto de valores de una variable aleatoria puede ser un conjunto de funciones como el proceso estocástico de Dirichlet.

Distribución de probabilidad de una variable aleatoria

La distribución de probabilidad de una v.a. X, también llamada función de distribución de X es la función , que asigna a cada evento definido sobre  una probabilidad dada por la siguiente expresión:
Y de manera que se cumplan las siguientes tres condiciones:
  1.  y 
  2. Es continua por la derecha.
  3. Es monótona no decreciente.
La distribución de probabilidad de una v.a. describe teóricamente la forma en que varían los resultados de un experimento aleatorio. Intuitivamente se trataría de una lista de los resultados posibles de un experimento con las probabilidades que se esperarían ver asociadas con cada resultado.

Función de densidad de una v.a. continua

La función de densidad de probabilidad (FDP) o, simplemente, función de densidad, representada comúnmente como f(x), se utiliza con el propósito de conocer cómo se distribuyen las probabilidades de un suceso o evento, en relación al resultado del suceso.
La FDP es la derivada (ordinaria o en el sentido de las distribuciones) de la función de distribución de probabilidad F(x), o de manera inversa, la función de distribución es la integral de la función de densidad:
La función de densidad de una v.a. determina la concentración de probabilidad alrededor de los valores de una variable aleatoria continua.

Funciones de variables aleatorias

Sea una variable aleatoria  sobre  y una función medible de Borel , entonces  será también una variable aleatoria sobre , dado que la composición de funciones medibles también es medible a no ser que  sea una función medible de Lebesgue. El mismo procedimiento que permite ir de un espacio de probabilidad  a  puede ser utilizado para obtener la distribución de . La función de probabilidad acumulada de  es
Si la función g es invertible, es decir g-1 existe, y es monótona creciente, entonces la anterior relación puede ser extendida para obtener
y, trabajando de nuevo bajo las mismas hipótesis de invertibilidad de g y asumiendo además diferenciabilidad, podemos hallar la relación entre las funciones de densidad de probabilidad al diferenciar ambos términos respecto de y, obteniendo
.
Si g no es invertible pero cada y tiene un número finito de raíces, entonces la relación previa con la función de densidad de probabilidad puede generalizarse como
donde xi = gi-1(y). Las fórmulas de densidad no requieren que g sea creciente.

Ejemplo

Sea X una variable aleatoria real continua y sea Y = X2.
Si y < 0, entonces P(X2 = y) = 0, por lo tanto
Si y ≥ 0, entonces
por lo tanto

Parámetros relacionados con una variable aleatoria

La función de densidad o la distribución de probabilidad de una variable aleatoria (v.a.) contiene exhaustivamente toda la información sobre la variable. Sin embargo, resulta conveniente resumir sus características principales con unos cuantos valores numéricos. Entre estos están la esperanza y la varianza (aunque para caracterizar completamente la distribución de probabilidad se necesitan parámetros estadísticos adicionales).

Esperanza

La esperanza matemática (o simplemente esperanza) o valor esperado de una v.a. es la suma del producto de la probabilidad de cada suceso por el valor de dicho suceso. Si todos los sucesos son de igual probabilidad la esperanza es la media aritmética. Para una variable aleatoria discreta con valores posibles  y sus probabilidades representadas por la función de probabilidad  la esperanza se calcula como:
Para una variable aleatoria continua la esperanza se calcula mediante la integral de todos los valores y la función de densidad :
La esperanza también se suele simbolizar con 
El concepto de esperanza se asocia comúnmente en los juegos de azar al de beneficio medio o beneficio esperado a largo plazo.

Varianza

La varianza es una medida de dispersión de una variable aleatoria  respecto a su esperanza . Se define como la esperanza de la transformación :
 o bien 

Momentos de orden superior

Dada una distribución de probabilidad continua el conjunto de sus momentos caracteriza completamente la distribución. Dos de estos momentos ya han aparecido, el valor esperado coincide con el momento de primer orden, mientras que la varianza puede expresarse como una combinación del momento de segundo orden y el cuadrado del momento de primer orden. En general, el momento de orden n de una variable aleatoria real con densidad de probabilidad definida casi en todas partes se calcula como:
Estos momentos pueden obtenerse a partir de las derivadas n-ésimas de la función característica  asociada a la variable X:
o análogamente la función generadora de momentos:

No hay comentarios:

Publicar un comentario