lunes, 20 de julio de 2015

Conceptos básicos de Inferencia Estadística


Objetivos de la Inferencia Estadística.

El objetivo de la Estadística es medir y modelar la variabilidad del proceso mediante un modelo probabilístico.
Para modelar la variabilidad de una variable aleatoria si sólo se dispone del conocimiento de una muestra de la misma se sigue el siguiente modo de actuación:
  1. Planteamiento del problema.
  2. Selección de la muestra (Muestreo estadístico), en algunos estudios la muestra se obtiene por simulación (Simulación Estadística)
  3. Estudio descriptivo de la muestra, analítico y gráfico (Estadística Descriptiva).
  4. En base al conocimiento de los modelos probabilísticos más utilizados y teniendo en cuenta el planteamiento del problema y el estudio descriptivo previo, elegir un modelo de probabilidad (Teoría de la Probabilidad).
  5. Estimar los parámetros del modelo supuesto a partir de las observaciones muestrales utilizando los métodos de Inferencia Estadística: estimación puntual, estimación por intervalos de confianza y contrastes de hipótesis paramétricos.
  6. Chequear que el modelo de probabilidad ajustado a los datos es adecuado y que se verifican las hipótesis supuestas en el estudio, por ejemplo, que las observaciones muestrales son independientes, que no existen observaciones erróneas,...,etc. Para ello se utilizan los métodos de Inferencia no Paramétrica.
  7. Si se acepta que el modelo ajustado es adecuado se puede utilizar para obtener resultados y conclusiones sobre la variable en estudio. En caso contrario, se debe reformular el modelo de probabilidad y repetir el proceso desde el paso 4.
Si se obtiene más información se puede mejorar el conocimiento de la variabilidad de la variable de interés. Puede hacerse por los siguientes medios:
Mejorar la estimación de los parámetros del modelo, utilizando métodos estadísticos más eficaces.
Aumentando el tamaño muestral.
Reducir la variabilidad controlando la variabilidad sistemática que puede ser debida a factores que influyen en la variable en estudio o controlando otras variables relacionadas con la variable de interés y que explican en mayor o menor medida su comportamiento. Para ello es necesario disponer de información adicional a la de la propia variable de interés, y tener datos de los factores y/o variables explicativas que influyen en ella.
Este texto se estudian los modelos estadísticos que estudian una variable utilizando su relación con otras variables y/o factores. En particular se estudiarán los dos modelos estadísticos más importantes y utilizados en la práctica,
El Diseño de Experimentos, que estudia la variabilidad de la variable de interés controlando los factores que pueden influir en la misma.
Los Modelos de Regresión, que estudian la variabilidad de la variable de interés teniendo en cuenta la relación funcional de la misma con otras variables explicativas.

Inferencia Estadística. Conceptos básicos.

Puede definirse la Inferencia Estadística como
“El conjunto de métodos estadísticos que permiten deducir (inferir) como se distribuye la población en estudio o las relaciones estocásticas entre varias variables de interés a partir de la información que proporciona una muestra”.

Para que un método de inferencia estadística proporcione buenos resultados debe de:
bulletBasarse en una técnica estadístico-matemática adecuada al problema y suficientemente validada.
bulletUtilizar una muestra que realmente sea representativa de la población y de un tamaño suficiente.
Conceptos básicos que se utilizarán en este texto son los siguientes:
bulletPoblación: es un conjunto homogéneo de individuos sobre los que se estudia una o varias características que son, de alguna forma, observables.
bulletMuestra: es un subconjunto de la población. El número de elementos de la muestra se denomina tamaño muestral.
bulletMuestreo aleatorio simple: es aquel en el que todos los individuos de la población tienen la misma probabilidad de ser elegidos.
bulletMuestra aleatoria simple, de una variable aleatoria X, con distribución F, de tamaño n, es un conjunto de variables aleatorias X1,X2,...,Xnindependientes e igualmente distribuídas (i.i.d.) con distribución F.
bulletEspacio muestral: es el conjunto de muestras posibles que pueden obtenerse al seleccionar una muestra aleatoria, de tamaño n, de una cierta población.
bulletParámetro: es cualquier característica medible de la función de distribución de la variable en estudio (media, varianza,..).
bulletEstadístico: es una función de la muestra T(X ,X
,...,X  )
  1   2       nPor tanto, es una variable aleatoria que tiene una función de distribución que se denominadistribución en el muestreo de T. Los estadísticos independientes del parámetro a estimar se denominan estimadores.
bulletPropiedades de los estimadores.
Sea ^h n = ^h n(X ,X  ,... ,X  )
  1   2      n un estimador del parámetro hPropiedades del estimador son las siguientes
  1. Estimador centrado o insesgado, tiene sesgo cero,
         (   )     (  ) Sesgo  ^hn =  E  ^hn -
h.

  2. Estimador asintóticamente centrado o insesgado, verifica
              (  )              (   ) lim
Sesgo  ^h   = 0 <==>  lim E   ^h  =  h. n--> oo         n
n--> oo     n

  3. Error Cuadrático Medio de  ^ h nes
          (^ )     (^     )2   (      (^ ))2       (^  ) ECM hn
= E  hn - h   =  Sesgo  hn    + V ar  hn .

  4. Estimador consistente en media cuadrática,  verifica
              (   ) lim ECM    h^n  =  0.
n--> oo
    por tanto

  5. La precisión o eficacia del estimador ^h n es
        (^ )    ----1-(--)- efic hn  =
ECM    ^h  .
                    n
    Si el estimador es insesgado
        (
) efic ^hn  =  ---1(--).
            Var  ^hn
     
  6. Estimador de la media poblacional, se utiliza la media muestral definida por
            n X =  1 sum   X .
     n      i
       i=1
    (1.1)
    Si sigue una distribución N(m,s2)se verifica que
           (   s2)    X  - m X  ~ N   m,---
<==> --- V~ --~ N (0,1)
            n      s/  n
    (1.2)
  7. Estimador de la varianza poblacional, se utiliza la cuasivarianza muestral definida por
                sum n ^S2 = --1--    (Xi -
X)2 .
     n - 1 i=1
    (1.3)
    Si sigue una distribución N(   2)
 m,sse verifica que
    (n--1)-^S2-   2
   s2     ~ xn-1.
    (1.4)
    Dado que normalmente la varianza poblacional se desconoce y es necesario estimarla, es de interés el siguiente resultado
    X----m ~ t S^/V ~ n    n-1
    (1.5)




No hay comentarios:

Publicar un comentario