distribución de Rayleigh es una función de distribución continua. Se suele presentar cuando un vector bidimensional (por ejemplo, el que representa la velocidad del viento) tiene sus dos componentes, ortogonales, independientes y siguen una distribución normal. Su valor absoluto seguirá entonces una distribución de Rayleigh. Esta distribución también se puede presentar en el caso de números complejos con componentes real e imaginaria independientes y siguiendo una distribución normal. Su valor absoluto sigue una distribución de Rayleigh.
La función de densidad de probabilidad es:
Su esperanza es:
y su varianza:
Función de distribución de Rayleigh
La forma funcional de la distribución de Rayleigh esLa función f(x) representa la probabilidad de que la velocidad del viento x esté en un intervalo entre x y x+dx. El área bajo f(x) es la unidad.como puede comprobarse fácilmente. La función de distribución de Rayleigh es un caso particular de la de Weibull para k=2.El valor medio de la velocidad <x>Para calcular el valor medio utilizamos el siguiente resultado tomado de una tabla de integralesNo hay que realizar un ajuste de datos a la función de Rayleigh, basta conocer la velocidad media del sitio <x> que está directamente relacionada con el parámetro b.La función de distribución de Rayleigh se expresa en términos del valor medio <x> de la velocidadEn la figura, se representa la función de distribución de Rayleigh para varios valores de la velocidad media del viento.media=[4 6 8 10]; g=@(med,x) pi*x.*exp(-pi*x.^2/(4*med^2))/(2*med^2); x=linspace(0,25,100); hold on for i=1:length(media) plot(x,g(media(i),x),'displayName',num2str(media(i))) end ylim([0 0.25]) xlabel('x') ylabel('f(x)') title('Función de Rayleigh') legend('-DynamicLegend','location','NorthEast') hold off
La velocidad para la cual la función de distribución de Rayleigh alcanza un máximo se obtiene derivando f(x) e igualando a cero.Tomando una velocidad media <x>=6 m/s, el máximo de la curva de color azul se produce para xmax=4.79 y su valor es 0.1267.La desviación estándar σEn la página anterior, calculamos la media y la desviación estándar de las medidas de la velocidad del viento a lo largo del mes de Marzo, comparamos estos resultados con la desviación estándar dada por la función de distribución de Rayleigh%medidas de las velocidades del viento >> media=sum(velocidad)/length(velocidad) media = 8.1741 >> estandar=std(velocidad) estandar = 3.9761 %función de distribución de Rayleigh >> estandar=sqrt(4/pi-1)*media estandar = 4.2728
La probabilidad acumulada F(x) valeLa probabilidad de que la velocidad del viento x este en el intervalo comprendido entre x0 y x1.Representamos f(x) y calculamos la probabilidad P(x) en el intervalo (4.5, 5.5), es decir, centrado en x0=5 y de anchura 1.0.med=6; %valor medio de las velocidades del viento f=@(x) pi*x.*exp(-pi*x.^2/(4*med^2))/(2*med^2); x=linspace(0,20,100); y=f(x); hold on plot(x,y,'b') x0=4.5; x1=5.5; xx=[x0 x0 x(x>x0 & x
x0 & x res=quad(f,x0,x1) prob=exp(-pi*x0^2/(4*med^2))-exp(-pi*x0^2/(4*med^2));
Obtenemos el mismo resultado efectuando la integración numérica de la función de Rayleigh f(x) mediante la función quad, que a partir de la expresión de la probabilidad P(x0≤x<x1) deducida anteriormente.
Comparación de Weibull y Rayleigh
clear,clc velocidad=xlsread('WhiteDeer2013','Mar','F2:F745'); %interpolar si es necesario if any(isnan(velocidad)) %si hay algún NaN x=1:length(velocidad); i=find(~isnan(velocidad)); velocidad=interp1(x(i),velocidad(i),x); end %histograma x=0.5:1:max(velocidad); horas=hist(velocidad,x); %convierte a frecuencias y ajusta a la función de Weibull frec=horas/sum(horas); f=@(a,x) (a(1)/a(2))*((x/a(2)).^(a(1)-1)).*exp(-(x/a(2)).^a(1)); a0=[2 8]; %valor inicial de los parámetros af=nlinfit(x,frec,f,a0); hold on %diagrama de barras bar(x,frec,'c'); %representa la curva da juste x=linspace(0,max(velocidad),100); %función de Weibull y=f(af,x); plot(x,y,'r','Linewidth',1.5) %función de Rayleigh media=sum(velocidad)/length(velocidad); g=@(x) pi*x.*exp(-pi*x.^2/(4*media^2))/(2*media^2); y=g(x); plot(x,y,'k','Linewidth',1.5) title('Ajuste a las funciones de distribución') xlabel('Velocidad') ylabel('Frecuencia') legend('Medidas','Weibull','Rayleigh') hold off
distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una poblaciónnormalmente distribuida cuando el tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos medias muestrales y para la construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de una población y ésta debe ser estimada a partir de los datos de una muestra.
Distribución t de Student | ||
---|---|---|
Función de densidad de probabilidad | ||
Función de distribución de probabilidad | ||
Parámetros | grados de libertad (real) | |
Dominio | ||
Función de densidad (pdf) | ||
Función de distribución (cdf) | donde es la función hipergeométrica | |
Media | para , indefinida para otros valores | |
Mediana | ||
Moda | ||
Varianza | para , indefinida para otros valores | |
Coeficiente de simetría | para | |
Curtosis | para | |
Entropía |
|
Caracterización
La distribución t de Student es la distribución de probabilidad del cociente
donde
- Z es una variable aleatoria distribuida según una normal típica (de media nula y varianza 1).
- V es una variable aleatoria que sigue una distribución χ² con grados de libertad.
- Z y V son independientes
Si μ es una constante no nula, el cociente es una variable aleatoria que sigue la distribución t de Student no central con parámetro de no-centralidad .
Aparición y especificaciones de la distribución t de Student
Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas normalmente, con media μ y varianza σ2. Sea
la media muestral. Entonces
sigue una distribución normal de media 0 y varianza 1.
Sin embargo, dado que la desviación estándar no siempre es conocida de antemano, Gosset estudió un cociente relacionado,
es la cuasivarianza muestral y demostró que la función de densidad de T es
donde es igual a n − 1.
La distribución de T se llama ahora la distribución-t de Student.
El parámetro representa el número de grados de libertad. La distribución depende de , pero no de o , lo cual es muy importante en la práctica.
Intervalos de confianza derivados de la distribución t de Student
El procedimiento para el cálculo del intervalo de confianza basado en la t de Student consiste en estimar la desviación típica de los datos S y calcular el error estándar de la media: , siendo entonces el intervalo de confianza para la media: .
Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las medias de muestras de dos distribuciones normales se distribuye también normalmente, la distribución t puede usarse para examinar si esa diferencia puede razonablemente suponerse igual a cero.
Para efectos prácticos el valor esperado y la varianza son:
y para
Historia
La distribución de Student fue descrita en 1908 por William Sealy Gosset. Gosset trabajaba en una fábrica de cerveza, Guinness, que prohibía a sus empleados la publicación de artículos científicos debido a una difusión previa de secretos industriales. De ahí que Gosset publicase sus resultados bajo el seudónimo de Student.1
Distribución t de Student no estandarizada
La distribución t puede generalizarse a 3 parámetros, introduciendo un parámero locacional y otro de escala . El resultado es una distribución t de Student no estandarizada cuya densidad está definida por:2
Equivalentemente, puede escribirse en términos de (correspondiente a la varianza en vez de a la desviación estándar):
Otras propiedades de esta versión de la distribución t son:2
No hay comentarios:
Publicar un comentario