jueves, 30 de marzo de 2017

Epónimos relacionados con las matemáticas

distribución de Rayleigh es una función de distribución continua. Se suele presentar cuando un vector bidimensional (por ejemplo, el que representa la velocidad del viento) tiene sus dos componentes, ortogonales, independientes y siguen una distribución normal. Su valor absoluto seguirá entonces una distribución de Rayleigh. Esta distribución también se puede presentar en el caso de números complejos con componentes real e imaginaria independientes y siguiendo una distribución normal. Su valor absoluto sigue una distribución de Rayleigh.
Distribución Rayleigh cumulativa.
La función de densidad de probabilidad es:
Su esperanza es:
y su varianza:


Distribución de probabilidad Rayleigh.


Estimación del parámetro

La estimación de máxima verosimilitud del parámetro  viene dado por:

Distribuciones relacionadas

  •  es una distribución de Rayleigh si  donde  y  son dos distribuciones normales independientes.
  • Si  entonces  sigue una distribución chi-cuadrado con dos grados de libertad: 
  • Si  sigue una distribución exponencial  entonces .
  • La distribución chi es una generalización de la distribución de Rayleigh.
  • La distribución de Rice es una generalización de la distribución de Rayleigh.
  • La distribución de Weibull es una generalización de la distribución de Rayleigh.



Función de distribución de Rayleigh

La forma funcional de la distribución de Rayleigh es
f(x)=2xb2exp(x2b2)x0
La función f(x) representa la probabilidad de que la velocidad del viento x esté en un intervalo entre x y x+dx. El área bajo f(x) es la unidad.
0f(x)·dx=1
como puede comprobarse fácilmente. La función de distribución de Rayleigh es un caso particular de la de Weibull para k=2.
El valor medio de la velocidad <x>
<x>=0x·f(x)·dx=π2b
Para calcular el valor medio utilizamos el siguiente resultado tomado de una tabla de integrales
0x2exp(αx2)dx=14πα3
No hay que realizar un ajuste de datos a la función de Rayleigh, basta conocer la velocidad media del sitio <x> que está directamente relacionada con el parámetro b.
La función de distribución de Rayleigh se expresa en términos del valor medio <x> de la velocidad
f(x)=πx2<x>2exp(π4(x<x>)2)x0
En la figura, se representa la función de distribución de Rayleigh para varios valores de la velocidad media del viento.
media=[4 6 8 10];
g=@(med,x) pi*x.*exp(-pi*x.^2/(4*med^2))/(2*med^2);
x=linspace(0,25,100);
hold on
for i=1:length(media)
     plot(x,g(media(i),x),'displayName',num2str(media(i)))
end
ylim([0 0.25])
xlabel('x')
ylabel('f(x)')
title('Función de Rayleigh')
legend('-DynamicLegend','location','NorthEast')
hold off
La velocidad para la cual la función de distribución de Rayleigh alcanza un máximo se obtiene derivando f(x) e igualando a cero.
xmax=2π<x>
Tomando una velocidad media <x>=6 m/s, el máximo de la curva de color azul se produce para xmax=4.79 y su valor es 0.1267.
La desviación estándar σ
σ2=(4π1)<x>2
En la página anterior, calculamos la media y la desviación estándar de las medidas de la velocidad del viento a lo largo del mes de Marzo, comparamos estos resultados con la desviación estándar dada por la función de distribución de Rayleigh
%medidas de las velocidades del viento
>> media=sum(velocidad)/length(velocidad)
media =     8.1741
>> estandar=std(velocidad)
estandar =    3.9761
%función de distribución de Rayleigh
>> estandar=sqrt(4/pi-1)*media
estandar =    4.2728
La probabilidad acumulada F(x) vale
F(x)=1exp(π4(x<x>)2)
La probabilidad de que la velocidad del viento x este en el intervalo comprendido entre x0 y x1.
P(x0x<x1)=x0x1f(x)·dx=exp(π4(x0<x>)2)exp(π4(x1<x>)2)
Representamos f(x) y calculamos la probabilidad P(x) en el intervalo (4.5, 5.5), es decir, centrado en x0=5 y de anchura 1.0.
med=6; %valor medio de las velocidades del viento
f=@(x) pi*x.*exp(-pi*x.^2/(4*med^2))/(2*med^2);
x=linspace(0,20,100);
y=f(x);
hold on
plot(x,y,'b')
x0=4.5; x1=5.5;
xx=[x0 x0 x(x>x0 & xx0 & xres=quad(f,x0,x1)
prob=exp(-pi*x0^2/(4*med^2))-exp(-pi*x0^2/(4*med^2));
text(x1+2, max(y),num2str(res)); title('Probabilidad') xlabel('x') ylabel('f(x)') hold off
Obtenemos el mismo resultado efectuando la integración numérica de la función de Rayleigh f(x) mediante la función quad, que a partir de la expresión de la probabilidad P(x0x<x1) deducida anteriormente.

Comparación de Weibull y Rayleigh

clear,clc
velocidad=xlsread('WhiteDeer2013','Mar','F2:F745');
%interpolar si es necesario
if any(isnan(velocidad)) %si hay algún NaN
    x=1:length(velocidad);
    i=find(~isnan(velocidad));
    velocidad=interp1(x(i),velocidad(i),x);
end
%histograma
x=0.5:1:max(velocidad);
horas=hist(velocidad,x);
%convierte a frecuencias y ajusta a la función de Weibull
frec=horas/sum(horas);
f=@(a,x) (a(1)/a(2))*((x/a(2)).^(a(1)-1)).*exp(-(x/a(2)).^a(1));
a0=[2 8];  %valor inicial de los parámetros
af=nlinfit(x,frec,f,a0);
hold on 

%diagrama de barras
bar(x,frec,'c');
%representa la curva da juste
x=linspace(0,max(velocidad),100);
%función de Weibull
y=f(af,x);
plot(x,y,'r','Linewidth',1.5)

%función de Rayleigh
media=sum(velocidad)/length(velocidad);
g=@(x) pi*x.*exp(-pi*x.^2/(4*media^2))/(2*media^2);
y=g(x);
plot(x,y,'k','Linewidth',1.5)
title('Ajuste a las funciones de distribución')
xlabel('Velocidad')
ylabel('Frecuencia')
legend('Medidas','Weibull','Rayleigh')
hold off













distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una poblaciónnormalmente distribuida cuando el tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos medias muestrales y para la construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de una población y ésta debe ser estimada a partir de los datos de una muestra.

Distribución t de Student
Student densite best.JPG
Función de densidad de probabilidad
T distributionCDF.png
Función de distribución de probabilidad
Parámetros grados de libertad (real)
Dominio
Función de densidad (pdf)
Función de distribución (cdf) donde  es la función hipergeométrica
Media para , indefinida para otros valores
Mediana
Moda
Varianza para , indefinida para otros valores
Coeficiente de simetría para 
Curtosis para 
Entropía
  • : función digamma,
  • : función beta

Caracterización

La distribución t de Student es la distribución de probabilidad del cociente
donde
Si μ es una constante no nula, el cociente  es una variable aleatoria que sigue la distribución t de Student no central con parámetro de no-centralidad .

Aparición y especificaciones de la distribución t de Student

Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas normalmente, con media μ y varianza σ2. Sea
la media muestral. Entonces
sigue una distribución normal de media 0 y varianza 1.
Sin embargo, dado que la desviación estándar no siempre es conocida de antemano, Gosset estudió un cociente relacionado,

es la cuasivarianza muestral y demostró que la función de densidad de T es
donde  es igual a n − 1.
La distribución de T se llama ahora la distribución-t de Student.
El parámetro  representa el número de grados de libertad. La distribución depende de , pero no de  o , lo cual es muy importante en la práctica.

Intervalos de confianza derivados de la distribución t de Student

El procedimiento para el cálculo del intervalo de confianza basado en la t de Student consiste en estimar la desviación típica de los datos S y calcular el error estándar de la media: , siendo entonces el intervalo de confianza para la media:  .
Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las medias de muestras de dos distribuciones normales se distribuye también normalmente, la distribución t puede usarse para examinar si esa diferencia puede razonablemente suponerse igual a cero.
Para efectos prácticos el valor esperado y la varianza son:
 y  para 

Historia

La distribución de Student fue descrita en 1908 por William Sealy Gosset. Gosset trabajaba en una fábrica de cerveza, Guinness, que prohibía a sus empleados la publicación de artículos científicos debido a una difusión previa de secretos industriales. De ahí que Gosset publicase sus resultados bajo el seudónimo de Student.1

Distribución t de Student no estandarizada

La distribución t puede generalizarse a 3 parámetros, introduciendo un parámero locacional  y otro de escala . El resultado es una distribución t de Student no estandarizada cuya densidad está definida por:2
Equivalentemente, puede escribirse en términos de  (correspondiente a la varianza en vez de a la desviación estándar):
Otras propiedades de esta versión de la distribución t son:2

No hay comentarios:

Publicar un comentario