AMIGOS PARA SIEMPRE: Análisis matemático

matriz hessiana o hessiano de una función f de n variables, es la matriz cuadrada de n × n, de las segundas derivadas parciales.

Dada una función real f de n variables reales:

\begin{align} & f\colon\mathbb{R}^{n}\to \mathbb{R} \\ & \,\,\,\,\,\,\,x\mapsto f(x) \\ \end{align}

Si todas las segundas derivadas parciales de f existen, se define la matriz hessiana de f como:

H_{f}(\mathbf{x})

, donde

H_{f}(\mathbf{x})_{i,j} = \frac{\partial^2\,f(\mathbf{x})}{\partial x_i\, \partial x_j}

tomando la siguiente forma

H(f) = \begin{bmatrix} \frac{\partial^2 f}{\partial x_1^2} & \frac{\partial^2 f}{\partial x_1\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_1\partial x_n} \\ \frac{\partial^2 f}{\partial x_2\partial x_1} & \frac{\partial^2 f}{\partial x_2^2} & \cdots & \frac{\partial^2 f}{\partial x_2\partial x_n} \\ \vdots & \vdots & \ddots & \vdots \\ \frac{\partial^2 f}{\partial x_n\partial x_1} & \frac{\partial^2 f}{\partial x_n\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_n^2} \end{bmatrix}

Además, se tiene que si :

f \colon A \subseteq \Bbb{R}^n \to \Bbb{R} \,

con A un conjunto abierto y f clase

\mathcal C^2

, entonces la matriz hessiana está bien definida, y en virtud del teorema de Clairaut(ó teorema de Schwarz), es una matriz simétrica.

Esta matriz debe su nombre al matemático alemán Ludwig Otto Hesse y fue introducido por James Joseph Sylvester.

Aplicación de la matriz hessiana

Concavidad/Convexidad

Sea

A \subseteq \mathbb{R}^n

un conjunto abierto y

f \colon A \to \mathbb{R}

una función con segundas derivadas continuas:

$f \,$ es convexa si y solo si, $\forall a \in A$ , la matriz hessiana $H_f(a) \,$ es positiva-definida.
Si la matriz hessiana es positiva-definida, entonces es estrictamente convexa.
- Si $f \,$ es una función convexa, entonces cualquier punto en que todas las derivadas parciales son cero, es un mínimo local.
$f \,$ es cóncava si y solo si, $\forall a \in A$ , la matriz hessiana $H_f(a) \,$ es negativa-definida.
Si la matriz hessiana es negativa-definida, entonces f es estrictamente cóncava.
- Si $f \,$ es una función cóncava, entonces cualquier punto en que todas las derivadas parciales son cero, es un máximo local.

Método para determinar el carácter de los puntos críticos

Se verá a continuación cómo hallar los puntos críticos (máximos, mínimos y puntos de inflexión -o silla o de ensilladura) de una función f de múltiples variables.

Se igualan las derivadas parciales primeras a cero.
Se resuelven las ecuaciones anteriores y se obtienen las coordenadas de los puntos críticos.
Se construye la matriz hessiana (derivadas segundas parciales).
Se sustituyen los puntos críticos en la matriz hessiana para obtener tantas matrices como puntos críticos tengamos.
Dependiendo del tipo de matriz resultante de evaluar la matriz Hessiana en los diferentes puntos críticos, estos puntos se pueden evaluar mediante el criterio de Sylvester:

Si todos los menores principales son mayores que 0, o sea, |H_i|>0 ∀i=1,...,n ƒ alcanza el mínimo relativo en el punto.
Si los menores principales de índice par son mayores que 0 y los de índice impar son menores que 0, o sea, |H_impar|<0 i="" y="">H

_par|>0 ∀i=1,...,n ƒ alcanza el máximo relativo en el punto.

Si los menores principales son distintos de 0, es decir, |H_i|≠0 ∀i=1,...,n y no es ninguno de los casos anteriores, es un punto de silla.

Cuando algún |H_i|=0 no se puede determinar nada, por lo que hace un estudio particular. Para n=2. el criterio se mejora en el sentido de que si |H₁|=0 y |H₂|<0 dd="" de="" el="" en="" punto.="" punto="" silla="" tiene="" un="">

De forma análoga podemos evaluar los extremos relativos de un campo escalar f:R^n--->R estudiando los autovalores de su matriz hessiana.

Teorema 9.6(CALCULUS volumen 2. Tom M.Apostol): "Sea f un campo escalar con derivadas parciales segundas continuas D_ijf en una n-bola B(a), y designemos con H(a) la matriz hessiana en el punto estacionario a. Tenemos entonces:

a)Si todos los autovalores de H(a) son positivos, f tiene un mínimo relativo en a.

b)Si todos los autovalores de H(a) son negativos, f tiene un máximo relativo en a.

c)Si H(a) tiene autovalores positivos y negativos, f tiene un punto de ensilladura en a."

El el caso particular en el que la función a evaluar grafica una superficie en R^3, f(x,y)=z, y tiene segundas derivadas continuas, se pueden estudiar los puntos críticos evaluando la matriz hessiana en ellos y luego utilizando el criterio de determinación de extremos. Si (a,b) es un punto crítico de f, (f_x(a,b)=0 y f_y(a,b)=0) entonces:

- Si el determinante de la matriz hessiana evaluado en el punto (a,b) es mayor que 0, |H|>0, y f_xx(a,b)<0 i="">, decimos que f alcanza un máximo relativo en(a,b).

- Si el determinante de la matriz hessiana evaluado en el punto (a,b) es mayor que 0, |H|>0, y f_xx(a,b)>0, decimos que f alcanza un mínimo relativo en(a,b).

- Si el determinante de la matriz hessiana evaluado en el punto (a,b) es menor que 0, |H|<0 decimos="" i="" nbsp="" que="">f(a,b)

es un Punto de silla.

- Si el determinante de la matriz hessiana evaluado en el punto (a,b) es igual a 0, |H|=0, el criterio no concluye resultado alguno.

Generalizaciones

Matriz hessiana orlada

La matriz hessiana orlada es una variante de la matriz hessiana utilizada en problemas de optimización restringida. El determinante de sus principales menores se utiliza como criterio para determinar si un punto crítico de una función es un mínimo, máximo, punto silla o no determinado (extremos condicionados).¹

Aplicación bilineal hessiana

El concepto de matriz hessiana puede generalizarse a espacios de dimensión infinita, concretamente a aplicaciones definidas sobre espacios vectoriales normados. Si una aplicación (o funcional) está definida es diferenciable en el sentido de Fréchet y su diferencial jacobiana también es diferenciable en el sentido de Fréchet puede definirse una forma bilineal continua (y por tanto acotada) sobre el espacio normado que generaliza la matriz hessiana.

Se dice que una aplicación

f\colon\Omega\in X \to Y

entre espacios vectoriales normados

X, Y

es diferenciable si existe una aplicación lineal continua

L_a\in\mathcal{L}(X,Y)

tal que:

$\lim_{h \to 0} \frac{\|f(a+h) -f(a) - L_a(h)\|_Y}{\|h\|_X} = 0$

En ese caso se escribe:

$\mathrm{D}f(a)h \equiv L_a(h)$

Puede probarse que

\mathcal{L}(X,Y)

es a su vez otro espacio vectorial normado con la norma:

$\|A\|_{\mathcal{L}(X,Y)}:= \sup_{0\ne x\in X} \frac{\|Ax\|_Y}{\|x\|_X}$

La segunda derivadas cuando existe es:

$\mathrm{D}^2f(a):= \mathrm{D}(\mathrm{D}f(a)) \in {\mathcal{L}(X,{\mathcal{L}(X,Y)})}$

La forma bilineal hessiana viene dada por:

$H_f(a)(h,k) := (\mathrm{D}^2f(a)h)k, \qquad h,k\in X,\ H_f(a)\in \mathcal{L}(X\times X,Y)\approx \mathcal{L}(X,{\mathcal{L}(X,Y)})$

NOTACIÓN EN DERIVADAS PARCIALES

Primeramente se aclaran las notaciones que se pueden utilizar y que representan lo mismo al trabajar con derivadas parciales:

MATRIZ HESSIANA DE DOS VARIABLES

Si tenemos un ejercicio con dos variables, obtendremos una matriz hessiana 2 x 2. Si el ejercicio fuera de tres variables, la matriz gesiana será 3 x 3, y así sucesivamente. Para el caso de dos variables, la matriz hessiana 2 x 2 se genera de la siguiente manera:

En este trabajo se estará usando la notación que aparece en el miembro izquierdo de las ecuaciones por considerarlo más sencillo de comprender a primera vista.

MATRIZ HESSIANA DE TRES VARIABLES

Antes de presentar ejemplos, se muestra la matriz resultante cuando se trabaja con ejercicios o problemas de tres variables. La matriz hessiana será de 3 x 3 y queda de esta forma:

SIGNIFICADO DE CADA ELEMENTO DE LA MATRIZ HESSIANA DE TRES VARIABLES

Con el objetivo de explicar cada detalle con la mayor claridad posible, se expresa el significado de cada uno de los elementos que aparecen dentro de la matriz:

Significa que se deriva la función original por primera vez con respecto a x y luego ese resultado se deriva por segunda vez con respecto a x nuevamente.

Significa que se deriva la función original por primera vez con respecto a x y luego ese resultado se deriva por segunda vez pero ahora con respecto a y.

Significa que se deriva la función original por primera vez con respecto a x y luego ese resultado se deriva por segunda vez pero ahora con respecto a z.

Significa que se deriva la función original por primera vez con respecto a y y luego ese resultado se deriva por segunda vez pero ahora con respecto a x.

Significa que se deriva la función original por primera vez con respecto a y y luego ese resultado se deriva por segunda vez con respecto a y nuevamente.

Significa que se deriva la función original por primera vez con respecto a y y luego ese resultado se deriva por segunda vez pero ahora con respecto a z.

Significa que se deriva la función original por primera vez con respecto a z y luego ese resultado se deriva por segunda vez pero ahora con respecto a x.

Significa que se deriva la función original por primera vez con respecto a z y luego ese resultado se deriva por segunda vez pero ahora con respecto a y.

Significa que se deriva la función original por primera vez con respecto a z y luego ese resultado se deriva por segunda vez con respecto a z nuevamente.

NOTA: Es bueno tomar en cuenta que:

, …

MATRIZ HESSIANA DE "N" VARIABLES

Ya se presentó la matriz hessiana de 2 variables y de 3 variables. Sin embargo podemos enfrentarnos a problemas en los que hayan más de tres variables, para lo cual se presenta a continuación lo que se tiene que hacer cuando se tengan matrices hessianas de cuatro variables o más, osea matrices 4 x 4, 5 x 5, 6 x 6, etc.

La manera de resolver este tipo de problemas de más de dos variables se presenta con la siguiente matriz, y funciona para cualquier problema donde se utilice matriz hessiana con más de dos variables:

Antes de continuar se debe decir que para ser capaces de resolver problemas utilizando matrices hessianas se debe poder resolver sin problemas determinantes cuadradas, pues es algo que se utiliza al trabajar con matrices. En este trabajo no se explica cómo resolver determinantes cuadradas pero se aclara que es algo indispensable en el trabajo y resolución de problemas utilizando matrices hessianas.

PASOS A SEGUIR PARA ENCONTRAR MÁXIMOS Y MÍNIMOS UTILIZANDO MATRICES HESSIANAS

1. Tener la función original que se va a trabajar.

2. Calcular las primeras derivadas parciales de la función con respecto a cada una de las variables que se tiene la función original.

3. Igualar a cero las primeras derivadas que se calcularon en el paso 2.

4. Simultanear las ecuaciones generadas en el paso 3 para encontrar el valor de cada una de las variables. Esos valores encontrados para cada una de las variables serán las coordenadas de los puntos críticos.

5. Teniendo los puntos críticos que se encontraron en el paso 4, se tiene que calcular las segundas derivadas parciales en el punto crítico de modo que asignemos los valores de cada elemento de la matriz hessiana, ya sea matriz 2 x 2 (si la función es de 2 variables), 3 x 3 (si la función es de 3 variables), 4 x 4 (si la función es de 4 variables), n x n (si la función es de n variables).

6. Resolver la matriz hessiana normalmente como se resuelve la determinante de una matriz cuadrada. El resultado que se obtenga de la matriz hessiana es la respuesta.

7. Se sacan conclusiones de la respuesta obtenida en el paso 6 de la siguiente manera:

CASO DE DOS VARIABLES O MATRIZ HESSIANA 2 X 2:

Si el determinante de la matriz hessiana es mayor que cero, entonces se procede a ver si es positivo o negativo. Si es positivo o mayor que cero entonces la función tiene un MÍNIMO en el punto crítico. Si es negativo o menor que cero entonces la función tiene un MÁXIMO en el punto crítico.
Si el determinante de la matriz hessiana es menor que cero entonces se concluye que la función tiene un PUNTO DE SILLA en el punto crítico.
Si el determinante de la matriz hessiana es cero entonces se concluye que NO HAY INFORMACIÓN o EL CRITERIO NO ES CONCLUYENTE.

CASO DE TRES O MÁS VARIABLES O MATRIZ HESSIANA 3 X 3 O N X N:

Si todos los determinantes de la matriz hessiana tienen signo positivo, entonces la función tiene un MÍNIMO en el punto crítico.
Si los determinantes tienen signo alterno (comenzando con un valor negativo), entonces la función tiene un MÁXIMO en el punto crítico.
Si no se cumple lo dicho en los literales a) y b), osea en cualquier otro caso se concluye que HAY DUDA, NO HAY INFORMACIÓN o EL CRITERIO NO ES CONCLUYENTE.

NOTA: En el caso de tener funciones de tres o más variables significa que comenzaremos trabajando la matriz hessiana f(x) o de 1 x 1, luego f(x,y) o de 2 x 2, luego f(x,y,z) o de 3 x 3,… hasta llegar a f(x,y,z,…n) o de n x n. Así llegaremos finalmente a concluir si se trata de máximo, mínimo o si no se sabe, de acuerdo a los tres literales anteriores.

EJEMPLO DE APLICACIÓN DE MATRIZ HESSIANA

Encontrar los máximos y mínimos (si los hay) de la función:

f(x,y,z) = x² + y² + 7z² - xy

Solución:

Calculando las primeras derivadas parciales de la función con respecto a cada una de las variables que tiene la función original:

Igualando a cero las primeras derivadas:

22x – y = 0

2y – x = 0

14z = 0

Simultanear las ecuaciones anteriores para encontrar los valores de x, y y z, que serán las coordenadas de los puntos críticos:

Al simultanear las ecuaciones obtenemos que los valores de x, y y z (osea los puntos críticos) son:

x = 1/3

y = 2/3

z = 0

Esto significa que las coordenadas del punto crítico son: f(1/3,2/3,0).

Calcular las segundas derivadas en el punto crítico para generar la matriz hessiana:

Resolver la matriz hessiana tal como se resuelve la determinante de una matriz cuadrada:

H(x,y,z) = -6

Sacar conclusiones de la respuesta obtenida:

La determinante de la matriz hessiana H(x) o de 1x1 da como resultado – 2 (resultado negativo).

La determinante de la matriz hessiana H(x,y) o de 2x2 da como resultado 3 (resultado positivo).

La determinante de la matriz hessiana H(x,y,z) o de 3x3 da como resultado -6 (resultado negativo).

Anteriormente se explicó que "Si los determinantes tienen signo alterno (comenzando con un valor negativo), entonces la función tiene un MÁXIMO en el punto crítico." Tal como se acaba de ver, los signos se alternan porque tenemos -2, +3 y -6, lo cual significa que la función la función tiene un MÁXIMO en el punto crítico.

Conclusión de la resolución del ejercicio:

La función f(x,y,z) = x² + y² + 7z² - xy es o tiene un máximo en el punto crítico (1/3,2/3,0).

AMIGOS PARA SIEMPRE

Páginas

jueves, 15 de octubre de 2015

Análisis matemático

Aplicación de la matriz hessiana

Concavidad/Convexidad

Método para determinar el carácter de los puntos críticos

Generalizaciones

Matriz hessiana orlada

Aplicación bilineal hessiana

No hay comentarios:

Publicar un comentario

Datos personales

Archivo del blog