Для начала рассмотрим случай функции двух переменных. Условным экстремумом функции $z=f(x,y)$ в точке $M_0(x_0;y_0)$ называется экстремум этой функции, достигнутый при условии, что переменные $x$ и $y$ в окрестности данной точки удовлетворяют уравнению связи $\varphi (x,y)=0$.

Название «условный» экстремум связано с тем, что на переменные наложено дополнительное условие $\varphi(x,y)=0$. Если из уравнения связи можно выразить одну переменную через другую, то задача определения условного экстремума сводится к задаче на обычный экстремум функции одной переменной. Например, если из уравнения связи следует $y=\psi(x)$, то подставив $y=\psi(x)$ в $z=f(x,y)$, получим функцию одной переменной $z=f\left(x,\psi(x)\right)$. В общем случае, однако, такой метод малопригоден, поэтому требуется введение нового алгоритма.

Метод множителей Лагранжа для функций двух переменных.

Метод множителей Лагранжа состоит в том, что для отыскания условного экстремума составляют функцию Лагранжа: $F(x,y)=f(x,y)+\lambda\varphi(x,y)$ (параметр $\lambda$ называют множителем Лагранжа). Необходимые условия экстремума задаются системой уравнений, из которой определяются стационарные точки:

$$ \left \{ \begin{aligned} & \frac{\partial F}{\partial x}=0;\\ & \frac{\partial F}{\partial y}=0;\\ & \varphi (x,y)=0. \end{aligned} \right. $$

Достаточным условием, из которого можно выяснить характер экстремума, служит знак $d^2 F=F_{xx}^{""}dx^2+2F_{xy}^{""}dxdy+F_{yy}^{""}dy^2$. Если в стационарной точке $d^2F > 0$, то функция $z=f(x,y)$ имеет в данной точке условный минимум, если же $d^2F < 0$, то условный максимум.

Есть и другой способ для определения характера экстремума. Из уравнения связи получаем: $\varphi_{x}^{"}dx+\varphi_{y}^{"}dy=0$, $dy=-\frac{\varphi_{x}^{"}}{\varphi_{y}^{"}}dx$, поэтому в любой стационарной точке имеем:

$$d^2 F=F_{xx}^{""}dx^2+2F_{xy}^{""}dxdy+F_{yy}^{""}dy^2=F_{xx}^{""}dx^2+2F_{xy}^{""}dx\left(-\frac{\varphi_{x}^{"}}{\varphi_{y}^{"}}dx\right)+F_{yy}^{""}\left(-\frac{\varphi_{x}^{"}}{\varphi_{y}^{"}}dx\right)^2=\\ =-\frac{dx^2}{\left(\varphi_{y}^{"} \right)^2}\cdot\left(-(\varphi_{y}^{"})^2 F_{xx}^{""}+2\varphi_{x}^{"}\varphi_{y}^{"}F_{xy}^{""}-(\varphi_{x}^{"})^2 F_{yy}^{""} \right)$$

Второй сомножитель (расположенный в скобке) можно представить в такой форме:

Красным цветом выделены элементы определителя $\left| \begin{array} {cc} F_{xx}^{""} & F_{xy}^{""} \\ F_{xy}^{""} & F_{yy}^{""} \end{array} \right|$, который является гессианом функции Лагранжа. Если $H > 0$, то $d^2F < 0$, что указывает на условный максимум. Аналогично, при $H < 0$ имеем $d^2F > 0$, т.е. имеем условный минимум функции $z=f(x,y)$.

Примечание относительно формы записи определителя $H$. показать\скрыть

$$ H=-\left|\begin{array} {ccc} 0 & \varphi_{x}^{"} & \varphi_{y}^{"}\\ \varphi_{x}^{"} & F_{xx}^{""} & F_{xy}^{""} \\ \varphi_{y}^{"} & F_{xy}^{""} & F_{yy}^{""} \end{array} \right| $$

В этой ситуации сформулированное выше правило изменится следующим образом: если $H > 0$, то функция имеет условный минимум, а при $H < 0$ получим условный максимум функции $z=f(x,y)$. При решении задач следует учитывать такие нюансы.

Алгоритм исследования функции двух переменных на условный экстремум

  1. Составить функцию Лагранжа $F(x,y)=f(x,y)+\lambda\varphi(x,y)$
  2. Решить систему $ \left \{ \begin{aligned} & \frac{\partial F}{\partial x}=0;\\ & \frac{\partial F}{\partial y}=0;\\ & \varphi (x,y)=0. \end{aligned} \right.$
  3. Определить характер экстремума в каждой из найденных в предыдущем пункте стационарных точек. Для этого применить любой из указанных способов:
    • Составить определитель $H$ и выяснить его знак
    • С учетом уравнения связи вычислить знак $d^2F$

Метод множителей Лагранжа для функций n переменных

Допустим, мы имеем функцию $n$ переменных $z=f(x_1,x_2,\ldots,x_n)$ и $m$ уравнений связи ($n > m$):

$$\varphi_1(x_1,x_2,\ldots,x_n)=0; \; \varphi_2(x_1,x_2,\ldots,x_n)=0,\ldots,\varphi_m(x_1,x_2,\ldots,x_n)=0.$$

Обозначив множители Лагранжа как $\lambda_1,\lambda_2,\ldots,\lambda_m$, составим функцию Лагранжа:

$$F(x_1,x_2,\ldots,x_n,\lambda_1,\lambda_2,\ldots,\lambda_m)=f+\lambda_1\varphi_1+\lambda_2\varphi_2+\ldots+\lambda_m\varphi_m$$

Необходимые условия наличия условного экстремума задаются системой уравнений, из которой находятся координаты стационарных точек и значения множителей Лагранжа:

$$\left\{\begin{aligned} & \frac{\partial F}{\partial x_i}=0; (i=\overline{1,n})\\ & \varphi_j=0; (j=\overline{1,m}) \end{aligned} \right.$$

Выяснить, условный минимум или условный максимум имеет функция в найденной точке, можно, как и ранее, посредством знака $d^2F$. Если в найденной точке $d^2F > 0$, то функция имеет условный минимум, если же $d^2F < 0$, - то условный максимум. Можно пойти иным путем, рассмотрев следующую матрицу:

Определитель матрицы $\left| \begin{array} {ccccc} \frac{\partial^2F}{\partial x_{1}^{2}} & \frac{\partial^2F}{\partial x_{1}\partial x_{2}} & \frac{\partial^2F}{\partial x_{1}\partial x_{3}} &\ldots & \frac{\partial^2F}{\partial x_{1}\partial x_{n}}\\ \frac{\partial^2F}{\partial x_{2}\partial x_1} & \frac{\partial^2F}{\partial x_{2}^{2}} & \frac{\partial^2F}{\partial x_{2}\partial x_{3}} &\ldots & \frac{\partial^2F}{\partial x_{2}\partial x_{n}}\\ \frac{\partial^2F}{\partial x_{3} \partial x_{1}} & \frac{\partial^2F}{\partial x_{3}\partial x_{2}} & \frac{\partial^2F}{\partial x_{3}^{2}} &\ldots & \frac{\partial^2F}{\partial x_{3}\partial x_{n}}\\ \ldots & \ldots & \ldots &\ldots & \ldots\\ \frac{\partial^2F}{\partial x_{n}\partial x_{1}} & \frac{\partial^2F}{\partial x_{n}\partial x_{2}} & \frac{\partial^2F}{\partial x_{n}\partial x_{3}} &\ldots & \frac{\partial^2F}{\partial x_{n}^{2}}\\ \end{array} \right|$, выделенной в матрице $L$ красным цветом, есть гессиан функции Лагранжа. Используем следующее правило:

  • Если знаки угловых миноров $H_{2m+1},\; H_{2m+2},\ldots,H_{m+n}$ матрицы $L$ совпадают с знаком $(-1)^m$, то исследуемая стационарная точка является точкой условного минимума функции $z=f(x_1,x_2,x_3,\ldots,x_n)$.
  • Если знаки угловых миноров $H_{2m+1},\; H_{2m+2},\ldots,H_{m+n}$ чередуются, причём знак минора $H_{2m+1}$ совпадает с знаком числа $(-1)^{m+1}$, то исследуемая стационарная точка является точкой условного максимума функции $z=f(x_1,x_2,x_3,\ldots,x_n)$.

Пример №1

Найти условный экстремум функции $z(x,y)=x+3y$ при условии $x^2+y^2=10$.

Геометрическая интерпретация данной задачи такова: требуется найти наибольшее и наименьшее значение аппликаты плоскости $z=x+3y$ для точек ее пересечения с цилиндром $x^2+y^2=10$.

Выразить одну переменную через другую из уравнения связи и подставить ее в функцию $z(x,y)=x+3y$ несколько затруднительно, поэтому будем использовать метод Лагранжа.

Обозначив $\varphi(x,y)=x^2+y^2-10$, составим функцию Лагранжа:

$$ F(x,y)=z(x,y)+\lambda \varphi(x,y)=x+3y+\lambda(x^2+y^2-10);\\ \frac{\partial F}{\partial x}=1+2\lambda x; \frac{\partial F}{\partial y}=3+2\lambda y. $$

Запишем систему уравнений для определения стационарных точек функции Лагранжа:

$$ \left \{ \begin{aligned} & 1+2\lambda x=0;\\ & 3+2\lambda y=0;\\ & x^2+y^2-10=0. \end{aligned} \right. $$

Если предположить $\lambda=0$, то первое уравнение станет таким: $1=0$. Полученное противоречие говорит о том, что $\lambda\neq 0$. При условии $\lambda\neq 0$ из первого и второго уравнений имеем: $x=-\frac{1}{2\lambda}$, $y=-\frac{3}{2\lambda}$. Подставляя полученные значения в третье уравнение, получим:

$$ \left(-\frac{1}{2\lambda} \right)^2+\left(-\frac{3}{2\lambda} \right)^2-10=0;\\ \frac{1}{4\lambda^2}+\frac{9}{4\lambda^2}=10; \lambda^2=\frac{1}{4}; \left[ \begin{aligned} & \lambda_1=-\frac{1}{2};\\ & \lambda_2=\frac{1}{2}. \end{aligned} \right.\\ \begin{aligned} & \lambda_1=-\frac{1}{2}; \; x_1=-\frac{1}{2\lambda_1}=1; \; y_1=-\frac{3}{2\lambda_1}=3;\\ & \lambda_2=\frac{1}{2}; \; x_2=-\frac{1}{2\lambda_2}=-1; \; y_2=-\frac{3}{2\lambda_2}=-3.\end{aligned} $$

Итак, система имеет два решения: $x_1=1;\; y_1=3;\; \lambda_1=-\frac{1}{2}$ и $x_2=-1;\; y_2=-3;\; \lambda_2=\frac{1}{2}$. Выясним характер экстремума в каждой стационарной точке: $M_1(1;3)$ и $M_2(-1;-3)$. Для этого вычислим определитель $H$ в каждой из точек.

$$ \varphi_{x}^{"}=2x;\; \varphi_{y}^{"}=2y;\; F_{xx}^{""}=2\lambda;\; F_{xy}^{""}=0;\; F_{yy}^{""}=2\lambda.\\ H=\left| \begin{array} {ccc} 0 & \varphi_{x}^{"} & \varphi_{y}^{"}\\ \varphi_{x}^{"} & F_{xx}^{""} & F_{xy}^{""} \\ \varphi_{y}^{"} & F_{xy}^{""} & F_{yy}^{""} \end{array} \right|= \left| \begin{array} {ccc} 0 & 2x & 2y\\ 2x & 2\lambda & 0 \\ 2y & 0 & 2\lambda \end{array} \right|= 8\cdot\left| \begin{array} {ccc} 0 & x & y\\ x & \lambda & 0 \\ y & 0 & \lambda \end{array} \right| $$

В точке $M_1(1;3)$ получим: $H=8\cdot\left| \begin{array} {ccc} 0 & x & y\\ x & \lambda & 0 \\ y & 0 & \lambda \end{array} \right|= 8\cdot\left| \begin{array} {ccc} 0 & 1 & 3\\ 1 & -1/2 & 0 \\ 3 & 0 & -1/2 \end{array} \right|=40 > 0$, поэтому в точке $M_1(1;3)$ функция $z(x,y)=x+3y$ имеет условный максимум, $z_{\max}=z(1;3)=10$.

Аналогично, в точке $M_2(-1;-3)$ найдем: $H=8\cdot\left| \begin{array} {ccc} 0 & x & y\\ x & \lambda & 0 \\ y & 0 & \lambda \end{array} \right|= 8\cdot\left| \begin{array} {ccc} 0 & -1 & -3\\ -1 & 1/2 & 0 \\ -3 & 0 & 1/2 \end{array} \right|=-40$. Так как $H < 0$, то в точке $M_2(-1;-3)$ имеем условный минимум функции $z(x,y)=x+3y$, а именно: $z_{\min}=z(-1;-3)=-10$.

Отмечу, что вместо вычисления значения определителя $H$ в каждой точке, гораздо удобнее раскрыть его в общем виде. Дабы не загромождать текст подробностями, этот способ скрою под примечание.

Запись определителя $H$ в общем виде. показать\скрыть

$$ H=8\cdot\left|\begin{array}{ccc}0&x&y\\x&\lambda&0\\y&0&\lambda\end{array}\right| =8\cdot\left(-\lambda{y^2}-\lambda{x^2}\right) =-8\lambda\cdot\left(y^2+x^2\right). $$

В принципе, уже очевидно, какой знак имеет $H$. Так как ни одна из точек $M_1$ или $M_2$ не совпадает с началом координат, то $y^2+x^2>0$. Следовательно, знак $H$ противоположен знаку $\lambda$. Можно и довести вычисления до конца:

$$ \begin{aligned} &H(M_1)=-8\cdot\left(-\frac{1}{2}\right)\cdot\left(3^2+1^2\right)=40;\\ &H(M_2)=-8\cdot\frac{1}{2}\cdot\left((-3)^2+(-1)^2\right)=-40. \end{aligned} $$

Вопрос о характере экстремума в стационарных точках $M_1(1;3)$ и $M_2(-1;-3)$ можно решить и без использования определителя $H$. Найдем знак $d^2F$ в каждой стационарной точке:

$$ d^2 F=F_{xx}^{""}dx^2+2F_{xy}^{""}dxdy+F_{yy}^{""}dy^2=2\lambda \left(dx^2+dy^2\right) $$

Отмечу, что запись $dx^2$ означает именно $dx$, возведённый в вторую степень, т.е. $\left(dx \right)^2$. Отсюда имеем: $dx^2+dy^2>0$, посему при $\lambda_1=-\frac{1}{2}$ получим $d^2F < 0$. Следовательно, функция имеет в точке $M_1(1;3)$ условный максимум. Аналогично, в точке $M_2(-1;-3)$ получим условный минимум функции $z(x,y)=x+3y$. Отметим, что для определения знака $d^2F$ не пришлось учитывать связь между $dx$ и $dy$, ибо знак $d^2F$ очевиден без дополнительных преобразований. В следующем примере для определения знака $d^2F$ уже будет необходимо учесть связь между $dx$ и $dy$.

Ответ : в точке $(-1;-3)$ функция имеет условный минимум, $z_{\min}=-10$. В точке $(1;3)$ функция имеет условный максимум, $z_{\max}=10$

Пример №2

Найти условный экстремум функции $z(x,y)=3y^3+4x^2-xy$ при условии $x+y=0$.

Первый способ (метод множителей Лагранжа)

Обозначив $\varphi(x,y)=x+y$ составим функцию Лагранжа: $F(x,y)=z(x,y)+\lambda \varphi(x,y)=3y^3+4x^2-xy+\lambda(x+y)$.

$$ \frac{\partial F}{\partial x}=8x-y+\lambda; \; \frac{\partial F}{\partial y}=9y^2-x+\lambda.\\ \left \{ \begin{aligned} & 8x-y+\lambda=0;\\ & 9y^2-x+\lambda=0; \\ & x+y=0. \end{aligned} \right. $$

Решив систему, получим: $x_1=0$, $y_1=0$, $\lambda_1=0$ и $x_2=\frac{10}{9}$, $y_2=-\frac{10}{9}$, $\lambda_2=-10$. Имеем две стационарные точки: $M_1(0;0)$ и $M_2 \left(\frac{10}{9};-\frac{10}{9} \right)$. Выясним характер экстремума в каждой стационарной точке с использованием определителя $H$.

$$ H=\left| \begin{array} {ccc} 0 & \varphi_{x}^{"} & \varphi_{y}^{"}\\ \varphi_{x}^{"} & F_{xx}^{""} & F_{xy}^{""} \\ \varphi_{y}^{"} & F_{xy}^{""} & F_{yy}^{""} \end{array} \right|= \left| \begin{array} {ccc} 0 & 1 & 1\\ 1 & 8 & -1 \\ 1 & -1 & 18y \end{array} \right|=-10-18y $$

В точке $M_1(0;0)$ $H=-10-18\cdot 0=-10 < 0$, поэтому $M_1(0;0)$ есть точка условного минимума функции $z(x,y)=3y^3+4x^2-xy$, $z_{\min}=0$. В точке $M_2\left(\frac{10}{9};-\frac{10}{9}\right)$ $H=10 > 0$, посему в данной точке функция имеет условный максимум, $z_{\max}=\frac{500}{243}$.

Исследуем характер экстремума в каждой из точек иным методом, основываясь на знаке $d^2F$:

$$ d^2 F=F_{xx}^{""}dx^2+2F_{xy}^{""}dxdy+F_{yy}^{""}dy^2=8dx^2-2dxdy+18ydy^2 $$

Из уравнения связи $x+y=0$ имеем: $d(x+y)=0$, $dx+dy=0$, $dy=-dx$.

$$ d^2 F=8dx^2-2dxdy+18ydy^2=8dx^2-2dx(-dx)+18y(-dx)^2=(10+18y)dx^2 $$

Так как $ d^2F \Bigr|_{M_1}=10 dx^2 > 0$, то $M_1(0;0)$ является точкой условного минимума функции $z(x,y)=3y^3+4x^2-xy$. Аналогично, $d^2F \Bigr|_{M_2}=-10 dx^2 < 0$, т.е. $M_2\left(\frac{10}{9}; -\frac{10}{9} \right)$ - точка условного максимума.

Второй способ

Из уравнения связи $x+y=0$ получим: $y=-x$. Подставив $y=-x$ в функцию $z(x,y)=3y^3+4x^2-xy$, получим некоторую функцию переменной $x$. Обозначим эту функцию как $u(x)$:

$$ u(x)=z(x,-x)=3\cdot(-x)^3+4x^2-x\cdot(-x)=-3x^3+5x^2. $$

Таким образом задачу о нахождении условного экстремума функции двух переменных мы свели к задаче определения экстремума функции одной переменной.

$$ u_{x}^{"}=-9x^2+10x;\\ -9x^2+10x=0; \; x\cdot(-9x+10)=0;\\ x_1=0; \; y_1=-x_1=0;\\ x_2=\frac{10}{9}; \; y_2=-x_2=-\frac{10}{9}. $$

Получили точки $M_1(0;0)$ и $M_2\left(\frac{10}{9}; -\frac{10}{9}\right)$. Дальнейшее исследование известно из курса дифференциального исчисления функций одной переменой. Исследуя знак $u_{xx}^{""}$ в каждой стационарной точке или проверяя смену знака $u_{x}^{"}$ в найденных точках, получим те же выводы, что и при решении первым способом. Например, проверим знак $u_{xx}^{""}$:

$$u_{xx}^{""}=-18x+10;\\ u_{xx}^{""}(M_1)=10;\;u_{xx}^{""}(M_2)=-10.$$

Так как $u_{xx}^{""}(M_1)>0$, то $M_1$ - точка минимума функции $u(x)$, при этом $u_{\min}=u(0)=0$. Так как $u_{xx}^{""}(M_2)<0$, то $M_2$ - точка максимума функции $u(x)$, причём $u_{\max}=u\left(\frac{10}{9}\right)=\frac{500}{243}$.

Значения функции $u(x)$ при заданном условии связи совпадают с значениями функции $z(x,y)$, т.е. найденные экстремумы функции $u(x)$ и есть искомые условные экстремумы функции $z(x,y)$.

Ответ : в точке $(0;0)$ функция имеет условный минимум, $z_{\min}=0$. В точке $\left(\frac{10}{9}; -\frac{10}{9} \right)$ функция имеет условный максимум, $z_{\max}=\frac{500}{243}$.

Рассмотрим еще один пример, в котором характер экстремума выясним посредством определения знака $d^2F$.

Пример №3

Найти наибольшее и наименьшее значения функции $z=5xy-4$, если переменные $x$ и $y$ положительны и удовлетворяют уравнению связи $\frac{x^2}{8}+\frac{y^2}{2}-1=0$.

Составим функцию Лагранжа: $F=5xy-4+\lambda \left(\frac{x^2}{8}+\frac{y^2}{2}-1 \right)$. Найдем стационарные точки функции Лагранжа:

$$ F_{x}^{"}=5y+\frac{\lambda x}{4}; \; F_{y}^{"}=5x+\lambda y.\\ \left \{ \begin{aligned} & 5y+\frac{\lambda x}{4}=0;\\ & 5x+\lambda y=0;\\ & \frac{x^2}{8}+\frac{y^2}{2}-1=0;\\ & x > 0; \; y > 0. \end{aligned} \right. $$

Все дальнейшие преобразования осуществляются с учетом $x > 0; \; y > 0$ (это оговорено в условии задачи). Из второго уравнения выразим $\lambda=-\frac{5x}{y}$ и подставим найденное значение в первое уравнение: $5y-\frac{5x}{y}\cdot \frac{x}{4}=0$, $4y^2-x^2=0$, $x=2y$. Подставляя $x=2y$ в третье уравнение, получим: $\frac{4y^2}{8}+\frac{y^2}{2}-1=0$, $y^2=1$, $y=1$.

Так как $y=1$, то $x=2$, $\lambda=-10$. Характер экстремума в точке $(2;1)$ определим, исходя из знака $d^2F$.

$$ F_{xx}^{""}=\frac{\lambda}{4}; \; F_{xy}^{""}=5; \; F_{yy}^{""}=\lambda. $$

Так как $\frac{x^2}{8}+\frac{y^2}{2}-1=0$, то:

$$ d\left(\frac{x^2}{8}+\frac{y^2}{2}-1\right)=0; \; d\left(\frac{x^2}{8} \right)+d\left(\frac{y^2}{2} \right)=0; \; \frac{x}{4}dx+ydy=0; \; dy=-\frac{xdx}{4y}. $$

В принципе, здесь можно сразу подставить координаты стационарной точки $x=2$, $y=1$ и параметра $\lambda=-10$, получив при этом:

$$ F_{xx}^{""}=\frac{-5}{2}; \; F_{xy}^{""}=-10; \; dy=-\frac{dx}{2}.\\ d^2 F=F_{xx}^{""}dx^2+2F_{xy}^{""}dxdy+F_{yy}^{""}dy^2=-\frac{5}{2}dx^2+10dx\cdot \left(-\frac{dx}{2} \right)-10\cdot \left(-\frac{dx}{2} \right)^2=\\ =-\frac{5}{2}dx^2-5dx^2-\frac{5}{2}dx^2=-10dx^2. $$

Однако в других задачах на условный экстремум стационарных точек может быть несколько. В таких случаях лучше $d^2F$ представить в общем виде, а потом подставлять в полученное выражение координаты каждой из найденных стационарных точек:

$$ d^2 F=F_{xx}^{""}dx^2+2F_{xy}^{""}dxdy+F_{yy}^{""}dy^2=\frac{\lambda}{4}dx^2+10\cdot dx\cdot \frac{-xdx}{4y} +\lambda\cdot \left(-\frac{xdx}{4y} \right)^2=\\ =\frac{\lambda}{4}dx^2-\frac{5x}{2y}dx^2+\lambda \cdot \frac{x^2dx^2}{16y^2}=\left(\frac{\lambda}{4}-\frac{5x}{2y}+\frac{\lambda \cdot x^2}{16y^2} \right)\cdot dx^2 $$

Подставляя $x=2$, $y=1$, $\lambda=-10$, получим:

$$ d^2 F=\left(\frac{-10}{4}-\frac{10}{2}-\frac{10 \cdot 4}{16} \right)\cdot dx^2=-10dx^2. $$

Так как $d^2F=-10\cdot dx^2 < 0$, то точка $(2;1)$ есть точкой условного максимума функции $z=5xy-4$, причём $z_{\max}=10-4=6$.

Ответ : в точке $(2;1)$ функция имеет условный максимум, $z_{\max}=6$.

В следующей части рассмотрим применение метода Лагранжа для функций большего количества переменных.

Метод множителей Лагранжа (в англ. литературе «LaGrange"s method of undetermined multipliers») ˗ это численный метод решения оптимизационных задач, который позволяет определить «условный» экстремум целевой функции (минимальное или максимальное значение)

при наличии заданных ограничений на ее переменные в виде равенств (т.е. определена область допустимых значений)

˗ это значения аргумента функции (управляемые параметры) на вещественной области при котором значение функции стремится к экстремуму. Применение названия «условный» экстремум связано с тем, что на переменные наложено дополнительное условие, которое ограничивает область допустимых значений при поиске экстремума функции.

Метод множителей Лагранжа позволяет задачу поиска условного экстремума целевой функции на множестве допустимых значений преобразовать к задаче безусловной оптимизации функции.

В случае если функции и непрерывны вместе со своими частными производными, то существуют такие переменные λ не равные одновременно нулю, при которых выполняется следующее условие:

Таким образом, в соответствии с методом множителей Лагранжа для поиска экстремума целевой функции на множестве допустимых значений составляю функцию Лагранжа L(х, λ), которую в дальнейшем оптимизируют:

где λ ˗ вектор дополнительных переменных, называемых неопределенными множителями Лагранжа.

Таким образом, задача нахождения условного экстремума функции f(x) свелась к задаче поиска безусловного экстремума функции L(x, λ).

и

Необходимое условие экстремума функции Лагранжа задается системой уравнений (система состоит из «n + m» уравнений):

Решение данной системы уравнений позволяет определить аргументы функции (Х), при которых значение функции L(x, λ), а также значение целевой функции f(x) соответствуют экстремуму.

Величина множителей Лагранжа (λ) имеет практический интерес в случае, если ограничения представлены в форме со свободным членом уравнения (константой). В этом случае можно рассматривать дальнейшее (увеличение/уменьшение) значения целевой функции за счет изменения значения константы в системе уравнения . Таким образом, множитель Лагранжа характеризует скорость изменения максимума целевой функции при изменении ограничивающей константы.

Существует несколько способов определения характера экстремума полученной функции:

Первый способ: Пусть – координаты точки экстремума, а - соответствующее значение целевой функции. Берется точка , близкая к точке , и вычисляется значение целевой функции :

Если , то в точке имеет место максимум.

Если , то в точке имеет место минимум.

Второй способ: Достаточным условием, из которого можно выяснить характер экстремума, является знак второго дифференциала функции Лагранжа. Второй дифференциал функции Лагранжа определяется следующим образом:

Если в заданной точке минимум , если же , то целевая функция f(x) имеет в данной точке условный максимум.

Третий способ: Также характер экстремума функции можно выяснить рассмотрев гессиан функции Лагранжа. Матрица Гессе представляет собой симметричную квадратную матрицу вторых частных производных функции в точке , в которой элементы матрицы симметричны относительно главной диагонали.

Для определения типа экстремума (максимум или минимум функции) можно воспользоваться правилом Сильвестра:

1. Для того, чтобы второй дифференциал функции Лагранжа был знакоположителен необходимо, чтобы угловые миноры функции были положительными . При таких условиях функция в этой точке имеет минимум.

2. Для того, чтобы второй дифференциал функции Лагранжа был знакоотрицателен , необходимо, чтобы угловые миноры функции чередовались, причем первый элемент матрицы должен быть отрицательнsv . При таких условиях функция в этой точке имеет максимум.

Под угловым минором понимаем минор, расположенный в первых k строках и k столбцах исходной матрицы.

Основное практическое значение метода Лагранжа заключается в том, что он позволяет перейти от условной оптимизации к безусловной и, соответственно, расширить арсенал доступных методов решения задачи. Однако задача решения системы уравнений, к которой сводится данный метод, в общем случае не проще исходной задачи поиска экстремума. Такие методы называются непрямыми. Их применение объясняется необходимостью получить решение экстремальной задачи в аналитической форме (допустим, для тех или иных теоретических выкладок). При решении конкретных практических задач обычно используются прямые методы, основанные на итеративных процессах вычисления и сравнения значений оптимизируемых функций.

Методика расчета

1 шаг : Определяем функцию Лагранжа из заданной целевой функции и системы ограничений:

Вперёд

Для того, чтобы добавить Ваш комментарий к статье, пожалуйста, зарегистрируйтесь на сайте.

Рассмотрим задачу условной оптимизации, содержащую только ограничения в виде равенств

min

при наличии ограничений

,
.

Эта задача в принципе может быть решена как задача безусловной оптимизации, полученная путем исключения из целевой функции m независимых переменных с помощью заданных равенств. Наличие ограничений в виде равенств фактически позволяет уменьшить размерность исходной задачи. Новая задача может быть решена с помощью подходящего метода безусловной оптимизации.

Пример . Требуется минимизировать функцию

при ограничении

Исключив переменную с помощью уравнения, получим оптимизационную задачу с двумя переменными без ограничений:

минимизировать ,

которую можно решить одним из методов безусловной оптимизации.

Однако метод исключения переменных применим лишь в тех случаях, когда уравнения, представляющие ограничения, можно разрешить относительно некоторого набора переменных. При наличии большого числа ограничений в виде равенств процесс исключения переменных становится весьма трудоемкой процедурой. Кроме того, возможны ситуации, когда уравнение не удается разрешить относительно переменной. В этом случае целесообразно использовать метод множителей Лагранжа.

С помощью метода множителей Лагранжа по существу устанавливаются необходимые условия, позволяющие идентифицировать точки оптимума в задачах оптимизации с ограничениями в виде равенств.

Рассмотрим задачу

min

при наличии ограничений

,
.

Из курса математического анализа хорошо известно, что точка условного минимума функции совпадает с седловой точкой функции Лагранжа:

,

при этом седловая точка должна обеспечивать минимум по переменным и максимум по параметрам. Эти параметры называются множителями Лагранжа. Приравнивая частные производные функциипои пок нулю, получим необходимые условия стационарной точки:

,
,

,
.

Решение системы
уравнений определяет стационарную точку функции Лагранжа. Достаточные условия существования минимума исходной задачи содержат, кроме выше упомянутых, положительную определенность матрицы Гессе целевой функции.

4.2. Условия куна - таккера

Рассмотрим задачу нелинейного программирования с ограничениями в виде неравенств

min

при ограничениях

,
.

Сведем ограничения в виде неравенств к ограничениям-равенствам добавлением к каждому из них ослабляющих переменных ,
:



.

Сформируем функцию Лагранжа:

Тогда необходимые условия минимума принимают вид

,
;

,
;

,
.

Можно умножить последнее уравнение на и заменить ослабляющие переменные, выразив их из второго уравнения. Второе уравнение можно преобразовать, отбросив ослабляющие переменные и переходя к ограничениям-неравенствам. Следует добавить еще одно условие
, которое должно выполняться в точке условного минимума.

Окончательно получаем необходимые условия существования минимума задачи нелинейного программирования с ограничениями неравенствами, которые называются условиями Куна- Таккера:

,
; (1)

,
; (2)

,
; (3)

,
. (4)

Ограничение в виде неравенства
называется активным в точке, если оно превращается в равенство
, и называется неактивным, если
. Если существует возможность обнаружить до непосредственного решения задачи ограничения, которые неактивны в точке оптимума, то эти ограничения можно исключить из модели и тем самым уменьшить ее размеры.

Уравнение (3) означает, что либо
, либо
. Если
, то
и ограничение является активным и представляет собой ограничение равенство. С другой стороны, если ограничение является строгим неравенством
, то множитель Лагранжа будет иметь вид
т.е. ограничение
является неактивным и им можно пренебречь. Конечно, предварительно не известно какими ограничениями можно пренебречь.

Описание метода

где .

Обоснование

Нижеприведенное обоснование метода множителей Лагранжа не является его строгим доказательством. Оно содержит эвристические рассуждения, помогающие понять геометрический смысл метода.

Двумерный случай

Линии уровня и кривая .

Пусть требуется найти экстремум некоторой функции двух переменных при условии, задаваемом уравнением . Мы будем считать, что все функции непрерывно дифференцируемы, и данное уравнение задает гладкую кривую S на плоскости . Тогда задача сводится к нахождению экстремума функции f на кривой S . Будем также считать, что S не проходит через точки, в которых градиент f обращается в 0 .

Нарисуем на плоскости линии уровня функции f (то есть кривые ). Из геометрических соображений видно, что экстремумом функции f на кривой S могут быть только точки, в которых касательные к S и соответствующей линии уровня совпадают. Действительно, если кривая S пересекает линию уровня f в точке трансверсально (то есть под некоторым ненулевым углом), то двигаясь по кривой S из точки мы можем попасть как на линии уровня, соответствующие большему значению f , так и меньшему. Следовательно, такая точка не может быть точкой экстремума.

Тем самым, необходимым условием экстремума в нашем случае будет совпадение касательных. Чтобы записать его в аналитической форме, заметим, что оно эквивалентно параллельности градиентов функций f и ψ в данной точке, поскольку вектор градиента перпендикулярен касательной к линии уровня. Это условие выражается в следующей форме:

где λ - некоторое число, отличное от нуля, и являющееся множителем Лагранжа.

Рассмотрим теперь функцию Лагранжа , зависящую от и λ :

Необходимым условием ее экстремума является равенство нулю градиента . В соответствии с правилами дифференцирования, оно записывается в виде

Мы получили систему, первые два уравнения которой эквивалентны необходимому условию локального экстремума (1), а третье - уравнению . Из нее можно найти . При этом , поскольку в противном случае градиент функции f обращается в нуль в точке , что противоречит нашим предположениям. Следует заметить, что найденные таким образом точки могут и не являться искомыми точками условного экстремума - рассмотренное условие носит необходимый, но не достаточный характер. Нахождение условного экстремума с помощью вспомогательной функции L и составляет основу метода множителей Лагранжа, примененного здесь для простейшего случая двух переменных. Оказывается, вышеприведенные рассуждения обобщаются на случай произвольного числа переменных и уравнений, задающих условия.

На основе метода множителей Лагранжа можно доказать и некоторые достаточные условия для условного экстремума, требующие анализа вторых производных функции Лагранжа.

Применение

  • Метод множителей Лагранжа применяется при решении задач нелинейного программирования, возникающих во многих областях (например, в экономике).
  • Основной метод решения задачи об оптимизации качества кодирования аудио и видео данных при заданном среднем битрейте (оптимизация искажений - англ. Rate-Distortion optimization ).

См. также

Ссылки

  • Зорич В. А. Математический анализ. Часть 1. - изд. 2-е, испр. и доп. - М.: ФАЗИС, 1997.

Wikimedia Foundation . 2010 .

Смотреть что такое "Множители Лагранжа" в других словарях:

    Множители Лагранжа - дополнительные множители, преобразующие целевую функцию экстремальной задачи выпуклого программирования (в частности, линейного программирования) при ее решении одним из классических методов методом разрешающих множителей… … Экономико-математический словарь

    множители Лагранжа - Дополнительные множители, преобразующие целевую функцию экстремальной задачи выпуклого программирования (в частности, линейного программирования) при ее решении одним из классических методов методом разрешающих множителей (методом Лагранжа).… … Справочник технического переводчика

    Механики. 1) Лагранжа уравнения 1 го рода дифференциальные ур ния движения механич. системы, к рые даны в проекциях на прямоугольные координатные оси и содержат т. н. множители Лагранжа. Получены Ж. Лагранжем в 1788. Для голономной системы,… … Физическая энциклопедия

    Механики обыкновенные дифференциальные уравнения 2 го порядка, описывающие движения механич. систем под действием приложенных к ним сил. Л. у. установлены Ж. Лаг ранжем в двух формах: Л. у. 1 го рода, или уравнения в декартовых координатах с… … Математическая энциклопедия

    1) в гидромеханике ур ния движения жидкости (газа) в переменных Лагранжа, к рыми являются координаты ч ц среды. Получены франц. учёным Ж. Лагранжем (J. Lagrange; ок. 1780). Из Л. у. определяется закон движения ч ц среды в виде зависимостей… … Физическая энциклопедия

    Метод множителей Лагранжа, метод нахождения условного экстремума функции f(x), где, относительно m ограничений, i меняется от единицы до m. Содержание 1 Описание метода … Википедия

    Функция, используемая при решении задач на условный экстремум функций многих переменных и функционалов. С помощью Л. ф. записываются необходимые условия оптимальности в задачах на условный экстремум. При этом не требуется выражать одни переменные … Математическая энциклопедия

    Метод решения задач на Условный экстремум; Л. м. м. заключается в сведении этих задач к задачам на безусловный экстремум вспомогательной функции т. н. функции Лагранжа. Для задачи об экстремуме функции f (х1, x2,..., xn) при… …

    Переменные, с помощью к рых строится Лагранжа функция при исследовании задач на условный экстремум. Использование Л. м. и функции Лагранжа позволяет единообразным способом получать необходимые условия оптимальности в задачах на условный экстремум … Математическая энциклопедия

    1) в гидромеханике уравнения движения жид кой среды, записанные в переменных Лагранжа, которыми являются координаты частиц среды. Из Л. у. определяется закон движения частиц среды в виде зависимостей координат от времени, а по ним… … Большая советская энциклопедия

Жозеф Луи Лагранж родился в Турине (Италия) в итало-французской семье. Он учился, а затем преподавал в Артиллерийском училище. В 1759 г. по рекомендации Эйлера 23-летнего Лагранжа избирают в члены Берлинской академии наук. В 1766 г. он уже стал ее президентом. Фридрих II пригласил Лагранжа в Берлин. После смерти Фридриха II в 1786 г. Лагранж переехал в Париж. С 1722 г. он был членом Парижской академии наук, в 1795 г. его назначили членом Бюро долгот, и он принял активное участие в создании метрической системы мер. Круг научных исследований Лагранжа был необычайно широк. Они посвящены механике, геометрии, математическому анализу, алгебре, теории чисел, а также теоретической астрономии. Основным направлением исследований Лагранжа было представление самых различных явлений в механике с единой точки зрения. Он вывел уравнение, описывающее поведение любых систем под действием сил. В области астрономии Лагранж много сделал для решения проблемы устойчивости Солнечной системы; доказал некоторые частные случаи устойчивого движения, в частности для малых тел находящихся в так называемых треугольных точках либрации.

Метод Лагранжа ─ это метод решения задачи условной оптимизации, при котором ограничения, записываемые как неявные функции, объединяются с целевой функцией в форме нового уравнения, называемого лагранжианом .

Рассмотрим частный случай общей задачи нелинейного программирования:

Дана система нелинейных уравнений (1):

(1) gi(x1,x2,…,xn)=bi (i=1..m),

Найти наименьшее (или наибольшее) значение функции (2)

(2) f (х1,х2,…,хn),

если отсутствуют условия неотрицательности переменных и f(х1,х2,…,хn) и gi(x1,x2,…,xn) ─ функции, непрерывные вместе со своими частными производными.

Чтобы найти решение этой задачи, можно применить следующий метод: 1. Вводят набор переменных λ1, λ2,…, λm, называемых множителями Лагранжа, составляют функцию Лагранжа (3)

(3) F(х1,х2,…,хn , λ1,λ2,…,λm) = f(х1,х2,…,хn)+ λi .

2. Находят частные производные от функции Лагранжа по переменным xi и λi и приравнивают их нулю.

3. Решая систему уравнений, находят точки, в которых целевая функция задачи может иметь экстремум.

4.Среди точек, подозрительных не экстремум, находят такие, в которыхдостигается экстремум, и вычисляют значения функции в этих точках.

4. Сравнить полученные значения функции f и выбрать наилучшее.

По плану производства продукции предприятию необходимо изготовить 180 изделий. Эти изделия могут быть изготовлены двумя технологическими способами. При производстве х1 изделия I способом затраты равны 4*х1+х1^2 руб., а при изготовлении х2 изделий II способом они составляют 8*х2+х2^2 руб. Определить, сколько изделий каждым из способов следует изготовить, так чтобы общие затраты на производство продукции были минимальными.

Решение: Математическая постановка задачи состоит в определении наименьшего значения функции двух переменных:

f = 4*x1+x1^2 +8*x2 +x2^2, при условии x1 +x2 = 180.

Составим функцию Лагранжа:

F(x1,x2,λ) = 4*x1+x1^2+8*x2+x2^2+λ*(180-x1-x2).

Вычислим ее частные производные по х1,х2, λ и приравняем их к 0:

Перенесем в правые части первых двух уравнений λ и приравняем их левые части, получим 4 + 2*x1 = 8 + 2*x2, или x1 − x2 = 2.

Решая последнее уравнение совместно с уравнением x1 + x2 = 180, находим x1 = 91, x2 = 89, то есть получили решение, удовлетворяющее условиям:

Найдем значение целевой функции f при этих значениях переменных:

F(x1, x2) = 17278

Эта точка является подозрительной на экстремум. Используя вторые частные производные, можно показать, что в точке (91,89) функция f имеет минимум.