Аннотация:
Рассматривается задача условной оптимизации гладкой функции, определенной
на банаховом пространстве, с гладкими ограничениями типа равенств и неравенств.
Для нее показано, что в известных достаточных условиях оптимальности второго
порядка можно заменить множество множителей Лагранжа некоторым меньшим
множеством.
Библиография: 12 названий.
Ключевые слова:
задача математического программирования, функция Лагранжа,
достаточные условия оптимальности второго порядка.
Здесь $k_1$ и $k\geqslant k_1$ – заданные неотрицательные целые числа, а $f_j$, $j=0,\dots,k$, – заданные функции, которые предполагаются дважды непрерывно дифференцируемыми в окрестности заданной точки $x_*\in X$. Для определенности будем считать, что $k\geqslant 1$.
Частным случаем рассматриваемой задачи является задача, в которой ограничения типа неравенств отсутствуют, и в этом случае $k_1=0$. Другим частным случаем является задача, в которой ограничения типа равенств отсутствуют, и тогда $k_2:=k-k_1=0$.
Удаляя часть ограничений типа неравенств, которые не играют роли для локальных рассмотрений, будем считать, что $f_j(x_*)=0$ при всех $j=0,\dots,k$.
Напомним необходимые условия экстремума в точке $x_*$ (см., например, [1; гл. 3] или [2; гл. 4]). Зададим функцию Лагранжа стандартно по формуле
Векторы $\lambda=(\lambda_0,\lambda_1,\dots,\lambda_k)\in\mathbb R^{k+1}$, для которых $\lambda_j\geqslant 0$ при всех $j=0,\dots,k_1$, будем называть множителями Лагранжа. Для них положим
Обозначим через $\Lambda(x_*)$ множество нормированных множителей Лагранжа $\lambda$, отвечающих точке $x_*$ в силу правила множителей Лагранжа, т.е. таких, что
Для каждого целого $s$ введем в рассмотрение множество (возможно, пустое), состоящее из тех множителей Лагранжа $\lambda\in\Lambda(x_*)$, для которых существует такое (зависящее от $\lambda$) замкнутое подпространство $\Pi\subseteq X$, что
Здесь $f=(f_1,f_2,\dots,f_k)$. Это множество множителей Лагранжа будем обозначать через $\Lambda_s(x_*)$. Введем также в рассмотрение конус критических направлений
Он, очевидно, является выпуклым и непустым ($0\in K(x_*)$).
Доказано (см. [3; теорема 2.1]), что если в рассматриваемой задаче точка $x_*$ является локальным минимумом, то множество $\Lambda_k(x_*)$ непусто и, более того,
Эта форма задана симметричной билинейной формой, значения которой будем обозначать через $\gamma[x_1,x_2]$. Квадратичная форма $\gamma$ бесконечно дифференцируема (см., например, [1; § 2.2.5, предложение 2]).
Известно, что если $\gamma$ является строгим высшим порядком (см., например, [3; § 1.7]), множество $\Lambda(x_*)$ непусто и, более того, выполнено
то точка $x_*$ является точкой строго локального минимума в рассматриваемой задаче. Это утверждение назовем теоремой ($\mathbf M$).
Отметим, что в конечномерном случае и в случае гильбертового пространства можно взять $\gamma(x)=\varepsilon\|x\|^2$ для некоторого $\varepsilon>0$. Когда пространство $X$ конечномерно, предположение (1.3) эквивалентно предположению
(см., например, [2], [4], [5]). Аналогичные утверждения для других задач оптимизации получены, например, в [6]–[10].
Определим еще одно множество множителей Лагранжа. Через $\Lambda_k(x_*,\gamma)$ обозначим множество тех $\lambda\in\Lambda(x_*)$, для которых существует такое (зависящее от $\lambda$) замкнутое линейное подпространство $\Pi\subseteq X$, что
Каждое из множеств $\Lambda_k(x_*,\gamma)$ замкнуто (это вытекает из [3; теорема 2.3]) и, возможно, пусто.
Сравнивая достаточные условия с выписанными выше необходимыми, видим, что в них фигурируют разные множества множителей Лагранжа: $\Lambda(x_*)$ и $\Lambda_k(x_*)$. Это несоответствие представляется неестественным. Наша цель – доказать, что при общих предположениях в достаточных условиях второго порядка (1.3) множество $\Lambda(x_*)$ можно заменить на, вообще говоря, меньшее множество $\Lambda_k(x_*,\gamma)$.
2. Вспомогательные утверждения
Вначале рассмотрим задачу с ограничениями только типа равенств, т.е. при $k_1=0$, $k=k_2$ задачу
Доказательство. Снова для простоты будем считать, что $x_*=0$. Рассматриваемая задача, очевидно, эквивалентна следующей задаче с ограничениями типа неравенств, но уже в количестве $2k$ штук:
Очевидно, что $g'_j(0)=f'_j(0)$ и $g''_j(0)=f''_j(0)$, $j=0,\dots,k$. Критический конус в нуле обозначим через $K^\gamma$, а множество нормированных множителей Лагранжа – через $\Lambda^\gamma$, т.е. положим
Покажем, что для задачи (2.4) выполняется предположение теоремы ($\mathbf M$). Действительно, возьмем произвольный $x\in K(0)=K^\gamma$. Пусть максимум в (2.2) достигается на некотором $\lambda=(\lambda_0,\dots,\lambda_k)\in\Lambda(0)$. Положим
Таким образом, показано, что для задачи (2.4) выполняется предположение теоремы ($\mathbf M$). Из нее вытекает, что точка $x_*=0$ является строгим локальным минимумом в задаче (2.4).
Шаг I. Обозначим через $\Lambda^\gamma_k$ множество (возможно, пустое) всех векторов $\mu\in \Lambda^\gamma$, для которых существует (зависящее от $\mu$) замкнутое линейное подпространство $\Pi\subset X$, для которого
Здесь $r >0$ – это радиус той окрестности, в которой достигается строгий минимум в задаче (2.4).
При номерах $i>r^{-1}$, которые мы только и будем рассматривать, решение задачи (2.12) существует, поскольку точка $(i^{-1}h,1)$ удовлетворяет всем ее ограничениям, шар $\{x\colon \|x\|^2\leqslant r^2\}$ компактен и по построению $\xi(\chi)/\chi\to +\infty$ при $\chi\to\infty$.
Покажем, что среди решений $(x,\chi)$ задачи (2.12) существует решение $(x_i,\chi_i)$ такое, что $\chi_i>0$. Действительно, пусть $(x_i,0)$ является решением задачи (2.12). Покажем, что тогда $x_i=0$. Действительно, пусть $x_i\ne 0$. Тогда поскольку $x_i$ удовлетворяет всем ограничениям задачи (2.4), то $g_0(x_i)-\gamma[x_i,x_i]/4\geqslant 0$ и, значит, имеем
Следовательно, $g_i(x_i,0)>g_i(i^{-1}h,1)=0$ и точка $(i^{-1}h,1)$ также удовлетворяет всем ограничениям рассматриваемой задачи. Полученное противоречие доказывает, что $x_i=0$. Но тогда минимум в задаче (2.12) равен нулю. Значит, точка $(i^{-1}h,1)$ также является ее решением и $\chi_i>0$. Это доказывает требуемое.
Рассмотрим последовательность таких решений $(x_i,\chi_i)$ задачи (2.12), что $\chi_i> 0$ для любого $i$. Из $\xi(\chi)/\chi\to+\infty$ при $\chi\to+\infty$ вытекает ограниченность последовательности $\{\chi_i\}$. Используя это, неравенство $g_i(x_i,\chi_i)\leqslant g_i(i^{-1}h,1)=0$ и неотрицательность функции $\xi$, имеем
Поэтому для любой предельной точки $\overline x\in X$ последовательности $\{x_i\}$ имеет место $\widetilde g_0(\overline x)=g_0(\overline x) -\gamma[\overline x,\overline x]/4+(\gamma[\overline x,\overline x])^2\leqslant 0$. Значит,
Зафиксируем произвольную предельную точку $\overline x$ последовательности $\{x_i\}$. Вначале переходя к подпоследовательности, а затем к пределу при $i\to\infty$ в ограничениях задачи (2.12), получаем, что точка $\overline x$ является допустимой в задаче (2.4).
Как доказано выше, условный минимум в задаче (2.4) функции $g_0(x)-\gamma[x,x]/4$ равен нулю. Поэтому $g_0(\overline x)-\gamma[\overline x,\overline x]/4\geqslant 0$. Значит, $\overline x=0$. Следовательно, $x_i\to 0$ при $i\to +\infty$. Поэтому при достаточно больших $i$, которые только и будут рассматриваться, $\|x_i\|<r$.
Покажем, что существует номер $I>0$, для которого выполнено
Условие (A). Для всех $i\geqslant I$ в задаче (2.12) в точке $(x_i,\chi_i)$ при каждом $j=1,\dots,k$ активно не более одного из двух ограничений, т.е. если
и $\chi_i\ne 0$ следует, что $g_1(i^{-1}h)=0$. Отсюда, учитывая, что $h\in K(0)$ и, значит, $g_1(0)=0$, $\langle g'_1(0),h\rangle=0$, получаем, что $g''_1(0)[i^{-1}h,i^{-1}h]=0$, а это противоречит предположению $g''_1(0)[h,h]\ne 0$. Таким образом, $x_i\ne 0$.
Поскольку квадратичная форма $\gamma$ положительна и $x_i\ne 0$, то выполняется не более одного из двух равенств
Здесь слагаемые, отвечающие ограничениям $\|x\|^2\leqslant r^2$ и $\chi\geqslant 0$ задачи (2.12), отсутствуют, поскольку в точке $(x_i,\chi_i)$ эти ограничения неактивны.
Здесь последнее равенство в (2.14) вытекает из условия (A). Равенство (2.15) следует из того, что $(\partial\widetilde{\mathscr L}_i/\partial x)((x_i,\chi_i),\mu^i)=0$, и тождества (2.13). Равенство в (2.16) следует из того, что $(\partial\widetilde{\mathscr L}_i/\partial\chi)((x_i,\chi_i),\mu^i)=0$, и тождества (2.13).
Соотношения (2.17) и (2.18) вытекают из следующих соображений. По теореме 2.1 из [3] неравенство
справедливо на некотором подпространстве $\widetilde\Pi_i\subset X\times\mathbb R$, коразмерность которого не превышает $k$. Отсюда, поскольку в силу тождества (2.13) и выпуклости функции $\xi$ имеют место соотношения
справедливо на линейном подпространстве $\Pi_i:=\{x\in X\colon (x,0)\in\widetilde{\Pi}_i\}$ и $\operatorname{codim}\Pi_i\leqslant k$. Кроме того, в (2.17) мы воспользовались тем, что в силу условия (A) из $2k$ ограничений активно не более $k$ штук.
По теореме 2.3 из [3] существует подпространство $\Pi\subset X$ такое, что $\operatorname{codim}\Pi= k$ и $\Pi\subset\operatorname{Ls}\{\Pi^i\}$. Переходя сначала к подпоследовательности, а затем к пределу при $i\to \infty$ в соотношениях (2.14)–(2.18) и используя, что $x_i\to 0$, получим, что существует вектор $\mu=(\mu_0,\mu_{1,1},\dots,\mu_{1,k},\mu_{2,1},\dots,\mu_{2,k})$, для которого имеет место
Таким образом, $\mu\in\Lambda^\gamma_k$. Кроме того, раскладывая в левой части (2.16) функции $g_0$ и $g_j$ в нуле до членов второго порядка включительно и учитывая, что $h\in K(0)$, переходя к пределу при $i\to\infty$ получаем, что
Для этой задачи нуль является допустимой точкой, критический конус в нуле совпадает с $K(0)$, а множество нормированных множителей Лагранжа совпадает с $\Lambda(0)$. Обозначим через $\mathscr L_s(x,\lambda)$ функцию Лагранжа для этой задачи, т.е.
Здесь $\gamma$ – это заданная в предположении леммы квадратичная форма. Функция Лагранжа $\mathscr L^\gamma_s$ получается заменой $g_j(x)$ на $g_{s,j}(x)$ в правой части равенства (2.5).
Таким образом, для достаточно больших номеров $s$ для задачи (2.21) в нуле выполняется предположение теоремы ($\mathbf M$) и по построению $g''_{s,j}(0)[h,h]\ne 0$ при каждом $j=1,\dots,k$. Следовательно, применяя к задаче (2.21) доказанное в первом случае шага I, утверждение, получаем, что
Здесь $\Lambda^{\gamma,s}_k$ – это множество всех единичных неотрицательных векторов $\mu^s\in\mathbb R_+\times\mathbb R^k_+\times\mathbb R^k_+$, для которых $(\partial\mathscr L^\gamma_s/\partial x)(0,\mu^s)=0$ и существует подпространство $\Pi_s\subset X$ такое, что
Переходя к подпоследовательности, будем, не ограничивая общности, считать, что $\mu^s$ при $s\to\infty$ сходится к некоторому вектору $\mu=(\mu_0,\mu_1,\mu_2)\in\mathbb R_+\times\mathbb R^k_+\times\mathbb R^k_+$, для которого $\mu_1=(\mu_{1,1},\dots,\mu_{1,k})$, $\mu_2=(\mu_{2,1},\dots,\mu_{2,k})$.
Очевидно, что $\mu\in\Lambda^\gamma$. Переходя в (2.22) к пределу при $s\to\infty$ и используя [3; теорема 2.3], получаем, что
Разделение шага I на два случая вызвано следующими соображениями.
В предположениях первого случая, т.е. когда $g''_j(0)[h,h]\ne 0$ для некоторого $j$, доказано, что при всех $i\ne 0$ существует решение $(x_i,\chi_i)$ задачи (2.12) такое, что $x_i\ne 0$ при всех достаточно больших $i$. Значит, в точке $x_i$ активно не более одного из двух ограничений
и поэтому в задаче (2.12) также активно не более $k$ ограничений, откуда уже выводится, что $\operatorname{codim}\Pi\leqslant k$.
Если же выполняется предположение второго случая, т.е. $g''_j(0)[h,h]=0$ при всех $j$, то возможно, что $x_i=0$ для всех решений $(x_i,\chi_i)$ задачи (2.12). В этом случае при указанном $j$ уже активны оба ограничения задачи (2.12), что не позволяет получить нужную оценку коразмерности подпространства $\Pi$. Поэтому мы и возмущаем задачу (2.12), заменяя функцию $g_j$ на $g_j+s^{-1}\gamma$, для которой предположения первого случая уже выполняются.
Шаг II. Докажем, что существует $\overline\lambda\in\Lambda(0)$ и подпространство $\Pi\subset X$, для которых
В силу утверждения, доказанного на шаге I, существует $\mu=(\mu_0,\mu_1,\mu_2)$, для которого выполняются неравенство и равенства в (2.11), и подпространство $\Pi\subset X$, для которого выполняются соотношения (2.10). Покажем, что $\overline\lambda:=(\mu_0,\mu_1-\mu_2)$ является искомым.
Поскольку $\mu_{1,j}\mu_{2,j}=0$ при $j=1,\dots,k$, то $|\overline\lambda|=|\mu|=1$. Поэтому из очевидного тождества
Кроме того, $(\partial^2\mathscr L/\partial x^2)(0,\overline\lambda)[h,h]\geqslant 0$ в силу (2.11).
Таким образом, шаг II весьма прост и заключается во введении $\overline\lambda$ по формуле $\overline\lambda=(\mu_0,\mu_1-\mu_2)$.
Шаг III. Для фиксированного выше $h$ возьмем вектор $\overline\lambda\in\Lambda(0)$ и подпространство $\Pi\subset X$, для которых выполняется (2.23). В силу предположения (2.2) существует $\overline{\overline\lambda} =(\overline{\overline\lambda}_0,\dots,\overline{\overline\lambda}_k) \in\Lambda(0)$, для которого имеет место
поскольку $\overline\lambda,\overline{\overline\lambda}\in\Lambda(0)$. Значит, $\widehat\lambda$ – это тоже множитель Лагранжа в нуле. Кроме того, имеем
Кроме того, в силу (2.23) $\operatorname{codim}\Pi\leqslant k$ и $\Pi\subset\operatorname{ker}f'_j(0)$ при всех $j=1,\dots,k$. Следовательно, $\lambda\in\Lambda_k(0,\gamma)$. Кроме того, в силу (2.28) и неравенства $|\widehat\lambda|\leqslant 1$ имеем
В силу произвольности выбора $h$ соотношение (2.3) доказано, что и завершает доказательство леммы 1.
Замечание 1. В соотношении (2.3) в утверждении леммы 1 максимум берется по множеству $\Lambda_k(x_*,\gamma)$. Отметим, что имеет место включение $\Lambda_k(x_*,\gamma)\subseteq\Lambda_k(x_*)$, а в теореме 2, доказанной в [11] другим методом, максимум берется по множеству $\Lambda_{k-1}(x_*)$. В то же время несложно привести примеры задач, в которых может выполняться строгое включение $\Lambda_k(x_*,\gamma)\subset\Lambda_{k-1}(x_*)$, причем обратное неверно. Поэтому лемма 1 не вытекает из теоремы 2. Кроме того, в [11] теорема 2 доказана в предположении аномальности точки $x_*$.
Покажем, что от предположения конечномерности пространства $X$ в лемме 1 можно отказаться следующим образом. При этом наложим на функции $f_j$ более слабые предположения, чем это было сделано выше. А именно, предположим, что функции $f_j$, $j=0,\dots,k$, дважды непрерывно дифференцируемы относительно конечной топологии в окрестности точки $x_*$, т.е. для любого конечномерного подпространства $M$ сужения функций $f_j$, $j=0,\dots,k$, на $\{x_*\}+M$ дважды непрерывно дифференцируемы в некоторой окрестности точки $x_*$, зависящей от $M$ (см., например, [12]).
Лемма 2. Пусть $\Lambda(x_*)\ne\varnothing$ и выполняется условие (1.3), т.е. имеет место
Доказательство. Снова будем считать, что $x_*=0$. Возьмем произвольное $h\in K(0)$, $h\ne 0$. Обозначим через $\mathscr M$ множество всех конечномерных подпространств $M$ пространства $X$ таких, что $h\in M$ и $F'(0)M=F'(0)X$. Здесь $F\colon X\to\mathbb R^k$ – это отображение, определяемое по формуле $F=(f_1,\dots,f_k)$. Возьмем произвольное $M\in\mathscr M$ и рассмотрим задачу, полученную из (2.1) заменой $X$ на $M$. Как доказано в лемме 1, для этой конечномерной задачи существуют такие множители Лагранжа $\lambda_M$ и число $\delta(M)>0$, что
Обозначим множество всех $\lambda_M$ через $\Lambda_k(M)$. В силу того, что каждое конечномерное пространство $M$ замкнуто и в (2.30) знак в неравенстве нестрогий, множество $\Lambda_k(M)$ замкнуто для любого $M\in\mathscr M$. Из того, что $\delta(M)>0$ и квадратичная форма $\gamma$ положительна, вытекает, что
$$
\begin{equation*}
\frac{\partial^2L}{\partial x^2}(0,\lambda_M)[h,h] \geqslant\delta(M)\gamma[h,h]\qquad \forall\,M\in\mathscr M.
\end{equation*}
\notag
$$
Для произвольных $M_1,\dots,M_s\in\mathscr M$, очевидно,
Следовательно, система непустых замкнутых множеств $\Lambda_k(M)$, $M\in\mathscr M$, является центрированной. Поэтому в силу компактности единичной сферы в $\mathbb R^{k+1}$ множество $\bigcap_{M\in\mathscr M}\Lambda_k(M)$ непусто. Очевидно, что для произвольного вектора $\lambda$ из этого пересечения имеет место
Докажем, что $\lambda\in\Lambda_k(0,\gamma)$. Максимальная из размерностей, лежащих в $\operatorname{ker}F'(0)$ подпространств, на которых форма $(\partial^2 F/\partial x^2)(0,\lambda)-\gamma/4$ отрицательно определена, не превышает числа $k-\operatorname{dim}(\operatorname{Im}F'(0))$. Это утверждение вытекает из того, что $\lambda\in\Lambda_k(M)$ для любого $M\in\mathscr M$. Существование подпространства $\Pi$, на котором квадратичная форма $(\partial^2 F/\partial x^2)(0,\lambda)-\gamma/4$ неотрицательна, вытекает из [3; теорема 2.3]. Таким образом, доказано, что $\lambda\in\Lambda_k(0,\gamma)$.
3. Основные результаты
Рассмотрим вначале задачу с ограничениями только типа неравенств, т.е. при $k_1=k$ и $k_2=0$. Итак, рассмотрим задачу
Доказательство. Не теряя общности, будем считать, что $x_*=0$. Для заданной по условию функции $\gamma$ рассмотрим задачу с ограничениями типа неравенств
Покажем, что точка $x_*=0$ – это строгий локальный минимум задачи (3.4). Очевидно, что нуль является допустимой точкой для рассматриваемой задачи. Далее, для любого $x\in X$ и $\lambda=(\lambda_0,\lambda_1,\dots,\lambda_k)\in\Lambda(0)$ имеем
Здесь первое равенство следует из того, что $\Lambda^\gamma=\Lambda(0)$, а последнее неравенство выполняется в силу (3.2), поскольку $K(0)=K^\gamma$.
В силу (3.6) и поскольку $\Lambda^\gamma\ne\varnothing$, для задачи (3.4) выполнены предположения теоремы ($\mathbf M$). Из нее получаем, что нуль, т.е. $x_*=0$, является точкой строгого локального минимума в задаче (3.4).
Применим к задаче (3.4) необходимые условия минимума в нуле [3; теорема 2.1]. По этой теореме
Здесь $\Lambda^\gamma_k$ – это множество всех векторов $\lambda\in\Lambda^\gamma$, для которых существует (зависящее от $\lambda$) замкнутое линейное подпространство $\Pi\subset X$, для которого
Зафиксируем произвольный вектор $h\in K^\gamma=K(0)$. Из (3.7) следует, что существует $\lambda\in\Lambda^\gamma=\Lambda(0)$ и замкнутое линейное подпространство $\Pi\subseteq X$, для которых имеют место соотношения (3.8) и
Критический конус в нуле обозначим через $K^\gamma$, а множество нормированных множителей Лагранжа – через $\Lambda^\gamma$. Очевидно, что $K(0)=K^\gamma$.
Повторяя рассуждения, приведенные в доказательстве леммы 1, получаем, что для задачи (3.11) выполняется условие теоремы ($\mathbf M$) и, значит, по этой теореме точка $x_*=0$ является строгим локальным минимумом в задаче (3.11).
По аналогии с леммой 1 выполним шаг I. Обозначим через $\Lambda^\gamma_k$ множество всех векторов $\mu\in\Lambda^\gamma$, для которых существует (зависящее от $\mu$) замкнутое линейное подпространство $\Pi\subset X$ такое, что
Рассмотрим два случая. Предположим, вначале, что существует $j\in\{1,\dots,k\}$, для которого $g''_j(0)[h,h]\ne 0$. Для определенности будем считать, что $g''_1(0)[h,h]\ne 0$. Функции $\chi$ и $g_i(x,\chi)$ определим как и при доказательстве леммы 1.
Здесь $r>0$ – это радиус той окрестности, в которой достигается строгий минимум в задаче (3.11).
Повторяя рассуждения, приведенные в шаге I доказательства леммы 1 при рассмотрении задачи (2.12), получаем, что среди решений $(x,\chi)$ задачи (3.15) существует решение $(x_i,\chi_i)$ такое, что $\chi_i>0$, и для последовательности этих решений последовательность $\{\chi_i\}$ ограниченна и $x_i\to 0$ при $i\to\infty$. Кроме того, применяя приведенные в шаге I доказательства леммы 1 рассуждения и предположение $g''_1(0)[h,h]\ne 0$, получаем, что при больших $i$ найдутся подпространство $\Pi_i\subset X$ коразмерности $k$ и вектор
Переходя вначале к подпоследовательности, а затем к пределу при $i\to+\infty$, повторяя рассуждения, приведенные в шаге I доказательства леммы 1, получаем, что существует $\mu\in\Lambda^\gamma_k$, для которого выполняются соотношения (3.14).
Итак, первый случай рассмотрен, т.е. в предположении, что $g''_j(0)[h,h]\ne 0$ для некоторого $j\in\{1,\dots,k\}$, доказано (3.14).
Второй случай, когда $g''_j(0)[h,h]=0$ при всех $j\in\{1,\dots,k\}$, полностью аналогичен рассмотрениям леммы 1. Дословно повторяя рассуждения шага II доказательства леммы 1, получаем, что для $\overline\lambda:=(\mu_0,\mu_1-\mu_2)\in\Lambda(0)$ и подпространства $\Pi\subset X$ имеет место (2.23).
Выбирая константы $c>0$ и $\delta>0$ и векторы $\overline{\overline\lambda}$ и $\widehat\lambda$, как в шаге III доказательства леммы 1 повторяя соответствующие построения, получаем, что
В силу произвольности выбора $h$ соотношение (3.10) доказано.
Покажем, что от предположения конечномерности пространства $X$ в теореме 2 можно отказаться следующим образом. Предположим, что все функции $f_j$, $j=0,\dots,k$, дважды непрерывно дифференцируемы относительно конечной топологии в окрестности точки $x_*$.
Предложение 1. Пусть $X$ – банахово пространство, $\Lambda(x_*)\ne\varnothing$ и выполняется условие (1.3), т.е. имеет место
Доказательство дословно повторяет доказательство леммы 2. Единственное отличие состоит в том, что здесь мы применяем теорему 2 к задаче, полученной из задачи
Замечание 2. Если пространство $X$ конечномерно, то (3.10) выполняется тогда и только тогда, когда выполняется (3.16). Поэтому в случае, когда пространство $X$ конечномерно, теорема 2 и предложение 1 эквивалентны.
Таким образом, неравенство (3.16) является достаточным условием локального минимума, когда пространство $X$ конечномерно. Более того, из теоремы 2 следует, что для бесконечномерного пространства $X$ неравенство (3.16) является достаточным условием локального минимума относительно конечной топологии. При этом множество называется открытым в конечной топологии, если его пересечение с любым конечномерным подпространством $M\subset X$ открыто в единственной отделимой топологии пространства $M$ (см., например, [12]).
Замечание 3. Без предположения о конечномерности пространства $X$ условие (3.16), вообще говоря, не является достаточным условием локального минимума (относительно сильной топологии). Поясним сказанное на примере бесконечномерной задачи без ограничений в гильбертовом пространстве $\ell_2$.
Очевидно, что функция $f_0$ бесконечно дифференцируема и для нее условие (3.16) выполняется в точке $x^*=0$ при $k=0$, $\gamma(x)=\sum_{i=1}^{+\infty}x_i^2/i$, $K(x^*)=\ell_2$, $\Lambda_k(x_*,\gamma)=\{1\}$. Однако нуль не является точкой локального минимума функции $f_0$.
Действительно, рассмотрим сходящуюся к нулю последовательность векторов $x_n=(x_{n,1},x_{n,2},\dots)$, $n=1,2,\dots$, у которых $n$-я координата $x_{n,n}$ равна $-2/n$, а остальные равны нулю. Для этой последовательности имеем
Авторы благодарны рецензенту за внимание к работе и ценные замечания.
СПИСОК ЦИТИРОВАННОЙ ЛИТЕРАТУРЫ
1.
В. М. Алексеев, В. М. Тихомиров, С. В. Фомин, Оптимальное управление, Физматлит, М. 2007, 2007
2.
Ф. П. Васильев, Методы оптимизации, т. 1, МЦНМО, М., 2011
3.
А. В. Арутюнов, “Гладкие анормальные задачи теории экстремума и анализа”, УМН, 67:3 (405) (2012), 3–62
4.
D. Klatte, B. Kummer, Nonsmooth Equations in Optimization. Regularity, Calculus, Methods and Applications, Nonconvex Optim. Appl., 60, Kluwer Acad. Publ., Dordrecht, 2002
5.
J. F. Bonnans, A. Shapiro, Perturbation Analysis of Optimization Problems, Springer Ser. Oper. Res., Springer, New York, 2000
6.
Д. Ю. Карамзин, “Необходимые условия экстремума в задаче управления с фазовыми ограничениями”, Ж. вычисл. матем. и матем. физ., 47:7 (2007), 1123–1150
7.
B. S. Mordukhovich, M. E. Sarabi, “Critical multipliers in variational systems via second-order generalized differentiation”, Math. Program., 169:2 (2018), 605–648
8.
B. S. Mordukhovich, M. E. Sarabi, “Second-order analysis of piecewise linear functions with applications to optimization and stability”, J. Optim. Theory Appl., 171:2 (2016), 504–526
9.
А. Ф. Измаилов, Чувствительность в оптимизации, ФИЗМАТЛИТ, М., 2006
10.
А. Ф. Измаилов, “Чувствительность решений систем условий оптимальности при нарушении условий регулярности ограничений”, Ж. вычисл. матем. и матем. физ., 47:4 (2007), 555–577
11.
А. В. Арутюнов, “Положительность квадратичных форм на пересечении квадрик”, Матем. заметки, 71:1 (2002), 27–36
12.
Р. Хилле, Э. Филлипс, Функциональный анализ и полугруппы, ИЛ, М., 1962
Образец цитирования:
А. В. Арутюнов, С. Е. Жуковский, “О достаточных условиях второго порядка в задаче математического
программирования”, Матем. заметки, 115:2 (2024), 177–196; Math. Notes, 115:2 (2024), 148–163