Аннотация:
Рассматриваются различные аспекты обобщённой гамильтоновой динамики Дирака. Исходный пункт – это гамильтонова система на симплектическом многообразии, на котором ещё задано распределение многомерных касательных плоскостей. Требуется изменить гамильтоново векторное поле таким образом, чтобы это распределение было инвариантным относительно фазового потока изменённой динамической системы. Эта задача может быть решена различными способами. В самом простом из них гамильтоново векторное поле проектируется на касательные плоскости распределения с помощью симплектической структуры – замкнутой невырожденной 2-формы на симплектическом многообразии (которая задаёт симплектическую геометрию на плоскостях, касательных к фазовому пространству). Если заданное распределение интегрируемо, то такой подход приводит к обобщённой гамильтоновой динамике, развитой Дираком (и другими авторами) для целей квантования систем с вырожденным по скоростям лагранжианом. В применении к механике лагранжевых систем с неинтегрируемыми связями этот подход даёт классические неголономные системы. Другой подход основан на определении движения гамильтоновых систем с дифференциальными связями как экстремалей вариационной задачи со связями, где в качестве функционала берётся действие по Пуанкаре–Гельмгольцу. В случае неинтегрирумых связей получаем динамические системы совершенно другого типа. Если этот подход применить к лагранжевым системам с неинтегрируемыми связями, то получим уравнения движения в так называемой вакономной динамике. В качестве примера рассматривается геометрическая оптика, которая основывается на вариационном принципе Ферма с лагранжианом, однородным по скоростям со степенью 1.
Библиография: 34 названия.
Ключевые слова:
гамильтонова система, симплектическая структура, симплектическая геометрия, лагранжиан, гамильтониан, первичные связи, вторичные связи, распределения, действие по Пуанкаре–Гельмгольцу, множители Лагранжа, неголономные системы, вакономные системы, неизотропные оптические среды, принцип Ферма.
Когда Гамильтон развивал свои методы, конечно, он не думал о том, что они приобретут такую значимость. Единственное, что могло служить ему в качестве путеводного маяка при выполнении этой работы, была математическая красота уравнений. То, что он сумел оценить важность своей работы несмотря на отсутствие в то время каких-либо её практических применений, свидетельствует о его великом гении.
П. Дирак, “Гамильтоновы методы и квантовая механика”
0. Введение
0.1.
Динамика консервативных систем обычно представляется либо в лагранжевом, либо в гамильтоновом формализме. Лагранжевы и гамильтоновы уравнения связаны между собой преобразованием Лежандра, которое обладает свойством дуальности. В задачах механики фазовым пространством лагранжевой системы служит пространство касательного расслоения конфигурационного пространства $M$, а гамильтонова система определена в пространстве кокасательного расслоения $M$. Однако гамильтоновы системы имеют более общую природу: их естественно рассматривать на произвольных симплектических многообразиях (а не только на $T^*M$).
В работах [1], [2] Дирак развил гамильтонов подход в случае, когда функция Лагранжа $L(\dot{q},q)$ вырождена по скоростям. Этот круг вопросов рассматривался также в [3]. Важным примером служит задача о релятивистской частице в заданном электромагнитном поле в четырёхмерном пространстве-времени. Здесь “кинетическая” энергия частицы будет однородной функцией от обобщённых скоростей степени 1. Сюда же следует отнести и задачи геометрической оптики. Важность рассмотрения задач с вырожденным лагранжианом связана прежде всего с проблемой квантования, которая исходит из гамильтоновой формы уравнений движения.
Дирак предлагает воспользоваться преобразованием Лежандра и ввести импульсы по обычному правилу
$n$ – число степеней свободы. Если лагранжиан вырожден по скоростям (т. е. $\det\|\partial^2 L/\partial\dot{q}^2\|=0$), то из (0.1) можно вывести несколько соотношений
$$
\begin{equation}
\varphi_k(p,q)=0,\qquad 1 \leqslant k \leqslant m.
\end{equation}
\tag{0.2}
$$
В работе [3] они названы первичными связями. Гамильтониан вводится обычным способом:
что обращается в нуль согласно (0.1). Поэтому гамильтониан $H$ можно считать функцией только от $p$ и $q$ (в некотором “слабом” смысле по Дираку). Более точно, $H$ является функцией на некотором $2n$-мерном подмногообразии $3n$-мерного пространства переменных $q$, $\dot{q}$ и $p$, которое задаётся $n$ независимыми соотношениями (0.1) и (0.2).
Далее Дирак “выводит” обобщённые уравнения Гамильтона
Здесь $\lambda_1,\dots,\lambda_m$ – пока не определённые множители. К уравнениям (0.4) следует добавить ещё $m$ уравнений связей (0.2). При этом должны удовлетворяться “условия совместности” связей
$$
\begin{equation}
\dot{\varphi}_i=\{\varphi_i,H\}+\sum \lambda_k\{\varphi_i,\varphi_k\}=0,\qquad 1 \leqslant i \leqslant m,
\end{equation}
\tag{0.5}
$$
когда все $\varphi_k$ равны нулю. Здесь $\{\,\cdot\,{,}\,\cdot\,\}$ – обычная скобка Пуассона.
Если матрица скобок Пуассона $\|\{\varphi_i,\varphi_j\}\|$ невырождена, то уравнения (0.5) однозначно задают $ \lambda_k$ как функции от $p$, $q$. В случае вырождения этой матрицы возникают вторичные связи как алгебраические условия разрешимости системы уравнений (0.5) относительно $\lambda_1,\dots,\lambda_m$. Далее вторичные связи добавляют к первичным связям и повторяют условия совместности ещё раз. В итоге мы либо придём к противоречию (например, когда уравнения Лагранжа с вырожденным лагранжианом вообще не имеют решений), либо линейная система уравнений вида (0.5) окажется совместной. В последнем случае множители $\lambda$, возможно, определены неоднозначно.
Вывод уравнений (0.4) основан на введённых Дираком сильных и слабых соотношениях. Комментаторы работ [1], [2] отмечают, что введённые Дираком правила перехода от вырожденных лагранжевых уравнений к уравнениям (0.4) нуждаются в более тщательном обосновании (в частности, следовало бы установить непротиворечивость этих правил). Однако “… как всегда, непостижимым образом в его рассуждениях и конструкциях сомнительные ситуации просто не попадаются” [4].
0.2.
Справедливости ради надо сказать, что первым автором, кто рассматривал гамильтоновы аспекты лагранжевых динамических систем с вырожденным лагранжианом, был сам Гамильтон. Предметом его исследований вначале была геометрическая оптика, а уже затем динамика механических систем в потенциальном силовом поле. Оптические свойства среды определяются показателем преломления $n$. Он равен обратной величине скорости света. В общем случае он является функцией от точки $x$ и направления скорости световых частиц $v=\dot{x}$:
Интеграл (0.6) часто называют действием по Ферма. Согласно принципу Ферма свет распространяется вдоль пути с наименьшей продолжительностью по времени. Другими словами, путь $t \mapsto x(t)$ является стационарной точкой функционала (0.6) с закреплёнными концами и тем самым удовлетворяет уравнению Лагранжа с лагранжианом $L$.
Так как лагранжиан $L$ однороден по скорости, то (по теореме Эйлера)
Таким образом, в этом случае нельзя воспользоваться классическим преобразованием Лежандра.
Эту трудность Гамильтон преодолел следующим образом. Вводится замкнутое множество точек $v \in \mathbb{R}^3$, удовлетворяющих уравнению $L(x,v)=1$. Эта поверхность называется индикатрисой в точке $x$. Далее вводится фигуратриса – множество импульсов $y \in \mathbb{R}^3$, определяемых следующими соотношениями:
Если индикатриса является выпуклой поверхностью, то фигуратриса обладает тем же свойством. В этом важном случае существует единственная функция $H(x,y)$, положительно однородная по $y$ ($H(x,\lambda y)=\lambda H(x,y)$ для всех $\lambda>0$) и равная 1 для всех импульсов, лежащих на фигуратрисе. Преобразование
переводит фигуратрису в индикатрису. Таким образом, функции $L$ и $H$ (так же как индикатриса и фигуратриса) двойственны друг другу. Как показал Гамильтон, путь $t \mapsto x(t)$ является световым лучом тогда и только тогда, когда найдётся “сопряжённая” функция $t \mapsto y(t)$ такая, что они вместе удовлетворяют каноническим уравнениям
Этот результат получен Гамильтоном в работе, представленной им в 1824 г. Ирландской академии наук (краткое изложение см. в [5; гл. I, § 4]).
Как всё это выглядит с точки зрения гамильтонова формализма Дирака? Легко понять, что если индикатриса выпукла, то соотношение $y=\partial L/\partial v$ влечёт только одну нетривиальную первичную связь
Ввиду того, что лагранжиан $L$ есть однородная функция первой степени по скоростям, гамильтониан (0.3) тождественно равен нулю. Следовательно, уравнения Дирака (0.4) принимают следующий вид:
Условия совместности (0.5), очевидно, справедливы при всех значениях $\lambda$. Уравнения (0.8) отличаются от уравнений Гамильтона (0.7) только множителем $\lambda$, который может быть произвольной положительной функцией времени. Положительность множителя $\lambda$ вытекает из того простого факта, что частицы света движутся по лучам с ненулевой скоростью, не меняя направления движения. Таким образом, с точки зрения задачи о нахождении световых лучей уравнения (0.7) и (0.8) совпадают.
Метод Гамильтона усовершенствован в вариационном исчислении (см., например, [6]). Он основан на известном в геометрии преобразовании полюсов и поляр относительно единичной сферы. Кстати сказать, результаты Гамильтона в геометрической оптике не упоминаются в [1]–[3] (как и в других работах, посвящённых динамике Дирака; см., например, [7]–[10]).
0.3.
Рассмотрим ещё в качестве примера другой крайний случай, когда лагранжиан линеен по скоростям:
Динамическую систему такого вида Биркгоф назвал гироскопической частицей [11; гл. I, § 9]. К этому типу принадлежит, например, заряженная частица с ничтожной массой в статическом магнитном поле.
Предположим, что определитель кососимметрической матрицы $\|a_{ij}\|$ отличен от нуля (общий случай обсуждается в работах [12], [9]). Тогда (0.10) задаёт обычную динамическую систему в конфигурационном пространстве:
$$
\begin{equation*}
\dot{q}_i=\sum a^{ij}\frac{\partial u}{\partial q_j}\,,\qquad 1 \leqslant i \leqslant n.
\end{equation*}
\notag
$$
Здесь $\|a^{ij}\|$ – матрица, обратная к $\|a_{ij}\|$.
В этом случае $n$ обязательно чётно и система (0.10) будет гамильтоновой, но только не представленной в канонических переменных. Симплектическая структура на $M=\{q\}$ задаётся замкнутой невырожденной 2-формой
а функцией Гамильтона служит $-u(q)$ (на самом деле выбор знака перед гамильтонианом не имеет никакого значения). В частности, функция $u\colon M \to \mathbb{R}$ будет первым интегралом системы (0.10).
Применим к вырожденному лагранжиану (0.9) гамильтонов формализм Дирака. Соотношения для импульсов
В силу предположения о невырожденности матрицы $\|a_{ij}\|$ из (0.14) однозначно находятся множители $\lambda_1,\dots,\lambda_n$. Их подстановка в первое уравнение (0.13) даст нам уравнения Лагранжа (0.10). Второе уравнение (0.13) не даёт ничего нового по сравнению с соотношениями (0.11).
Итак, формализм Дирака приводит к той же гамильтоновой системе (0.10) с $n/2$ степенями свободы. В работах [13], [10] лагранжева система с лагранжианом (0.9) рассматривалась с другой точки зрения. Уравнения (0.10) (не содержащие вторых производных) предполагалось трактовать как связи, наложенные на лагранжеву систему. После этого используется гамильтонов формализм, хорошо известный в вариационной задаче Лагранжа со связями. В итоге уравнения представляются в виде канонических гамильтоновых уравнений в $2n$-мерном фазовом пространстве, причём уравнения для координат $q$ отделяются и, конечно, совпадают с уравнениями (0.10). Такой подход развивался в ряде работ (см., например, [8], [10]) с попыткой его соединения с подходом Дирака. На наш взгляд, всё это приводит только к ненужным усложнениям. К тому же не вполне ясен инвариантный смысл таких построений.
0.4.
В [14; гл. I, § 6] указан конструктивный метод обоснования обобщённой гамильтоновой динамики Дирака, связанный с рассмотрением механических систем с малыми массами. Более точно, речь идёт о системах с $(n+1)$ степенями свободы, динамика которых описывается уравнениями Лагранжа с лагранжианом
Решения уравнений Лагранжа с лагранжианом (0.15) можно представить в виде рядов по степеням $\varepsilon$, причём при $\varepsilon=0$ будем иметь решения соответствующих уравнений Дирака. Эти ряды могут расходиться, но (как показано в [15]) они заведомо носят асимптотический характер.
С этим приёмом связана теория гироскопических систем (см., например, [16]–[18]). Рассмотрим динамику механических систем с лагранжианом
Матрица $A$ считается положительно определённой при всех значениях $q \in M$; она задаёт инерциальные свойства системы. Параметр $N$ считается большим. Перейдём к новому времени $\tau=t/N$ и будем обозначать штрихом дифференцирование по $\tau$. Тогда уравнениям Лагранжа можно придать следующий вид:
$T=(Aq',q')/2$ – кинетическая энергия системы, $\varepsilon=1/N^2$ – малый параметр. При $\varepsilon=0$ будем иметь уравнения (0.10), которые при условии невырожденности кососимметрической матрицы $\Lambda$ будут гамильтоновыми. Уравнения (0.10) называются прецессионными. Анализ перехода от полных уравнений к упрощенным при $\varepsilon\to 0$ составляет важную задачу теории гироскопических систем [16]–[18]. Как отмечено в [16], если $\det\Lambda=0$, то решения прецессионных уравнений могут вообще не существовать, либо таких решений бесконечно много (как в теории Дирака). Этот вопрос исследован в [19]. Там же изучались разложения решений полной системы уравнений (0.16) в ряды по степеням $\varepsilon$. Переход при $\varepsilon\to 0$ от полных уравнений (0.16) к прецессионным уравнениям рассматривался в работе [9] с точки зрения гамильтонова формализма Дирака. Приложения динамики Дирака к конкретным задачам механики с малыми обобщёнными скоростями имеются в [20], [21].
0.5.
До сих пор мы обсуждали важный (но не единственный) аспект гамильтонова формализма Дирака. Он связан с алгоритмом представления уравнений Лагранжа с вырожденным лагранжианом в некоторой обобщённой гамильтоновой форме. В этом круге вопросов ключевым остаётся следующий: верно ли, что все решения уравнений Лагранжа могут быть получены с помощью указанного выше представления Дирака? По-видимому, это так. Но, насколько известно автору, строгое и полное доказательство отсутствует. Уравнения Лагранжа с вырожденным лагранжианом вообще могут не иметь ни одного решения. Вот тривиальный пример:
Решение задачи об эквивалентности должно, конечно, включать и такую возможность.
Уравнения (0.4) можно понимать по-другому. Их можно трактовать как уравнения Гамильтона со связями (не привязывая их вообще к лагранжевой механике). Дирак в своей статье [1] обсуждает и эту задачу. Здесь исходный пункт – это гамильтониан и уравнения связей (0.2), заданные в фазовом пространстве.
Однако такая постановка задачи радикально меняет ситуацию. В первоначальном подходе (когда выстраивается гамильтонов аспект лагранжевой механики с вырожденными лагранжианами) у нас имеется определение движения: это решения уравнений Лагранжа. Во втором подходе (когда на заданную гамильтонову систему налагаются связи, которые не инвариантны относительно её фазового потока) сначала надо дать определение движений, а уже затем выводить дифференциальные уравнения, которым эти движения удовлетворяют.
Именно такой подход к построению обобщённой гамильтоновой динамики Дирака изложен в книге [14; гл. I, § 5]. Сам Дирак не настаивал на необходимости дать ясное определение движения гамильтоновой системы со связями. Причина, видимо, состоит в неявном предположении, что рассматриваемые гамильтоновы системы получены каким-то естественным путём из уравнений Лагранжа. Между тем с современной точки зрения (идущей от Э. Картана [22]) имеется чёткое разграничение двух аспектов механики: гамильтоновой и лагранжевой. Гамильтоновы системы “живут” на симплектических многообразиях, которые вовсе не обязаны быть пространствами кокасательных расслоений конфигурационных пространств механических систем.
Здесь уместно провести аналогию с теорией лагранжевых систем со связями. Пусть $L(\dot{q},q)$ – лагранжиан, а $(a(q),\dot{q})=0$ – уравнение связи. В неголономной механике постулируется, что движения $t \mapsto q(t)$ суть решения уравнений
Здесь $\lambda$ – множитель, который находится как функция от состояния системы $\dot{q}$, $q$, если лагранжиан невырожден по скоростям. В вакономной модели движения уравнения движения имеют другой вид:
в классе кривых с закреплёнными концами и удовлетворяющих уравнению связи $(a,\dot{q})=0$. Если связь интегрируемая, то обе модели эквивалентны. Обсуждение см. в [14; гл. I].
0.6.
В настоящей работе предложено обобщение гамильтоновой динамики Дирака, когда на гамильтонову систему налагаются связи, линейные по скоростям канонических переменных. Если такие связи задают интегрируемое распределение на фазовом пространстве, то получим динамику Дирака.
Вначале (раздел 1) общие идеи продемонстрированы в более простой ситуации, когда на динамическую систему в римановом пространстве налагаются дифференциальные связи. Затем рассматривается гамильтонова система со связями, которые задаются некоторым распределением касательных плоскостей (раздел 2). Учёт связей основан на проектировании гамильтонова векторного поля на касательные плоскости этого распределения. Само проектирование осуществляется с помощью симплектической геометрии касательных плоскостей, которая индуцируется симплектической структурой фазового пространства.
В разделе 3 обсуждается случай, когда распределение касательных плоскостей (задающее связь) является интегрируемым. Тогда общая конструкция раздела 2 приводит к гамильтоновой динамике Дирака. В разделе 4 обсуждается другой подход к динамике гамильтоновых систем со связями. В отличие от раздела 2, движениями таких систем называются экстремали вариационной задачи с заданными связями, когда в качестве функционала берётся действие по Пуанкаре–Гельмгольцу. В случае интегрируемых связей мы снова получаем гамильтонову динамику Дирака.
Частными случаями построений из разделов 2 и 4 являются неголономная и вакономная модели движения механических систем, которые были упомянуты выше. В разделе 5 рассмотрены некоторые другие примеры, в том числе из геометрической оптики. В разделе 6 содержится распространение оптико-механической аналогии И. Бернулли на сильно неизотропные оптические среды. В разделе 7 дано сопоставительное обсуждение обобщённой гамильтоновой динамики Дирака и известных в аналитической механике принципов построения лагранжевых систем со связями.
1. Динамические системы со связями в римановом пространстве
1.1.
Пусть $S^m=\{x_1,\dots,x_m\}$ – риманово $m$-мерное многообразие с римановой метрикой
коэффициенты $a_{ij}$ – гладкие функции, а матрица $A(x)=\|a_{ij}(x)\|$ положительно определена при всех $x \in S^m$. Значение квадратичной формы (1.1) на паре векторных полей $u_1(x)$ и $u_2(x)$ на $S$ можно задать в виде
где $(\,\cdot\,{,}\,\cdot\,)$ – каноническое спаривание (значение ковектора на векторе в точке $x \in S$). Действительно, $Au_1$ – это ковектор (вектор из кокасательного пространства $T_x^* S$).
Пусть $v$ – гладкое касательное векторное поле на $S$. Оно порождает автономную систему дифференциальных уравнений
$$
\begin{equation}
\dot{x}=v(x),\qquad x \in S
\end{equation}
\tag{1.2}
$$
(точка, как обычно, обозначает производную по независимой переменной, которую будем обозначать $t$). Рассмотрим ещё несколько связей, линейных по скоростям:
Здесь $a_1,\dots,a_k$ ($k<m$) – ковекторные поля на $S$, линейно независимые в каждой точке. Система уравнений (1.3) задаёт гладкое $(m-k)$-мерное распределение $\Pi$ на $S$. В общем случае оно неинтегрируемое.
Распределение $\Pi$, вообще говоря, не инвариантно относительно фазового потока динамической системы (1.2). Как добиться инвариантности? Для этого надо заменить поле $v$ векторным полем $w$ таким, что
для всех $x \in S$. Это можно осуществить разными способами.
Задачи подобного рода часто встречаются в теории управления динамическими системами, особенно при описании так называемых скользящих режимов (см., например, [23], [24]). Правда, обычно рассматривают интегрируемые связи, когда
Здесь $F_1,\dots,F_k\colon S \to \mathbb{R}$ – некоторые гладкие независимые функции; в частности, $a_j=\partial F_j/\partial x$. Считается, что поле $v(x)$ определено вне “особого” множества
на котором оно разрывно. Предполагается, что фазовые траектории поля $v$ за конечное время с “разных” сторон выходят на $N$. Для полного описания динамики необходимо доопределить поле $v$ в точках множества $N$. Траектории “расширенной” системы, лежащие на $N$, как раз отвечают скользящим режимам.
Вернёмся к определению нужного нам векторного поля $w$. Один из самых естественных способов задать поле $w$ – это спроектировать исходное поле $v$ на касательные $(m-k)$-мерные плоскости (1.3). Однако результат проектирования зависит от выбора метрики. В нашем случае уже имеется риманова метрика на $S$, которой можно воспользоваться.
Замечание. В теории скользящих режимов обычно рассматривают случай, когда $k=1$. При этом естественные доопределения поля $v$ на гипермногообразии $N$ (например, доопределение по Филиппову) вообще не используют метрики в объемлющем пространстве. В этом состоит специфика скользящих режимов [23], [24].
Далее, используя очевидные равенства $(a_j,w)=0$ и умножая соотношение (1.5) на $a_1,\dots,a_k$, получаем линейную систему алгебраических уравнений для отыскания множителей:
$$
\begin{equation}
(a_s,v)+\sum_{j=1}^k \lambda_j (A^{-1}a_j,a_s)=0,\qquad 1 \leqslant s \leqslant k.
\end{equation}
\tag{1.6}
$$
Так как матрица $A^{-1}$ положительно определена и ковекторы $a_1,\dots,a_k$ линейно независимы, то определитель матрицы Грама
положителен. Следовательно, из уравнений (1.6) множители $\lambda_1,\dots,\lambda_k$ находятся однозначно как гладкие функции на $S$.
1.2.
Можно дать различные интерпретации сделанного выбора векторного поля $w$. Укажем аналог принципа Гаусса из динамики механических систем со связями, тесно связанный с методом наименьших квадратов (см. [25]). Мыслимым векторным полем $u$ назовём любое векторное поле, удовлетворяющее условию $u(x) \in \Pi_x$ для всех $x$. Векторное поле $v$ назовём освобождённым, а поле $w$ – действительным полем. Согласно Гауссу, мыслимые движения – это отображения $t \mapsto x(t)$, удовлетворяющие при всех значениях $t$ уравнениям связей (1.3). Освобождённое движение происходит со скоростью $v(x)$, а действительное движение (как одно из мыслимых) – со скоростью $w(x)$. Общий принцип Гаусса наименьшего принуждения можно сформулировать следующим образом.
Теорема 1. Среди всех мыслимых движений действительное наименее всего отклоняется от освобождённого движения.
В качестве меры отклонения (принуждения по Гауссу) возможного движения от освобождённого возьмём величину
причём векторы $u-w$ и $w-v$ ортогональны в римановой метрике на $S$. Действительно, $u(x)-w(x) \in \Pi_x$, а $w(x)-v(x)$ ортогонален $\Pi_x$ согласно (1.5). Следовательно, по теореме Пифагора,
Так как матрица $A$ положительно определённая, то $Z(u,v)\geqslant Z(v,w)$ и принуждение $Z(u,v)$ принимает минимальное значение при $u=w$. Что и требовалось.
1.3.
Для более наглядного сопоставления этих наблюдений с обобщённой гамильтоновой динамикой Дирака (которая будет обсуждаться в разделе 3) рассмотрим так называемые градиентные динамические системы в евклидовом пространстве $S=\mathbb{R}^m$ со стандартной метрикой. Градиентная система задаётся векторным полем с компонентами
$\varphi\colon \mathbb{R}^m \to \mathbb{R}$ – гладкая функция. Рассмотрим частный случай, когда связи (1.3) интегрируемые: речь пойдёт о движении по $(m-k)$-мерному многообразию (1.4), в точках которого векторное поле $w$ принимает вид
$$
\begin{equation}
\dot{x}=\frac{\partial\varphi}{\partial x}+ \sum_{j=1}^k\lambda_j\frac{\partial F_j}{\partial x}\,,\qquad x \in N.
\end{equation}
\tag{1.7}
$$
Уравнения (1.6) для нахождения неопределённых коэффициентов $\lambda_1,\dots,\lambda_k$ выглядят следующим образом:
Это – “условия совместности” связей с подправленным векторным полем: $\dot{F}_s\!= 0$ (в силу системы (1.7)) во всех точках, где $F_1=\dots=F_k=0$.
Такой подход можно попытаться применить в более общей ситуации, когда многообразие $S$ снабжено псевдоримановой метрикой: матрица коэффициентов $A(x)=\|a_{ij}(x)\|$ невырождена, но не является положительно определённой. Пусть (в самом простом случае) распределение $\Pi$ задаётся всего одним равенством $(a(x),\dot{x})=0$. Тогда в результате ортогонального проектирования получаем векторное поле
Пусть $(a,v) \ne 0$ (т. е. исходное поле $v$ не относится к “мыслимым”) и ковектор $a$ является изотропным (т. е. $(A^{-1}a,a)=0$). Тогда соотношение (1.9) будет противоречивым. Таким образом, в случае псевдоевклидовой метрики векторное поле $v$ не всегда можно ортогонально спроектировать на плоскости из распределения, задающего связь.
2. Гамильтоновы системы со связями. Симплектическое проектирование
2.1.
Пусть теперь $(M^{2n},\Omega^2)$ – симплектическое многообразие; $M^{2n}=\{x\}$ – гладкое чётномерное многообразие, $\Omega^2$ – замкнутая невырожденная 2-форма (симплектическая структура на $M^{2n}$). В дальнейшем оно будет играть роль фазового пространства гамильтоновой системы с $n$ степенями свободы.
Значение 2-формы на касательных векторных полях $u_1(x)$ и $u_2(x)$ имеет вид
где $J$ – невырожденная кососимметрическая $(2n\times 2n)$-матрица, гладко зависящая от точки $x \in M^{2n}$. Согласно теореме Дарбу, в некоторых специальных локальных канонических координатах $p_1,\dots,p_n$, $q_1,\dots,q_n$ на $M^{2n}$ матрица $J$ приводится к следующему виду:
Пусть $H \colon M^{2n} \to \mathbb{R}$ – гладкая функция. Это функция Гамильтона, которая порождает касательное гамильтоново векторное поле $v$ на $M^{2n}$:
Ковекторные поля $a_1,\dots,a_k$ предполагаются линейно независимыми в каждой точке $x \in M^{2n}$. Распределение (2.3) в общем случае, конечно, неинтегрируемое. Как теперь совместить гамильтонову систему (2.2) со связями (2.3), которые, вообще говоря, не инвариантны относительно фазового потока гамильтоновой системы?
Можно поступить так же, как в разделе 1: спроектировать гамильтоново векторное поле $v$ на $(2n-k)$-мерные касательные плоскости (2.3) и получить динамическую систему
$$
\begin{equation*}
\dot{x}=w(x),\qquad x \in M^{2n},
\end{equation*}
\notag
$$
поток которой на $M^{2n}$ уже оставляет распределение $\Pi$ неизменным. Но в нашем распоряжении нет естественной структуры риманова многообразия на $M^{2n}$. Однако есть симплектическая структура, которая превращает каждую $2n$-мерную касательную плоскость к точкам $M^{2n}$ в симплектическое пространство со своей симплектической геометрией. Последнее означает, что мы можем ввести ортогональную проекцию векторов $v(x)$ на касательные плоскости $\Pi_x$ (как объектов из симплектического пространства $T_x M^{2n}$). В результате получим формулу
Однако аналогия с динамическими системами в римановом пространстве здесь заканчивается. Дело в том, что матрица $J^{-1}$ (как и $J$) кососимметрическая и поэтому $(k\times k)$-матрица
может оказаться вырожденной. В частности, вектор $v(x)$ вообще нельзя будет ортогонально спроектировать на плоскость $\Pi_x$, либо такое проектирование будет неоднозначным.
Введём касательные векторы
$$
\begin{equation*}
\alpha_s(x)=J^{-1}(x)a_s(x),\qquad 1 \leqslant s \leqslant k.
\end{equation*}
\notag
$$
Они линейно независимы и ортогональны плоскостям $\Pi_x$:
$$
\begin{equation}
(J\alpha_s,\dot{x})=(a_s,\dot{x})=0,\qquad 1 \leqslant s \leqslant k.
\end{equation}
\tag{2.6}
$$
натянутое на векторы $\alpha_1,\dots,\alpha_k$, является симплектическим пространством. В частности, $k$ чётно.
Итак, мы приходим к следующему выводу.
Теорема 2. Если ограничение симплектической структуры на $\Sigma_x \subset T_x M^{2n}$ является невырожденной 2-формой, то векторное поле (2.4) однозначно определено и его фазовый поток сохраняет распределение (2.3).
Так как $\Sigma_x$ – симплектическое подпространство, то матрица (2.5) невырождена и из этой линейной системы вытекает, что $\mu_1=\dots=\mu_k=0$.
Докажем теперь заключение b). Предположим, что $\Pi_x$ не является симплектическим подпространством. Тогда ограничение $\Omega^2$ на $\Pi_x$ будет вырожденной 2-формой. Значит, найдётся вектор $\widehat{u} \in \Pi_x$ такой, что $\Omega^2(\widehat{u},u)=0$ для всех $u \in \Pi_x$. Согласно заключению a) любой элемент $T_x M^{2n}$ есть сумма $\alpha+u$, где $\alpha \in \Sigma_x$. Так как $\Omega^2(\widehat{u},\alpha)=0$ (согласно (2.6)), то
Но тогда форма $\Omega^2$ будет вырожденной на $T_x M^{2n}$, что невозможно.
Очевидно, что в лемме подпространства $\Sigma_x$ и $\Pi_x$ можно поменять местами.
Теорема 2'. Если ограничение симплектической структуры на касательные плоскости из распределения (2.3) является невырожденной 2-формой, то векторное поле (2.4) однозначно определено и его фазовый поток сохраняет распределение (2.3).
Это утверждение сразу же вытекает из леммы и теоремы 2. Теоремы 2 и 2' двойственны друг другу.
2.2.
Как выглядит формула (2.4) в канонических координатах $p$, $q$? Пусть уравнения связей (2.3) имеют вид
$$
\begin{equation}
(b_j,dp)+(c_j,dq)=0,\qquad 1 \leqslant j\leqslant k.
\end{equation}
\tag{2.7}
$$
Здесь $b_j$ и $c_j$ – гладкие “вектор-функции” от $p$, $q$. С учётом формулы (2.1) получаем следующие дифференциальные уравнения:
является достаточным условием для корректного и однозначного определения векторного поля $w$, которое допускается связями. Однако это условие не является необходимым.
Например, матрица (2.10) заведомо вырождена, если $b_1=\dots=b_k=0$. Приведём содержательный пример, показывающий возможность нахождения нужного нам векторного поля $w$ при таком вырождении матрицы (2.10).
2.3.
Пусть $Q^n=\{q\}$ – гладкое $n$-мерное многообразие (конфигурационное пространство механической системы), $M^{2n}=T^*Q$ – пространство кокасательного расслоения $Q$. Пусть $p$ – элемент из $T_q^*Q$. Многообразие $M^{2n}$ снабжено естественной симплектической структурой
Ковекторы $c_1,\dots,c_k$ считаются линейно независимыми всюду на $Q$. Соотношения (2.11) – частный случай связей (2.7); здесь $b_1=\dots=b_k=0$, а $c_1,\dots,c_k$ зависят лишь от точек конфигурационного пространства $Q$.
Уравнения Гамильтона со связями (2.8) примут следующий вид:
В механике эти уравнения описывают динамику неголономных систем. Хорошо известно, что (ввиду положительной определённости матрицы $K$) множители $\lambda_1,\dots,\lambda_k$ могут быть однозначно найдены как функции состояния, т. е. как функции от $q$ и $\dot{q}$ (см., например, [25]).
Замечание. Если в уравнениях (2.9) положить $b_1=\dots=b_k=0$, то получим соотношения
которые, вообще говоря, не обязаны выполняться. Однако в этом случае (согласно (2.8)) $\partial H/\partial p=\dot{q}$ и поэтому соотношения (2.14) переходят в уравнения связей (2.7). Так что никакого противоречия здесь не возникает.
Таким образом, мы имеем содержательный пример гамильтоновой системы со связями (2.7) и вырожденной матрицей (2.10), в котором тем не менее множители $\lambda_1,\dots,\lambda_k$ находятся однозначно как функции от канонических переменных $q$ и $p$ ( $=K^{-1}\dot{q}$). Кстати сказать, в случае неинтегрируемых связей (2.11) уравнения Гамильтона со связями (2.12) уже не сводятся к уравнениям Гамильтона даже при чётных значениях $k$. Они обладают разными динамическими свойствами. В частности, уравнения (2.12) (или (2.13)) как общие уравнения неголономной динамики не допускают интегральных инвариантов с гладкими плотностями [26]. Однако если связи (2.11) интегрируемые, то уравнения Гамильтона со связями (2.12) сами являются гамильтоновыми уравнениями с $n-k$ степенями свободы.
3. Задача Дирака
3.1.
Рассмотрим теперь частный случай, когда связи (2.7) интегрируемые. Более точно, пусть задано $(2n-k)$-мерное гладкое подмногообразие
Система алгебраических уравнений для отыскания множителей $\lambda_1,\dots,\lambda_k$ принимает следующий вид:
$$
\begin{equation}
\{H,F_s\}+\sum\lambda_j\{F_j,F_s\}=0,\qquad 1 \leqslant s \leqslant k.
\end{equation}
\tag{3.3}
$$
Здесь $\{\,\cdot\,{,}\,\cdot\,\}$ – стандартная скобка Пуассона. Поэтому достаточным условием однозначной разрешимости этой системы (а значит, и условием однозначного проектирования исходного гамильтонова векторного поля на $(2n-k)$-мерные плоскости, касательные к $N$) будет невырожденность кососимметрической $(k\times k)$-матрицы скобок Пуассона
Замечание. Уравнения (3.1) и (3.3) вполне аналогичны уравнениям (1.7) и (1.8) для градиентных динамических систем с интегрируемыми связями в евклидовом пространстве.
Уравнения (3.1)–(3.2) (как и условия совместности (3.3)) были впервые получены Дираком для целей квантования систем с вырожденным лагранжианом. Применение преобразования Лежандра к вырожденному лагранжиану даёт несколько соотношений вида (3.2), которые теперь обычно называются первичными связями. К бесконечномерным системам с вырожденным лагранжианом относятся, например, уравнения Максвелла для эволюции электромагнитного поля1[x]1Другой способ представления уравнений Максвелла (как и других линейных уравнений математической физики с квадратичным инвариантом) содержится в работе [27]..
В отличие от гамильтоновых систем с дифференциальными связями, рассмотренных в разделе 2, результат проектирования уравнений Гамильтона с конечными связями на соответствующие касательные подпространства приводит к экстремалям некоторой вариационной задачи. При выводе уравнений (3.1) Дирак исходил как раз из вариационной задачи (из вариационного принципа Гамильтона в лагранжевой механике), а не использовал более простую идею симплектического проектирования. Мы кратко воспроизведём конструкцию Дирака в более общей форме, которая
Точку $p$, $q$ в $M^{2n}$ будем для краткости записи обозначать через $x$, ограничение функции $H$ на $N$ обозначим $\Phi$, а ограничение 2-формы на $N$ обозначим $\omega^2$. Форма $\omega^2$, конечно, замкнута, но может оказаться вырожденной (например, если $\dim N$ нечётно, т. е. $k$ нечётно).
Гладкий путь $x \colon \Delta \to M$, $x(t) \in N$ для всех $t \in \Delta$, назовём движением гамильтоновой системы со связями $(M,\Omega^2,H,N)$, если
Если $N$ совпадает с $M$ (связей нет), то система Дирака совпадает с обычной гамильтоновой системой с $n$ степенями свободы. Более общо, если 2-форма $\omega^2$ невырождена, то $(N,\omega^2)$ – симплектическое подмногообразие $(M^{2n},\Omega^2)$ и движения системы Дирака $(M,\Omega^2,H,N)$ совпадают с решениями гамильтоновой системы на симплектическом многообразии $(N,\omega^2)$ с функцией Гамильтона $\Phi$. Условие невырожденности $\omega^2$ совпадает с условием невырожденности кососимметрической матрицы (3.4). Скобка Пуассона $\{\,\cdot\,{,}\,\cdot\,\}'$ на $N \subset M$ задаётся равенством
где $\|c_{ij}\|$ – матрица, обратная к матрице (3.4). Оказывается, ограничение $\{\Phi_1,\Phi_2\}'$ на $N$ зависит лишь от ограничений $\Phi_1$ и $\Phi_2$ на $N$ (детали см. в [1]).
Если некоторые из уравнений (3.3) не содержат множителей $\lambda_1,\dots,\lambda_k$, то мы получаем новые связи $\Psi_j=\{H,F_j\}=0$, которые называются вторичными связями. В общем случае вторичные связи являются алгебраическими условиями разрешимости систем уравнений (3.3) относительно множителей $\lambda_j$. Функции $\Psi_j$ следует добавить к функциям $\Phi_s$. Если эти функции составляют независимый набор, то можно повторить исследование условий совместности (для первичных и вторичных связей) ещё раз. В итоге либо мы придём к противоречию (в этом случае задача Дирака не имеет решений), либо система (3.4) окажется совместной при подходящем выборе множителей $\lambda$. В последнем случае множители $\lambda$, возможно, определены неоднозначно и тогда начальные условия не определяют единственное решение задачи Дирака.
3.3.
Справедливо следующее утверждение.
Теорема 3. Гладкий путь $x\colon [t_1,t_2] \to N$ является движением системы со связями $(M,\Omega^2,H,N)$ тогда и только тогда, когда на этом пути функционал действия
и считать множители $\lambda_1,\dots,\lambda_k$ дополнительными обобщёнными координатами. Уравнения Лагранжа с лагранжианом $\mathcal{L}$ дают уравнения (3.1) и соотношения (3.2).
Теорема 3 сводит задачу Дирака к изучению вариационной задачи Лагранжа с вырожденным лагранжианом $(p,\dot{q})-H$, а интегрируемые связи задаются формулами (3.2). Таким образом, уравнения задачи Дирака совпадают с уравнениями Гамильтона, которые спроектированы на касательные плоскости к многообразию связей $N \subset M$. Но только роль римановой геометрии здесь играет симплектическая геометрия фазового пространства гамильтоновой системы.
4. Гамильтоновы системы со связями. Вариационный подход
4.1.
Как и в разделе 2, рассмотрим гамильтонову систему с дифференциальными связями
Но только, в отличие от раздела 2, под движениями таких систем будем понимать экстремали подходящей вариационной задачи.
Пусть снова $(M^{2n},\Omega^2)$ – симплектическое многообразие, а $H \colon M \to \mathbb{R}$ – функция Гамильтона. Симплектическая структура $\Omega^2$ – невырожденная замкнутая 2-форма. Локально $\Omega^2=d\omega^1$, где $\omega^1=(a(x),\dot{x})$ – гладкая 1-форма. Рассмотрим функционал действия в фазовом пространстве (по Пуанкаре–Гельмгольцу):
на пространстве кривых $x\colon [t_1,t_2] \to M$ с закреплёнными концами и которые удовлетворяют соотношениям (4.1).
Будем искать экстремали этой вариационной задачи. Дирак рассматривал важный, но частный случай, когда дифференциальные связи (4.1) являются интегрируемыми. Сформулированная вариационная задача – это вариационная задача Лагранжа с неинтегрируемыми связями (4.1) и с вырожденным лагранжианом
Эти $2n$ уравнений следует рассматривать вместе с $k$ уравнениями связей (4.1). Уравнения (4.3) и (4.1) служат для нахождения $2n+k$ переменных $x$ и $\lambda$ как функций времени.
Прежде чем двигаться дальше, сделаем несколько замечаний.
A. Выше мы ввели 1-форму $\omega^1$ такую, что $d\omega^1=\Omega^2$. Эта форма определена с точностью до замкнутой 1-формы (которая локально будет дифференциалом гладкой функции). Однако эта замкнутая форма не оказывает никакого влияния на экстремали функционала (4.2) и не входит в уравнения (4.3).
B. В гамильтоновой механике кососимметрическая $(2n\times 2n)$-матрица
В задаче Дирака ситуация более простая: $\Lambda_1=\dots=\Lambda_k=0$ и поэтому первое уравнение (4.4) не содержит множителей $\lambda_1,\dots,\lambda_k$. Тогда можно положить $\mu_s=\dot{\lambda}_s$ и считать $\mu_1,\dots,\mu_k$ независимыми дополнительными параметрами.
Итак, функция $x \colon [t_1,t_2] \to M$ является решением обобщённой задачи Дирака тогда и только тогда, когда найдётся функция $\lambda \colon [t_1,t_2] \to \mathbb{R}^k$ такая, что они вместе удовлетворяют уравнениям (4.4). Эти уравнения можно представить в инвариантной форме. Для этого положим $\omega_s^1(\,\cdot\,)=(a_s,\,\cdot\,)$; это дифференциальные 1-формы на $M^{2n}$. Если $w$ – искомое векторное поле на $M^{2n}$ ($w=\dot{x}$), то
Здесь (как обычно) $i_w$ обозначает внутреннее произведение векторного поля $w$ и дифференциальной формы. При $k=0$ получаем исходную гамильтонову систему
отличен от нуля, то система уравнений (4.4) имеет единственное решение $t \mapsto x(t)$, $t \mapsto \lambda(t)$ такое, что $x(0)=x^0$ и $\lambda(0)=\lambda^0$.
Как обычно, это решение заведомо существует в некоторой окрестности точки $t=0$. Важно подчеркнуть, что если связи неинтегрируемые, то при фиксированном значении $x(0)$ и различных $\lambda(0)$ движения системы $t \mapsto x(t)$ будут разными. Для интегрируемых связей это не так.
Доказательство теоремы 4. Представим систему (4.4) в следующей эквивалентной форме:
Если определитель матрицы (4.5) отличен от нуля в точке $(x^0,\lambda^0) \in M^{2n}\times \mathbb{R}^k$, то в окрестности этой точки соотношение (4.6) задаёт некоторую динамическую систему. В частности, значения $x(0)=x^0$ и $\lambda(0)=\lambda^0$ однозначно определяют её дальнейшую эволюцию. Что и требовалось.
Следствие. Если при $x=x^0$ матрица (2.5) невырождена, то система уравнений (4.4) имеет единственное решение $x(t)$, $\lambda(t)$ с начальными условиями $x(0)=x^0$, $\lambda(0)=0$.
Действительно, если $(k \times k)$-матрица (2.5) является невырожденной, то при $\lambda_1=\dots=\lambda_k=0$ определитель матрицы (4.5) отличен от нуля.
Кратко обсудим условия существования решений системы (4.4) в случае вырождения матрицы (4.5). Условие существования скоростей $\dot{x}$ и $\dot{\lambda}$, удовлетворяющих системе (4.6), сводится к условию совпадения рангов двух матриц: матрицы (4.5) и матрицы
размером $(2n+k)\times(2n+k+1)$. В типичном случае ранг матрицы (4.5) постоянен в некоторой области расширенного фазового пространства $M^{2n} \times \mathbb{R}^k$. Пусть этот ранг равен $r<2n+k$. Тогда все миноры матрицы (4.7) до порядка $r+1$ включительно должны обращаться в нуль. В итоге получаем несколько независимых соотношений
как условие равенства рангов матриц (4.5) и (4.7). По аналогии с динамикой Дирака их следует назвать вторичными связями. Следует иметь в виду, что в теории Дирака вторичные связи не зависят от множителей $\lambda$.
Соотношения (4.8) – интегрируемые связи лагранжевой системы с $n+k$ степенями свободы и вырожденным лагранжианом $\mathcal{L}(\dot{x},x,\lambda)$. Новая система уравнений имеет вид уравнений Лагранжа с дополнительными множителями $\nu_1,\dots,\nu_p$:
К этой системе, конечно, надо добавить уравнения (4.8).
В итоге приходим к уравнениям, которые также имеют вид (4.4). Их тоже надо исследовать на разрешимость относительно $\dot{x}$, $\dot{\lambda}$ и $\nu$. Условия совместности могут привести к новым уравнениям связей. Этот процесс будет повторяться, как и в динамике Дирака.
4.3.
В заключение приведём пример, содержательный с точки зрения механики, в котором матрица (4.5) вырождается. Этот пример напоминает пример из раздела 2, когда гамильтоново векторное поле проектировалось на плоскости из неинтегрируемого распределения. Но только сейчас мы будем исходить из вариационной задачи, которая обобщает вариационную задачу, рассмотренную Дираком.
Итак, пусть $M^{2n}=T^*Q^n$ снабжено стандартной симплектической структурой (как в разделе 2),
Это уравнение вместе с уравнениями связей представляют уравнения движения механических систем в так называемой вакономной механике [29]. Они отличаются от неголономных уравнений (2.13), хотя исходным пунктом в этих моделях служат один и тот же лагранжиан и одни и те же связи. Эти модели различаются принципами, лежащими в определении движения. Сопоставительное обсуждение различных моделей движения механических систем со связями можно найти, например, в [14].
В отсутствие потенциала (когда $V \equiv 0$) уравнения вакономной механики совпадают с уравнениями геодезических в так называемой субримановой геометрии [30]–[33]. Правда, в субримановой геометрии обычно предполагается, что линейные связи (4.9)вполне неинтегрируемые: из любой точки $Q^n$ в любую другую точку можно попасть, двигаясь в соответствии с уравнениями связей (4.9). Условие полной неинтегрируемости даёт известная теорема Рашевского–Чжоу.
На различие неголономных и вакономных уравнений геодезических в римановой геометрии с неинтегрируемыми распределениями было указано ещё Герцем [34]. Правда, в некоторых поздних математических текстах, где обсуждались вариационные задачи со связями, утверждается, что тем самым решены задачи из “реальной” механики (которые на самом деле описываются неголономными уравнениями).
5. Некоторые примеры
В этом разделе мы применим подход Дирака к некоторым задачам аналитической механики и геометрической оптики.
5.1.
Рассмотрим динамику механической системы с лагранжианом
где $L_j$ – однородная форма по скорости $\dot{q}$ степени $j$, гладко зависящая от координат $q$. Уравнения Лагранжа с таким лагранжианом допускают интеграл энергии
Эту константу положим равной нулю; это всегда можно сделать, поскольку функция $L_0(q)$ определена с точностью до аддитивной постоянной. Согласно принципу наименьшего действия траектории движения $t \mapsto q(t)$ являются геодезическими линиями финслеровой метрики
в классе кривых с закреплёнными концами. Лагранжиан (5.1) является параметрическим лагранжианом: интеграл (5.2) не зависит от способа параметризации кривых.
В механике функция $U$ отвечает силовой функции. Обычно матрица $A$ является положительно определённой. Но это не обязательно. Будем считать её невырожденной. В этом случае функционал (5.2) определён не на всех кривых, а только на лежащих в соответствующем “световом” конусе. Последняя возможность характерна для динамики релятивистской частицы.
где $\lambda$ – ненулевой неопределённый множитель.
Таким образом, функции $t \mapsto q(t)$, удовлетворяющие уравнениям (5.4) вместе с “сопряжёнными” импульсами $t \mapsto p(t)$, задают экстремали финслеровой метрики (4.1). Функция $F$ совпадает с функцией Гамильтона исходной лагранжевой системы с лагранжианом $L_2+L_1+L_0$ (так как $L_2-L_0=0$, то $F$ также равна нулю на решениях (5.4)). Так как $H \equiv 0$, то система (3.3) всегда совместна и поэтому в этом случае нет необходимости вводить вторичные связи.
Итак, мы вывели принцип наименьшего действия с помощью обобщённой гамильтоновой динамики Дирака. Уравнения (5.4) перейдут в обычные уравнения Гамильтона, если ввести новое время
представляет собой оптическую длину пути $x\colon [t_1,t_2] \to \mathbb{R}^3$ (действие по Ферма), а $n(x)$ – показатель преломления в изотропной оптической среде. Согласно принципу Ферма стационарные точки функционала (5.7) представляют собой световые лучи.
Это – уравнение движения материальной частицы единичной массы в потенциальном поле с силовой функцией $U$. Таким образом, световые лучи в оптической среде $\mathbb{R}^3=\{x\}$ с показателем преломления $n(x)$ совпадают с траекториями движения материальной точки в потенциальном поле с силовой функцией $n^2/2$. Это утверждение составляет содержание оптико-механической аналогии, установленной Иоганном Бернулли ещё в 1696 г. Уравнения Гамильтона в геометрической оптике обычно выводят другим путём (см. [5; гл. I]).
6. Световые лучи в сильно анизотропных средах
6.1.
В анизотропных оптических средах показатель преломления имеет вид
$$
\begin{equation*}
f\biggl(x,\frac{\dot{x}}{|\dot{x}|}\biggr),\qquad x \in \mathbb{R}^3.
\end{equation*}
\notag
$$
Для изотропной среды эта функция не зависит от направления движения световых частиц; она обычно обозначается $n(x)$. Световые лучи совпадают с траекториями решений уравнения Лагранжа с лагранжианом
Здесь $a(x) \ne 0$ – гладкое векторное поле в трёхмерном евклидовом пространстве $\mathbb{R}^3=\{x\}$, $N$ – параметр (который будет устремлён к $+\infty$). При $N=0$ получаем лагранжиан (5.6), описывающий распространение света в изотропной среде. В пределе, когда $N \to \infty$, движение световых частиц будет удовлетворять уравнению связи
Как в этом убедиться? Дело в том, что показатель преломления оптической среды в точке $x$ и в направлении $v/|v|$ равен обратной величине скорости световой частицы, которая движется в точке $x$ со скоростью $v$. Так что на “действительных” движениях $L(v,x)=1$. Это уравнение определяет поверхность в $\mathbb{R}^3=\{v\}$, которая называется индикатрисой в точке $x$. Для изотропной среды индикатриса будет сферой радиуса $1/n(x)$. Для лагранжиана (6.1) индикатриса будет эллипсоидом, который сжат в направлении вектора $a(x)$. Так что в пределе, когда $N \to \infty$, движение световых частиц подчиняется уравнению связи (6.2).
6.2.
Мы выведем “предельные” уравнения световых лучей двумя способами. Первый из них – формальный. Будем исходить из принципа Ферма $\delta I=0$ с учётом связи (6.2). Для этого воспользуемся методом множителей Лагранжа, а затем применим обобщённую гамильтонову динамику Дирака.
Второй подход более содержательный. Уравнения световых лучей в оптической среде с лагранжианом $L_N$ представим в виде уравнений Гамильтона, а затем устремим параметр $N$ к бесконечности. В обоих подходах световые лучи будут описываться одними и теми же уравнениями Гамильтона.
Итак, сначала (следуя Лагранжу) введём новый лагранжиан
и будем считать $\lambda$ новой координатой (как и переменные $x_1$, $x_2$, $x_3$). Лагранжиан $\mathcal{L}$ вырожден по скоростям $\dot{x}$ и $\dot{\lambda}$.
Множитель $\mu$ не играет никакой роли, поскольку скорость световых частиц не влияет на вид световых лучей, которыми мы интересуемся. Поэтому можно положить $\mu=1$. Далее, согласно (6.2) и (6.3)
При этом надо помнить, что эти уравнения следует рассматривать на нулевом уровне гамильтониана (когда $F=0$).
6.3.
Во втором подходе надо преобразовать уравнения Лагранжа с лагранжианом $L_N$ к уравнениям Гамильтона и затем устремить $N$ к бесконечности. Поскольку $L_N$ – однородная функция по скоростям степени однородности 1, то непосредственно применить преобразование Лежандра не удается. Обычно поступают по-другому. Вводится новый лагранжиан $L_N^*=L^2_N/2$, однородный по $\dot{x}$ степени 2. При этом, очевидно, матрица Гессе
Таким образом, при $N \to \infty$ функция $x(\,\cdot\,)$, задающая световой луч, вместе с сопряжённым импульсом $y(\,\cdot\,)$ удовлетворяет системе канонических уравнений Гамильтона с гамильтонианом (6.8):
Эта теорема о предельном переходе, установленная в [29] (1982 г.), является одной из реализаций общей идеи метода штрафных функций. Так как на световых лучах $L_N^*=1/2$, то (согласно (6.7)) уравнения (6.9) надо рассматривать на уровне $H^*=1/2$.
Сравнивая гамильтонианы (6.6) и (6.8), приходим к выводу, что рассмотренные два подхода действительно приводят к одинаковому результату.
где “кинетическая” энергия $K$ определяется формулой (6.10), а силовая функция $U$ равна $n^2/2$.
Введём поле векторов $\alpha=a/\sqrt{(a,a)}$ единичной длины. Тогда $y-(y,\alpha)\alpha=y_\alpha$ будет проекцией импульса на направление, определяемое вектором $\alpha$. Второе уравнение (6.11) принимает вид
Это кинетическая энергия частицы единичной массы, которая движется в евклидовом пространстве.
Теорема 5. Световые лучи в сильно анизотропной оптической среде являются траекториями движения вакономной частицы в потенциальном поле с силовой функцией $n^2/2$.
Доказательство основано на замечании, что уравнения Гамильтона (6.12) с кинетической энергией (6.10) как раз являются вакономными уравнениями движения несвободной частицы единичной массы в потенциальном поле с силовой функцией $U=n^2/2$, на движение которой наложена связь $\bigl(\alpha(x),\dot{x}\bigr)=0$ (ср. с [29]).
Теорема 5 распространяет оптико-механическую аналогию И. Бернулли на случай сильно анизотропных оптических сред. Подчеркнём, что при наложении связи возникает вакономная механическая система, а не привычная неголономная система. Причина заключается в том, что световые лучи определяются вариационным принципом Ферма, а классические неголономные уравнения в общем случае вообще не допускают вариационного представления.
7. Заключительные замечания
7.1.
Основные идеи обобщённой гамильтоновой динамики Дирака на самом деле были известны в аналитической механике намного раньше. В других терминах (и не в такой общности) они давно использовались в лагранжевой механике с интегрируемыми (голономными) связями. Напомним (восходящие к Лагранжу) основные принципы учёта голономных связей.
Пусть $L(\dot{q},q)$ – лагранжиан, а $F(q)=0$ – уравнение интегрируемой связи. Предполагается, что $dF \ne 0$ при $F=0$. Динамика такой системы описывается уравнением Лагранжа с множителем:
Слагаемое $\lambda\,\partial F/\partial q$ справа в механике называется реакцией связи $\{F=0\}$. Можно ли найти множитель $\lambda$, чтобы система (7.1) была непротиворечивой?
Обычно поступают следующим образом. Так как $F\bigl(q(t)\bigr)=0$, то
где $A$ – матрица вторых производных $\partial^2 L/\partial \dot{q}^2$, а слагаемое $\Gamma$ не зависит от ускорений $\ddot{q}$. В задачах механики матрица $A$ положительно определена; в частности, она невырождена. Тогда из (7.3) и (7.4) получаем соотношение
Мы предположили, что $\partial F/\partial q \ne 0$ (по меньшей мере, где $F(q)=0$). Значит, из (7.5) множитель $\lambda$ однозначно находится как функция от состояния системы $\dot{q}$, $q$.
Первое уравнение (7.1) является дифференциальным уравнением второго порядка относительно $q$, а функция (7.2) будет его первым интегралом. Нас интересуют только те решения этого уравнения, на которых функции $F$ и $\Phi$ обращаются в нуль.
7.2.
Как всё это выглядит с точки зрения обобщённого гамильтонова формализма Дирака? Если матрица $A$ невырождена, то (хотя бы локально) можно воспользоваться преобразованием Лежандра и ввести канонические импульсы и функцию Гамильтона:
Это уравнение совпадает с условием (7.2), но только представленным в канонических переменных.
Затем (по Дираку) уравнения $F=0$ и $\Phi=0$ надо рассматривать как новые “первичные” связи и вместо уравнений (7.6) мы должны записать новые уравнения
взаимно обратны. Если (как в механике) матрица $A=\partial^2 L/\partial \dot{q}^2$ положительно определена, то таковой является и матрица $\partial^2 H/\partial p^2$. Но тогда из (7.8) следует, что $\{F,\Phi\} \ne 0$.
Так как $\Phi=\{F,H\}=0$ (вторичная связь), то первое уравнение совместности (7.7) даёт нам, что $\mu=0$. Легко проверить, что второе уравнение (7.7) в точности совпадает с уравнением (7.5), представленным в канонических переменных.
7.3.
В разделе 2 в качестве примера рассмотрена “натуральная” лагранжева система с неинтегрируемой связью
Лагранжевы уравнения можно представить в гамильтоновых переменных. Если связь (7.9) трактовать как распределение в фазовом пространстве гамильтоновой системы, то симплектическое проектирование на касательную гиперплоскость (7.9) приводит к классическим неголономным уравнениям.
С другой стороны, если $H(p,q)$ – функция Гамильтона, то $\dot{q}=\partial H/\partial p$ и уравнение (7.9) представляется в виде
Его можно рассматривать как первичную связь, наложенную на систему с гамильтонианом $H$. Какие уравнения в лагранжевом представлении даёт метод Дирака? Можно подумать, что те же неголономные уравнения. Однако это не так.
Рассмотрим простой пример гамильтоновой системы с гамильтонианом
К этому уравнению надо добавить уравнение связи $(a(q),\dot{q})=0$. В результате получили вакономное уравнение движения частицы в потенциальном поле с неинтегрируемой связью.
Уравнение (7.11) – это уравнение экстремалей вариационной задачи Лагранжа
Причина появления вакономных уравнений, а не привычных неголономных уравнений, понятна: уравнения Дирака (3.1) имеют вариационную природу, что, конечно, проявляется и в лагранжевом представлении уравнений движения со связями.
Список литературы
1.
P. A. M. Dirac, “Generalized Hamiltonian dynamics”, Canad. J. Math., 2:2 (1950), 129–148
2.
P. A. M. Dirac, “Generalized Hamiltonian dynamics”, Proc. Roy. Soc. London Ser. A, 246 (1958), 326–332
3.
J. L. Anderson, P. G. Bergmann, “Constraints in covariant field theories”, Phys. Rev. (2), 83:5 (1951), 1018–1025
4.
Б. В. Медведев, “П. А. М. Дирак и логические основы квантовой теории. II”: П. А. М. Дирак, Собрание научных трудов, т. III, Физматлит, М., 2004, 649–650
5.
В. В. Козлов, Общая теория вихрей, 2-е испр. и доп. изд., Ин-т компьютерных исследований, М.–Ижевск, 2013, 324 с.; англ. пер. 1-го изд.: V. V. Kozlov, Dynamical systems X. General theory of vortices, Encyclopaedia Math. Sci., 67, Springer-Verlag, Berlin, 2003, viii+184 с.
6.
Л. Янг, Лекции по вариационному исчислению и теории оптимального управления, Мир, М., 1974, 488 с. ; пер. с англ.: L. C. Young, Lectures on the calculus of variations and optimal control theory, W. B. Saunders Co., Philadelphia–London–Toronto, ON, 1969, xi+331 с.
7.
A. J. Hanson, T. Regge, C. Teitelboim, Constrained Hamiltonian systems, Accad. Naz. Lincei, Rome, 1976, 135 pp.
8.
В. В. Нестеренко, А. М. Червяков, “Некоторые свойства связей в теориях с вырожденными лагранжианами”, ТМФ, 64:1 (1985), 82–91; англ. пер.: V. V. Nesterenko, A. M. Chervyakov, “Some properties of constraints in theories with degenerate Lagrangians”, Theoret. and Math. Phys., 64:1 (1985), 701–707
9.
L. Faddeev, R. Jackiw, “Hamiltonian reduction of unconstrained and constrained systems”, Phys. Rev. Lett., 60:17 (1988), 1692–1694
10.
Б. М. Барбашов, “Гамильтонов формализм для лагранжевых систем с заданными связями”, Физика элементарных частиц и атомного ядра, 34:1 (2003), 5–42
11.
Дж. Д. Биркгоф, Динамические системы, Гостехиздат, М.–Л., 1941, 320 с.; пер. с англ.: G. D. Birkhoff, Dynamical systems, Amer. Math. Soc. Colloq. Publ., 9, Amer. Math. Soc., New York, 1927, viii+295 с.
12.
E. Newman, P. G. Bergmann, “Lagrangians linear in the “velocities””, Phys. Rev. (2), 99:2 (1955), 587–592
13.
Ф. А. Березин, “Гамильтонов формализм в общей задаче Лагранжа”, УМН, 29:3(177) (1974), 183–184
14.
В. И. Арнольд, В. В. Козлов, А. И. Нейштадт, Математические аспекты классической и небесной механики, 2-е перераб. и доп. изд., Едиториал УРСС, М., 2002, 416 с.; англ. пер.: V. I. Arnold, V. V. Kozlov, A. I. Neĭshtadt, Mathematical aspects of classical and celestial mechanics, Encyclopaedia Math. Sci., 3, Dynamical systems. III, 3rd ed., Springer-Verlag, Berlin, 2006, xiv+518 с.
15.
М. В. Дерябин, “О гамильтоновом формализме Дирака и реализации связей малыми массами”, ПММ, 64:1 (2000), 41–45; англ. пер.: M. V. Deryabin, “The Dirac Hamiltonian formalism and the realization of constraints by small masses”, J. Appl. Math. Mech., 64:1 (2000), 35–39
16.
Д. Р. Меркин, Гироскопические системы, 2-е изд., Наука, М., 1974, 344 с.
17.
В. В. Стрыгин, В. А. Соболев, Разделение движений методом интегральных многообразий, Наука, М., 1988, 256 с.
18.
А. Ю. Ишлинский, Механика гироскопических систем, 2-е изд., Изд-во АН СССР, М., 1963, 482 с.
19.
В. В. Козлов, “Динамика систем с большими гироскопическими силами и реализация связей”, ПММ, 78:3 (2014), 307–315; англ. пер.: V. V. Kozlov, “The dynamics of systems with large gyroscopic forces and the realization of constraints”, J. Appl. Math. Mech., 78:3 (2014), 213–219
20.
А. В. Влахова, “О ‘неголономных движениях’ гироскопических и колесных систем”, Вестн. Моск. ун-та. Сер. 1. Матем., мех., 2013, № 5, 67–73; англ. пер.: A. V. Vlakhova, “Nonholonomic motions of gyroscopic and wheeled systems”, Moscow Univ. Mech. Bull., 68:5 (2013), 126–132
21.
А. В. Влахова, “Динамика систем с качением и гироскопических систем с малыми обобщенными скоростями и реализация связей”, ПММ, 78:6 (2014), 790–807; англ. пер.: A. V. Vlakhova, “The dynamics of systems with rolling and gyroscopic systems with small generalized velocities and the realization of constraints”, J. Appl. Math. Mech., 78:6 (2014), 568–579
22.
Э. Картан, Интегральные инварианты, Гостехиздат, М.–Л., 1940, 216 с.; пер. с фр.: E. Cartan, Leçons sur les invariants intégraux, Hermann, Paris, 1922, x+210 pp.
23.
А. Ф. Филиппов, “Дифференциальные уравнения с разрывной правой частью”, Матем. сб., 51(93):1 (1960), 99–128; англ. пер.: A. F. Filippov, “Differential equations with discontinnuous right-hand side”, Amer. Math. Soc. Transl. Ser. 2, 42, Amer. Math. Soc., Providence, RI, 1964, 199–231
24.
В. И. Уткин, Скользящие режимы и их применение в системах с переменной структурой, Наука, М., 1974, 272 с. ; англ. пер.: V. I. Utkin, Sliding modes and their application in variable structure systems, Mir, Moscow, 1978, 257 с.
25.
П. Аппель, Теоретическая механика, т. I, II, Физматлит, М., 1960, 1004 с.; пер. с фр.: P. Appell, Traité de mécanique rationnelle, v. I, 5-e éd., Gauthier-Villars, Paris, 1926, 619 pp. ; v. II, 6-e éd., 1953, 575 pp.
26.
V. V. Kozlov, “On the integration theory of equations of nonholonomic mechanics”, Regul. Chaotic. Dyn., 7:2 (2002), 161–176
27.
В. В. Козлов, “Квадратичные законы сохранения уравнений математической физики”, УМН, 75:3(453) (2020), 55–106; англ. пер.: V. V. Kozlov, “Quadratic conservation laws for equations of mathematical physics”, Russian Math. Surveys, 75:3 (2020), 445–494
28.
Г. А. Блисс, Лекции по вариационному исчислению, ИЛ, М., 1950, 349 с.; пер. с англ.: G. A. Bliss, Lectures on the calculus of variations, Univ. of Chicago Press, Chicago, IL, 1946, ix+296 с.
29.
В. В. Козлов, “Динамика систем с неинтегрируемыми связями. I”, Вестн. Моск. ун-та. Сер. 1. Матем., мех., 1982, № 3, 92–100; II, 1982, № 4, 70–76; III, 1983, № 3, 102–111; IV. Интегральные принципы, 1987, № 5, 76–83; V. Принцип освобождаемости и условие идеальности связей, 1988, № 6, 51–54; англ. пер.: V. V. Kozlov, “Dynamics of systems with nonintegrable constraints. I”, Moscow Univ. Mech. Bull., 37:3-4 (1982), 27–34; II, 37:3-4 (1982), 74–80; III, 38:3 (1983), 40–51; IV. Integral principles, 42:5 (1987), 40–49; V. Freedom principle and ideal constraints condition, 43:6 (1988), 23–29
30.
R. S. Strichartz, “Sub-Riemannian geometry”, J. Differential Geom., 24:2 (1986), 221–263
31.
Ф. Гриффитс, Внешние дифференциальные системы и вариационное исчисление, Мир, М., 1986, 360 с. ; пер. с англ.: P. A. Griffiths, Exterior differential systems and the calculus of variations, Progr. Math., 25, Birkhäuser, Boston, MA, 1983, ix+335 с.
32.
А. М. Вершик, В. Я. Гершкович, “Неголономные динамические системы. Геометрия распределений и вариационные задачи”, Динамические системы – 7, Итоги науки и техн. Сер. Соврем. пробл. матем. Фундам. направления, 16, ВИНИТИ, М., 1987, 5–85; англ. пер.: A. M. Vershik, V. Ya. Gershkovich, “Nonholonomic dynamical systems, geometry of distributions and variational problems”, Dynamical systems VII, Encyclopaedia Math. Sci., 16, Springer, Berlin, 1994, 1–81
33.
А. А. Аграчев, “Некоторые вопросы субримановой геометрии”, УМН, 71:6(432) (2016), 3–36; англ. пер.: A. A. Agrachev, “Topics in sub-Riemannian geometry”, Russian Math. Surveys, 71:6 (2016), 989–1019
34.
Г. Р. Герц, Принципы механики, изложенные в новой связи, Изд-во АН СССР, М., 1959, 386 с. ; пер. с нем.: H. Hertz, Die Principien der Mechanik in neuem Zusammenhange dargestellt, Gesammelte Werke, III, J. A. Barth, Leipzig, 1894, xxix+312 pp.
Образец цитирования:
В. В. Козлов, “К обобщенной гамильтоновой динамике Дирака”, УМН, 79:4(478) (2024), 95–130; Russian Math. Surveys, 79:4 (2024), 649–681