Аннотация:
В контексте теории аналитической сложности рассмотрены две геометрические конструкции. Первая – на совокупности аналитических функций построена метрика, инвариантная относительно действия калибровочной группы. Вторая – получено необходимое дифференциально-алгебраическое условие принадлежности функции касательному пространству к классу функций двух переменных аналитической сложности не выше чем два в точке $z_0=x^3 y^2 +xy$. Этот результат позволил привести простой пример полинома степени пять, чья аналитическая сложность равна трем, а именно, $z=x^3y^2+xy + \pi x^2 y^3$.
Библиография: 10 наименований.
Операция суперпозиции (подстановки) позволяет из функций меньшего числа переменных получать функции бóльшего числа переменных. В этой тематике имеется ряд ярких достижений, но много вопросов остаются открытыми [1]–[5]. Чтобы придать рассмотрению определенность, следует уточнить класс функций и число переменных. Вопрос о возможности представления функций двух переменных с помощью функций одного переменного (проблема “$2 \to 1$”), как и другие похожие вопросы, таит немало интересных и нерешенных проблем. Настоящая работа примыкает к кругу публикаций (см. [6], [7] и др.), где этот вопрос обсуждается в контексте аналитических функций.
Иерархию классов $Cl^n$, $n=0,1, \dots$, определяем индуктивно. При этом $Cl^0$ – это аналитические функции одного переменного ($x$ или $y$), а класс $Cl^{n+1}$ состоит из аналитических функций, имеющих локальное представление вида $z=c(A_n(x,y)+B_n(x,y))$, где $A_n$ и $B_n$ – функции из $Cl^n$, а $c(t)$ – аналитическая функция одного переменного. Одна из основных характеристик $z(x,y)$, аналитической функции двух переменных, – это ее сложность $N(z)$. То, что $N(z)=n$, означает, что $z \in Cl^n \setminus Cl^{n-1}$, если же $z$ не попала ни в один из классов, то пишем, что $N(z)=\infty$. При этом сложность элемента аналитической функции, вычисленная в одной точке, будет совпадать со сложностью в любой другой неособой точке. Множество особых точек для представления функции, голоморфной в области двумерного пространства суперпозицией минимальной сложности, – это собственное аналитическое подмножество этой области.
При построении иерархии можно базовую функцию $(x+y)$ заменить на произвольную аналитическую функцию двух переменных $\varphi(x,y)$ и получить иерархию $Cl^n_{\varphi}$ и, соответственно, относительную сложность $N_{\varphi}(z)$. Зафиксируем некоторый росток функции двух переменных $\varphi(x,y)$ с условием $\varphi'_x\varphi'_y \neq 0$. Тогда можно определить возрастающую последовательность классов функций. Положим ${Cl_{\varphi}^1=Cl^0}$. Далее по индукции: $Cl_{\varphi}^{n+1}$ – это совокупность функций, имеющих ростки, эквивалентные (под действием калибровочной группы, см. ниже) росткам функций вида $c(\varphi(A_n(x,y),B_n(x,y)))$, где $A_n(x,y), B_n(x,y) \,{\in} Cl_{\varphi}^n$, $c(t)$ – аналитична.
Характеристики сложности, как $N(z)$, так и $N_{\varphi}(z)$, инвариантны относительно некоторого действия. Пусть $f$ – росток аналитической функции двух переменных в начале координат и $f(0,0)=0$ (стандартный росток). Обозначим через $G$ группу ростков голоморфных отображений вида $\{u \to \lambda u +o(u)\}$, $\lambda \neq 0$, обозначим $\mathcal{G}=G \times G \times G$. И если $g=(a(u),b(u),c(u)) \in \mathcal{G}$, то обозначим $\varphi(x,y)=c(f(a(x),b(y)))$ через $g \circ f$. При этом будем говорить, что $\varphi$ и $f$ эквивалентны.
Если $f$ – росток в $(p,q)$, то $(f(x-p,y-q)-f(p,q))$ – стандартный росток. Отношение эквивалентности стандартных ростков порождает отношение эквивалентности произвольных ростков, голоморфных и полных аналитических функций. Пусть в окрестности $D$ точки $(x_0,y_0)$ имеются две голоморфные функции $F_1(x,y)$ и $F_2(x,y)$ (элементы аналитических функций). Пусть росток $\widetilde{F}_1(x,y,x_0,y_0)$ эквивалентен ростку $\widetilde{F}_2(x,y,x_0,y_0)$. Тогда утверждается, что для всех путей $\gamma(t)=(x(t),y(t))$, выходящих из $(x_0,y_0)$, в $D \setminus \sigma$ ($\sigma$ – собственное аналитическое подмножество) существует непрерывное по $t$ семейство ростков $g_t=(a_t(s),b_t(s),c_t(s)) \in \mathcal{G}$ таких, что $\widetilde{F}_2(x,y,x(t),y(t))=g_t \circ \widetilde{F}_1(x,y,x(t),y(t))$, т. е. ростки $F_1$ и $F_2$ будут эквивалентны в каждой точке их общей области определения минус собственное аналитическое подмножество (дискриминантное подмножество). В этом смысле факт локальной эквивалентности ростков перестает быть локальным. Если $f$ – росток, то класс полных аналитических функций, эквивалентных функции, порожденной этим ростком, мы будем обозначать $[f]$.
Совокупность всех аналитических функций двух комплексных переменных $(x,y)$ обладает естественной структурой пучка ростков. С этой точки зрения полная аналитическая функция, порожденная некоторым конкретным ростком, представляет собой связную компоненту этого пучка, содержащую данный росток. Введенное выше отношение эквивалентности – это отношение эквивалентности на пучке ростков.
Отметим также, что с точностью до этой эквивалентности все аналитические функции одного переменного сводятся к следующим четырем классам: $z=0$, $z=1$, $z=x$, $z=y$.
§ 2. Аналитические функции как метрическое пространство
Наша ближайшая цель – превратить совокупность аналитических функций двух переменных $\mathcal{A}$ в метрическое пространство. При этом будем предполагать, что мы удалили из этой совокупности константы и функции одного переменного. Таким образом, $\mathcal{A}$ – это совокупность аналитических функций с тем условием, что $F'_xF'_y$ не есть тождественный нуль.
Для двух ростков аналитических функций двух переменных $\varphi(x,y)$ и $\psi(x,y)$ введем следующую характеристику:
Теорема 1. Функция $\rho$ определяет на $\mathcal{A}$ метрику.
Доказательство. Поскольку $N_{[\varphi]}([\psi]) \geqslant 1$, то $\rho([\varphi],[\psi]) \geqslant 0$. Равенство $\rho([\varphi],[\psi])=0$ равносильно тому, что $[\varphi]=[\psi]$. Симметричность функции $\rho$ видна из определения. Осталось проверить неравенство треугольника.
В связи с этим отметим следующее свойство относительной сложности. Пусть имеются три аналитические функции $(\varphi, \psi, \chi)$. Причем $N_{\varphi}(\psi) \leqslant l$, $N_{\psi}(\chi) \leqslant m$, тогда $N_{\varphi}(\chi) \leqslant l m$. Отсюда сразу следует необходимое неравенство. А именно, что для любых трех классов $[\varphi]$, $[\psi]$, $[\chi]$ выполнено неравенство
Метрика $\rho$ может принимать значение $\infty$, и такую метрику иногда называют квазиметрикой. При этом нетрудно превратить ее в метрику, принимающую только конечные значения. Действительно, если $h(s)=s/(1+s)$, то величина
также является метрикой на $\mathcal{A}$, но при этом $\widetilde{\rho} ([\varphi], [\chi]) \leqslant 1$ для любой пары функций.
В связи с тем, что $\rho$ может принимать как конечные, так и бесконечные значения можно ввести на $\mathcal{A}$ еще одно отношение эквивалентности. А именно, отношение “находиться на конечном расстоянии”. Вся совокупность $\mathcal{A}$ распадается в дизъюнктное объединение по “типам”. Функции (классы), принадлежащие одному типу, находятся на конечном расстоянии, разным типам – на бесконечном.
Можно отметить, что мощность множества типов не может быть счетной.
Метрика, описанная выше, специализирована для сложности типа $(2 \to 1)$, т. е. для изучения вопросов представимости функций двух переменных с помощью суперпозиции функций одного переменного. Но нетрудно распространить ее и на общий случай. Например, для функций трех переменных возможны два подхода: $(3 \to 1)$ и $(3 \to 2)$. Введение метрики возможно в обоих случаях. Действительно, единственное свойство метрики, которое нуждается в доказательстве – это неравенство треугольника. Это неравенство следует из мультипликативной оценки относительной сложности, которая имеет место в очень широком контексте.
§ 3. Классы сложности как подмногообразия в пространстве функций
Классам сложности $Cl^n$, введенным выше, можно сопоставить $I^n$ – радикальный дифференциальный идеал, состоящий из дифференциальных полиномов с рациональными коэффициентами, которые аннулируют функции из $z \in Cl^n$ (см. [7]). По теореме Ритта–Роденбаша [8] каждый такой идеал имеет конечный базис $D_n=(d_1,\dots, d_l)$. В силу инвариантности любого класса $Cl^n$ относительно действия калибровочной группы $\mathcal{G}$ этот базис содержит только полиномы, не зависящие явно от переменных $(x,y,z)$, а только от производных функции $z$ с некоторыми условиями однородности.
Дифференциальный идеал $I^1$ имеет одну образующую:
Для вычисления образующих идеалов $I^n$ имеются алгоритмы. Однако большой объем вычислений приводит к тому, что уже вычисление $D_2$ представляется недоступным [9].
Нетрудно показать, что все полиномы степени два не выходят за рамки $Cl^2$. Также нетрудно показать, что полином степени $11$ общего положения имеет сложность выше, чем два. Вопрос о конкретном примере полинома сложности три – гораздо сложнее. В [10] были предложены примеры функций (в том числе полиномы) произвольной наперед заданной сложности. Однако даже, если говорить только о полиномах сложности три, – это полиномы астрономически высокой степени.
Ниже предлагается рассмотреть классы сложности как бесконечномерные подмногообразия некоторого функционального пространства. На этом пути удается конструктивно описать касательное пространство к $Cl^2$ в некоторой точке. Это, далее, позволяет явно предъявить полином степени пять, имеющий аналитическую сложность три.
Перейдем к нашему построению.
Зафиксируем функцию $Z_0=x^3y^2 +xy$ как точку $Cl^2$. Функцию $Z_0$ можно представить в виде (3.1), полагая
провели через точку $(u,\exp(u),\exp(u),3\ln(u),2\ln(u),\ln(u),\ln(u))$ прямую в направлении $(s(u),c(u),r(u),a(u),b(u),p(u),q(u))$, где функции $(s,c,r,a,b,p,q)$ – аналитичны, и композиция имеет непустую область определения. В возмущенном выражении $Z(x,y,t)=(x^3y^2+xy)+tz(x,y)+o(t)$ выделим линейное по $t$ слагаемое. Получим параметрическое описание $T \, Cl^2_{(x^3y^2 +xy)}$ – касательного пространства к $Cl^2$ в точке $Z_0=(x^3y^2+xy)$:
Наша ближайшая цель – перейти от параметрического описания касательного пространства к определяющим его соотношениям. Для этого мы должны исключить из соотношения (3.2) функциональные параметры $(s,c,a,b,p,q,r)$. В дальнейшем будем обозначать производные нижними индексами, т. е. как $a_p$, $b_q$, $z_{m,n}$ и так далее. Причем всю совокупность производных функции $z$ порядков до $n$ включительно будем обозначать $z^{(n)}$, аналогично $a^{(n)}$ и так далее.
Ядро $\Delta_s$ – функции вида $s(x^3 y^2+xy)$, ядро $\Delta_c$ – функции вида $c(x^3 y^2)$, ядро $\Delta_r$ – функции вида $r(xy)$. Применим к (3.2) дифференциальный оператор $\Delta_s$. Получаем
Итак, мы получили дифференциальный полином третьего порядка, который не зависит от $(s(x^3y^2+x\,y), c(x^3y^2), r(x\,y))$, а зависит только от $(a(x),b(y),p(x), q(y))$ и функции $z(x,y)$. Наша цель состоит в том, чтобы, используя соотношение (3.5) и его дифференциальные следствия, получить какое-либо соотношение только на функцию $z$; т. е. мы будем последовательно исключать функции $(q(y),b(y),p(x),a(x))$ (именно в таком порядке). Вычисления осуществлялись с помощью системы Maple. Текст программы для Maple, которая осуществляет описанные выше вычисления, доступен на http://vkb.strogino.ru/ (раздел “другое”, п. 3).
Объемы (число мономов) и дифференциальные порядки промежуточных дифференциальных следствий в процессе вычислений будут возрастать. Здесь мы не будем выписывать их явно, но будем следить за схемой вычисления, а также отмечать дифференциальные порядки полиномов и число содержащихся в них мономов.
Выразим из соотношения (3.5) функцию $q_3$: $q_3=Q_3(a^{(3)},b^{(3)},p^{(3)}, q^{(2)},z^{(3)})$, и записывая условие того, что она не зависит от $x$, получаем соотношение $e_4(a^{(4)},b^{(3)},p^{(4)},q^{(2)},z^{(4)})=0$ ($68$ мономов).
Выражая из $e_4=0$ функцию $q_2$, получаем $q_2=Q_2(a^{(4)},b^{(3)},p^{(4)},q_1, z^{(4)})$, и записывая условие того, что она не зависит от $x$, получаем соотношение $e_5(a^{(5)},b^{(3)},p^{(5)}, z^{(5)})=0$ (52 монома, от $q$ не зависит). Записывая соотношение $(Q_2)'_x=Q_3$, получаем $e_6(a^{(4)},b^{(4)},p^{(4)}, z^{(5)})=0$ ($75$ мономов).
Переходим к исключению $b$. Выражая из $e_5=0$ функцию $b_3$, получаем $b_3=B_3(a^{(5)},b_2,p^{(5)}, z^{(4)})$, и записывая условие того, что она не зависит от $x$, получаем соотношение $e_7(a^{(6)},p^{(6)}, z^{(6)})=0$ ($61$ моном, от $b$ не зависит). Выражая из $e_6=0$ функцию $b_4$, получаем $b_4=B_4(a^{(5)},b_2,p^{(5)}, z^{(6)})$, и записывая условие того, что она не зависит от $x$, получаем соотношение $e_7(a^{(6)},p^{(6)}, z^{(6)})=0$ ($61$ моном, от $b$ не зависит). Записывая соотношение $(B_3)'_y=B_4$, получаем $e_8(a^{(5)},b_2,p^{(5)}, z^{(6)})=0$ ($131$ моном). Выражая из $e_8=0$ функцию $b_2$, получаем $b_2=B_4(a^{(5)},p^{(5)}, z^{(6)})$, и записывая условие того, что она не зависит от $x$, получаем соотношение $e_9(a^{(6)},p^{(6)}, z^{(7)})=0$ ($148$ мономов). Соотношение $(B_2)'_y=B_3$ дает $e_{10}(a^{(5)},p^{(5)}, z^{(7)})=0$ ($134$ монома).
Переходим к исключению $p$. Выражая из $e_{10}=0$ функцию $p_5$, получаем $p_5=P_5(a^{(5)},p^{(4)}, z^{(7)})$, и записывая условие того, что она не зависит от $y$, получаем соотношение $e_{11}(a^{(5)},p^{(4)}, z^{(8)})=0$ ($247$ мономов). Подставляя в $e_7$ вместо $p_6$ выражение $(P_5)'_x$, получаем $ee_7(a^{(6)},p^{(4)}, z^{(8)})=0$ ($336$ мономов). Аналогично, подставляя в $e_9$ выражения для $p_5$ и $p_6$, получаем $ee_9(a^{(6)},p^{(4)}, z^{(8)})=0$ ($404$ монома). Выразим из $e_{11}=0$ функцию $p_4$ и подставим полученное выражение в $ee_7=0$ и в $ee_9=0$. Получим $eee_7(a^{(6)}, z^{(8)})=0$ ($354$ монома, от $p$ не зависит) и $eee_9(a^{(6)}, z^{(8)})=0$ ($418$ мономов, от $p$ также не зависит).
Переходим к исключению $a$ из двух последних соотношений. Выразим $a_6$ из $eee_7=0$, получим $a_6=A_{61}(a^{(5)}, z^{(8)})$, и из $eee_9=0$, получим $a_6=A_{62}(a^{(5)}, z^{(8)})$. Записывая, что $A_{61}=A_{62}$, получим $e_{12}(a^{(5)}, z^{(8)})=0$ ($266$ мономов). Из $e_{12}=0$ получаем $a_5=A_5(a^{(4)}, z^{(8)})$. Дифференцируя $A_5$, получаем еще одно выражение для $a_6$, а именно, $a_6=A_{63}(a^{(4)}, z^{(9)})$. Записывая, что $A_{63}=A_{61}$, получим $e_{13}(a^{(4)}, z^{(9)})=0$ ($533$ монома). Из $e_{13}=0$ получаем $a_4=A_4(a^{(3)}, z^{(9)})$. Дифференцируя $A_4$, получаем еще одно выражение для $a_5$, а именно, $a_5=AA_5(a^{(3)}, z^{(10)})$. Записывая, что $A_5=AA_5$, получим $e_{14}( z^{(10)})=0$ ($705$ мономов, от $a$ не зависит).
Полином десятого порядка $e_{14}$ – это и есть итог наших вычислений. Данное выражение линейно по производным функции $z$ от первого до десятого порядка.
В итоге мы получаем следующее утверждение.
Утверждение. a) Пространство $T \, Cl^2_{(x^3y^2+xy)}$, касательное пространство к $Cl^2$ в точке $Z_0=(x^3y^2+xy)$, состоит из аналитических функций $z(x,y)$ вида
где $(a,b,c,p,q,r,s)$ – аналитические функции одного переменного такие, что сумма определена в некоторой непустой области.
b) Соотношение $e_{14}(z^{(10)})=0$ – необходимое условие того, что $z(x,y)$ имеет представление из пункта a).
c) Полином $e_{14}(z^{(10)})$ ($705$ мономов) – линейное выражение от производных функции $z$ порядков не выше десятого ($65$ производных), коэффициенты – это полиномы от $(x,y)$ с целыми коэффициентами, расположенными на отрезке $[-306021888,306021888]$.
Располагая необходимым условием принадлежности функции касательному пространству, нетрудно привести примеры простых выражений, которые ему не принадлежат. Например, если подставить $z=x^2y^3$ в $e_{14}$, то получаем
Пусть $a \in \mathbf{C}^{21}$ – набор коэффициентов общего многочлена от $(x,y)$ степени не выше пяти, и $p(x,y,a)$ – полином, чьи коэффициенты равны $a$. Пусть $\sigma_2=\{a \in \mathbf{C}^{21}\colon N(p(x,y,a)) \leqslant 2\}$.
b) Множество $\sigma_2$ – собственное алгебраическое подмножество $\mathbf{C}^{21}$, причем $\sigma_2$ – множество общих нулей набора полиномов от $a$ с целыми коэффициентами.
Доказательство. То, что сложность $W$ не превосходит трех, очевидно. Поэтому достаточно показать, что $ W \notin Cl^2$. Рассмотрим прямую $l$, проходящую через $(x^3y^2+xy)$ в направлении $z=x^2y^3$, т. е. $l=\{Z(x,y,t)=(x^3y^2+xy)+tx^2y^3\}$. Если бы $l$ целиком содержалась в $Cl^2$, то ее направляющий вектор был бы касательным. Но это не так, и, следовательно, $l$ в $Cl^2$ целиком не содержится. Рассмотрим $(d_1(Z(x,y)), \dots, d_s(Z(x,y)))$ – дифференциальные полиномы, определяющие $Cl^2$, и их сужение на $l$. Мы получим набор полиномов $(P_1(t), \dots,P_s(t))$ c целыми коэффициентами переменного $t$, причем не все из них тождественно равны нулю. Пусть $\widetilde{P}(t)$ – такой полином, т. е., если для некоторого $t$ функция $Z(x,y,t) \in Cl^2$, то $\widetilde{P}(t)=0$. Нули этого полинома – это конечный набор алгебраических чисел (над полем $\mathbf{Q}$). Поскольку число $\pi$ неалгебраично, то $(x^3y^2+xy+\pi x^2y^3) \notin Cl^2$. Это доказывает a).
Рассмотрим результат подстановки общего полинома пятой степени $Z=p(x,y,a)$ в $(d_1, \dots, d_s)$. Получим набор полиномиальных соотношений на $a \in \mathbf{C}^{21}$ с целыми коэффициентами. Поскольку у нас есть полином степени пять $p(x,y,a_0)$, который не попал в $Cl^2$, то эти соотношения задают собственное алгебраическое подмножество $\mathbf{C}^{21}$. Это доказывает b).
Теорема доказана.
Хотя дифференциальные полиномы, задающие второй класс, не даны нам явно, имеется алгоритм их построения. Анализ этого алгоритма позволяет написать оценки сверху на дифференциальный порядок, число мономов и величину коэффициентов (это целые числа). Используя такие оценки, нетрудно получить оценку сверху модулей корней полинома $P(t)$ из доказательства теоремы 2. Это позволяет заменить в полиноме $W$ неалгебраический коэффициент $\pi$ на очень большое (или очень маленькое) рациональное число. После чего мы получим пример многочлена степени пять сложности три с целыми коэффициентами.
A. Ostrowski, “Über Dirichletsche Reihen und algebraische Differentialgleichungen”, Math. Z., 8:3-4 (1920), 241–298; англ. пер.: E. Ch. Hansen, Y. Stone, J. Wolfson, Alexander Ostrowski's “On Dirichlet series and algebraic differential equations”, 2022, arXiv: 2211.02088
3.
В. И. Арнольд, “О функциях трех переменных”, Докл. АН СССР, 114:4 (1957), 679–681
4.
А. Н. Колмогоров, “О представлении непрерывных функций нескольких переменных в виде суперпозиций непрерывных функций одного переменного и сложения”, Докл. АН СССР, 114:5 (1957), 953–956; англ. пер.: A. N. Kolmogorov, “On the representation of continuous functions of many variables by superposition of continuous functions of one variable and addition”, Amer. Math. Soc. Transl. Ser. 2, 28, Amer. Math. Soc., Providence, RI, 1963, 55–59
5.
А. Г. Витушкин, “13-я проблема Гильберта и смежные вопросы”, УМН, 59:1(355) (2004), 11–24; англ. пер.: A. G. Vitushkin, “On Hilbert's thirteenth problem and related questions”, Russian Math. Surveys, 59:1 (2004), 11–25
6.
V. K. Beloshapka, “Analytical complexity: development of the topic”, Russ. J. Math. Phys., 19:4 (2012), 428–439
7.
V. K. Beloshapka, “Decomposition of functions of finite analytical complexity”, Журн. СФУ. Сер. Матем. и физ., 11:6 (2018), 680–685
8.
И. Капланский, Введение в дифференциальную алгебру, ИЛ, М., 1959, 85 с. ; пер. с англ.: I. Kaplansky, An introduction to differential algebra, Actualités Sci. Ind., 1251, Publ. Inst. Math. Univ. Nancago, 5, Hermann, Paris, 1957, 63 с.
9.
В. К. Белошапка, “О сложности дифференциально-алгебраического описания классов аналитической сложности”, Матем. заметки, 105:3 (2019), 323–331; англ. пер.: V. K. Beloshapka, “On the complexity of the differential-algebraic description of analytic complexity classes”, Math. Notes, 105:3 (2019), 309–315
10.
М. А. Степанова, “О функциях конечной аналитической сложности”, Тр. ММО, 83, № 1, МЦНМО, М., 2022, 1–16
Образец цитирования:
В. К. Белошапка, “Геометрические конструкции в теории аналитической сложности”, Изв. РАН. Сер. матем., 88:3 (2024), 3–11; Izv. Math., 88:3 (2024), 411–418