Аннотация:
Эта работа является прямым продолжением недавних работ автора. В этой работе мы продолжаем анализировать свойства аппроксимации и восстановления по системам, удовлетворяющим условию универсальной дискретизации по значениям в точках и специальному условию безусловности. Кроме того, мы предполагаем, что подпространство, натянутое на нашу систему, удовлетворяет некоторым неравенствам Никольского. В основном мы изучаем восстановление с ошибкой, измеренной в норме $L_p$ для $2\le p<\infty$. Мы применяем мощный нелинейный метод приближения – алгоритм слабого ортогонального преследования (АСОП) (Weak Orthogonal Matching Pursuit (WOMP)), который также известен под названием слабый ортогональный жадный алгоритм (СОЖА) (Weak Orthogonal Greedy Algorithm (WOGA)). Мы устанавливаем, что АСОП, основанный на точках, которые дают хорошую универсальную дискретизацию в $L_2$, обеспечивает хорошее восстановление в норме $L_p$ для $2\le p<\infty$. Для наших алгоритмов восстановления мы получаем как неравенства Лебега для индивидуальных функций, так и оценки ошибок для специальных функциональных классов функций многих переменных.
В этой работе для того, чтобы получить новые результаты о восстановлении по выборке (по значениям в точках), мы одновременно используем два глубоких и мощных метода: неравенства типа Лебега для АСОП и теорию универсальной дискретизации по значениям в точках.
Библиография: 19 названий.
Ключевые слова:
дискретизация по значениям в точках, универсальность, восстановление.
Эта работа является продолжением работы [18]. Мы сформулируем результаты из [18], которые мы будем использовать в нашем анализе. Читатель может найти обсуждение предыдущих результатов, непосредственно связанных с результатами из [18] и из настоящей работы, в работе [18]. Результаты о дискретизации можно найти в недавних обзорах [2] и [10].
Начнем с краткого описания некоторых необходимых нам понятий разреженной аппроксимации. Пусть $X$ – банахово пространством с нормой $\|\cdot\|:=\|\cdot\|_X$, и пусть $\mathcal D=\{g_i\}_{i=1}^\infty $ – система (счетная) элементов из $X$. Для заданного подмножества $J\subset \mathbb N$ определяем $V_J(\mathcal D):=\operatorname{span}\{g_j\colon j\in J\}$. Для положительного целого числа $v$ определяем $\mathcal{X}_v(\mathcal D)$ как совокупность всех линейных подпространств $V_J(\mathcal D)$ с $|J|=v$. Обозначим $\Sigma_v(\mathcal D)$ множество всех $v$-членных приближений по $\mathcal D$: $\Sigma_v(\mathcal D):=\bigcup_{V\in\mathcal X_v(\mathcal D)} V$. Для $f\in X$ определим
В этой работе мы рассматриваем случай $X=L_p(\Omega,\mu)$, $1\leqslant p<\infty$. Точнее, пусть $\Omega$ – компакт в $\mathbb R^d$ с вероятностной мерой $\mu$ на нем. Под нормой $L_p$, $1\leqslant p< \infty$, комплексных функций, определенных на $\Omega$, мы понимаем
В случае $X=L_p(\Omega,\mu)$ иногда для краткости мы пишем $\sigma_v(\cdot,\cdot)_p$ вместо $\sigma_v(\cdot,\cdot)_{L_p(\Omega,\mu)}$.
Мы изучаем системы функций, которые имеют свойство универсальной дискретизации по значениям в точках.
Определение 1.1. Пусть $1\leqslant p<\infty$. Говорим, что множество $\xi:=\{\xi^j\}_{j=1}^m \subset\Omega$ обеспечивает $L_p$-универсальную дискретизацию по выборке (по значениям в точках) для набора $\mathcal X:=\{X(n)\}_{n=1}^k$ конечномерных линейных подпространств $X(n)$, если
Обозначим $m(\mathcal X,p)$ минимальное $m$ такое, что существует множество $\xi$ из $m$ точек, которое обеспечивает $L_p$-универсальную дискретизацию по выборке (1.1) для набора $\mathcal X$.
Будем использовать краткую форму $L_p$-удв для $L_p$-универсальной дискретизации по выборке (1.1).
Мы используем $C$, $C'$ и $c$, $c'$ для обозначения различных положительных постоянных. Их аргументы указывают параметры, от которых они могут зависеть. Обычно эти постоянные не зависят от функции $f$ и меняющихся параметров $m$, $v$, $u$. Для краткости используем следующие обозначения. Для двух неотрицательных последовательностей $a=\{a_n\}_{n=1}^\infty$ и $b=\{b_n\}_{n=1}^\infty$ соотношение $a_n\ll b_n$ означает, что существует число $C(a,b)$ такое, что для всех $n$ имеем $a_n\leqslant C(a,b)b_n$. Соотношение $a_n\gg b_n$ означает, что $b_n\ll a_n$, а $a_n\asymp b_n$ означает, что $a_n\ll b_n$ и $a_n \gg b_n$. Для действительного числа $x$ обозначим $[x]$ целую часть $x$, $\lceil x\rceil$ – наименьшее целое число, которое больше или равно $x$.
Для множества $\xi$, состоящего из $m$ точек из $\Omega$, обозначим
где $\delta_{\mathbf x}$ обозначает меру Дирака в точке ${\mathbf x}$.
Для удобства будем обозначать $\|\cdot\|_{L_p(\nu)}$ норму $L_p$, определенную по мере $\nu$ на $\Omega$. Иногда используем обозначение $\|\cdot\|_{p}$.
Основная цель работы состоит в изучении оптимального восстановления на специальных классах функций многих переменных.
Для функционального класса ${\mathbf F}\subset \mathcal C(\Omega)$ определим (см. [19])
где $\mathcal M$ пробегает все отображения $\mathcal M \colon \mathbb C^m \to L_p(\Omega,\mu)$ и $\xi$ пробегает все подмножества $\{\xi^1,\dots,\xi^m\}$ из $m$ точек в $\Omega$. Мы используем индекс $o$, чтобы подчеркнуть оптимальность.
В [18] мы изучали поведение $\varrho_m^o({\mathbf F},L_p)$ для нового вида классов – ${\mathbf A}^r_\beta(\Psi)$. Мы установили порядки $\varrho_m^o({\mathbf A}^r_\beta(\Psi),L_p)$ (с точностью до логарифмического по $m$ множителя) в случае $1\leqslant p\leqslant 2$ для класса равномерно ограниченных ортонормированных систем $\Psi$. Дадим определение классов ${\mathbf A}^r_\beta(\Psi)$. Для данного $1\leqslant p\leqslant \infty$ пусть $\Psi=\{\psi_{{\mathbf k}}\}_{{\mathbf k} \in \mathbb Z^d}$, $\psi_{\mathbf k} \in \mathcal C(\Omega)$, $\|\psi_{\mathbf k}\|_p \leqslant B$, ${\mathbf k}\in\mathbb Z^d$, – система в пространстве $L_p(\Omega,\mu)$. Рассмотрим функции, представимые в виде абсолютно сходящегося ряда
Для $\beta \in (0,1]$ и $r>0$ рассмотрим следующий класс ${\mathbf A}^r_\beta(\Psi)$ функций $f$, которые имеют представление (1.3), удовлетворяющее следующим условиям:
В специальном случае, когда $\Psi$ – это тригонометрическая система $\mathcal T^d:=\{e^{i({\mathbf k},{\mathbf x})}\}_{{\mathbf k}\in \mathbb Z^d}$, мы доказали в [18] (см. теорема 4.6) следующую нижнюю оценку:
В [18] отмечено, что $(\log(m+1))^{-5}$ в (1.6) можно заменить на $(\log(m+1))^{-4}$. Оценки (1.5) и (1.6) показывают, что, вообще говоря, для равномерно ограниченных ортонормированных систем $\Psi$, например, для тригонометрической системы $\mathcal T^d$, различие между верхней и нижней оценками состоит в дополнительном логарифмическом по $m$ множителе.
В этой работе, так же как и в работе [18], мы изучаем специальный случай, когда $\Psi$ удовлетворяет определенным ограничениям. Мы сформулируем эти ограничения в форме условий, наложенных на $\Psi$.
Условие A. Предположим, что $\Psi$ – равномерно ограниченная система, а именно, предположим, что $\Psi:=\{\varphi_j\}_{j=1}^\infty$ является системой равномерно ограниченных функций на $\Omega \subset \mathbb R^d$ такой, что
Условие B3. Предположим, что $\Psi$ – система Бесселя, т.е. существует постоянная $K>0$ такая, что для любого $N\in\mathbb{N}$ и произвольного $(a_1,\dots, a_N) \in\mathbb C^N$
Ясно, что условие B1 влечет условие B2 с $R_1=R_2=1$. Условие B2 влечет условие B3 с $K=R_1^{-2}$.
В случае $2<p<\infty$ следующие оценки сверху были доказаны в [18] (см. теорема 4.2 и замечание 6.1).
Теорема 1.1 (см. [18]). Предположим, что $\Psi$ – равномерно ограниченная система Рисса (в пространстве $L_2(\Omega,\mu)$), удовлетворяющая (1.7) и (1.8) для некоторых постоянных $0<R_1\leqslant R_2<\infty$. Пусть $2<p<\infty$, $\beta \in (0,1]$ и $r>0$. Существуют постоянные $c'=c'(r,\beta,p,R_1,R_2,d)$ и $C'=C'(r,\beta,p,d)$ такие, что для любого $v\in\mathbb{N}$ справедлива оценка
для произвольного $m$, удовлетворяющего неравенству
$$
\begin{equation*}
m\geqslant c' v^{p/2} (\log v)^{2}.
\end{equation*}
\notag
$$
Результаты об универсальной $L_p$-дискретизации играли важную роль при доказательстве теоремы 1.1. Сейчас мы сформулируем соответствующий результат.
Теорема 1.2 (см. [3]). Предположим, что $\mathcal D_N=\{\varphi_j\}_{j=1}^N$ – равномерно ограниченная система Рисса, удовлетворяющая (1.7) и (1.8) с некоторыми постоянными $0<R_1\leqslant R_2<\infty$. Пусть $2<p<\infty$, и пусть $1\leqslant u\leqslant N$ – целое число. Тогда для достаточно большой постоянной $C=C(p,R_1,R_2)$ и произвольного $\varepsilon\in (0, 1)$ существуют $m$ точек $\xi^1,\dots, \xi^m\in \Omega$ с
Более того, оценка (1.13) дается простым жадным алгоритмом – алгоритмом слабого ортогонального преследования (АСОП) (см. определение ниже). Верхняя оценка (5.11) и нижняя оценка из предложения 5.1 (см. ниже) дают следующие неравенства в специальном случае $d$-мерной тригонометрической системы $\mathcal T^d$
Алгоритм слабого ортогонального преследования (АСОП) – это жадный алгоритм, определенный по заданному словарю (системе) $\mathcal D=\{g\}$ в гильбертовом пространстве, снабженном скалярным произведением $ \langle\cdot,\cdot\rangle$ и нормой $\|\cdot\|_H$. Этот алгоритм также известен под названием слабый ортогональный жадный алгоритм (см., например, [15]).
Пусть $\mathcal D=\{g\}$ – система ненулевых элементов из $H$ таких, что $\|g\|_H\leqslant 1$. Пусть задана последовательность $\tau:=\{t_k\}_{k=1}^\infty\subset [0, 1]$ параметров слабости. Для данного $f_0\in H$ определим последовательность $\{f_k\}_{k=1}^\infty\subset H$ остатков для $k=1,2,\dots$ индуктивно.
(1) $g_k\in \mathcal D$ – любой элемент, удовлетворяющий условию
В случае, когда $t_k=1$ для $k=1,2,\dots$, АСОП называется алгоритмом ортогонального преследования (АОП). В этой работе мы рассматриваем лишь случай, когда $t_k=t\in (0, 1]$ для $k=1,2,\dots$ . Термин слабый в определении АСОП означает, что на шаге (1) мы не стремимся выбрать оптимальный элемент словаря, на котором достигается верхняя грань. Очевидная причина – в общем случае мы не знаем, что оптимальный элемент существует. Другая, практическая причина, состоит в том, что более слабое условие легче реализовать на практике. Ясно, что $g_k$ может быть не единственным. Однако все сформулированные ниже результаты не зависят от выбора $g_k$.
Для удобства в дальнейших приложениях будем использовать обозначение $\operatorname{\textrm{АСОП}}(\mathcal D; t)_H$ для АСОП, определенного по данному параметру слабости $t\in (0, 1]$ и системе $\mathcal D$ в гильбертовом пространстве $H$.
UP($u,D$). ($u,D$)-свойство безусловности
Говорим, что система $\mathcal D=\{\varphi_i\}_{i\in I}$ элементов гильбертова пространства $H=(H, \|\cdot\|)$ является ($u,D$)-безусловной с постоянной $U>0$ для некоторых целых чисел $1\leqslant u\leqslant D$, если для любого $f=\sum_{i\in A} c_i \varphi_i\in \Sigma_u(\mathcal D)$ с $A\subset I$ и $J\subset I\setminus A$ таких, что $|A|+|J| \leqslant D$, имеем
где $ V_J(\mathcal D):=\operatorname{span}\{\varphi_i\colon i\in J\}$.
Выше мы сформулировали определение для случая счетной (или конечной) системы $\mathcal D$. Подобное определение можно дать и для произвольной системы $\mathcal D$.
Теорема 2.1 (см. [11; следствие I.1]). Пусть $\mathcal D$ – словарь в гильбертовом пространстве $H=(H, \|\cdot\|)$, имеющий свойство $\mathbf{UP}(u,D)$ с постоянной $U>0$ для некоторых целых чисел $1\leqslant u\leqslant D$. Пусть $f_0\in H$, и пусть $t\in (0, 1]$ – параметр слабости. Тогда существует положительная постоянная $c_\ast:=c(t,U)$, зависящая только от $t$ и $U$, такая, что $\operatorname{\textrm{АСОП}}(\mathcal D; t)_H$, примененный к $f_0$, дает
где $C>1$ – абсолютная постоянная, а $f_k$ обозначает остаток от $f_0$ после $k$-й итерации алгоритма.
Мы рассмотрим гильбертово пространство $L_2(\Omega_m,\mu_m)$ вместо $L_2(\Omega,\mu)$, где $\Omega_m=\{\xi^\nu\}_{\nu=1}^m$ – множество точек, которое обеспечивает хорошую универсальную дискретизацию, а $\mu_m$ – равномерная вероятностная мера на $\Omega_m$, т.е. $\mu_m\{ \xi^\nu\}=1/m$, $\nu=1,\dots,m$. Пусть $\mathcal D_N(\Omega_m)$ обозначает сужение системы $\mathcal D_N$ на множество $\Omega_m$. Теорема 2.2 (см. ниже) гарантирует, что простой жадный алгоритм АСОП дает соответствующее неравенство Лебега в норме $L_2(\Omega_m,\mu_m)$ и, следовательно, обеспечивает хорошее разреженное восстановление.
Теорема 2.2 (см. [4]). Пусть $\mathcal D_N=\{\varphi_j\}_{j=1}^N$ – равномерно ограниченная система Рисса в $L_2(\Omega, \mu)$, удовлетворяющая (1.7) и (1.8) при некоторых постоянных $0<R_1\leqslant R_2<\infty$. Пусть $\Omega_m=\{\xi^1,\dots, \xi^m\}$ – конечное подмножество $\Omega$, обеспечивающее $L_2$-универсальную дискретизацию (1.1) для набора $\mathcal X_u(\mathcal D_N)$ и заданных целых чисел $1\leqslant u\leqslant N$. По данному параметру слабости $0<t\leqslant 1$ можно найти константу (целое число) $c=c(t,R_1,R_2)\geqslant 1$ такую, что для любого целого числа, удовлетворяющего неравенствам $0\leqslant v\leqslant u/(1+c)$, и произвольного $f_0\in \mathcal C(\Omega)$ алгоритм
и $X$ называется равномерно гладким, если $\eta(w)/w\to 0$ при $w\to 0+$. Хорошо известно, что пространство $L_p$ при $1< p<\infty$ является равномерно гладким банаховым пространством с
В дополнение к сформулированным во введении условиям на систему $\Psi$ нам нужно еще одно свойство системы $\Psi$.
$u$-членное неравенство Никольского
Пусть $1\leqslant q\leqslant p\leqslant \infty$, и пусть $\Psi$ – система из $L_p:=L_p(\Omega,\mu)$. Для натурального числа $u$ говорим, что система $\Psi$ удовлетворяет $u$-членному неравенству Никольского для пары $(q,p)$ с постоянной $H$, если выполнено следующее неравенство:
В таком случае пишем $\Psi \in \mathrm{NI}(q,p,H,u)$.
Отметим, что очевидно $H\geqslant 1$.
Теорема 3.1. Пусть $\mathcal D_N=\{\varphi_j\}_{j=1}^N$ является равномерно ограниченной системой Рисса в $L_2(\Omega, \mu)$, удовлетворяющей (1.7) и (1.8) при некоторых постоянных $0<R_1\leqslant R_2<\infty$. Пусть $\Omega_m=\{\xi^1,\dots, \xi^m\}$ – конечное подмножество $\Omega$, которое обеспечивает $L_2$-универсальную дискретизацию для набора $\mathcal X_u(\mathcal D_N)$, $1\leqslant u\leqslant N$. В дополнение предположим, что $\mathcal D_N \in \mathrm{NI}(2,p,H,u)$ с $p\in [2,\infty)$. Тогда для заданного параметра слабости $0<t\leqslant 1$ найдется постоянная (целое число) $c=c(t,R_1,R_2)\geqslant 1$ такая, что для любого целого числа, удовлетворяющего неравенствам $0\leqslant v\leqslant u/(1+c)$, и произвольного $f_0\in \mathcal C(\Omega)$ алгоритм
где $C_i$, $i=0,1$, – абсолютные постоянные, $f_k$ обозначает остаток от $f_0$ после $k$-й итерации алгоритма и $\mu_\xi$ определено в (1.2).
Доказательство. Начнем с неравенства (3.2). Оно вытекает из неравенства (2.2) в теореме 2.2. Для полноты изложения мы приведем здесь это простое доказательство. Используя (1.8), мы получим, что для любых множеств $A\subset \{1,2,\dots, N\}$ и $\Lambda\subset \{1,\dots, N\}\setminus A$ и для любых последовательностей $\{x_i\}_{i\in A},$ $\{c_i\}_{i\in\Lambda}\subset\mathbb C$ выполнено
Это означает, что система $\mathcal D_N$ имеет свойство $\mathbf{UP}(v,N)$ с постоянной $U_1=R_2/R_1$ в пространстве $L_2(\Omega,\mu)$ для любых целых чисел $1\leqslant v< N$. Далее, из неравенств дискретизации (1.1) с $\mathbf {\mathcal{X}}=\mathbf {\mathcal{X}}_u(\mathcal D_N)$ вытекает, что система $\mathcal D:=\mathcal D_N(\Omega_m)$, которая является сужением $\mathcal D_N$ на $\Omega_m=\{\xi^1, \dots,\xi^m\}$, имеет свойство $\mathbf{UP}(v,u)$ в пространстве $L_2(\Omega_m,\mu_m)$ с постоянной $U_2=U_1 3^{1/2}$ для любого целого $1\leqslant v\leqslant u$. Таким образом, применяя теорему 2.1 к дискретизированной системе $\mathcal D_N(\Omega_m)$ в гильбертовом пространстве $L_2(\Omega_m,\mu_m)$, мы получим, что алгоритм
Во-вторых, учитывая, что $h-G_{cv}(f_0,\mathcal D_N(\Omega_m)) \in \Sigma_u(\mathcal D_N)$, по нашему предположению $\mathcal D_N \in \mathrm{NI}(2,p,H,u)$ и благодаря дискретизации (1.1) заключаем
Для краткости обозначим $L_p(\xi):=L_p(\Omega_m,\mu_m)$, где $\Omega_m=\{\xi^\nu\}_{\nu=1}^m$ и $\mu_m(\xi^\nu)=1/m$, $\nu=1,\dots,m$. Пусть $B_v(f,\mathcal D_N,L_p(\xi))$ обозначает наилучшее $v$-членное приближение $f$ в норме $L_p(\xi)$ по системе $\mathcal D_N$. Отметим, что $B_v(f,\mathcal D_N,L_p(\xi))$ может быть не единственным. Очевидно, что
Теорема 3.2 (см. [5]). Пусть $1\leqslant p<\infty$, и пусть $m$, $v$, $N$ – натуральные числа такие, что $2v\leqslant N$. Пусть $\mathcal D_N\subset \mathcal C(\Omega)$ – система из $N$ элементов. Предположим, что существует множество $\xi:=\{\xi^j\}_{j=1}^m \subset \Omega $, которое обеспечивает одностороннюю $L_p$-универсальную дискретизацию
Теорема 3.3. Пусть $2\leqslant p\leqslant \infty$, и пусть $m$, $v$, $N$ – натуральные числа такие, что $2v\leqslant N$. Пусть $\mathcal D_N\subset \mathcal C(\Omega)$ – система из $N$ элементов такая, что $\mathcal D_N \in \mathrm{NI}(2,p,H,2v)$. Предположим, что существует множество $\xi:=\{\xi^j\}_{j=1}^m \subset \Omega $, которое обеспечивает одностороннюю $L_2$-универсальную дискретизацию
Доказательство. Доказательства неравенств (3.11) и (3.12) похожи. Начнем с неравенства (3.11). Для краткости обозначим $g:=B_v(f,\mathcal D_N,L_2(\xi))$ и $h:=B_v(f,\mathcal D_N,L_p(\mu_\xi))$. Тогда
Во-вторых, учитывая очевидный факт $h-g\in \Sigma_{2v}(\mathcal D_N)$, по предположению $\mathcal D_N \in \mathrm{NI}(2,p,H,2v)$ получим
$$
\begin{equation*}
\|h-g\|_p \leqslant H \|h-g\|_2
\end{equation*}
\notag
$$
и продолжим с помощью (3.10) и тривиального неравенства $\|f-g\|_{L_2(\xi)} \leqslant \|f-h\|_{L_2(\xi)}$
$$
\begin{equation*}
\begin{aligned} \, \|h-g\|_p &\leqslant HD \|h-g\|_{L_2(\xi)} \leqslant 2HD \|f-h\|_{L_2(\xi)} \\ &\leqslant 2 HD \|f-h\|_\infty=2 HD \sigma_v(f,\mathcal D_N)_\infty. \end{aligned}
\end{equation*}
\notag
$$
Собирая воедино полученные выше неравенства, завершаем доказательство (3.12).
Теорема доказана.
§ 4. Новые результаты в оценках снизу
Обсудим нижние оценки для нелинейной характеристики $\varrho_m^o({\mathbf A}^r_\beta(\Psi),L_p)$. Сделаем это в специальном случае, когда $\Psi$ – это тригонометрическая система $\mathcal T^d:=\{e^{i({\mathbf k},{\mathbf x})}\}_{{\mathbf k}\in \mathbb Z^d}$. Для ${\mathbf N}=(N_1,\dots,N_d)$, $N_j\in \mathbb{N}_0$, $j=1,\dots,d$, обозначим
Пусть $g_\xi\in T(\xi)$ и точка ${\mathbf x}^*$ таковы, что $|g_\xi({\mathbf x}^*)|=\|g_\xi\|_\infty=1$. Для дальнейших рассуждений нам понадобятся классические тригонометрические полиномы. Одномерное ядро Фейера порядка $j-1$:
Это и соотношения (4.3), (4.5) в совокупности с тем фактом, что обе функции $f/\|f\|_q$ и $-f/\|f\|_q$ принадлежат $\mathcal T(2{\mathbf N},d)_q$, завершают доказательство леммы 4.1.
Покажем, как теорема 3.2 может быть использована для доказательства того, что теорема 1.2 не может быть существенно улучшена в смысле соотношения между $m$ и $u$.
Предложение 4.1. Пусть $d\in \mathbb{N}$ и $p\in (2,\infty)$. Существует положительная постоянная $C(d,p)$ со следующим свойством. Для любого
и $m\leqslant \vartheta({\mathbf N})/2$ нет множества из $m$ точек, которое обеспечивало бы одностороннюю $L_p(\mathbb T^d,\mu)$-универсальную дискретизацию (3.7) для $\mathcal X_{2v}(\mathcal D_N)$ с
$$
\begin{equation*}
v \geqslant C(d,p)(2D+1)^2 (\vartheta({\mathbf N}))^{2/p}.
\end{equation*}
\notag
$$
Здесь $\mu$ – нормированная мера Лебега на $\mathbb T^d$.
Доказательство. Доказательство проведем от противного. Предположим, что существует множество $\xi:=\{\xi^j\}_{j=1}^m \subset \mathbb T^d $, которое обеспечивает одностороннюю $L_p$-универсальную дискретизацию (3.7) для $\mathcal X_{2v}(\mathcal D_N)$. Тогда по теореме 3.2 выполнено неравенство (3.8) для любой функции $f\in\mathcal C(\mathbb T^d)$. Возьмем функцию $f$ из доказательства леммы 4.1, определенную в (4.2). По определению $f$ имеем $f(\xi^j)=0$ для всех $j=1,\dots,m$. Следовательно, $B_v(f,\mathcal D_N,L_p(\xi))=0$ и с помощью (4.5) получаем
По (2.5) получаем, что $\eta(L_p(\mathbb T^d,\mu_\xi),w) \leqslant (p-1)w^2/2$. Известно (см., например, [15; с. 342]), что для любого словаря $\mathcal D=\{g\}$, $\|g\|_X \leqslant 1$, в банаховом пространстве $X$ с $\eta(X,w) \leqslant \gamma w^q$, $1<q\leqslant 2$, выполнено
Отметим, что (4.8) доказано в [15] для действительных банаховых пространств. Ясно, что мы можем получить результаты для комплексных $\mathcal D_N$ из соответствующих результатов для действительных тригонометрических полиномов из $\mathcal T(2{\mathbf N},d)$.
Теорема 5.1 (см. [18]). Пусть $1<p<\infty$, $r>0$, $\beta\in (0,1]$. Предположим, что $\|\psi_{\mathbf k}\|_{L_p(\Omega,\mu)} \leqslant B$, ${\mathbf k}\in\mathbb Z^d$, с некоторой вероятностной мерой $\mu$ на $\Omega$. Тогда существуют две константы $c^*=c(r,\beta,p,d)$ и $C=C(r,\beta,p,d)$ такие, что для любого $v\in \mathbb{N}$ найдется $J\in\mathbb{N}$, не зависящее от меры $\mu$, $2^J \leqslant v^{c^*}$, со следующим свойством ($p^*:=\min\{p,2\}$):
Более того, эта оценка дается простым жадным алгоритмом.
Перейдем к новому результату о восстановлении по выборке (по значениям в точках). В доказательстве теоремы 5.3 (см. ниже) нам нужен следующий известный результат об универсальной дискретизации.
Теорема 5.2 (см. [4]). Пусть $1\leqslant p\leqslant 2$. Предположим, что $ \mathcal D_N{=}\,\{\varphi_j\}_{j=1}^N\subset\mathcal C(\Omega)$ – система, удовлетворяющая условиям (1.7) и (1.9) с некоторой постоянной $K\geqslant 1$. Пусть $\xi^1,\dots, \xi^m$ – независимые случайные точки на $\Omega$, распределенные согласно $\mu$. Тогда существуют постоянные $C=C(p)>1$ и $c=c(p)>0$ такие, что для целых чисел $1\leqslant u\leqslant N$ и
$$
\begin{equation*}
m \geqslant C Ku \log N (\log(2Ku ))^2 (\log (2Ku )+\log\log N)
\end{equation*}
\notag
$$
выполняются с вероятностью $\geqslant 1-2 \exp( -cm/(Ku\log^2 (2Ku)))$.
Теорема 5.3. Предположим, что $\Psi$ – равномерно ограниченная система Рисса (в пространстве $L_2(\Omega,\mu)$), удовлетворяющая (1.7) и (1.8) с некоторыми постоянными $0<R_1\leqslant R_2<\infty$. Пусть $2\leqslant p<\infty$ и $r>0$. Для $v\in\mathbb{N}$ обозначим $u:=\lceil (1+c)v\rceil$, где $c$ – постоянная из теоремы 3.1. Кроме того, предположим, что $\Psi \in \mathrm{NI}(2,p,H,u)$ с $p\in [2,\infty)$. Тогда существуют постоянные $c'=c'(r,\beta,p,R_1,R_2,d)$ и $C'=C'(r,\beta,p,d)$ такие, что имеет место неравенство
$$
\begin{equation}
\varrho_{m}^{o}({\mathbf A}^r_\beta(\Psi),L_p(\Omega,\mu)) \leqslant C' H v^{1/2 -1/\beta -r/d}
\end{equation}
\tag{5.2}
$$
для $m$, удовлетворяющего неравенству
$$
\begin{equation*}
m\geqslant c' v (\log(2v ))^4 .
\end{equation*}
\notag
$$
Более того, эта оценка дается АСОП.
Доказательство. Сначала мы воспользуемся теоремой 5.1 в пространстве $L_p(\Omega,\mu)$. В нашем случае $B=1$ и $2<p<\infty$, что влечет $p^*=2$. Рассмотрим систему $\Psi_J:=\{\psi_{\mathbf k}\}_{\|{\mathbf k}\|_\infty <2^J}$, $2^J \leqslant v^{c^*}$, из теоремы 5.1. Отметим, что $J$ не зависит от $\mu$. По теореме 3.1 с $\mathcal D_N=\Psi_J$ и теореме 5.2 с $p=2$ и $K=R_1^{-2}$ существуют $m$ точек $\xi^1,\dots, \xi^m\in \Omega$ с
$$
\begin{equation}
m\leqslant C u (\log N)^4
\end{equation}
\tag{5.3}
$$
таких, что для произвольной $f_0\in \mathcal C(\Omega)$ алгоритм АСОП с параметром слабости $t$, примененный к $f_0$ по системе $\mathcal D_N(\Omega_m)$ в пространстве $L_2(\Omega_m,\mu_m)$, для целого числа $v$, удовлетворяющего неравенствам $1\leqslant v \leqslant u/(1+c)$, дает
Для того чтобы оценить правую часть (5.4), применяем теорему 5.1 в пространстве $L_p(\Omega, \mu_\xi)$. Для того чтобы это можно было сделать, достаточно проверить, что $\|\psi_{\mathbf k}\|_{L_p(\Omega, \mu_\xi)} \leqslant 1$, ${\mathbf k}\in\mathbb Z^d$. Это следует из предположения, что $\Psi$ удовлетворяет (1.7). Таким образом, по теореме 5.1 получаем для $f_0 \in {\mathbf A}^r_\beta(\Psi)$
Следствие 5.1. Предположим, что $\Psi$ является равномерно ограниченной системой Рисса (в пространтстве $L_2(\Omega,\mu)$), удовлетворяющей (1.7) и (1.8) с некоторыми постоянными $0<R_1\leqslant R_2<\infty$. Пусть $2\leqslant p<\infty$ и $r>0$. Существуют постоянные $c=c(r,\beta,p,R_1,R_2,d)$ и $C=C(r,\beta,p,d)$ такие, что имеет место оценка
$$
\begin{equation*}
m\geqslant c v (\log(2v ))^4 .
\end{equation*}
\notag
$$
Более того, эта оценка дается АСОП.
Доказательство. Докажем, что система $\Psi$, удовлетворяющая условиям следствия 5.1, удовлетворяет условию $\Psi \in \mathrm{NI}(2,p,H,u)$ с $H=C(R_2) u^{1/2-1/p}$, которое требуется в теореме 5.3. Тогда следствие 5.1 вытекает из теоремы 5.3. Действительно, пусть
Мы вывели теорему 5.3 из теоремы 3.1. Сформулируем аналог теоремы 5.3, который может быть выведен из теоремы 3.3 таким же путем, каким теорема 5.3 была выведена из теоремы 3.1.
Теорема 5.4. Пусть $2\leqslant p<\infty$, и пусть $m$, $v$ – натуральные числа. Пусть $\Psi$ является равномерно ограниченной системой Бесселя, удовлетворяющей (1.7) и (1.9) и такой, что $\Psi \in \mathrm{NI}(2,p,H,2v)$. Существуют постоянные $c=c(r,\beta,p,K,d)$ и $C=C(r,\beta,p,d)$ такие, что имеет место оценка
В [4] отмечено, что известные результаты о свойстве ограниченной изометрии (англ. Restricted Isometry Property (RIP)) для тригонометрической системы могут быть использованы для улучшения результатов об универсальной дискретизации в норме $L_2$ в случае тригонометрической системы. Объясним это в деталях. Пусть $M\in \mathbb{N}$ и $d\in \mathbb{N}$. Обозначим $\Pi(M):=[-M,M]^d$ – $d$-мерный куб. Рассмотрим систему $\mathcal T^d(M):=\mathcal T^d(\Pi(M))$ функций $e^{i({\mathbf k},{\mathbf x})}$, ${\mathbf k} \in \Pi(M)$, определенную на $\mathbb T^d=[0,2\pi)^d$. Тогда $\mathcal T^d(M)$ – ортонормированная система в $L_2(\mathbb T^d,\mu)$ с нормированной мерой Лебега $\mu$ на $\mathbb T^d$. Для числа элементов этой системы имеем $N(M):=|\mathcal T^d(M)|=(2M+1)^d$. Мы заинтересованы в оценках на $m(\mathcal X_v(\mathcal T^d(M)),2)$ в специальном случае, когда $M\leqslant v^c$ с некоторой постоянной $c$, которая может зависеть от $d$. Тогда теорема 5.2 с $p=2$ дает
Докажем, что (5.11) не может быть существенно улучшена. Воспользуемся леммой 4.1. Возьмем $n\in\mathbb{N}$ и положим $N:=2^n-1$, ${\mathbf N}:=(N,\dots,N)$. Тогда для $f\in \mathcal T({\mathbf N},d)_2$ по неравенству Гёльдера с параметром $2/\beta$ получим
В этой работе мы подчеркиваем важность классов ${\mathbf A}^r_\beta(\Psi)$, которые определены с помощью структурных, а не гладкостных условий. Приведем краткую историю развития этой идеи. Первый результат, который связал наилучшие приближения $\sigma_v(f,\Psi)_2$ со сходимостью ряда $\sum_{k}|\langle f,\psi_k\rangle|$ был получен С. Б. Стечкиным [13] в 1955 г. в случае ортонормированной системы $\Psi$. Сейчас мы сформулируем его результат и более общий результат. Следующие классы были введены в [6] при изучении разреженных приближений по произвольным системам (словарям) $\mathcal D$ в гильбертовом пространстве $H$. Для общего словаря $\mathcal D$ и числа $\beta>0$ определим следующий класс функций (элементов):
и определим $\mathcal A_\beta(\mathcal D,M)$ как замыкание (в $H$) множества $\mathcal A^o_\beta(\mathcal D,M)$. Далее, определим $\mathcal A_\beta(\mathcal D)$ как объединение классов $\mathcal A_\beta(\mathcal D,M)$ по всем $M>0$. В случае, когда $\mathcal D$ – ортонормированная система, С. Б. Стечкин в [13] доказал (см. обсуждение этого результата в [7; п. 7.4]), что
$$
\begin{equation}
f\in \mathcal A_1(\mathcal D) \quad \text{тогда и только тогда, когда}\quad \sum_{v=1}^\infty (v^{1/2}\sigma_v(f,\mathcal D)_2)\frac{1}{v} <\infty.
\end{equation}
\tag{6.1}
$$
Следующий вариант (6.1) для классов $\mathcal A_\beta(\mathcal D)$, $\beta\in (0,2)$, был получен в [6]:
$$
\begin{equation}
f\in \mathcal A_\beta(\mathcal D) \quad \text{тогда и только тогда, когда}\quad \sum_{v=1}^\infty (v^{\alpha}\sigma_v(f,\mathcal D)_H)^\beta\frac{1}{v} <\infty,
\end{equation}
\tag{6.2}
$$
где $\alpha:=1/\beta-1/2$. В частности, (6.2) влечет, что для $f\in \mathcal A_\beta(\mathcal D)$, $\beta\in (0,2)$, имеем
Напомним, что соотношения (6.1)–(6.3) были доказаны для ортонормированной системы $\mathcal D$. Очень интересно отметить, что в действительности (6.3) остается справедливым для общей нормированной системы $\mathcal D$ при условии $\beta \in (0,1]$. В случае $\beta=1$ это было доказано Б. Мореем (см. [12]). Для $\beta \in (0,1]$ это было доказано в [6]. Отметим, что классы $\mathcal A_1(\mathcal D)$ и их обобщения на банаховы пространства играют фундаментальную роль в изучении наилучших $v$-членных приближений и свойств сходимости жадных приближений по общим словарям $\mathcal D$ (см. [15]). Этот факт побудил специалистов ввести и изучать функциональные классы, определяемые ограничениями на коэффициенты их разложений. Объясним этот подход в деталях.
Пусть, как и выше, система $\Psi:=\{\psi_{\mathbf k}\}_{{\mathbf k}\in \mathbb Z^d}$ индексирована ${\mathbf k}\in\mathbb Z^d$. Рассмотрим последовательность подмножеств $\mathcal G:=\{G_j\}_{j=1}^\infty$, $G_j \subset \mathbb Z^d$, $j=1,2,\dots$, таких, что
Для $\beta \in (0,1]$ и $r>0$ определим класс ${\mathbf A}^r_\beta(\Psi,\mathcal G)$ функций $f$, которые допускают представления (6.5), удовлетворяющие следующим условиям:
Также можно рассмотреть следующую, более узкую, версию этого класса ${\mathbf A}^r_\beta(\Psi,\mathcal G,\infty)$ – класс функций $f$, которые допускают представления (6.5), удовлетворяющие условиям
Вероятно, первая реализация идеи рассмотрения классов ${\mathbf A}^r_\beta(\Psi,\mathcal G)$ была осуществлена в [16] в специальном случае, когда $\Psi$ является тригонометрической системой $\mathcal T^d:=\{e^{i({\mathbf k},{\mathbf x})}\}_{{\mathbf k}\in\mathbb Z^d}$. Перейдем к определению классов ${\mathbf W}^{a,b}_A(\mathcal T^d)$ из [16], которые соответствуют случаю $\beta=1$. Приведем необходимые обозначения. Для вектора $\mathbf s=(s_1,\dots,s_d )$ с неотрицательными целыми координатами обозначим
Следующие классы, которые удобны при изучении разреженных приближений по тригонометрической системе, были введены и изучены в [16]. Для $f\in L_1(\mathbb T^d)$ определим
и классы ${\mathbf W}^{a,b}_A$ с $b=0$ аналогичны определенным выше классам ${\mathbf A}^a_1(\mathcal T^d,\mathcal G)$. Более узкая версия ${\mathbf A}^a_1(\mathcal T^d,\mathcal G,\infty)$ этих классов была недавно изучена в [9].
Классы ${\mathbf A}^r_\beta(\Psi)$, изучаемые в этой работе, соответствуют случаю классов ${\mathbf A}^r_\beta(\Psi,\mathcal G)$ с
Отметим, что классы ${\mathbf A}^r_\beta(\mathcal T^d)$ связаны с периодическими изотропными классами Никольского $H^r_q$. Имеется несколько эквивалентных определений классов $H^r_q$. Дадим удобное для нас определение. Пусть $r>0$ и $1\leqslant q\leqslant \infty$. Класс $H^r_q$ состоит из периодических функций $f$ от $d$ переменных, удовлетворяющих следующим условиям:
Например, легко видеть, что в случае $q=2$ и $r/d >1/2$ класс $H^r_q$ вложен в класс ${\mathbf A}^{r-d/2}_1(\mathcal T^d)$. Однако класс ${\mathbf A}^{r-d/2}_1(\mathcal T^d)$ значительно больше, чем класс $H^r_2$. Например, возьмем ${\mathbf k} \in G_j\setminus G_{j-1}$ с $G_j$, определенным в (6.8). Тогда функция $g_{\mathbf k}:=2^{-(r-d/2)j}e^{i({\mathbf k},{\mathbf x})}$ принадлежит ${\mathbf A}^{r-d/2}_1(\mathcal T^d)$, но не принадлежит никакому классу $H^{r'}_2$ с $r'> r-d/2$.
Приведем краткое сравнение результатов о восстановлении по выборке в классах $H^r_q$ и ${\mathbf A}^r_\beta(\mathcal T^d)$. Напомним постановку задачи об оптимальном линейном восстановлении. Для фиксированных $m$ и множества точек $\xi:=\{\xi^j\}_{j=1}^m\subset\Omega$ пусть $\Phi $ – линейный оператор из $\mathbb C^m$ в $L_p(\Omega,\mu)$. Определим для класса ${\mathbf F}$ (обычно центрально симметричное и компактное подмножество $L_p(\Omega,\mu)$) (см. [14])
Ясно, что (6.9) влечет такие же верхние оценки для $\varrho^o_m(H^r_q,L_p)$. Результаты о нижних оценках для $\varrho^o_m(\mathcal T({\mathbf N},d)_q,L_p)$ из [18; лемма 4.3] и лемма 4.1 этой работы показывают, что выполнено следующее соотношение:
Соотношения (6.11)–(6.13) означают, что мы получаем близкие оценки для класса $H^r_2$ и более широкого класса ${\mathbf A}^{r-d/2}_1(\mathcal T^d)$, $r>d/2$. Отметим, что для класса $H^r_2$ мы получаем такие же оценки для линейного восстановления по выборке. В [18] доказано, что для линейного восстановления по выборке в классе ${\mathbf A}^r_\beta(\mathcal T^d)$ имеем
Неравенства (6.14) с $\beta=1$ и (6.13) с $p=2$ демонстрируют, что нелинейное восстановление по выборке обеспечивает лучшие гарантии ошибки, чем линейное восстановление по выборке.
Список литературы
1.
J. Bourgain, “An improved estimate in the restricted isometry problem”, Geometric aspects of functional analysis, Lecture Notes in Math., 2116, Springer, Cham, 2014, 65–70
2.
Ф. Дай, А. Примак, В. Н. Темляков, С. Ю. Тихонов, “Дискретизация интегральной нормы и близкие задачи”, УМН, 74:4(448) (2019), 3–58; англ. пер.: F. Dai, A. Prymak, V. N. Temlyakov, S. Yu. Tikhonov, “Integral norm discretization and related problems”, Russian Math. Surveys, 74:4 (2019), 579–630
3.
F. Dai, V. Temlyakov, “Universal sampling discretization”, Constr. Approx., 58:3 (2023), 589–613
4.
F. Dai, V. Temlyakov, “Random points are good for universal discretization”, J. Math. Anal. Appl., 529:1 (2024), 127570, 28 pp. ; arXiv: 2301.12536
5.
F. Dai, V. Temlyakov, Lebesgue-type inequalities in sparse sampling recovery, arXiv: 2307.04161v1
6.
R. A. DeVore, V. N. Temlyakov, “Some remarks on greedy algorithms”, Adv. Comput. Math., 5:2-3 (1996), 173–187
7.
Dinh Dũng, V. Temlyakov, T. Ullrich, Hyperbolic cross approximation, Adv. Courses Math. CRM Barcelona, Birkhäuser/Springer, Cham, 2018, xi+218 pp.
8.
I. Haviv, O. Regev, “The restricted isometry property of subsampled Fourier matrices”, Geometric aspects of functional analysis, Lecture Notes in Math., 2169, Springer, Cham, 2017, 163–179
9.
T. Jahn, T. Ullrich, F. Voigtlaender, Sampling numbers of smoothness classes via $\ell^1$-minimization, arXiv: 2212.00445v1
10.
B. Kashin, E. Kosov, I. Limonova, V. Temlyakov, “Sampling discretization and related problems”, J. Complexity, 71 (2022), 101653, 55 pp.
11.
E. D. Livshitz, V. N. Temlyakov, “Sparse approximation and recovery by greedy algorithms”, IEEE Trans. Inform. Theory, 60:7 (2014), 3989–4000; arXiv: 1303.3595v1
12.
G. Pisier, “Remarques sur un résultat non publié de B. Maurey”, Seminaire d'analyse fonctionalle, Exp. No. V, v. 1980–1981, École Polytechnique, Centre de Mathématiques, Palaiseau, 1981, 12 pp.
13.
С. Б. Стечкин, “Об абсолютной сходимости ортогональных рядов”, Докл. АН СССР, 102 (1955), 37–40
14.
V. N. Temlyakov, “On approximate recovery of functions with bounded mixed derivative”, J. Complexity, 9:1 (1993), 41–59
15.
V. Temlyakov, Greedy approximation, Cambridge Monogr. Appl. Comput. Math., 20, Cambridge Univ. Press, Cambridge, 2011, xiv+418 pp.
16.
В. Н. Темляков, “Конструктивные разреженные тригонометрические приближения и другие задачи для функций смешанной гладкости”, Матем. сб., 206:11 (2015), 131–160; англ. пер.: V. N. Temlyakov, “Constructive sparse trigonometric approximation and other problems for functions with mixed smoothness”, Sb. Math., 206:11 (2015), 1628–1656; arXiv: 1412.8647v1
17.
V. Temlyakov, Multivariate approximation, Cambridge Monogr. Appl. Comput. Math., 32, Cambridge Univ. Press, Cambridge, 2018, xvi+534 pp.
18.
V. Temlyakov, Sparse sampling recovery by greedy algorithms, arXiv: 2312.13163v2
19.
J. F. Traub, G. W. Wasilkowski, H. Woźniakowski, Information-based complexity, Comput. Sci. Sci. Comput., Academic Press, Inc., Boston, MA, 1988, xiv+523 pp.
Образец цитирования:
В. Н. Темляков, “Разреженное восстановление в некоторых функциональных классах в интегральных нормах”, Матем. сб., 215:10 (2024), 146–166; V. N. Temlyakov, “Sparse sampling recovery in integral norms on some function classes”, Sb. Math., 215:10 (2024), 1406–1425