Теория вероятностей и ее применения
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор
Подписка
Правила для авторов
Загрузить рукопись

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Теория вероятн. и ее примен.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Теория вероятностей и ее применения, 2024, том 69, выпуск 2, страницы 272–284
DOI: https://doi.org/10.4213/tvp5690
(Mi tvp5690)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

О близости распределений последовательных сумм в метрике Прохорова

А. Ю. Зайцевab

a Санкт-Петербургское отделение Математического института им. В. А. Стеклова Российской академии наук, Санкт-Петербург, Россия
b Санкт-Петербургский государственный университет, Санкт-Петербург, Россия
Список литературы:
Аннотация: Пусть $X, X_1,\dots, X_n,\dots$ — независимые одинаково распределенные $d$-мерные случайные векторы с общим распределением $F$. Пусть $F_{(n)}$ — распределение нормированного случайного вектора $X/\sqrt{n}$. Тогда $(X_1+\dots+X_n)/\sqrt{n}$ имеет распределение $F_{(n)}^n$ (степень понимается в смысле свертки). Пусть $\pi(\,{\cdot}\,,{\cdot}\,)$ — расстояние Прохорова. Основной результат состоит в следующем. Для любого $d$-мерного распределения $F$ существуют $c_1(F)>0$ и $c_2(F)>0$, зависящие только от $F$ и такие, что $\pi(F_{(n)}^n, F_{(n)}^{n+1})\leqslant c_1(F)/\sqrt n$ и $(F^n)\{A\} \le (F^{n+1})\{A^{c_2(F)}\}+c_2(F)/\sqrt{n}$, $(F^{n+1})\{A\} \leqslant (F^n)\{A^{c_2(F)}\}+c_2(F)/\sqrt{n}$ для любого борелевского множества $A$ и для всех натуральных чисел $n$ (здесь $A^{\varepsilon}$ обозначает $\varepsilon$-окрестность множества $A$).
Ключевые слова: суммы независимых случайных векторов, близость последовательных сверток, выпуклые множества, расстояние Прохорова, неравенства.
Финансовая поддержка Номер гранта
Министерство науки и высшего образования Российской Федерации 075-15-2022-289
Данная работа была поддержана Санкт-Петербургским международным математическим институтом имени Леонарда Эйлера, грантовое соглашение № 075-15-2022-289 от 06.04.2022.
Поступила в редакцию: 15.12.2023
Дата публикации: 25.04.2024
Английская версия:
Theory of Probability and its Applications, 2024, Volume 69, Issue 2, Pages 217–226
DOI: https://doi.org/10.1137/S0040585X97T991878
Реферативные базы данных:
Тип публикации: Статья

1. Близость распределений последовательных сумм на выпуклых множествах

В этой статье мы дадим подробное доказательство результата, сформулированного в недавней работе автора [26].

Пусть $X,X_1,\dots, X_n,\dots$ — независимые одинаково распределенные $d$-мерные случайные векторы с общим распределением $F$. Тогда $S_n = X_1+\dots+X_n$ имеет распределение $F^n$ (степень понимается в смысле свертки). Мы изучаем, насколько отличается распределение $F^{n+1}$ от $F^n$, т.е. насколько может измениться распределение суммы $S_n$ после добавления к ней очередного независимого слагаемого. Будет показано, что различие между этими распределениями невелико, причем оно не просто стремится к нулю при $n\to\infty$, а имеет порядок $O(n^{-1/2})$, стандартный для оценок в предельных теоремах теории вероятностей.

Суммы независимых случайных величин и векторов — классический объект теории вероятностей. Начиная с изучения биномиального распределения, появившегося в схеме Бернулли еще в восемнадцатом веке, свойства распределений сумм независимых одинаково распределенных слагаемых были одним из основных предметов исследования. При некоторых (иногда весьма ограничительных) условиях были найдены все возможные предельные распределения для центрированных и нормированных сумм (см. [2], [5], [13]). В новых результатах работы автора [26] установлена устойчивость по количеству слагаемых распределений сумм независимых одинаково распределенных векторов при произвольных распределениях слагаемых в конечномерных евклидовых пространствах. При этом полученные оценки имеют оптимальный порядок $O(n^{-1/2})$ при сравнении значений вероятностей попадания в произвольное выпуклое множество для сумм $n$ и $n+1$ слагаемых. Удивительно, но в такой простой и естественной постановке задача рассматривалась ранее только в работах автора (в том числе совместных) начиная с 1980-х годов (см. [1], [21]–[25]).

Такая постановка задачи естественно возникает при рассмотрении задачи А. Н. Колмогорова [10] об оценивании точности безгранично делимой аппроксимации распределений сумм независимых одинаково распределенных случайных величин. Л. Ле Кам [11] показал, что естественным безгранично делимым приближением для $F^n$ может быть сопровождающее обобщенное распределение Пуассона

$$ \begin{equation*} e(nF)=e^{-n}\sum_{s=0}^\infty \frac{n^sF^s}{s!}, \end{equation*} \notag $$
предложенное Б. В. Гнеденко (см. [5], [9]). Ясно, что при оценивании близости распределений $F^n$ и $e(nF)$ полезно уметь оценивать близость распределений $F^n$ и $F^s$.

Нам потребуются некоторые обозначения. Обозначим через $\mathfrak F_d$ совокупность вероятностных распределений, определенных на борелевской $\sigma$-алгебре $\mathcal{B}_d$ подмножеств евклидова пространства $\mathbf{R}^d$.

Определим расстояния между распределениями $F, G\in\mathfrak F_d$:

$$ \begin{equation*} \begin{aligned} \, \rho_{\mathcal{C}_d}(F, G) &= \sup_{A\in\mathcal{C}_d} |F\{A\} - G\{A\}|, \\ \rho_{\mathrm{TV}}(F, G) &= \sup_{A\in\mathcal{B}_d} |F\{A\} - G\{A\}|, \end{aligned} \end{equation*} \notag $$
где $\mathcal{C}_d $ — совокупность выпуклых подмножеств пространства $\mathbf{R}^d$. Символами $c$ и $c(\,{\cdot}\,)$ мы обозначаем, вообще говоря, различные положительные абсолютные постоянные и величины, зависящие только от аргумента в скобках. Распределение случайного вектора $\xi$ обозначается $\mathcal L(\xi)$.

Следующая теорема является основным результатом работы автора [26].

Теорема 1. Для любого нетривиального распределения $F$ найдется величина $c(F)$, зависящая только от $F$ и такая, что

$$ \begin{equation} \rho_{\mathcal{C}_d}(F^n, F^{n+1}) \leqslant\frac{c(F)}{\sqrt{n}} \end{equation} \tag{1} $$
при всех натуральных $n$.

Распределение $F$ считается тривиальным, если оно сосредоточено на аффинной гиперплоскости, не содержащей начало координат. Ясно, что для таких $F$ имеет место равенство

$$ \begin{equation} \rho_{\mathcal{C}_d}(F^n, F^{n+1}) =1. \end{equation} \tag{2} $$
Тривиальность означает, что (2) тривиально выполняется для тривиального $F$, поскольку гиперплоскости являются выпуклыми множествами, а распределения $F^n$ и $F^{n+1}$ сосредоточены на непересекающихся гиперплоскостях. В одномерном случае тривиальными являются распределения $E_a$, сосредоточенные в точках $a\ne0$.

Теорема 1 является очень общим результатом. Оценка (1) и равенство (2) дают полную информацию о близости распределений $F^n$ и $F^{n+1}$ на произвольных выпуклых множествах для произвольных распределений $F\in\mathfrak F_d$. Константа $c(F)$ в неравенстве (1) может быть сколь угодно большой, если распределение $F$ близко к некоторому тривиальному распределению.

В одномерном случае утверждение теоремы 1 содержится в [1; гл. V, теорема 4.2]. Оно известно для невырожденных гауссовских распределений $\Phi\in\mathfrak F_d$, причем оценка справедлива даже для расстояния по вариации:

$$ \begin{equation} \rho_{\mathrm{TV}}(\Phi^n, \Phi^{n+1}) \leqslant\frac{c(\Phi)}{\sqrt{n}}. \end{equation} \tag{3} $$

Это неравенство можно вывести из следующей леммы (см. [18], [12; лемма 8], а также [6; неравенства (1.3), (1.7)]).

Лемма 1. Пусть $\Phi_k\in\mathfrak F_d$, $k=1,2$, — гауссовские распределения с невырожденными ковариационными матрицами $\Sigma_k$ и средними значениями $b_k$. Тогда

$$ \begin{equation*} \rho_{\mathrm{TV}}(\Phi_1, \Phi_2) \leqslant\frac{1}{2}\bigl(\bigl\|\Sigma_1^{-1/2}\Sigma_2\Sigma_1^{-1/2}-I_d\bigr\|_{\mathrm{F}} +\bigl\|\Sigma_2^{-1/2}(b_1-b_2)\bigr\|\bigr), \end{equation*} \notag $$
где $\|\,{\cdot}\,\|_{\mathrm{F}}$ — норма Фробениуса, а $I_d$ — единичная ($d\times d)$-матрица.

Для доказательства оценки (3) следует применить лемму 1 с $\Sigma_1=n\Sigma$, $\Sigma_2=(n+1)\Sigma$, $b_1=nb$, $b_2= (n+1)b$, где $\Sigma$ и $b$ — ковариационная матрица и среднее значение случайного вектора $\xi$ с распределением $\mathcal{L}(\xi)=\Phi$.

Ясно, что для тривиального гауссовского распределения $\Phi$ справедливо равенство

$$ \begin{equation} \rho_{\mathrm{TV}}(\Phi^n, \Phi^{n+1})=1. \end{equation} \tag{4} $$
Такое распределение имеет вырожденную ковариационную матрицу и ненулевое среднее значение.

В монографии [1; гл. V, § 4 и § 5] приведены и другие оценки близости $n$- и $(n+1)$-кратных сверток вероятностных распределений (см. также работы [7], [8], [25], [26]).

В работе автора [26] теорема 1 сравнительно несложно выводится с помощью неравенства (3) и следующей леммы 2, принадлежащей В. В. Сазонову [15] (см. также [3], [16]).

Лемма 2. Пусть $F\in\mathfrak F_d$ — вероятностное распределение, удовлетворяющее условию

$$ \begin{equation*} \int_{\mathbf{R}^{d}}\|x\|^3\,F\{dx\}<\infty, \end{equation*} \notag $$
а $\Phi$ — гауссовское распределение с той же ковариационной матрицей и тем же средним значением, что у распределения $F$. Тогда найдется величина $c(F)$, зависящая только от $F$ и такая, что
$$ \begin{equation*} \rho_{\mathcal{C}_d}(F^n, \Phi^{n}) \leqslant\frac{c(F)}{\sqrt{n}} \end{equation*} \notag $$
при всех натуральных $n$.

При $d=1$ лемма 2 вытекает из хорошо известного неравенства Берри–Эссеена. Ясно, что для распределений с конечными моментами третьего порядка утверждение теоремы 1 легко выводится из оценки (3) и леммы 2 с помощью неравенства треугольника.

2. Оценки расстояния Прохорова

В этом разделе мы сформулируем аналог теоремы 1 для расстояния Прохорова [14], метризирующего слабую сходимость вероятностных распределений (см. теорему 3). Вопрос о возможности получения такого аналога был задан Ю. А. Давыдовым во время доклада автора, посвященного теореме 1.

Расстояние Прохорова между распределениями $G,H\in\mathfrak F_d$ определяется равенством

$$ \begin{equation} \begin{aligned} \, \pi(G,H) &=\inf \bigl\{ \varepsilon>0\colon G\{A\}\leqslant H\{A^{\varepsilon}\}+\varepsilon,\, H\{A\}\leqslant G\{A^{\varepsilon}\}+\varepsilon \nonumber \\ &\qquad\qquad\qquad \text{для любого борелевского множества }A\bigr\}, \end{aligned} \end{equation} \tag{5} $$
где $A^{\varepsilon }=\{y\in \mathbf{R}^{d}\colon\inf_{x\in A}\|x-y\| <\varepsilon \}$ обозначает $\varepsilon$-окрестность множества $A$.

Нам понадобится следующее свойство расстояния Прохорова.

Лемма 3 (см. [27]). Пусть $F, G, H\in\mathfrak F_d$ — произвольные распределения. Тогда $\pi(FH, GH)\leqslant \pi(F,G)$.

Следующую лемму 4 обычно называют теоремой Штрассена–Дадли (см. [4], [17], [19]).

Лемма 4. Пусть $F, G\in\mathfrak F_d$ — произвольные распределения. Тогда

$$ \begin{equation} \begin{aligned} \, \pi(F, G) &=\inf \bigl\{ \varepsilon>0 \colon \textit{можно построить на одном и том же} \nonumber \\ &\qquad\quad\textit{вероятностном пространстве случайные векторы }\xi\textit{ и }\eta \nonumber \\ &\qquad\quad\textit{с }\mathcal{L}(\xi)=F\textit{ и }\mathcal{L}(\eta)=G\textit{ так, что } \mathbf{P}\{\|\xi -\eta\| >\varepsilon\}\leqslant \varepsilon \bigr\}. \end{aligned} \end{equation} \tag{6} $$

Если $X$ — случайный вектор с распределением $F$ и $a>0$, мы будем обозначать через $F_{(a)}$ распределение нормированного случайного вектора $X/\sqrt{a}$. Следующую лемму 5 легко вывести с помощью леммы 4.

Лемма 5. Пусть $ F, G\in\mathfrak F_d$ — произвольные распределения. Тогда для любых $a,b>0$

$$ \begin{equation*} \pi(F_{(b)},G_{(b)})\leqslant\max\biggl\{\frac{\sqrt{a}}{\sqrt{b}}, 1\biggr\} \pi(F_{(a)},G_{(a)}). \end{equation*} \notag $$

Доказательство теоремы 3 проводится индукцией по размерности $d$. Остальные шаги доказательства вспомогательной теоремы 2 почти дословно повторяют доказательство теоремы 1 в [26]. Только вместо леммы 2 следует использовать следующую лемму 6, принадлежащую В. В. Юринскому [20].

Лемма 6. Пусть $F\in\mathfrak F_d$ — вероятностное распределение, удовлетворяющее условию

$$ \begin{equation*} \int_{\mathbf{R}^{d}}\|x\|^3\,F\{dx\}<\infty, \end{equation*} \notag $$
а $\Phi$ — гауссовское распределение с той же ковариационной матрицей и тем же средним значением, что у распределения $F$. Тогда существует величина $c(F)$, зависящая только от $F$ и такая, что
$$ \begin{equation*} \pi\bigl(F_{(n)}^n, \Phi_{(n)}^{n}\bigr) \leqslant\frac{c(F)}{\sqrt{n}} \end{equation*} \notag $$
для всех натуральных чисел $ n$.

Величина $c(F)$ из формулировки леммы 6 зависит от моментов распределения $F$ до третьего порядка включительно. Изначальная формулировка леммы 6 в работе В. В. Юринского [20] немного иная. Случайные векторы нормируются не только на $\sqrt{n}$, но и на $\sigma$, где $\sigma^2$ — максимальное собственное значение ковариационной матрицы слагаемых. Чтобы получить утверждение леммы 6, следует дополнительно воспользоваться леммой 5.

Биномиальное распределение с параметрами $n$, $p$ может быть представлено в виде

$$ \begin{equation*} B_{n,p}=\sum_{k=0}^{n}b_k(n,p)E_k, \end{equation*} \notag $$
где
$$ \begin{equation*} b_k(n, p)=C_n^k (1-p)^{n-k}p^k, \end{equation*} \notag $$
а $C_n^k=n!/(k!\,(n-k)!)$ — биномиальные коэффициенты. Мы будем использовать следующее утверждение о близости биномиальных распределений по вариации.

Лемма 7 (см. [26; лемма 3]). При $0<p<1$ имеет место неравенство

$$ \begin{equation} \rho_{\mathrm{TV}}(B_{n,p}, B_{n+1,p})\leqslant\frac{c(p)}{\sqrt{n}} \end{equation} \tag{7} $$
для любого натурального $n$.

Эту лемму тоже можно рассматривать как оценку близости $n$- и $(n+1)$-кратных сверток, поскольку $B_{n,p}=(B_{1,p})^n$.

Основным результатом статьи является теорема 3, сформулированная в работе [26]. Мы докажем эту теорему в разделе 3. Теорема 2 представляет собой вспомогательный результат, дающий оценку для невырожденных распределений $F$.

Теорема 2. Предположим, что $F\in\mathfrak F_d$ — вероятностное распределение такое, что

$$ \begin{equation} F=(1-p)U+pV, \end{equation} \tag{8} $$
где $0<p<1$, $U\in\mathfrak F_d$ — вероятностное распределение с ограниченным носителем и невырожденной ковариационной матрицей, а $V\in\mathfrak F_d$ — некоторое вероятностное распределение. Тогда существует величина $c(F)$, зависящая только от $F$ и такая, что
$$ \begin{equation} \pi\bigl(F_{(n)}^n, F_{(n)}^{n+1}\bigr) \leqslant\frac{c(F)}{\sqrt{n }} \end{equation} \tag{9} $$
для всех натуральных $n$.

Величина $c(F)$ из формулировки теоремы 2 зависит от $p$ и моментов распределения $U$ до третьего порядка включительно. Представление распределения $F$ в виде (8) не единственно. Поэтому минимизацию величины $c(F)$ по выбору представления (8) можно рассматривать как отдельную задачу.

Теорема 3. Для любого распределения $F\in\mathfrak F_d$ существует величина $c(F)$, зависящая только от $F$ и такая, что

$$ \begin{equation} \pi\bigl(F_{(n)}^n, F_{(n)}^{n+1}\bigr) \leqslant\frac{c(F)}{\sqrt{n }} \end{equation} \tag{10} $$
для всех натуральных $n$.

Правая часть неравенства (10) имеет правильный порядок по $n$. Чтобы убедиться в этом, достаточно взять в качестве $F$ симметричное одномерное распределение $F=E_{-1}/2+E_{1}/2$ и четное $n$. Тогда распределения $F_{(n)}^n$ и $F_{(n)}^{n+1}$ сосредоточены соответственно на множествах $\{2k/\sqrt{n},\, k\in \mathbf{Z}\}$ и $\{(2k+1)/\sqrt{n}, \, k\in \mathbf{Z}\}$, причем

$$ \begin{equation} \max_k\mathbf{P}\{S_{n}=k\}=\mathbf{P}\{S_{n}=0\}\geqslant\frac{c}{\sqrt{n}}. \end{equation} \tag{11} $$
Последнее неравенство в формуле (11) несложно выводится с помощью формулы Стирлинга. Из сказанного следует, что
$$ \begin{equation*} \pi\bigl(F_{(n)}^n, F_{(n)}^{n+1}\bigr) \geqslant\frac{c}{\sqrt{n}}. \end{equation*} \notag $$

В теоремах 2 и 3 мы не делим распределения на тривиальные и нетривиальные. Заметим, что для всех $G,H\in\mathfrak F_d$

$$ \begin{equation} \pi(G, H) \leqslant \rho_{\mathrm{TV}}(G, H). \end{equation} \tag{12} $$
Так что для невырожденных гауссовских распределений утверждение теоремы 3 следует из неравенства (3).

Легко видеть, что для всех $a, b\in\mathbf{R}^d$

$$ \begin{equation} \pi(E_a, E_b) =\min\{1,\|b-a\|\}. \end{equation} \tag{13} $$

Ясно, что $F_{(n)}^n$ — это распределение нормированной суммы $S_n/\sqrt{n}$, которое не близко к вырожденному распределению $E_0$, если только распределение $F$ не вырождено. Действительно, используя неравенство Колмогорова–Рогозина для функций концентрации Леви (см. [1; гл. II, теорема 2.4]), можно показать, что для любого невырожденного распределения $F$ существует $c(F)$ такое, что

$$ \begin{equation*} \mathbf{P}\biggl\{\biggl\|\frac{S_n}{\sqrt{n}}\biggr\|\leqslant c(F)\biggr\}\leqslant \frac12. \end{equation*} \notag $$
В то же время очевидно, что можно выбрать нормирующие константы $\varphi(n)$ настолько большими, что $\pi(\mathcal{L}(S_n/\varphi(n)), \mathcal{L}(S_{n+1}/\varphi(n)))$ мало из-за того, что оба распределения близки к вырожденному распределению $E_0$.

Таким образом, нормировка на $\sqrt{n}$ естественна при рассмотрении расстояния Прохорова, которое не инвариантно относительно преобразования масштаба. Для распределений ненормированных сумм утверждение теоремы 3, вообще говоря, может быть неверно. В частности, $\pi(F^n, F^{n+1})=1$ для $F=E_a$ при $\|a\|\geqslant 1$ (см. (13)).

Из теоремы 3, леммы 4 и определения расстояния Прохорова легко вывести следующие теоремы 4 и 5.

Теорема 4. Для любого распределения $F\in\mathfrak F_d$ найдется величина $c(F)$, зависящая только от $F$ и такая, что

$$ \begin{equation*} \begin{aligned} \, (F^n)\{A\} &\leqslant (F^{n+1})\{A^{c(F)}\}+\frac{c(F)}{\sqrt{n}}, \\ (F^{n+1})\{A\} &\leqslant (F^n)\{A^{c(F)}\}+\frac{c(F)} {\sqrt{n}} \end{aligned} \end{equation*} \notag $$
для любого борелевского множества $A$ при всех натуральных $n$.

Теорема 5. Для любого распределения $F\in\mathfrak F_d$ найдется величина $c(F)$, зависящая только от $F$ и такая, что для любого натурального $n$ можно построить на одном вероятностном пространстве случайные векторы $\xi_n$ и $\eta_n$ с распределениями $\mathcal{L}(\xi_n)=F^{n+1}$ и $\mathcal{L}(\eta_n)=F^n$ так, что

$$ \begin{equation} \mathbf{P}\{ \|\xi_n -\eta_n \| >c(F)\} \leqslant \frac{c(F)}{\sqrt{n}}. \end{equation} \tag{14} $$

Заметим, что векторы $\xi_n=S_{n+1}$ и $\eta_n=S_n$ имеют требуемые распределения, но для вектора $\xi_n -\eta_n=X_{n+1}$ в этом случае не выполняется неравенство (14) — разумеется, если распределение $F$ имеет неограниченный носитель. Если же носитель распределения $F$ ограничен, то утверждение теоремы 5 при $\xi_n=S_{n+1}$ и $\eta_n=S_n$ очевидно, причем правую часть неравенства (14) можно заменить на нуль.

Теоремы 35 также являются очень общими утверждениями. Они описывают близость распределений $F^n$ и $F^{n+1}$ на произвольных борелевских множествах для произвольных распределений $F\in\mathfrak F_d$. На самом деле утверждения теорем 35 эквивалентны. Заметим при этом, что теоремы 4 и 5 говорят о близости распределений $F^{n+1}$ и $F^n$ ненормированных векторов $S_{n+1}$ и $S_n$, что еще раз указывает на естественность выбора нормировки на $\sqrt{n}$ при рассмотрении распределений $F_{(n)}^{n}$ и $F_{(n)}^{n+1}$ векторов $S_{n}/\sqrt{n}$ и $S_{n+1}/\sqrt{n}$ в формулировке теоремы 3.

Пусть $\xi_1, \xi_2, \dots$ — независимые одинаково распределенные случайные векторы с общим распределением $F\in\mathfrak F_d$, и пусть $\mu$ — целочисленная неотрицательная случайная величина, не зависящая от последовательности $\{\xi_j\}_{j=1}^\infty$. Обозначим

$$ \begin{equation*} G=\mathcal{L}(\xi_1+\cdots+\xi_\mu). \end{equation*} \notag $$
Хорошо известно, что тогда
$$ \begin{equation} G=\sum_{k=0}^\infty\mathbf{P}\{\mu=k\}F^k. \end{equation} \tag{15} $$
Ясно, что оценки близости распределений $F^{n+1}$ и $F^n$ могут быть полезны при сравнении между собой распределений вида (15) (см. [1; гл. V, § 5], [7], [8]).

3. Доказательства

Доказательство теоремы 2. Имеют место представления
$$ \begin{equation} \begin{aligned} \, F_{(n)} &=(1-p)U_{(n)}+pV_{(n)}, \\ F_{(n)}^n &=\sum_{k=0}^{n}b_k(n,p)V^k_{(n)}U_{(n)}^{n-k}, \\ F_{(n)}^{n+1} &=\sum_{k=0}^{n+1}b_k(n+1, p)V_{(n)}^kU_{(n)}^{n+1-k}. \end{aligned} \end{equation} \tag{16} $$

Введем распределения

$$ \begin{equation*} G_n=\sum_{k=0}^{n}b_k(n,p)V_{(n)}^kU_{(n)}^{n+1-k}. \end{equation*} \notag $$
Пусть $\Phi $ — гауссовское распределение с той же ковариационной матрицей и тем же средним, что у распределения $U$. Применяя неравенства (3), (12) и леммы 3, 5, 6, получаем, что при $k\in\mathbf{Z}$, $0\leqslant k< np(2-p)$, справедливы оценки
$$ \begin{equation} \begin{aligned} \, &\pi\bigl(V_{(n)}^k U_{(n)}^{n-k},V_{(n)}^k U_{(n)}^{n+1-k}\bigr)\leqslant\pi\bigl(U_{(n)}^{n-k}, U_{(n)}^{n+1-k}\bigr) \nonumber \\ &\qquad\leqslant\pi\bigl(U_{(n)}^{n-k}, \Phi_{(n)}^{n-k}\bigr)+\pi\bigl(\Phi_{(n)}^{n-k}, \Phi_{(n)}^{n+1-k}\bigr)+\pi\bigl(\Phi_{(n)}^{n+1-k}, U_{(n)}^{n+1-k}\bigr) \nonumber \\ &\qquad\leqslant\pi\bigl(U_{(n-k)}^{n-k}, \Phi_{(n-k)}^{n-k}\bigr)+\pi\bigl(\Phi_{(n-k)}^{n-k}, \Phi_{(n-k)}^{n+1-k}\bigr)+c\pi\bigl(\Phi_{(n+1-k)}^{n+1-k}, U_{(n+1-k)}^{n+1-k}\bigr) \nonumber \\ &\qquad\leqslant\frac{c(F)}{\sqrt{n-k}}+\frac{c(\Phi)}{\sqrt{n-k}}+\frac{c(F)}{\sqrt{n+1-k}} \leqslant\frac{c(F)}{\sqrt{n-k}}<\frac{c(F)}{\sqrt{n}}=\varepsilon_n \end{aligned} \end{equation} \tag{17} $$
(мы воспользовались тем, что $0<p(2-p)<1$ при $0<p<1$).

Пусть $\eta_{n,p}$ — случайная величина с биномиальным распределением $B_{n,p}$. Согласно неравенству Бернштейна (см. [1; гл. I, теорема 4.1]),

$$ \begin{equation} \mathbf{P}\{\eta_{n,p}\geqslant np(2-p)\}=\mathbf{P}\{\eta_{n,p}-np\geqslant np(1-p)\} \leqslant\exp\biggl(-\frac{np(1-p)}4\biggr). \end{equation} \tag{18} $$
Используя (17), (18), мы получаем для любого борелевского множества $A$ соотношения
$$ \begin{equation*} \begin{aligned} \, &F_{(n)}^n\{A\}=\sum_{k=0}^{n}b_k(n,p)V_{(n)}^kU_{(n)}^{n-k}\{A\} \\ &\ =\sum_{np(2-p)\leqslant k\leqslant n} b_k(n,p)V_{(n)}^kU_{(n)}^{n-k}\{A\} + \sum_{0\leqslant k < np(2-p)} b_k(n,p) V_{(n)}^kU_{(n)}^{n-k}\{A\} \\ &\ \leqslant\mathbf{P}\{\eta_{n,p}\geqslant np(2-p)\} + \sum_{0\leqslant k< np(2-p)} b_k(n,p) \bigl(V_{(n)}^kU_{(n)}^{n+1-k}\{A^{\varepsilon_n}\}+\varepsilon_n\bigr) \\ &\ \leqslant\exp\biggl(-\frac{np(1-p)}4\biggr)+G_n\{A^{\varepsilon_n}\}+\varepsilon_n\leqslant G_n\{A^{\varepsilon_n}\}+\frac{c(F)}{\sqrt{n}}. \end{aligned} \end{equation*} \notag $$
Аналогично доказывается, что
$$ \begin{equation*} G_n\{A\}\leqslant F_{(n)}^n\{A^{\varepsilon_n}\}+\frac{c(F)}{\sqrt{n}}. \end{equation*} \notag $$

Следовательно,

$$ \begin{equation} \pi\bigl(F_{(n)}^{n},G_n\bigr)\leqslant\frac{c(F)}{\sqrt{n}}. \end{equation} \tag{19} $$

Ясно, что

$$ \begin{equation} \pi\bigl(G_n,F_{(n)}^{n+1}\bigr)\leqslant\sum_{k=0}^{n+1}|b_k(n,p)-b_k(n+1,p)| =2\rho_{\mathrm{TV}}(B_{n,p}, B_{n+1,p}) \end{equation} \tag{20} $$
(разумеется, мы полагаем $b_{n+1}(n,p)=0$). Остается применить неравенства (19), (20) и лемму 7. Теорема доказана.

Доказательство теоремы 3. Мы воспользуемся индукцией по размерности $d$. Пусть $d=1$ и $F=E_a$, где $a\in\mathbf{R}$. Тогда
$$ \begin{equation*} F_{(n)}^n=E_{na/\sqrt{n}},\quad F_{(n)}^{n+1}=E_{(n+1)a/\sqrt{n}} \end{equation*} \notag $$
и, используя (13), мы имеем
$$ \begin{equation*} \pi\bigl(F_{(n)}^n, F_{(n)}^{n+1}\bigr) =\pi\bigl(E_0, E_{a/\sqrt {n}}\bigr)\leqslant \frac{|a|}{\sqrt{n}}, \end{equation*} \notag $$
что и доказывает оценку (10) в этом случае. Если распределение $F$ не вырождено, $F\ne E_a$, мы можем представить $F$ в виде (8) так, чтобы $(1-p)U$ и $pV$ являлись сужениями меры $F$ соответственно на интервал $[-T,T]$ и на $\mathbf{R}\setminus[-T,T]$, дополнение к этому интервалу. Выбирая достаточно большое $T$, мы можем обеспечить отличие от нуля дисперсии случайной величины $\xi$ с распределением $\mathcal{L}(\xi)=U$. Теперь из теоремы 2 следует одномерный вариант теоремы 3.

Предположим, что теорема 3 доказана для $(d-1)$-мерных распределений $F$. Докажем ее в $d$-мерном случае. Легко понять, что мы можем представить $F$ в виде (8) с некоторым $p$ таким, что $0<p<1$, $U\in\mathfrak F_d$ — вероятностное распределение с ограниченным носителем и невырожденной ковариационной матрицей, а $V\in\mathfrak F_d$ — некоторое вероятностное распределение. Ясно, что распределения $U$ и $V$ можно выбрать так, чтобы $(1-p)U$ являлось сужением меры $F$ на центрированный шар достаточно большого радиуса, а $pV$ — на дополнение к этому шару. Кроме того, если для всех радиусов распределение $U$ имеет вырожденную ковариационную матрицу, то распределение $F$ сосредоточено на некоторой аффинной гиперплоскости $H$. Если эта гиперплоскость содержит начало координат, то она представляет собой $(d-1)$-мерное линейное подпространство в $\mathbf{R}^d$ и утверждение теоремы следует из предположения индукции. Если $H$ не содержит начала координат, то это $(d-1)$-мерное линейное подпространство $H_0$, сдвинутое на вектор $a\in\mathbf{R}^d$, т.е. $H=H_0+a$. В этом случае распределение $F$ можно представить в виде $F=GE_a$, где распределение $G$ сосредоточено на гиперплоскости $H_0$. По предположению индукции имеем

$$ \begin{equation} \pi\bigl(G_{(n)}^n, G_{(n)}^{n+1}\bigr) \leqslant\frac{c(G)}{\sqrt{n}}. \end{equation} \tag{21} $$
Используя равенство (13), оценку (21) и лемму 3, получаем
$$ \begin{equation*} \begin{aligned} \, \pi\bigl(F_{(n)}^n, F_{(n)}^{n+1}\bigr) &=\pi\bigl(G_{(n)}^nE_{na/\sqrt{n}},G_{(n)}^{n+1} E_{(n+1)a/\sqrt{n}}\bigr) \\ &\leqslant \pi\bigl(G_{(n)}^nE_{na/\sqrt{n}},G_{(n)}^{n+1} E_{na/\sqrt{n}}\bigr) +\pi\bigl(E_{na/\sqrt{n}}, E_{(n+1)a/\sqrt{n}}\bigr) \\ &\leqslant \frac{c(G)}{\sqrt{n }}+\frac{\|a\|}{\sqrt{n }} \leqslant \frac{c(F)}{\sqrt{n }}. \end{aligned} \end{equation*} \notag $$
Теорема доказана.

Список литературы

1. Т. В. Арак, А. Ю. Зайцев, “Равномерные предельные теоремы для сумм независимых случайных величин”, Тр. МИАН СССР, 174, 1986, 3–214  mathnet  mathscinet  mathscinet  zmath; англ. пер.: T. V. Arak, A. Yu. Zaĭtsev, “Uniform limit theorems for sums of independent random variables”, Proc. Steklov Inst. Math., 174 (1988), 1–222
2. A. Araujo, E. Giné, The central limit theorem for real and Banach valued random variables, Wiley Ser. Probab. Math. Statist., John Wiley & Sons, New York–Chichester–Brisbane, 1980, xiv+233 pp.  mathscinet  zmath
3. Р. Н. Бхаттачария, Р. Ранга Рао, Аппроксимация нормальным распределением и асимптотические разложения, Наука, М., 1982, 288 с.  mathscinet  zmath; пер. с англ.: R. N. Bhattacharya, R. Ranga Rao, Normal approximation and asymptotic expansions, Wiley Ser. Probab. Math. Statist., John Wiley & Sons, New York–London–Sydney, 1976, xiv+274 с.  mathscinet  zmath
4. R. M. Dudley, “Distances of probability measures and random variables”, Ann. Math. Statist., 39:5 (1968), 1563–1572  crossref  mathscinet  zmath
5. Б. В. Гнеденко, А. Н. Колмогоров, Предельные распределения для сумм независимых случайных величин, Гостехиздат, М.–Л., 1949, 264 с.  mathscinet  zmath; англ. пер.: B. V. Gnedenko, A. N. Kolmogorov, Limit distributions for sums of independent random variables, Addison-Wesley Publishing Company, Inc., Cambridge, MA, 1954, ix+264 с.  mathscinet  zmath
6. F. Götze, A. Naumov, V. Spokoiny, V. Ulyanov, “Large ball probabilities, Gaussian comparison and anti-concentration”, Bernoulli, 25:4A (2019), 2538–2563  crossref  mathscinet  zmath
7. Ф. Гётце, А. Ю. Зайцев, “Оценки близости сверток вероятностных распределений на выпуклых многогранниках”, Вероятность и статистика. 27, Зап. науч. сем. ПОМИ, 474, ПОМИ, СПб., 2018, 108–117  mathnet  mathscinet  zmath; англ. пер.: F. Götze, A. Yu. Zaitsev, “Estimates for closeness of convolutions of probability distributions on convex polyhedra”, J. Math. Sci. (N.Y.), 251:1 (2020), 67–73  crossref
8. Ф. Гётце, А. Ю. Зайцев, “Сходимость к бесконечномерным обобщенным распределениям Пуассона на выпуклых многогранниках”, Вероятность и статистика. 30, Зап. науч. сем. ПОМИ, 501, ПОМИ, СПб., 2021, 118–125  mathnet  mathscinet  zmath; англ. пер.: F. Götze, A. Yu. Zaitsev, “Convergence to infinite-dimensional compound Poisson distributions on convex polyhedra”, J. Math. Sci. (N.Y.), 273:5 (2023), 732–737  crossref
9. И. А. Ибрагимов, Э. Л. Пресман, “О скорости сближения распределений сумм независимых случайных величин с сопровождающими законами”, Теория вероятн. и ее примен., 18:4 (1973), 753–766  mathnet  mathscinet  zmath; англ. пер.: I. A. Ibragimov, E. L. Presman, “On the rate of approach of the distributions of sums of independent random variables to accompanying distributions”, Theory Probab. Appl., 18:4 (1974), 713–727  crossref
10. А. Н. Колмогоров, “Две равномерные предельные теоремы для сумм независимых слагаемых”, Теория вероятн. и ее примен., 1:4 (1956), 426–436  mathnet  mathscinet  zmath; англ. пер.: A. N. Kolmogorov, “Two uniform limit theorems for sums of independent random variables”, Theory Probab. Appl., 1:4 (1956), 384–394  crossref
11. L. Le Cam, “On the distribution of sums of independent random variables”, Bernoulli 1713, Bayes 1763, Laplace 1813, Anniversary volume (Statist. Lab., Univ. California, Berkeley, CA, 1963), Springer-Verlag, New York, 1965, 179–202  crossref  mathscinet  zmath
12. M. Panov, V. Spokoiny, “Finite sample Bernstein–von Mises theorem for semiparametric problems”, Bayesian Anal., 10:3 (2015), 665–710  crossref  mathscinet  zmath
13. В. В. Петров, Предельные теоремы для сумм независимых случайных величин, Наука, M., 1987, 318 с.  mathscinet  zmath
14. Ю. В. Прохоров, “Сходимость случайных процессов и предельные теоремы теории вероятностей”, Теория вероятн. и ее примен., 1:2 (1956), 177–238  mathnet  mathscinet  zmath; англ. пер.: Yu. V. Prokhorov, “Convergence of random processes and limit theorems in probability theory”, Theory Probab. Appl., 1:2 (1956), 157–214  crossref
15. V. V. Sazonov, “On the multi-dimensional central limit theorem”, Sankhyā Ser. A, 30 (1968), 181–204  mathscinet  zmath
16. V. V. Sazonov, Normal approximation — some recent advances, Lecture Notes in Math., 879, Springer-Verlag, Berlin–New York, 1981, vii+105 pp.  crossref  mathscinet  zmath
17. G. Schay, “Nearest random variables with given distributions”, Ann. Probab., 2 (1974), 163–166  crossref  mathscinet  zmath
18. V. Spokoiny, M. Zhilova, “Bootstrap confidence sets under model misspecification”, Ann. Statist., 43:6 (2015), 2653–2675  crossref  mathscinet  zmath
19. V. Strassen, “The existence of probability measures with given marginals”, Ann. Math. Statist., 36:2 (1965), 423–439  crossref  mathscinet  zmath
20. В. В. Юринский, “Неравенство сглаживания для оценок расстояния Леви–Прохорова”, Теория вероятн. и ее примен., 20:1 (1975), 3–12  mathnet  mathscinet  zmath; англ. пер.: V. V. Jurinskii, “A smoothing inequality for estimates of the Lévy–Prokhorov distance”, Theory Probab. Appl., 20:1 (1975), 1–10  crossref
21. А. Ю. Зайцев, “Оценка близости распределений последовательных сумм независимых одинаково распределенных случайных векторов”, Проблемы теории вероятностных распределений. VI, Зап. науч. сем. ЛОМИ, 97, Изд-во “Наука”, Ленинград. отд., Л., 1980, 83–87  mathnet  mathscinet  zmath; англ. пер.: A. Yu. Zaitsev, “Estimation of proximity of distributions of sequential sums of independent identically distributed random vectors”, J. Soviet Math., 24:5 (1984), 536–539  crossref
22. А. Ю. Зайцев, “Некоторые свойства $n$-кратных сверток распределений”, Теория вероятн. и ее примен., 26:1 (1981), 152–156  mathnet  mathscinet  zmath; англ. пер.: A. Yu. Zaitsev, “Some properties of $n$-fold convolutions of distributions”, Theory Probab. Appl., 26:1 (1981), 148–152  crossref
23. А. Ю. Зайцев, “Некоторые оценки для распределений сумм независимых случайных величин и векторов”, В ст.: “Резюме докладов, сделанных на заседаниях семинара по теории вероятностей и математической статистике в Ленинградском отделении Математического института Академии наук СССР”, Теория вероятн. и ее примен., 26:1 (1981), 193–194  mathnet; англ. пер.: A. Yu. Zaitsev, “Some estimates for the distributions of sums of independent random variables and vectors”, In: “Summary of papers presented at sessions of the probability and statistics seminar at the Leningrad section of the Mathematical Institute of the USSR Academy of Sciences, 1979”, Theory Probab. Appl., 26:1 (1981), 188  crossref
24. А. Ю. Зайцев, “Оценки близости последовательных сверток симметричных распределений”, В ст.: “Резюме докладов, сделанных на заседаниях семинара по теории вероятностей и математической статистике в Ленинградском отделении Математического института (январь–декабрь 1981 г.)”, Теория вероятн. и ее примен., 28:1 (1983), 184–185  mathnet; англ. пер.: A. Yu. Zaitsev, “Estimates of closeness of successive convolutions of symmetric distributions”, In: “Summary of reports presented at sessions of the probability and mathematical statistics seminar at the Leningrad section of the Mathematical Institute of the USSR Academy of Sciences, 1981”, Theory Probab. Appl., 28:1 (1984), 194–195  crossref
25. A. Yu. Zaĭtsev, “Estimates for the closeness of successive convolutions of multidimensional symmetric distributions”, Probab. Theory Relat. Fields, 79:2 (1988), 175–200  crossref  mathscinet  zmath
26. А. Ю. Зайцев, “Оценки устойчивости по количеству слагаемых для распределений последовательных сумм независимых одинаково распределенных векторов”, Вероятность и статистика. 34, Посвящается юбилею Андрея Николаевича Бородина, Зап. науч. сем. ПОМИ, 525, ПОМИ, СПб., 2023, 86–95  mathnet
27. В. М. Золотарев, Современная теория суммирования независимых случайных величин, Наука, М., 1986, 416 с.  mathscinet  zmath

Образец цитирования: А. Ю. Зайцев, “О близости распределений последовательных сумм в метрике Прохорова”, Теория вероятн. и ее примен., 69:2 (2024), 272–284; Theory Probab. Appl., 69:2 (2024), 217–226
Цитирование в формате AMSBIB
\RBibitem{Zai24}
\by А.~Ю.~Зайцев
\paper О~близости распределений последовательных сумм в~метрике Прохорова
\jour Теория вероятн. и ее примен.
\yr 2024
\vol 69
\issue 2
\pages 272--284
\mathnet{http://mi.mathnet.ru/tvp5690}
\crossref{https://doi.org/10.4213/tvp5690}
\mathscinet{https://mathscinet.ams.org/mathscinet-getitem?mr=4912064}
\transl
\jour Theory Probab. Appl.
\yr 2024
\vol 69
\issue 2
\pages 217--226
\crossref{https://doi.org/10.1137/S0040585X97T991878}
\scopus{https://www.scopus.com/record/display.url?origin=inward&eid=2-s2.0-85202549339}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/tvp5690
  • https://doi.org/10.4213/tvp5690
  • https://www.mathnet.ru/rus/tvp/v69/i2/p272
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Теория вероятностей и ее применения Theory of Probability and its Applications
    Статистика просмотров:
    Страница аннотации:331
    PDF полного текста:31
    HTML русской версии:98
    Список литературы:52
    Первая страница:23
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2026