Математические заметки
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Скоро в журнале
Архив
Импакт-фактор
Подписка
Правила для авторов
Лицензионный договор
Загрузить рукопись

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Матем. заметки:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Математические заметки, 2023, том 114, выпуск 6, страницы 803–807
DOI: https://doi.org/10.4213/mzm13802
(Mi mzm13802)
 

Коэффициент эргодичности. Новые доказательства известных свойств

Ю. А. Альпин, Н. Н. Корнееваa

a Казанский (Приволжский) федеральный университет
Список литературы:
Аннотация: Приводятся новые простые доказательства двух известных теорем о коэффициенте эргодичности стохастической матрицы.
библиография: 7 названий.
Ключевые слова: стохастическая матрица, коэффициент эргодичности.
Финансовая поддержка Номер гранта
Министерство науки и высшего образования Российской Федерации 075-02-2023-944
Работа выполнена в рамках реализации программы развития Научно-образовательного математического центра Приволжского федерального округа (соглашение № 075-02-2023-944).
Поступило: 03.11.2022
Исправленный вариант: 12.04.2023
Дата публикации: 30.11.2023
Английская версия:
Mathematical Notes, 2023, Volume 114, Issue 6, Pages 1103–1106
DOI: https://doi.org/10.1134/S0001434623110433
Реферативные базы данных:
Тип публикации: Статья
УДК: 512.6

1. Введение

Неотрицательная матрица $A=(a_{ij})$ называется стохастической, если сумма элементов любой ее строки равна единице. Стохастические матрицы служат основным инструментом теории конечных цепей Маркова [1]. Важнейшим понятием теории является коэффициент эргодичности.

Коэффициентом эргодичности стохастической (необязательно квадратной) матрицы $A=(a_{ij})$ называется число

$$ \begin{equation} \delta(A)=1-\min_{i_1,i_2}\sum_j\min (a_{i_1,j},a_{i_2,j}). \end{equation} \tag{1.1} $$
Если $A$ имеет одну строку или один столбец, то логично положить $\delta(A)=0$.

Традиционно считается, что коэффициент эргодичности впервые появился в работе [2]. Однако Сенета [3] установил, что коэффициент эргодичности в неявном виде использовался уже в статье Маркова [4].

Стохастическая матрица называется стягивающей, если любые две ее строки имеют положительные элементы в некотором общем столбце. Из формулы (1.1) следует, что

1) $0\leqslant \delta (A)\leqslant 1$;

2) $\delta (A)=0$ тогда и только тогда, когда все строки $A$ равны;

3) $\delta (A)<1$ тогда и только тогда, когда матрица $A$ стягивающая.

Роль коэффициента эргодичности в теории цепей Маркова объясняется двумя его свойствами, приводимыми ниже.

Коэффициент эргодичности обладает свойством субмультипликативности, т.е. имеет место следующая

Теорема 1. Пусть $A$ и $B$ – стохастические матрицы, для которых существует произведение $AB$. Тогда

$$ \begin{equation*} \delta(AB)\leqslant\delta(A)\delta(B). \end{equation*} \notag $$

Известно, что для любой стохастической матрицы порядка $n$ единица является собственным значением, причем остальные $n-1$ собственных значений по модулю не больше единицы (см., например, [1], [5]). Коэффициент эргодичности является верхней границей для собственных значений, неравных единице, т.е. имеет место следующая

Теорема 2. Все собственные значения стохастической матрицы $A$, за исключением, возможно, единицы, удовлетворяют неравенству

$$ \begin{equation*} |\lambda|\leqslant\delta(A). \end{equation*} \notag $$

Существуют различные доказательства теорем 1 и 2. Обзор результатов, связанных с коэффицентом эргодичности, снабженный полными доказательствами и обширной библиографией, можно найти в [6]. Целью этой заметки являются новые, более простые, доказательства теорем 1 и 2. Решающее значение в этих доказательствах имеют леммы о двустрочных стохастических матрицах.

2. Двустрочные стохастические матрицы

Предположим, что даны стохастические строки $\mu=(\mu_j)$, $\pi=(\pi_j)$ длины $n$. Коэффициент эргодичности матрицы

$$ \begin{equation*} \begin{pmatrix}\mu\\ \pi\end{pmatrix} \end{equation*} \notag $$
обозначим через $\delta(\mu,\pi)$. Согласно (1.1)
$$ \begin{equation*} \delta(\mu,\pi) =1-\sum_j\min (\mu_j,\pi_j). \end{equation*} \notag $$

Лемма 1. Для неравных стохастических строк $\mu$ и $\pi$ существуют такие стохастические строки $\varphi$ и $\psi$, что

$$ \begin{equation} \mu-\pi=\delta(\mu,\pi)(\varphi-\psi). \end{equation} \tag{2.1} $$

Доказательство. Определим неотрицательные строки
$$ \begin{equation*} \begin{gathered} \, \mu'=(\mu'_j), \qquad\text{где}\quad \mu'_j=\mu_j-\min(\mu_j,\pi_j), \\ \pi'=(\pi'_j), \qquad\text{где}\quad \pi'_j=\pi_j-\min(\mu_j,\pi_j). \end{gathered} \end{equation*} \notag $$
Пусть $\mathbf{1}$ – столбец, все элементы которого равны 1. Тогда $\mu'\mathbf{1}=\pi'\mathbf{1}=\delta(\mu,\pi)$. Действительно,
$$ \begin{equation*} \sum_j(\mu_j-\min(\mu_j,\pi_j))=\sum_j(\pi_j-\min(\mu_j,\pi_j)) =1-\sum_j\min(\mu_j,\pi_j)=\delta(\mu,\pi). \end{equation*} \notag $$
Поскольку $\mu\neq\pi$, то $\delta(\mu,\pi)>0$. Определим стохастические строки
$$ \begin{equation*} \varphi=\delta^{-1}(\mu,\pi)\mu', \qquad \psi=\delta^{-1}(\mu,\pi)\pi'. \end{equation*} \notag $$
Легко проверить, что для строк $\varphi$ и $\psi$ верно равенство (2.1).

Пусть $z=(z_1,\dots,z_n)^{\top}]$ – комплексный столбец. Положим, что

$$ \begin{equation*} d(z)=\max_{i_1,i_2}|z_{i_1}-z_{i_2}|. \end{equation*} \notag $$

Лемма 2. Пусть $\mu=(\mu_1,\dots,\mu_n)$, $\pi=(\pi_1,\dots,\pi_n)$ – стохастические строки, $z=(z_1,\dots,z_n)^{\top}$ – комплексный столбец. Тогда

$$ \begin{equation} |(\mu -\pi)z|\leqslant\delta(\mu,\pi)d(z). \end{equation} \tag{2.2} $$

Доказательство. Вначале докажем вспомогательное неравенство
$$ \begin{equation} |(\mu-\pi)z|\leqslant d(z). \end{equation} \tag{2.3} $$
Действительно,
$$ \begin{equation*} |(\mu-\pi)z|=\biggl|\sum_{i=1}^n \mu_iz_i - \sum_{j=1}^n\pi_jz_j\biggr| =\biggl|\sum_{i,j=1}^n\mu_i\pi_j(z_i-z_j)\biggr| \leqslant \sum_{i,j=1}^n\mu_i\pi_j d(z)= d(z). \end{equation*} \notag $$

Переходя к доказательству основного утверждения, заметим, что при $\mu=\pi$ лемма верна, так как обе части в неравенстве (2.2) обращаются в 0. Дальше считаем, что $\mu\neq \pi$. Используя представление (2.1) и применяя неравенство (2.3) к стохастическим строкам $\varphi$ и $\psi$, получим

$$ \begin{equation*} |(\mu-\pi)z|=\delta(\mu,\pi)|(\varphi-\psi)z|\leqslant \delta(\mu,\pi)d(z). \end{equation*} \notag $$

Следствие 1. Пусть $z=(z_i)$ – произвольный комплексный столбец высоты $n$, $a=(a_i)$ – вещественная строка длины $n$, причем сумма элементов $a$ равна 0. Тогда

$$ \begin{equation} |az|\leqslant \frac{1}{2}d(z)\sum_{i=1}^n|a_i|. \end{equation} \tag{2.4} $$

Доказательство. Обозначим через $a^+$ строку, полученную из $a$ заменой отрицательных элементов нулями, и положим, что $a^-=a^+-a$. Сумма элементов в строках $a^+$ и $a^-$ одна и та же, обозначим ее через $s$. Применим неравенство (2.3) к непересекающимся стохастическим строкам $s^{-1}a^+$ и $s^{-1}a^-$:
$$ \begin{equation*} |(s^{-1}a^+-s^{-1}a^-)z|\leqslant d(z) \quad\Longrightarrow\quad |(a^+-a^-)z|\leqslant sd(z). \end{equation*} \notag $$
Учитывая, что $a^+-a^-=a$ и $s=(1/2)\sum_{i=1}^n|a_i|$, получим (2.4).

Замечание 1. Неравенство (2.4) впервые было опубликовано в [7]. Его доказательство, представленное выше, основано на иных соображениях, чем оригинальное, и намного проще. О связи неравенства (2.4) с работой Маркова [4] см. в [3].

Лемма 3. Для любых стохастических строк $\mu=(\mu_j)$, $\pi=(\pi_j)$ длины $n$ существует такой $(0,1)$-столбец $z=(z_j)$, что

$$ \begin{equation*} (\mu-\pi)z=\delta(\mu,\pi). \end{equation*} \notag $$

Доказательство. При $\mu=\pi$ утверждение леммы тривиально верно. Дальше считаем, что $\mu\neq\pi$. Для любого $(0,1)$-столбца $z=(z_j)$ имеют место равенства
$$ \begin{equation*} (\mu-\pi)z=\sum_j(\mu_j-\pi_j)z_j=\sum_j(\mu_j-\min(\mu_j,\pi_j))z_j - \sum_j(\pi_j-\min(\mu_j,\pi_j))z_j. \end{equation*} \notag $$
Определим столбец $z=(z_j)$ условиями
$$ \begin{equation*} z_j=\begin{cases} 1,&\text{если } \mu_j-\min(\mu_j,\pi_j)>0, \\ 0, &\text{если } \mu_j-\min(\mu_j,\pi_j)=0. \end{cases} \end{equation*} \notag $$
Тогда
$$ \begin{equation*} (\mu-\pi)z=\sum_j(\mu_j-\min(\mu_j,\pi_j))= 1-\sum_j\min(\mu_j,\pi_j)=\delta(\mu,\pi). \end{equation*} \notag $$

3. Следствия для стохастических матриц произвольного размера

Обозначим $i$-ю строку стохастической $(m\times n)$-матрицы $A=(a_{ij})$ символом $a_i$. Тогда коэффициент эргодичности (1.1) можно записать так:

$$ \begin{equation} \delta(A)=\max_{i_1,i_2}\delta(a_{i_1},a_{i_2}). \end{equation} \tag{3.1} $$
Действительно,
$$ \begin{equation*} \delta(A)=1-\min_{i_1,i_2}\sum_j\min (a_{i_1,j},a_{i_2,j})=\max_{i_1,i_2} \biggl(1-\sum_j\min (a_{i_1,j},a_{i_2,j})\biggr)=\max_{i_1,i_2}\delta(a_{i_1},a_{i_2}). \end{equation*} \notag $$

Теорема 3. Пусть $A=(a_{ij})$ – стохастическая $(m\times n)$-матрица, $z$ – комплексный столбец высоты $n$. Тогда

$$ \begin{equation*} d(Az)\leqslant \delta(A)d(z). \end{equation*} \notag $$

Доказательство. Cогласно лемме 2 и представлению (3.1) имеем
$$ \begin{equation*} d(Az)=\max_{i_1,i_2}|(a_{i_1}-a_{i_2})z|\leqslant \max_{i_1,i_2}\delta(a_{i_1},a_{i_2})d(z)=\delta(A)d(z). \end{equation*} \notag $$

Лемма 4. Для любой стохастической матрицы $A$ существует $(0,1)$-столбец $z$ такой, что

$$ \begin{equation*} d(Az)=\delta(A). \end{equation*} \notag $$

Доказательство. По теореме 3 для любого $(0,1)$-столбца $z$ имеем
$$ \begin{equation} d(Az)=\max_{i_1,i_2}|(a_{i_1}-a_{i_2})z|\leqslant \max_{i_1,i_2}\delta(a_{i_1},a_{i_2})=\delta(A). \end{equation} \tag{3.2} $$
Пусть строки $a_l,a_m$ таковы, что $\delta(a_l,a_m)=\max_{i_1,i_2}\delta(a_{i_1},a_{i_2})=\delta(A)$. По лемме 3 существует $(0,1)$-столбец $z$, для которого
$$ \begin{equation*} (a_l-a_m)z=\delta(a_l,a_m)=\delta(A). \end{equation*} \notag $$
Отсюда и из (3.2) видно, что
$$ \begin{equation*} \max_{i_1,i_2}|(a_{i_1}-a_{i_2})z|=(a_l-a_m)z, \end{equation*} \notag $$
поэтому $d(Az)=\delta(A)$.
Доказательство теоремы 1. Существует по лемме 4 такой $(0,1)$-столбец $z$, для которого $d(ABz)=\delta(AB)$. Далее, в силу теоремы 3 имеем
$$ \begin{equation*} \delta(AB)=d(ABz)\leqslant\delta(A)d(Bz)\leqslant\delta(A)\delta(B)d(z) =\delta(A)\delta(B). \end{equation*} \notag $$

Из теоремы 1 легко выводится

Следствие 2. Пусть $A_1A_2\cdots A_k$ – произведение прямоугольных стохастических матриц. Тогда

$$ \begin{equation*} \delta(A_1A_2\cdots A_k)\leqslant \delta(A_1)\delta(A_2)\cdots\delta(A_k). \end{equation*} \notag $$

В частности,

$$ \begin{equation*} \delta(A^k)\leqslant \delta^k(A). \end{equation*} \notag $$

Доказательство теоремы 2. Векторы $z\neq 0$, для которых $d(z)=0$, пропорциональны вектору $\mathbf{1}$ и потому являются собственными векторами, отвечающими собственному значению $1$. Следовательно, если собственный вектор $z$ отвечает собственному значению $\lambda\neq1$, то $d(z)>0$. Для таких векторов согласно теореме 3 имеем
$$ \begin{equation*} d(Az)=d(\lambda z)=|\lambda|d(z)\leqslant \delta(A)d(z). \end{equation*} \notag $$
Из последнего неравенства следует утверждение теоремы 2.

СПИСОК ЦИТИРОВАННОЙ ЛИТЕРАТУРЫ

1. E. Seneta, Non-Negative Matrices and Markov Chains, Springer Ser. Statist., Springer, New-York, 2006  mathscinet
2. P. Л. Добрушин, “Центральная предельная теорема для неоднородных цепей Маркова. I”, Теория вероятн. и ее примен., 1:1 (1956), 72–89  mathnet  mathscinet
3. E. Seneta, “Markov and the creation of Markov chains”, Markov Anniversary Meeting, 2006, 1–20
4. А. А. Марков, “Распространение закона больших чисел на величины, зависящие друг от друга”, Изв. Физ.-мат. о-ва при Казанск. ун-те, 2:15 (1906), 135–156
5. Ф. Р. Гантмахер, Теория матриц, Физматлит, М., 2004  mathscinet
6. I. C. F. Ipsen, T. M. Selee, “Ergodicity coefficients defined by vector norms”, SIAM J. Matrix Anal. Appl., 32:1 (2011), 153–200  crossref  mathscinet
7. Ю. А. Альпин, Н. З. Габбасов, “Замечание к задаче локализации собственных чисел вещественных матриц”, Изв. вузов. Матем., 1976, № 11, 98–100  mathnet  mathscinet

Образец цитирования: Ю. А. Альпин, Н. Н. Корнеева, “Коэффициент эргодичности. Новые доказательства известных свойств”, Матем. заметки, 114:6 (2023), 803–807; Math. Notes, 114:6 (2023), 1103–1106
Цитирование в формате AMSBIB
\RBibitem{AlpKor23}
\by Ю.~А.~Альпин, Н.~Н.~Корнеева
\paper Коэффициент эргодичности. Новые~доказательства известных свойств
\jour Матем. заметки
\yr 2023
\vol 114
\issue 6
\pages 803--807
\mathnet{http://mi.mathnet.ru/mzm13802}
\crossref{https://doi.org/10.4213/mzm13802}
\transl
\jour Math. Notes
\yr 2023
\vol 114
\issue 6
\pages 1103--1106
\crossref{https://doi.org/10.1134/S0001434623110433}
\scopus{https://www.scopus.com/record/display.url?origin=inward&eid=2-s2.0-85187713587}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/mzm13802
  • https://doi.org/10.4213/mzm13802
  • https://www.mathnet.ru/rus/mzm/v114/i6/p803
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Математические заметки Mathematical Notes
    Статистика просмотров:
    Страница аннотации:370
    PDF полного текста:65
    HTML русской версии:113
    Список литературы:92
    Первая страница:35
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2026