Вестник Санкт-Петербургского университета. Серия 10. Прикладная математика. Информатика. Процессы управления
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Вестн. С.-Петербург. ун-та. Сер. 10. Прикл. матем. Информ. Проц. упр.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Вестник Санкт-Петербургского университета. Серия 10. Прикладная математика. Информатика. Процессы управления, 2024, том 20, выпуск 3, страницы 391–403
DOI: https://doi.org/10.21638/spbu10.2024.307
(Mi vspui634)
 

Информатика

Extending the applicability of the Zipf's laws to the sequences of byte data
[Расширение применимости закона Ципфа для произвольных последовательностей битовых данных]

S. L. Sergeev, I. S. Blekanov, F. V. Ezhov, N. A. Tarasov

St. Petersburg State University, 7-9, Universitetskaya nab., St. Petersburg, 199034, Russian Federation
Список литературы:
Аннотация: Доказано, что закон Ципфа справедлив для самых разнообразных статистических распределений, начиная с его первоначальной идеи о статистической закономерности, связанной с его применением для обработки естественных языков, и заканчивая его более поздними адаптациями для экономической, социальной и многих других предметных областей, в которых было установлено, что он работает практически повсеместно. Во всех этих случаях авторы различных исследований обсуждают применимость закона Ципфа в терминах семантически сложных структур. Сделан следующий шаг в этом вопросе и показано, как такой закон может работать для анализа данных, в том числе для последовательностей байтовых данных, полученных из разных источников. Используя базовую методологию разбиения на блоки, можно доказать, что закон Ципфа справедлив для многих типов необработанных последовательностей байтовых данных, в частности во всех случаях для «средней точки» данных, где они присутствуют со степенью достоверности более 90 %. В заключение приводятся рассуждения о последствиях и возможных вариантах использования полученных результатов.
Ключевые слова: законы Ципфа, битовые данные, фрагментация данных, частотный анализ.
Поступила: 19 мая 2024 г.
Принята к печати: 25 июня 2024 г.
Тип публикации: Статья
УДК: 004.93
MSC: 93B03
Язык публикации: английский
Образец цитирования: S. L. Sergeev, I. S. Blekanov, F. V. Ezhov, N. A. Tarasov, “Extending the applicability of the Zipf's laws to the sequences of byte data”, Вестн. С.-Петербург. ун-та. Сер. 10. Прикл. матем. Информ. Проц. упр., 20:3 (2024), 391–403
Цитирование в формате AMSBIB
\RBibitem{SerBleEzh24}
\by S.~L.~Sergeev, I.~S.~Blekanov, F.~V.~Ezhov, N.~A.~Tarasov
\paper Extending the applicability of the Zipf's laws to the sequences of byte data
\jour Вестн. С.-Петербург. ун-та. Сер. 10. Прикл. матем. Информ. Проц. упр.
\yr 2024
\vol 20
\issue 3
\pages 391--403
\mathnet{http://mi.mathnet.ru/vspui634}
\crossref{https://doi.org/10.21638/spbu10.2024.307}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/vspui634
  • https://www.mathnet.ru/rus/vspui/v20/i3/p391
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Вестник Санкт-Петербургского университета. Серия 10. Прикладная математика. Информатика. Процессы управления
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025