Головная страница ИПМ Библиотеки, издания  •  Поиск публикаций  English 
Публикация

Препринт ИПМ № 27, Москва, 2013 г.
Авторы: Борисов Л.А., Орлов Ю. Н., Осминин К.П.
Идентификация автора текста по распределению частот буквосочетаний
Аннотация:
Исследованы распределения расстояний между распределениями триграмм, получена оценка точности частот буквосочетаний в зависимости от длины текста и даны оценки вероятности правильной идентификации автора текста по близости текста к его средневзвешенному эталону в смысле распределения частот. Построены авторские длины представительности для большого числа писателей и показано, что стабилизация триграмм происходит примерно на половине текста независимо от автора и длины текста. Проведен анализ литературного наследия Е.И. Рерих с целью кластеризации ее произведений и проверки ряда утверждений о возможном соавторстве.
Ключевые слова:
эмпирическая вероятность, минимально достаточная длина текста, идентификация автора
Язык публикации: русский,  страниц: 26
Направление исследований:
Математическое моделирование в актуальных проблемах науки и техники
Полный текст на русском языке:
Список цитирующих публикаций:
Экспорт ссылки на публикацию в формате:   RIS    BibTeX
Статистика просмотров (обновляется раз в сутки):
за последние 30 дней — 9 (+2), всего с 01.09.2019 — 1054
Сведения об авторах:
  • Борисов Леонид Андреевич,  leonidborisoff@gmail.com,  МФТИ
  • Орлов Юрий Николаевич,  ov31509f@yandex.ruorcid.org/0000-0002-1356-5137ИПМ им. М.В. Келдыша РАН
  • Осминин Константин Павлович,  osminik@yandex.ru,  Компания Courant