Головная страница ИПМ Библиотеки, издания  •  Поиск публикаций  English 
Публикация

Препринт ИПМ № 17, Москва, 2024 г.
Авторы: Кислицына М.Ю., Орлов Ю.Н.
Статистический анализ полного корпуса художественной литературы на русском языке и распознавание автора
Аннотация:
Собрана статистика эталонных триграмм для полного корпуса литературных текстов на русском языке, включая переводных зарубежных авторов. Построены распределения расстояний от отдельных текстов до эталонов. Протестирован метод ближайшего эталона для распознавания автора текста. Определена ошибка по жанрам, подгруппам авторов и по корпусу в целом. Проведена классификация ошибок для разработки метода коррекции.
Ключевые слова:
триграммы, метод ближайшего соседа, распознавание автора текста
Язык публикации: русский,  страниц: 24
Направление исследований:
Математическое моделирование в актуальных проблемах науки и техники
Полный текст на русском языке:
Экспорт ссылки на публикацию в формате:   RIS    BibTeX
Статистика просмотров (обновляется раз в сутки):
за последние 30 дней — 17 (-13), всего с 07.03.2024 — 76
Сведения об авторах:
  • Кислицына Мария Юрьевна,  orcid.org/0000-0002-2542-8914ИПМ им. М.В. Келдыша РАН
  • Орлов Юрий Николаевич,  orcid.org/0000-0002-1356-5137ИПМ им. М.В. Келдыша РАН