Головная страница ИПМ Библиотеки, издания  •  Поиск публикаций  English 
Публикация

Препринт ИПМ № 106, Москва, 2017 г.
Авторы: Борисов Л.А., Ивченко А. Ю., Митин Н. А., Орлов Ю. Н.
Тематическая классификация текстов с помощью спектральных портретов
Аннотация:
В работе рассмотрены примеры применения метода спектрального анализа несимметричных матриц для построения классификационных индикаторов при структурировании текстовой информации большого объема. Обнаружилась возможность классификации текстов по тематике на основе анализа структуры инвариантных подпространств стохастической матрицы условных вероятностей парных буквосочетаний. Выяснилось, что тексты весьма достоверно могут быть классифицированы как литературные, научные по психологии, философии, а также по естественным наукам. Индикатором разделения служит величина близости к нулю косинуса угла между левым и правым собственными векторами, отвечающими соответственно минимальному и максимальному действительным собственным значениям стохастической матрицы условных вероятностей пар буквосочетаний.
Ключевые слова:
стохастическая матрица, спектральный портрет, классификация текстов
Язык публикации: русский,  страниц: 22
Направление исследований:
Математическое моделирование в актуальных проблемах науки и техники
Полный текст на русском языке:
Экспорт ссылки на публикацию в формате:   RIS    BibTeX
Статистика просмотров (обновляется раз в сутки):
за последние 30 дней — 10 (+7), всего с 01.09.2019 — 440
Сведения об авторах:
  • Борисов Леонид Андреевич,  ИПМ им. М.В. Келдыша РАН
  • Ивченко Анастасия Юрьевна,  orcid.org/0000-0003-3669-4991ИПМ им. М.В. Келдыша РАН
  • Митин Николай Алексеевич,  orcid.org/0000-0001-7890-6353ИПМ им. М.В. Келдыша РАН
  • Орлов Юрий Николаевич,  orcid.org/0000-0002-1356-5137ИПМ им. М.В. Келдыша РАН