Головная страница ИПМ Библиотеки, издания  •  Поиск публикаций  English 
Публикация

Материал конференции: "Проектирование будущего. Проблемы цифровой реальности: труд 7-й Международной конференции (15-16 февраля 2024 г., Москва)"
Авторы: Громов В.А., Бородин Н.С., Коган А.С., Данг К.Н., Ерболова А.С., Баян Х.
Поймай бота: крупномасштабная структура естественного языка
Аннотация:
В современном мире специальные программы (боты) пишут комментарии, новости, отзывы, которые могут содержать ложную информацию. Вследствие этого крайне важно знать, написан ли тот или иной текст реальным человеком или ботом. Данная работа направлена на исследование семантических траекторий текстов на естественных языках для анализа вышеупомянутой проблемы. В исследовании используются понятия векторных вложений и их n-грамм, а также методы (1) кластеризации семантического пространства, (2) анализа позиции текстов на плоскости «энтропия-сложность», (3) оценки внутренних размерностей векторных представлений языка, (4) топологического анализа данных.
Ключевые слова:
семантические траектории, обработка естественного языка, боты, кластеризация, плоскость «энтропия-сложность», внутренняя размерность, топологический анализ данных
Язык публикации: русский,  страниц: 32 (с. 281-312)
Полный текст на русском языке:
Экспорт ссылки на публикацию в формате:   RIS    BibTeX
Сведения об авторах:
  • Громов Василий Александрович,  orcid.org/0000-0001-5891-6597НИУ «Высшая школа экономики»
  • Бородин Никита Сергеевич,  orcid.org/0000-0002-7102-4443НИУ «Высшая школа экономики»
  • Коган Александра Сергеевна,  orcid.org/0000-0002-6009-5203НИУ «Высшая школа экономики»
  • Данг Куинь Ньы,  orcid.org/0000-0003-0450-7063НИУ «Высшая школа экономики»
  • Ерболова Асель Серикановна,  orcid.org/0009-0007-7119-4665НИУ «Высшая школа экономики»
  • Баян Хендави,  orcid.org/0000-0003-0096-8612НИУ «Высшая школа экономики»