Головная страница ИПМ Библиотеки, издания  •  Поиск публикаций  English 
Публикация

Материал конференции: "Труды Международной конференции по компьютерной графике и зрению "Графикон""
Авторы: Клышинский Э.С., Ганеева В.А.
Метод визуальной интерпретации статического векторного пространства Word2Vec
Аннотация:
С момента появления статических векторных представлений слов было известно, что в них работает задача аналогий. В ней утверждается, что можно найти такой вектор, который переносил бы одно слово в другое, заменяя при этом некоторый признак. Также было известно, что задача аналогий не всегда решается качественно, в связи с чем возникла задача исследования свойств векторных семантических пространств. В данной работе мы вводим метод визуальной интерпретации такого пространства. Основой метода является использование тематических коллекций слов, разделение векторного пространства при помощи метода LSA и визуализация результатов с использованием тепловых карт. В ходе экспериментов мы обнаружили, что векторные пространства могут быть интерпретированы не только на локальном, но и на глобальном уровне. Разделение пространства на части при этом зависит от набора текстов, на котором проводилось создание этого пространства. Метод оказался пригоден для выделения нескольких верхних уровней, так как при увеличении глубины анализа количество слов в группе сокращается экспоненциально.
Ключевые слова:
статическое векторное пространство, визуальная интерпретация, LSA
Язык публикации: русский,  страниц: 7 (с. 297-303)
Полный текст на русском языке:
Экспорт ссылки на публикацию в формате:   RIS    BibTeX
Сведения об авторах:
  • Клышинский Эдуард Станиславович,  orcid.org/0000-0002-4020-488XИПМ им. М.В. Келдыша РАН
  • Ганеева В.А.,  orcid.org/0000-0002-9569-9197,  Национальный исследовательский университет «Высшая школа экономики»