Головная страница ИПМ Библиотеки, издания  •  Поиск публикаций  English 
Публикация

Материал конференции: "Научный сервис в сети Интернет: труды XXIII Всероссийской научной конференции (20-23 сентября 2021 г., онлайн)"
Авторы: Атаева О.М., Серебряков В.А., Тучкова Н.П.
Модель поиска схожих документов в семантической библиотеке
Аннотация:
Рассматривается задача нахождения наиболее релевантных документов в результате расширенного и уточненного запроса. Для этого предлагается модель поиска и механизм предварительной обработки текста, а также совместное использование поисковой системы и нейросетевой модели, построенной на основе индекса с помощью алгоритмов word2vec для генерации расширенного запроса с синонимами и уточнения результатов поиска на основе подбора похожих документов в цифровой семантической библиотеке. В работе исследуется построение векторного представления документов на основе абзацев применительно к массиву данных цифровой семантической библиотеки LibMeta. Решалась задача обогащения пользовательских запросов синонимами. При построении модели поиска совместно с алгоритмами word2vec использовался подход «сначала индексация, затем обучение», что позволяет охватить большее количество информации и выдать более точные результаты поиска.
Ключевые слова:
модель поиска, word2vec, синонимы, информационный запрос, расширение запроса
Язык публикации: русский,  страниц: 11 (с. 54-64)
Полный текст на русском языке:
Экспорт ссылки на публикацию в формате:   RIS    BibTeX
Сведения об авторах:
  • Атаева Ольга Муратовна,  orcid.org/0000-0003-0367-5575,  ВЦ ФИЦ ИУ РАН
  • Серебряков Владимир Алексеевич,  orcid.org/0000-0003-1423-621X,  ВЦ ФИЦ ИУ РАН
  • Тучкова Наталия Павловна,  orcid.org/0000-0001-6518-5817,  ФИЦ ИУ РАН