Материал конференции: "Научный сервис в сети Интернет: труды XXIII Всероссийской научной конференции (20-23 сентября 2021 г., онлайн)"
Авторы:Атаева О.М., Серебряков В.А., Тучкова Н.П.
Модель поиска схожих документов в семантической библиотеке
Аннотация:
Рассматривается задача нахождения наиболее релевантных документов в результате расширенного и уточненного запроса. Для этого предлагается модель поиска и механизм предварительной обработки текста, а также совместное использование поисковой системы и нейросетевой модели, построенной на основе индекса с помощью алгоритмов word2vec для генерации расширенного запроса с синонимами и уточнения результатов поиска на основе подбора похожих документов в цифровой семантической библиотеке. В работе исследуется построение векторного представления документов на основе абзацев применительно к массиву данных цифровой семантической библиотеки LibMeta. Решалась задача обогащения пользовательских запросов синонимами. При построении модели поиска совместно с алгоритмами word2vec использовался подход «сначала индексация, затем обучение», что позволяет охватить большее количество информации и выдать более точные результаты поиска.
Ключевые слова:
модель поиска, word2vec, синонимы, информационный запрос, расширение запроса