Модель поиска схожих документов в семантической библиотеке
Аннотация:
Рассматривается задача нахождения наиболее релевантных документов в результате расширенного и уточненного запроса. Для этого предлагается модель поиска и механизм предварительной обработки текста, а также совместное использование поисковой системы и нейросетевой модели, построенной на основе индекса с помощью алгоритмов word2vec для генерации расширенного запроса с синонимами и уточнения результатов поиска на основе подбора похожих документов в цифровой семантической библиотеке. В работе исследуется построение векторного представления документов на основе абзацев применительно к массиву данных цифровой семантической библиотеки LibMeta. Решалась задача обогащения пользовательских запросов синонимами. При построении модели поиска совместно с алгоритмами word2vec использовался подход «сначала индексация, затем обучение», что позволяет охватить большее количество информации и выдать более точные результаты поиска.
Ключевые слова:
модель поиска, word2vec, синонимы, информационный запрос, расширение запроса