Модель поиска схожих документов в семантической библиотеке

Атаева О.М.; Серебряков В.А.; Тучкова Н.П.

Аннотация:

Рассматривается задача нахождения наиболее релевантных документов в результате расширенного и уточненного запроса. Для этого предлагается модель поиска и механизм предварительной обработки текста, а также совместное использование поисковой системы и нейросетевой модели, построенной на основе индекса с помощью алгоритмов word2vec для генерации расширенного запроса с синонимами и уточнения результатов поиска на основе подбора похожих документов в цифровой семантической библиотеке. В работе исследуется построение векторного представления документов на основе абзацев применительно к массиву данных цифровой семантической библиотеки LibMeta. Решалась задача обогащения пользовательских запросов синонимами. При построении модели поиска совместно с алгоритмами word2vec использовался подход «сначала индексация, затем обучение», что позволяет охватить большее количество информации и выдать более точные результаты поиска.

Ключевые слова:

модель поиска, word2vec, синонимы, информационный запрос, расширение запроса

Язык публикации: русский, страниц: 11 (с. 54-64)

Полный текст на русском языке:

Список цитирующих публикаций:

Экспорт ссылки на публикацию в формате:

Сведения об авторах:

Атаева Ольга Муратовна, , , ВЦ ФИЦ ИУ РАН

Серебряков Владимир Алексеевич, , , ВЦ ФИЦ ИУ РАН

Тучкова Наталия Павловна, , , ФИЦ ИУ РАН

	Библиотеки, издания • Поиск публикаций	English
	Публикация