Материал конференции: "Научный сервис в сети Интернет: труды XXV Всероссийской научной конференции (18-21 сентября 2023 г., онлайн)"
Авторы:Гизатуллин Б.Т., Невзорова О.А.
К построению графа знаний коллекции математических статей
Аннотация:
В работе описывается процесс построения графа знаний для коллекции математических статей на русском языке из журнала «Известия ВУЗов. Математика». Коллекция содержит около 1100 документов формата LaTeX. Для построения графа знаний используется разработанная онтология представления графа знаний. Из коллекции выделяются базовые сущности статей: коды УДК, авторы, названия статей, использованные формулы, даты публикации статей, аффилиации авторов, ссылки на другие работы. Каждая выделенная сущность статей записывается в граф знаний через специальное отношение. Также на коллекции проводится тематическое моделирование с использованием метода латентного размещения Дирихле, для которого были подобраны оптимальные гиперпараметры. Выделенные тематики документов записываются через связи в граф знаний. Математические термины статей извлекаются с использованием онтологии OntoMathPRO и также включаются в граф знаний. Для построения графа знаний разработаны программные инструменты, позволяющие создавать граф знаний для любой научной коллекции, удовлетворяющей изученным шаблонам представления статей.
Ключевые слова:
Построение графа знаний, Связанные данные, Тематическое моделирование, Математическая статья