Материал конференции: "Научный сервис в сети Интернет: труды XXIV Всероссийской научной конференции (19-22 сентября 2022 г., онлайн)"
Авторы:Альмухаметов Д.А., Невзорова О.А.
Сервис назначения кода УДК математическим статьям на основе семантических технологий
Аннотация:
Классификация документов с присвоением кодовклассификаторов является традиционным способом систематизации и поиска документов по определенной тематике. Универсальная десятичная классификация (УДК) лежит в основе систематизации знаний, представленных в библиотеках, базах данных и других хранилищах информации. В России УДК является обязательным реквизитом всей книжной продукции и информации по естественным и техническим наукам. Выбор классификационных кодов связан с анализом структуры дерева классификатора и традиционно решается автором научной статьи. В статье предложено решение задачи автоматизации подбора классификационного кода УДК для математической статьи на основе специального ресурса – онтологии OntoMathPro для профессиональной математики, разработанной в Казанском федеральном университете. Подходом к решению задачи автоматизации является создание «кодовых карт» для каждого классифицирующего кода в дереве УДК в области математики. Под «кодовой картой» понимается взвешенный набор всех извлеченных, с помощью онтологии OntoMathPro, математических именованных сущностей из коллекции статей с заданным кодом УДК. Создание «кодовых карт» основано на гипотезе о том, что выбор кода УДК обуславливается определённым набором классифицирующих признаков, которые можно представить классами из онтологии OntoMathPro. Предложенная гипотеза проверена и подтверждена в статье. Проверка гипотезы проводилась на коллекции математических статей, опубликованных в журнале «Известия ВУЗов. Математика» в течение 1999-2009 гг.
Ключевые слова:
Универсальная десятичная классификация, кодовая карта, онтология OntoMathPro, математическая статья