Организация коллекций цифровой математической библиотеки методами семантического анализа
Аннотация:
Предложены методы формирования цифровых коллекций из набора документов – научных статей, монографий, докладов, представленных в различных форматах хранения. На основе анализа структуры документов и стилевых особенностей их оформления разработан алгоритм экстракции их мета-данных. Представлен программный инструмент разделения сборников статей на отдельные документы и формирования их семантического представления. На примере набора сборников «Трудов Математического центра им. Н.И. Лобачевского», имеющих различные формат и структуру, описан алгоритм создания цифровой коллекции и ее включения в цифровую математическую библиотеку Lobachevskii-DML.
Батыршина Рамиля Рустэмовна, , Институт математики и механики им. Н.И. Лобачевского
Елизаров Александр Михайлович, , orcid.org/0000-0003-2546-6897, Институт математики и механики им. Н.И. Лобачевского; Высшая школа информационных технологий и интеллектуальных систем Казанского (Приволжского) федерального университета
Липачев Евгений Константинович, , orcid.org/0000-0001-7789-2332, Институт математики и механики им. Н.И. Лобачевского; Высшая школа информационных технологий и интеллектуальных систем Казанского (Приволжского) федерального университета