Материал конференции: "Труды Международной конференции по компьютерной графики и зрению "Графикон" (22-25 сентября 2020 г., Санкт-Петербург)"
Авторы:Липкина А.Л., Местецкий Л.М.
Метод распознавания шрифтов на основе медиального представления
Аннотация:
В статье описывается метод распознавания шрифтов на основе медиального представления, интегрированный в систему распознавания шрифтов по цифровому изображению текста. Эта система ищет похожие шрифты, упорядоченные по схожести, на шрифт, изображенный на введенном пользователем изображении текста. Работа системы основана на решении двух задач машинного обучения: распознавания текста на изображении и распознавания шрифта по изображению текста. Для решения первой задачи используется понятие математической модели графемы, основанной на непрерывном медиальном представлении символа. Решение задачи распознавания шрифта основано на понятии морфологической ширины фигуры, также тесно связанной с медиальным представлением. Мы предлагаем метод использования функции морфологической ширины для поиска наиболее похожих шрифтов из известной базы. Проведенные эксперименты показывают высокую точность поиска наиболее похожих шрифтов. Для базы, состоящей из 2543 шрифтов, точность составляет 0.991 по метрике top@5 для правильно распознанного текста в размере шрифта 100 пикселей на изображении.
Ключевые слова:
графема, морфологическая ширина, цифровое изображение текста, цифровой шрифт, медиальное представление