Материал конференции: "Труды Международной конференции по компьютерной графике и зрению "Графикон" (19-21 сентября 2022 г., Рязань)"
Авторы:Левкин Т., Сконников П.Н., Трофимов Д.В.
Реализация в реальном времени модифицированного детектора объектов YOLO на FPGA
Аннотация:
Рассмотрены некоторые принципы работы детектора объектов YOLO. Анализируются функции обработки элементов массива, поступающих из последнего сверточного слоя. Показано, что для обработки различных параметров используются три различных типа функций. Например, логистическая сигмоида используется для прогнозирования точности позиционирования и смещения ограничивающих рамок по вертикали и горизонтали. Экспонента используется для прогнозирования высоты и ширины ящиков, а функция SoftMax используется для прогнозирования вероятностей классов. Приведены формулы для производных этих функций, необходимые при обучении сети. Предлагается замена этих функций на более простые для аппаратной реализации. Логистическая функция заменена рациональной сигмоидой, показатель степени заменен сдвинутой параболической кривой четвертого порядка. Модифицированная функция SoftMax также использует смещенную параболу. Представлены производные предложенных функций для расчета обратного распространения ошибки. По полученным формулам был обучен детектор YOLO на основе модифицированной нейронной сети. Модифицированный детектор YOLO с предложенными функциями реализован на специально разработанной плате Xilinx FPGA. Экспериментальные исследования платы показали высокую скорость работы детектора (более 60 кадров в секунду) и высокое качество обнаружения и классификации объектов.