Материал конференции: "Научный сервис в сети Интернет: труды XXI Всероссийской научной конференции (23-28 сентября 2019 г., г. Новороссийск)"
Авторы:Беген П.Н., Чугунов А.В.
Разработка интеллектуального классификатора сообщений граждан на портале «Наш Санкт-Петербург»: опыт применения методов машинного обучения
Аннотация:
Исследованы функциональные особенности и выявлены недостатки в существующем процессе подачи сообщений о городских проблемах на портале «Наш Санкт-Петербург». Описан подход к разработке автоматической классификации сообщений граждан по существующим категориям на портале. На базе поданных гражданами сообщений в размере 1,5 млн были сформированы обучающая и тестовая выборки в соотношении 80% и 20% от основного объема текстов соответственно. На основе обучающей выборки данных произведено обучение алгоритма автоматической классификации по 194 категориям, использующего такие классические методы машинного обучения, как наивный байесовский классификатор, деревья решений и искусственные нейронные сети. С помощью методики определения оценки эффективности классификации и тестовой выборки была осуществлена проверка обученного алгоритма. В результате анализа было выявлено, что алгоритм, основанный на применении искусственных нейронных сетей, показывает лучший результат среди остальных используемых методов. Средняя точность классификации алгоритма составила около 82%. Обученный алгоритм был применен в разработке интеллектуального классификатора, представляющего собой веб-приложение и реализующего механизмы API для взаимодействия с основными модулями информационной системы портала.
Ключевые слова:
искусственный интеллект, машинное обучение, искусственные нейронные сети, классификатор, электронное участие