Классификатор объектов городского хозяйства для данных из социальных сетей
Аннотация:
В статье приводятся результаты анализа сообщений из социальных сетей, основная задача – по имеющемуся набору данных, представляющих собой сообщения пользователей и собранных на разных площадках, автоматически определить, какой объект городского хозяйства упоминается в тексте отзыва, а также определить отношение пользователя к данному объекту (позитивное, нейтральное или негативное). Авторы представляют комплексный сценарий для проведения исследований, включающий сбор информации, контентанализ, методы классификации и кластеризации текста, анализ тональности сообщений, изучение обмена информацией между пользователями социальных сетей. Пилотное исследование проведено на примере 2 административных районов в Санкт-Петербурге – Петроградском и Кронштадтском. Средняя точность классификации модели алгоритма составила 78 %. Обученная модель алгоритма была применена в разработке онлайн сервиса для проведения классификации постов.
Ключевые слова:
машинное обучение, классификация, кластеризация, обработка естественного языка, нейронные сети, социальные сети