Головная страница ИПМ Библиотеки, издания  •  Поиск публикаций  English 
Публикация

Препринт ИПМ № 36, Москва, 2022 г.
Авторы: Белозеров И.А., Судаков В.А.
Машинное обучение с подкреплением для решения задач математического программирования
Аннотация:
В работе рассматриваются современные подходы к поиску рациональных решений в задачах смешанного целочисленного линейного программирования, как сгенерированных со случайными данными, так и из реальной практики. Основной упор сделан на то, каким образом можно осуществить процесс поиска решения задач дискретной оптимизации, используя концепцию обучения с подкреплением; какие техники возможно применить, чтобы улучшить скорость и качество работы. Были разработаны три основных варианта алгоритма, с помощью API библиотеки Ray, а также окружения – библиотеки Gym. Приводится сравнение результатов разработанного решателя с библиотекой OR-Tools. Лучшая модель может быть использована в качестве решателя для оптимизационных задач большой размерности, кроме того, данная концепция применима к другим задачам комбинаторного характера с изменением кода окружения и алгоритма интеллектуального агента.
Ключевые слова:
машинное обучение с подкреплением, окружение, нейронные сети, смешанное целочисленное программирование, дискретная оптимизация Ray, Gym
Язык публикации: русский,  страниц: 14
Направление исследований:
Математическое моделирование в актуальных проблемах науки и техники
Полный текст на русском языке:
Экспорт ссылки на публикацию в формате:   RIS    BibTeX
Статистика просмотров (обновляется раз в сутки):
за последние 30 дней — 3 (-11), всего с 04.07.2022 — 37
Сведения об авторах:
  • Белозеров Илья Андреевич,  orcid.org/0000-0002-9088-7260НЛ “Прикладное моделирование ФГБОУ ВО РЭУ им. Г.В. Плеханова”
  • Судаков Владимир Анатольевич,  orcid.org/0000-0002-1658-1941ИПМ им. М.В. Келдыша РАН