ПРИМЕНЕНИЕ ТРАНСФОРМЕРА ДЛЯ КОДИРОВАНИЯ СОСТОЯНИЙ В ОБУЧЕНИИ С ПОДКРЕПЛЕНИЕМ
Д.А. Козлов
"Самарский национальный исследовательский университет им. академика С. П. Королёва, Самара, Россия djoade100@gmail.com"
Ключевые слова: обучение с подкреплением, трансформер, SAC
Страницы: 60-68
Аннотация
Исследуется применение архитектуры трансформера для кодирования состояний в алгоритмах обучения с подкреплением. Представлен новый подход, который интегрирует трансформеры с существующими методами, такими как SAC (Soft Actor-Critic), для улучшения их производительности и обобщающей способности. Результаты экспериментальных исследований показывают, что предложенный подход может улучшить обучение в сложных задачах приобретения навыков передвижения в трёхмерном пространстве.
Наш сайт использует куки. Продолжая им пользоваться, вы соглашаетесь на обработку персональных данных в соответствии с политикой конфиденциальности. Подробнее