Издательство СО РАН

Издательство СО РАН

Адрес Издательства СО РАН: Россия, 630090, а/я 187
Новосибирск, Морской пр., 2

soran2.gif

Baner_Nauka_Sibiri.jpg


Яндекс.Метрика

Array
(
    [SESS_AUTH] => Array
        (
            [POLICY] => Array
                (
                    [SESSION_TIMEOUT] => 24
                    [SESSION_IP_MASK] => 0.0.0.0
                    [MAX_STORE_NUM] => 10
                    [STORE_IP_MASK] => 0.0.0.0
                    [STORE_TIMEOUT] => 525600
                    [CHECKWORD_TIMEOUT] => 525600
                    [PASSWORD_LENGTH] => 6
                    [PASSWORD_UPPERCASE] => N
                    [PASSWORD_LOWERCASE] => N
                    [PASSWORD_DIGITS] => N
                    [PASSWORD_PUNCTUATION] => N
                    [LOGIN_ATTEMPTS] => 0
                    [PASSWORD_REQUIREMENTS] => Пароль должен быть не менее 6 символов длиной.
                )

        )

    [SESS_IP] => 3.133.145.163
    [SESS_TIME] => 1730105321
    [BX_SESSION_SIGN] => 9b3eeb12a31176bf2731c6c072271eb6
    [fixed_session_id] => e52974a5952f8ffe496079de4f84ffb5
    [UNIQUE_KEY] => 9282a83bba105ea530468a4798655fd9
    [BX_LOGIN_NEED_CAPTCHA_LOGIN] => Array
        (
            [LOGIN] => 
            [POLICY_ATTEMPTS] => 0
        )

)

Поиск по журналу

Автометрия

2024 год, номер 5

ПРИМЕНЕНИЕ ТРАНСФОРМЕРА ДЛЯ КОДИРОВАНИЯ СОСТОЯНИЙ В ОБУЧЕНИИ С ПОДКРЕПЛЕНИЕМ

Д.А. Козлов
Самарский национальный исследовательский университет им. академика С. П. Королёва, Самара, Россия
djoade100@gmail.com
Ключевые слова: обучение с подкреплением, трансформер, SAC
Страницы: 60-68

Аннотация

Исследуется применение архитектуры трансформера для кодирования состояний в алгоритмах обучения с подкреплением. Представлен новый подход, который интегрирует трансформеры с существующими методами, такими как SAC (Soft Actor-Critic), для улучшения их производительности и обобщающей способности. Результаты экспериментальных исследований показывают, что предложенный подход может улучшить обучение в сложных задачах приобретения навыков передвижения в трёхмерном пространстве.

DOI: 10.15372/AUT20240507
Добавить в корзину
Товар добавлен в корзину