Еволюція агентів навчання з підкріпленням за допомогою генетичного алгоритму

Волокита, А.; Герега, Б.

Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://ir.stu.cn.ua/123456789/28990

Назва:	Еволюція агентів навчання з підкріпленням за допомогою генетичного алгоритму
Інші назви:	Evolution of reinforcement learning agents using the genetic algorithm
Автори:	Волокита, А. Герега, Б.
Ключові слова:	навчання з підкріпленням генетичний алгоритм агент безградієнтний підхід нейронна мережа CartPole policy gradients reinforcement learning genetic algorithm agent gradient-free approach neural network CartPole policy gradients
Дата публікації:	2023
Видавництво:	Чернігів : НУ "Чернігівська політехніка"
Серія/номер:	Технічні науки та технології;№ 2 (32)
Короткий огляд (реферат):	Це дослідження вивчає використання генетичних алгоритмів для покращення продуктивності агентів, що навчаються за допомогою підкріплення. Ми провели випробування, використовуючи різні параметри нейронної мережі, зокрема ваги, зсуви та функції активації, з метою знайти оптимальні значення, які змушують агента отримувати більше винагород. Наш підхід включає використання знань про предметну область для ініціалізації популяції генетичного алгоритму, а також для оцінки рішень. Це дозволяє нам спрямувати пошук до більш перспективних рішень. Особлива увага приділена впливу різних параметрів генетичного алгоритму на ефективність навчання. Потенційні застосування цього дослідження широкі – від робототехніки та автономних транспортних засобів до ігор та фінансів. Результати дослідження також можна використовувати для розробки нових алгоритмів та методів для покращення продуктивності агентів, що навчаються за допомогою підкріплення, що далі сприятиме розвитку машинного навчання. Наше дослідження показало, що використання генетичного алгоритму може значно покращити ефективність навчання агентів. Результатом роботи є успішне проходження гри CartPole-v0 еволюціонований агентами. 98 % нашої популяції досягнуть максимуму, тобто успішно пройдуть гру.
Опис:	Волокита, А. Еволюція агентів навчання з підкріпленням за допомогою генетичного алгоритму / А. Волокита, Б. Герега // Технічні науки та технології. - 2023. - № 2 (32). - С. 175-184.
URI (Уніфікований ідентифікатор ресурсу):	http://ir.stu.cn.ua/123456789/28990
Розташовується у зібраннях:	Технічні науки та технології. – 2023. – №2 (32)

Файли цього матеріалу:

Файл	Опис	Розмір	Формат
175-184.pdf	стаття	776 kB	Adobe PDF	Переглянути/Відкрити

Показати повний опис матеріалу Перегляд статистики

Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.

DSpace JSPUI

DSpace зберігає і дозволяє легкий і відкритий доступ до всіх видів цифрового контенту, включаючи текст, зображення, анімовані зображення, MPEG і набори даних