Описание
[Otus] Reinforcement Learning. Обучение с подкреплением
Что даст вам этот курс?
Курс предназначен для DS/DL/ML специалистов, которые хотят погрузиться в алгоритмы обучения с подкреплением. После прохождения курса студенты научатся применять алгоритмы RL для решения разнообразных задач в реальном мире, включая игровую индустрию, робототехнику, управление энергетическими системами и управление финансовым портфелем.
Для кого этот курс?
- DS/ML/DL специалисты, которые хотят углубить знания в области обучения с подкреплением и получить практический опыт;
- Разработчики с базовыми навыками Python и ML, которые хотят получить опыт работы с рекомендательными системами;
- Выпускники курсов по машинному обучению
После обучения вы:
- Овладеете основными алгоритмами RL, такими как Q-learning, SARSA, Monte Carlo
- Научитесь строить модель среды и агента, а также проводить обучение на простых игровых сценариях
- Изучите такие алгоритмы, как Deep Q-Network (DQN), Policy Gradient (PG), Actor-Critic, и сможете реализовать их в своих проектах
- Познакомитесь с продвинутыми темами в Reinforcement
Что даст вам этот курс?
Курс предназначен для DS/DL/ML специалистов, которые хотят погрузиться в алгоритмы обучения с подкреплением. После прохождения курса студенты научатся применять алгоритмы RL для решения разнообразных задач в реальном мире, включая игровую индустрию, робототехнику, управление энергетическими системами и управление финансовым портфелем.
Для кого этот курс?
- DS/ML/DL специалисты, которые хотят углубить знания в области обучения с подкреплением и получить практический опыт;
- Разработчики с базовыми навыками Python и ML, которые хотят получить опыт работы с рекомендательными системами;
- Выпускники курсов по машинному обучению
После обучения вы:
- Овладеете основными алгоритмами RL, такими как Q-learning, SARSA, Monte Carlo
- Научитесь строить модель среды и агента, а также проводить обучение на простых игровых сценариях
- Изучите такие алгоритмы, как Deep Q-Network (DQN), Policy Gradient (PG), Actor-Critic, и сможете реализовать их в своих проектах
- Познакомитесь с продвинутыми темами в Reinforcement

Learning, такими как оптимальное управление, методы обучения со скользящим горизонтом, Model-based RL
- Научитесь применять RL для решения конкретных задач и понимать, как это применение работает на практике.
Особенности курса
Особенностью курса является его фокус на практических примерах и проектной работе. Студенты получат необходимые знания для реализации RL алгоритмов в своих собственных проектах и приложениях.
Необходимые знания:
- базовое знакомство с Python;
- базовые знания линейной алгебры (матрицы, векторы, градиентный спуск);
- базовые навыки работы с ML (pandas, sklearn, линейная регрессия, логистическая регрессия).
![[OTUS] Игорь Стурейко, Андрей Канашов - Reinforcement Learning (2023)](https://s1.kladovayakatalog.ru/wp-content/uploads/2026/04/cz0-00.jpg)
![[Нетология] Математика для анализа данных (Алексей Кузьмин, Денис Волк)](https://s1.kladovayakatalog.ru/wp-content/uploads/2021/08/34-324x218.jpg)
![[ExcelProfi] Онлайн курс Excel за 1 день](https://s1.kladovayakatalog.ru/wp-content/uploads/2022/01/2022-01-03_12-55-36-324x302.png)
![[Боевое Вождение] OpenWRT с нуля до профи (2025)](https://s1.kladovayakatalog.ru/wp-content/uploads/2025/06/2025-06-12_00-27-24.jpg)