Lecture 3: Planning by Dynamic Programming
Overview slide youtube Contents DP는 모든 evironment의 동작방식을 알고 있다는것이 전제이기때문에 RL 문제가 아니다. planning 문제이다. DP는 복잡한 문제를 subproblem으로 나누고 각각의 문제들을 해결한 뒤 하나로 합쳐서 해결한다. 이때 각각의...
Lecture 2: Markov Decision Process
Overview slide youtube Contents 개념 MDP는 RL에서 Goal에 도달하기위한 핵심 구조. “Markov decision processes formally describe an environment for reinforcement learning” “Where the environment is fully observable”( Partially observable problems...
Lecture 1: Introduction to Reinforcement Learning
Overview slide youtube Contents “Reinforcement learning is learning what to do—how to map situations to actions—so as to maximize a numerical reward signal” RL에 필요한 여러 다른분야의 이야기가 많이 있는데...
2018 딥사이트 스터디원 모집 [종료]
안녕하세요. 딥사이트에서 2018년도 강화학습 스터디원을 모집합니다. 2018년 딥사이트에서 강화학습 (Reinforcement Learning) 을 주제로 5기 스터디원을 모집합니다. 그 동안 딥러닝을 주제로 2017년 까지 진행해온 저희 모임에서는 2018년에는 강화학습이라는 새로운 주제로 학습을...