2023-Q1-AI 15. DQN DDQN

15.1. Video / Materials, 24 Apr 2023, 18:00

Video: https://youtube.com/live/0xHdJC_6gyk?feature=share

Jamboard: https://jamboard.google.com/d/116aaOmwkG7Dvo0Tg63WduZhwyYQhQqXciZa7ohqTtCQ/edit?usp=sharing

Sagatavošanās materiāli: Rainbow DQN: https://arxiv.org/abs/1710.02298 https://storage.googleapis.com/deepmind-media/dqn/DQNNaturePaper.pdf https://pytorch.org/tutorials/intermediate/reinforcement_q_learning.html https://medium.freecodecamp.org/an-introduction-to-reinforcement-learning-4339519de419

^ Shared: stefan.dayneko@gmail.com

Youtube key: ea11-mrgb-4jg2-4ajc-d4hr

Iepriekšējā gada video

Video https://youtu.be/tiaoLNMWZUA

Jamboard: https://jamboard.google.com/d/18gFXn4E36cP9P25wSKpvGgEv1mlAnKfDQbB7fGTDPi0/viewer

13.2. Implementēt DQN

Balstoties uz 13.1. materiāliem un video implementēt DQN, izmantojot sagatavi.

Iesniegt kodu un ekrānšāviņus ar rezultātiem.

Template: http://share.yellowrobot.xyz/1628158950-vea-rtu-course-2020-q1/13_2_dqn_lunar_lander_unfinished.py

13.3. Implementēt priority replay memory

Balstoties uz 13.1. materiāliem un video implementēt "Priority replay memory", izmantojot sagatavi.

Iesniegt kodu un ekrānšāviņus ar rezultātiem.

Template: http://share.yellowrobot.xyz/1628158950-vea-rtu-course-2020-q1/13_5_priority_dqn_lunar_lander_unfinished.py

13.4. Implementēt DDQN

Implementēt DDQN, balstoties uz 13.3 uzdevuma sagatavi.

Iesniegt kodu un ekrānšāviņus ar rezultātiem.

Vienādojums: http://share.yellowrobot.xyz/1628158950-vea-rtu-course-2020-q1/ddqn.png

13.5. Mājasdarbs - Dueling DDQN + MountainCar

Balstoties uz 13.4 kodu, implementēt jaunu vidi MountainCar: https://gym.openai.com/envs/MountainCar-v0
Implementēt Dueling DDQN modeļa arhitektūru
Iesniegt kodu un ekrānšāviņus ar rezultātiem.

Modeļa shēma: http://share.yellowrobot.xyz/1628158950-vea-rtu-course-2020-q1/dual.png

Modeļa apraksts: https://arxiv.org/abs/1511.06581

Materials

D0F8F846-6308-404F-9172-48E3ED484C38

B84E1B2A-C95F-40F1-9727-F9C33D880795

28454713-7BA1-4216-AE46-BC195CA49D21

07614319-25B9-4D8E-8A20-3A7CD86465F0

44428F96-1D4A-46BD-A635-8D1C51C295BE