2023-Q3-AI 5. Image classification - ConvNet ResNet

 

5.1. Video / Materials

Video: https://youtube.com/live/nVY2l0CWN6Y?feature=share

Jamboard: https://jamboard.google.com/d/1Hwx0VZ7OKecyJnUps0d-CZXKiR5vFPTsg4Fe7-DMgEA/edit?usp=sharing

Materials: https://cs231n.github.io/convolutional-networks/ http://www.cs.utoronto.ca/~rgrosse/cacm2011-cdbn.pdf https://ikhlestov.github.io/pages/machine-learning/convolutions-types/ https://github.com/vdumoulin/conv_arithmetic/blob/master/README.md

ResNet: https://arxiv.org/abs/1512.03385

DenseNet: https://arxiv.org/abs/1608.06993


Ir iedota pieeja jamboard un ar OBS jāveic screen streaming uz šādu setting

OBS key: s29p-6tk6-hyq3-uueu-0hvf

Par katru uzdevumu dodam 100 punktus

 

 


5.2. Implement the Conv2D kernel function

Implement Conv2D without using the built-in PyTorch version, following the instructions from the video.

Submit the code and a screenshot with the best results.

Template:

http://share.yellowrobot.xyz/quick/2023-2-27-7FA5DF91-9B41-4E56-8630-485CCA078E45.zip


5.3. Implement ResBlock according to the scheme

Implement ResBlock according to the scheme, this time using the built-in PyTorch ConvNet2d class.

Submit the code and a screenshot with the best results.

Template:

http://share.yellowrobot.xyz/quick/2023-3-5-746B40C5-AD38-4ABC-B0EB-88664531AC55.zip

Scheme:

http://share.yellowrobot.xyz/upic/a65c781c39c912ce3f6eb0fa0d8683d2_1648487642.png


5.4. Implement DenseBlock according to the scheme

Implement DenseBlock according to the scheme:

http://share.yellowrobot.xyz/upic/78a04509453a172cc8e9f4596e3f1bfb_1648487642.png

Concat torch across the channel dimension: out = torch.cat([x, conv1, conv2], dim=1)

Submit the code and a screenshot with the best results.


5.5. Implement Transition Layer according to the scheme

Implement Transition Layer according to the scheme:

http://share.yellowrobot.xyz/upic/818ebd4aefaaac1b89a95a001b8c2f84_1648487642.png

Submit the code and a screenshot with the best results.

 


Klases materiāli

 

Vēl labi materiāli + vizuālizācijas:

 

Saturs - ConvNet:

  1. Sākotnēji resursu dēļ izmantoja convnets kā optimizāciju parametru skaitam - Le Cun

  2. Izstāstīt basics datu struktūru image classification task (viņi zina tikai regresiju un klasifikāciju parastiem 1D datiem)

  3. Izstāstīt un implementēt Conv2D kernel function kopā

  4. Ja paspēj var klasē iedot implementēt BatchNorm + izstādīt dažādus norm un pooling

  5. Mājās implementēt ar iebūtvētajām torch functions arhitektūru

 

Ideāli būtu pamēģināt citu dataset nevis FashionMNIST, piemēram, bet tad jāsagatavo ar download_url_to_file kā 6. sessijā GIT piemērā

 

Iepriekšējā gada video par ConvNet

Video: https://youtu.be/xaj1cWtI_BM

Jamboard: https://jamboard.google.com/d/152zSE59rHNV9m-aMhhckM174RiHKdi1RQy_-XSrBN38/edit?usp=sharing

Iepriekšējā gada video par ResNet

Video: https://youtu.be/y9CcSpH1Db4

Jamboard (iedota edit pieeja stefan.dayneko@gmail.com): https://jamboard.google.com/d/1T0k_rnWjj5Flyd0BzJ3-At0QyOth78lfTSkKMdS1Zck/edit?usp=sharing

 

Saturs - ResNet:

  1. Wanishing gradient problem, training time

  2. Jāizstāsta par ResNet jēgu

  3. Kopīgi jāuzkodē

  4. Jāpastāsta vairāk kā izmantot cuda un kā palaist uz GoogleCollab, jo o aizmirsam pagājušā reizē laikam

  5. pastāstīt par print_model_size

  6. Jāizstāsta par DenseNet jēgu

  7. Kopīgi jāuzkodē

  8. Parādīt kā pārveidot dataset un CCE loss, lai strādātu ar indexes bez One-hot-encoded

  9. Mājās InceptionNet jāiedod - 1000 punkti

 

⚠️ Iesaku parādīt / pamainīt saturu, lai implementētuj HRNet, RegNet

https://paperswithcode.com/method/hrnet

 

⚠️ Lūdzu neizmantot __call__ operatoru

Tā vietā izmantot

Citādi studenti nesaprot atsķirību starp member funkciju un member instances funkcijas izsaukumu

 

⚠️ Lūdzu neraksti objektus / funkcijas bez named params, ja ir hardcoded

vietā

Jo, tad kods nav saprotams tiem, kas nepārvalda ļoti labi tās funkcijas

 

 


Bildes slaidiem

 

 

https://www.cs.umd.edu/~tomg/projects/landscapes/

image-20221129192648830

 

 

Bioloģiskais pamatojums, bet patiesība optimizācija

image-20221129193238304

img

http://cs231n.stanford.edu/slides/2018/cs231n_2018_lecture05.pdf

 

 

E9840FB5-1BFA-4D70-A863-81F999320365

D8C64824-0190-4A6A-9C4E-85801D476F16

AEB0A131-0381-48B3-ACCC-CDF579BBCF05

CAE07C28-BD56-4E9F-BEAC-0E8654860697

4FB09E95-B78C-468F-84A9-5B0836379BB6

B44C3C59-C924-442F-A8A1-D2C34A760AA6

 

image-20211018153940662

 

image-20211018153950281

 

 

image-20220727154243184

 

 

Feature Maps. Feature Map is also called as… | by Chris Kevin | Medium

 

image-20221202100422622

 

image-20221202101157276

 

ResNet / DenseNet

 

89462AEA-706D-4882-A8F8-213FEA3205F1

27A6E847-6B14-44F7-8A31-1515EE64406A

2D300D24-55A4-49B4-9DE5-762A96A4E0FF

C40766D4-FE91-4FB2-B22D-6DA38532DAE8

3D6EDABD-E3AE-4A39-AFF0-8434A758233C

962CAF7E-A018-4459-90CA-E6A7A1192A57

5FF1D9BF-081D-4AAA-8E1D-5B8A07C9ED83

FED42FCF-7590-4C8E-B2A3-CE9EF1DB67B4

 

001B172D-5D93-4FEA-B70C-D69559D162E8

992823B3-F29F-401C-B6F8-5ED62BBEBE8E

FD8C8D2D-5690-4DB9-8B98-646A192E2614

 

 

image-20230227214533659