2024-Q4-AI-LV-Business 4. Mākslīgie neironu tīkli, klasifikācijas un regresijas modeļi

 

 

4.1. Video / Materiāli (8 Jan 2024, 18:00)

Zoom (jānospiež ieraksts sākumā, pēc tam tiks ielikts youtube unlisted mode): https://us06web.zoom.us/j/81532941877?pwd=L1IgtKhCzcsLfxa5OKjB4N6ChulOab.1 Meeting ID: 815 3294 1877 Passcode: 388048

Whiteboard: https://www.figma.com/board/2GY22EPbQtR1VvRI6jlY9q/2024-Q4-AI-LV-Business-4.-M%C4%81ksl%C4%ABgie-neironu-t%C4%ABkli%2C-klasifik%C4%81cijas-un-regresijas-mode%C4%BCi?node-id=0-1&t=0ud0cEJJabhrf0s6-1

Materials: https://www.geeksforgeeks.org/neural-networks-a-beginners-guide/ https://www.youtube.com/@3blue1brown

 

 

image-20241219192137098

 

Rīki

  1. http://playground.tensorflow.org

  2. Altair AI studio (var dabūt bezmaksas versiju) air RapidMiner AI studio, https://docs.rapidminer.com/latest/studio/installation/index.html#from-rapidminer

  3. Pieeja H2O sistēmai: image-20241202172207190

 

Saturs

Iepriekšējā cikla lekcijas Video: https://youtube.com/live/wQ9Q5zLFkEs?feature=share

Whiteboard: https://whiteboard.fi/f293cc85-489b-4c57-a207-ec2d6a5b96f3

 

  1. Apskatīties dažus piemērus no iepriekšējā mājasdarba, lai motivētu studentus veikt mājasdarbus

  2. Izstāsīt analoģiju par dabīgajiem neironu tīkliem un perceprtonu. Vēsturi pastāstīt. aktivizācijas funkcijas pastāstīt. Pastāstīt arī , ka priekš Deep Learning Neural networks kā minimums vajag 10-50k paraugus, ja mazāk dati ieteicams lietot iepriekšejās lekcijās apskatītās metodes.

    image-20231004143159319

    image-20231004143203535

    img

    image-20241202171811426

    ReLU(x)={x,x>=00,otherwiseReLU(x)x={1,x>=00, otherwise 

  3. Pastāstīt kā mākslīgie neironu tīkli izpildās matemātiski, mazliet pastāstīt par to kas īsti ir matematemātiskajās funkcijās. Ka rotācijas + translācija īstenībā ir tas pats vienādojums, kuru izmanto GPU, lai zīmētu trijstūrus datorrspēlēs, un šeit tas noder arī priekš mākslīgajiem neirnu tīkliem. Kursa dalībnieki nav matemātiķi, jādod tikai ieskats.

    (1)y^=model(x,W1,b1,W2,b2,W3,b3)=Linear(Sigmoid(Linear(Sigmoid(Linear(x,W1,b1)),W2,b2)),W3,b3)Linear(x,W,b)=Wx+bLinear(x,W,b)W=xLinear(x,W,b)x=WLinear(x,W,b)b=1b0=1σ(x)=11+ex

     

    Untitled (255)

    Untitled (257)

     

    1.  

      image-20241202190511973

    image-20241202190441895

     

  4. Parādīt http://playground.tensorflow.org un pastāstīt intuitīvi kāpēc nepietiek ar Linear seperation, kāpēc vajag nonlinearities. Izstāstīt par visiem hiper-parametriem: Learning rate, layer count, Activation

    image-20241202171654424

    image-20241202172000766

     

    image-20231110135817841

    Linear-projection-of-the-data-points-The-figure-shows-the-projection-of-data-points-in-a

  1. Izstāstīt par datu sagatavošanu, ka vajag izprast datus, Normalizēt (feature scaling), cik iespējams augmentēt. Normalize data, split data into train, test and validation (80% vs 20%) or (70% vs 20% vs 10%). K-fold split. Data augmentation, each model has its limitations (if you have just 1000 samples, with augmentation you can get 10000-100000)

    image-20241224003339077

image-20241224003159081

image-20231012174227465

image-20241202173042200http://pytorch.org/vision/master/auto_examples/transforms/plot_transforms_illustrations.html#sphx-glr-auto-examples-transforms-plot-transforms-illustrations-py

  1. Pastāstīt par tipiskajām arhitektūrām - DNN, CNN, ResNet, Transformer - kam kura ir paredzēta, bet ne parāk dziļi. Primāri jāliek viņiem saprast, ka tas ir matemātisko funkciju grafs, kur katra kastīte ir funkcija.

    image-20241202173129330

  1. Pastāstīt par Classification, Regression. Iedot piemērus no interneta veikala - user activity prediction, price prediction, etc., jo dalībnieki būs biznesa studenti. image-20231012163731920

    image-20231012165808034

  2. Pastāstīt intuitīvi kā strādā backpropogation, atpakaļizplatīšanās algoritms. Pastāstīt, ka Geofrey Hinton par šo algoritumu 2024. gadā dabūja nobela prēmiju Fizikā. Pastāstīt, kas ir Epoha. Pastāstīt, ka gradients no kļūdas funkcijas strādā kā dabā zibens vai kā ūdens tek, uzdot gotcha jautājumu par loss function līkni. Pastāstīt arī par Stohastiskā kalnā kāpēja algoritmu SGD. Noteikti parādīt piemēru ar Class Activation Map bildi par PascalVOC dataset, kur AI iemācās atpazīt zirgu pēc paraksta un vieglākā risinājuma nevis pēc cilvēkam saprotams loģikas.

    Untitled (246)

    img

    image-20231012163811712

image-20241202173550408

image-20231012164306997

2tstnz

image-20231012165315753

image-20231012164923046

image-20211006120147471

image-20211006120217910

image-20210929092531501

Untitled (247) Untitled (192)

Untitled (163)

  1. Izstāsīt visu training ciklu. Pastāstīt par to kā rēķina accuracy, confusion matrix, F1 score, bet tikai informatīvi. Izstāstīt par Overfitting (pārapmācīšanos), Underfitting (zemapmācīšanos) un normālu apmācīšanos

    image-20241224005039194

    image-20241224005207423

    Untitled (190) image-20231012175120591

    Untitled (253)

  1. Parādīt kā sastādīt H2O Deep learning modeli. Augšupielādēt CSV failu. Noprocesēt datu kolonu tipus. Sadalīt Train un test kopās. Atzīmēt ignored kolonas modelim, izskaidrot kāpēc! Sastādīt arhitektūru un izstāstīt kā tā veidojas. Izvēlēties adekvātu loss funckiju

image-20241224005444770

image-20241224005519017

image-20241224005544017

image-20241224005603897

image-20241224005646668

image-20241224005706301

Pastāstīt un parādīt Variable importances, par to, ka modeļi nav black-boxes, bet tajos var “ieskatīties” izmantojot metodes kā, piemēram, SHAP LIME GRADCAM ELI5

image-20241202171505424

  1. Parādīt kā šo pašu var realizēt ar Altair AI studio

image-20241202171406133

 

4.2. Klientu novērtējuma prognozēšana

Izmantojot doto datu kopu, apmāciet modeli, izmantojot H2O vai Altair AI studiju, lai prognozētu "Vērtējumu", kas norāda uz apmierinātības novērtējuma prognozi.

http://share.yellowrobot.xyz/quick/2023-10-12-931888F3-5E95-4F53-9D22-85246F6C291F.zip

Iesniedziet modeļa kļūdas funkcijas līkņu un prognozēto rezultātu ekrānuzņēmumus. Tāpat izveidojiet un iesniedziet pašizveidotu CSV failu, kuram tika iegūta prognoze.

 

4.3. Mājasdarbs - Nekustamā īpašuma cenas prognozēšana

Izmantojot doto datu kopu, apmāci modeli, izmantojot H2O vai Altair AI studiju, lai prognozētu "Y mājas cenas vienības teritorijā" no citiem parametriem, kurus tev piedāvā izvēlēties.

http://share.yellowrobot.xyz/quick/2023-10-12-347B9B69-6759-4241-A678-C22AD5487D3C.zip

Iesniedz modeļa kļūdas funkcijas līkņu un prognozēto rezultātu ekrānuzņēmumus. Izveido un iesniedz pašveidotu CSV failu, kas satur prognozes.


 

 

Neutral network diagram