2025-Q1-AI 14. ViT Vision Transformers - Homeworks

 

14.3. Implementēt modeli ar talonu mācīšanos

Implementēt talonu mācīšanos izmantojot 14.2 pirmkodu un pievienot “ViT Token learner” pēc publikācijas https://arxiv.org/pdf/2106.11297.pdf Paraugs pirmkodam: https://github.com/google-research/scenic/tree/main/scenic/projects/token_learner

Iesniegt pirmkodu un screenshot ar rezultātiem, salīdzināt rezultātus ar un bez “ViT Token learner”

 

Nepieciešamā arhitektūra

CleanShot 2025-05-19 at 22.13.49@2x

 

 

Pareizā implementācija

 

 

Acīmredzami ģenerēts kods vai arī tad, lai students izskaidro einsum funkcionalitāti kā arī kāpēc parādās softmax => atzīme 5

CleanShot 2025-05-19 at 22.19.58@2x

 

Nepareiza arhitektūra, bet atzīme 8, jo nav klaji ģenerēts kods

CleanShot 2025-05-19 at 22.32.55@2x

 

 

Labākais mēģinājums, kas izskatās pēc paša darba => atzīme 10

CleanShot 2025-05-19 at 22.34.12@2x