2024-01-30 - Meeting #19

 

TODO

 

  1. Samazināt darbu līdz aptuveni 8 lpp (vēlams pat vēl mazāk)

  2. Paskaidrot precīzāk attēlā, ka tas ir procenti pret common voice. pārvietot labels augšā

image-20240130174141445

  1. Noņemt nenozīmīgos conclusions, pārtaisīt plūstošā tekstā - nevajag būt kā bakalaurā spoguļskatā ar uzdevumiem.

image-20240130174243984

 

  1. Pārformulēt “Method does not rely on machine learning” (pamēģināt vismaz pētījuma daļā iekļaut tā otra studenta difonu metodi arī)

 

image-20240130174422167

 

  1. Uzlabot formulējumu

image-20240130174459658

 

  1. Netaisīt paragrāfus pārāk bieži, ar ChatGPT saīsināt

image-20240130174549268

 

  1. Pirmās citātu tabulas vietā izveidot apmēram šādu grafu, grupēt ar krāsām pēc modeļu tipa un peilikt arī atsauces uz gadu, kad izveidots

image-20240130175355401

 

  1. Reducēt mazās nodaļas un apvienot vienā, saīsinot ar ChatGPT, bet tā lai paliek skaitļi un fakti

 

Prompts kuru es lietoju

 

 

 

image-20240130175450275

image-20240130175535328

 

  1. Salabot stiklu ar Writefull

  2. Pirms apmācam mūsu modeļus LV, nomērīt un detalizēti dokumentēt Latviešu valodas ViTs modeli

    1. Uz kā tas tika apmācīts noskaidrot

    2. No mūsu datu kopām - balss talka Common voice sagatavot validācijas kopu

    3. Pārbaudīt uz metrikām WER, CER, NISQA

  3. Ar mūsu datiem uz HPC apmācīt jaunu modeli (no sākuma ne ar visiem datiem, lai novērstu bugs), pieslēgt Ternsorboard, weights and biases vai ClearML, lai vari sekot līdzi apmācībai - maksimāli dokumentēt visu