2023-12-14 - Meeting #14

Sagatavaot datu kopu no Mozzila CommonVoice Englisk - 10k paraugus pēc reitinga, 10-20sek augstākais vērtējums, dokumentēt max CSV formātā, kuri paraugi tika paņemti
CER aprēķinam uz API sūtīt par 10k paraugi pa nakti max, 5 paralēli, caching sakodēt, lai otrreiz nav jāsūta to pašu audio
Kas tas par modeli apakšā gTTS? Atrast alternatīvu Open-source primitīvu TTS, kuru būt viegli dokumentēt
Salīdzīnāt uz datu kopas gTTS un ViTs ar NISQA, CER
Noskaidot no VitS code kas ir P jeb Score TTS "Monotonic Alignment Search" kur tas atrodas precīzi kodā P(x, z) Kā nosaka score?
Veikt rakstu darbus:
1. Priekš Latex tabulām izmantot - Excel2Latex /tables/slr_1.text
2. Ievads (bez apakš nodaļām) - 1lpp
  - Super vienkāršots ievads
  - Mērķis
    - Veikt sistemātisko zinātniskās literatūras analīzi un salīdzinājumu starp runas ģenerēšanas modeļiem angļu valodā
  - Uzdevumi
    - Iepazīties ar runas ģenerēšanas modeļiem, kuri nebalstās dziļajā māšinmācīšanā
    - Iepazīties nebalstās dziļajā māšinmācīšanās
    - …
3. Datu kopas apraksts (histogrammas vārdiem utt)
4. Sistemātiskā literatūras analīze