Datu kopa, kura nav izmantota apmācībā - CommonVoice daļa
Implementēts NISQA, CER (asya API collection)
Sagatavaot datu kopu no Mozzila CommonVoice Englisk - 10k paraugus pēc reitinga, 10-20sek augstākais vērtējums, dokumentēt max CSV formātā, kuri paraugi tika paņemti
CER aprēķinam uz API sūtīt par 10k paraugi pa nakti max, 5 paralēli, caching sakodēt, lai otrreiz nav jāsūta to pašu audio
Kas tas par modeli apakšā gTTS? Atrast alternatīvu Open-source primitīvu TTS, kuru būt viegli dokumentēt
Salīdzīnāt uz datu kopas gTTS un ViTs ar NISQA, CER
Noskaidot no VitS code kas ir P jeb Score TTS "Monotonic Alignment Search" kur tas atrodas precīzi kodā P(x, z) Kā nosaka score?
Veikt rakstu darbus:
Priekš Latex tabulām izmantot - Excel2Latex /tables/slr_1.text
Ievads (bez apakš nodaļām) - 1lpp
Super vienkāršots ievads
Mērķis
Veikt sistemātisko zinātniskās literatūras analīzi un salīdzinājumu starp runas ģenerēšanas modeļiem angļu valodā
Uzdevumi
Iepazīties ar runas ģenerēšanas modeļiem, kuri nebalstās dziļajā māšinmācīšanā
Iepazīties nebalstās dziļajā māšinmācīšanās
…
Datu kopas apraksts (histogrammas vārdiem utt)
Sistemātiskā literatūras analīze