2023-12-14 - Meeting #14

 

Done

  1. Datu kopa, kura nav izmantota apmācībā - CommonVoice daļa

  2. Implementēts NISQA, CER (asya API collection)

 

TODO

  1. Sagatavaot datu kopu no Mozzila CommonVoice Englisk - 10k paraugus pēc reitinga, 10-20sek augstākais vērtējums, dokumentēt max CSV formātā, kuri paraugi tika paņemti

  2. CER aprēķinam uz API sūtīt par 10k paraugi pa nakti max, 5 paralēli, caching sakodēt, lai otrreiz nav jāsūta to pašu audio

  3. Kas tas par modeli apakšā gTTS? Atrast alternatīvu Open-source primitīvu TTS, kuru būt viegli dokumentēt

  4. Salīdzīnāt uz datu kopas gTTS un ViTs ar NISQA, CER

  5. Noskaidot no VitS code kas ir P jeb Score TTS "Monotonic Alignment Search" kur tas atrodas precīzi kodā P(x, z) Kā nosaka score?

  6. Veikt rakstu darbus:

    1. Priekš Latex tabulām izmantot - Excel2Latex /tables/slr_1.text

    2. Ievads (bez apakš nodaļām) - 1lpp

      • Super vienkāršots ievads

      • Mērķis

        • Veikt sistemātisko zinātniskās literatūras analīzi un salīdzinājumu starp runas ģenerēšanas modeļiem angļu valodā

      • Uzdevumi

        • Iepazīties ar runas ģenerēšanas modeļiem, kuri nebalstās dziļajā māšinmācīšanā

        • Iepazīties nebalstās dziļajā māšinmācīšanās

    3. Datu kopas apraksts (histogrammas vārdiem utt)

    4. Sistemātiskā literatūras analīze