2023-12-29 - Meeting #15

 

Done:

  1. Eksperimenti ar MaryTTS, ViTS

  2. Atrasts MaryTTS no 2005-2016, kas izmanto difonu līmēšanu

  3. 4700 Paraugi atlasīti Audio kvalitātes reitings

  4. NISQA prognozē MOS

 

 

TODO:

  1. Teksta daļa

    1. Vispirms sarakstīt SLR (zemāk paraugi vēlreiz), uztaisi XLSX ar sheets un izmanto Excel2Latex

    2. Primāri tabulas - Datu kopas, Modeļi, Metrikas

    3. Uztaisi kvalitātes kritētijus tā, lai izvēlētos tieši NISQA, CER, Mozzila Common Voice, MaryTTS, ViTS kā pētēmos objektus

  2. Eksperimentālā daļa

    1. Īsos paraugus noņemt, kuri nespēj atrast STT

    2. Normalizēt tekstus, lai rēķinātu CER un WER

    3. Orģinālajam audio arī izrēķināt NISQA un CER un WER

    4. Salīdzināt arī citus modeļus gTTS utt


 

Examples of SLR tables:

  1. https://puupuls.notion.site/SLR-Tabula-1-04cafc5ed342497b92629b87c2c1e548

    1. Trūkst:

      1. Cite by year

      2. Future research

  2. https://www.evernote.com/shard/s736/sh/2c598470-3b41-6a1c-d629-3fa44ec1e0c3/c340ef470d5f0d9391b709d03751445f

 

Examples of Finished SLR:

  1. http://share.yellowrobot.xyz/quick/2023-2-28-62301A6A-9494-43EE-B86B-007AF6F685EB.pdf

  2. https://sci-hub.hkvisa.net/10.1016/j.infsof.2008.09.009

  3. https://www.sciencedirect.com/science/article/pii/S0950584908001390

  4. http://share.yellowrobot.xyz/quick/2023-2-28-0CCAE1B2-6579-4F45-97E3-A12AEDA732B0.pdf

 

Izveidot un nosharot SLR (Systematic Literature review tabulu)

  1. Atrast datu kopas

  2. Atrast SOTA (State of the Art) metrikas un vērtības katrai kopai

  3. Atrast metodes - dažādas kļūdas funkcijas, modeļu arhitektūras, pre-processing, post-processing

  4. Tabula - kolonas:

    1. Nr - Vismaz 20 pētījumi

    2. Gads

    3. Nosaukums

    4. Keywords

    5. Links uz pētījumu

    6. Links uz Github ja ir (vēlams)

    7. Organizācija (universitāte, firma)

    8. Citātu skaits (Semantic schollar)

    9. Datu kopas (kuras tiek izmatotas) - Ja nav publicēta vai nav info par datu kopu: NAV

    10. Metrikas un Rezultāti (kuras tiek izmantotas, lai noteiktu metodes darbību uz katru datu kopu), ja nav precīzi rezultāti, tad: NAV

    11. Modelis (kāda ir modeļa arhitektūra), var būt arī NE DL modelis

    12. Metode (kas ir galvenā metode, kura tiek izmantota)

    13. Tālākie pētījumi (ko iesaka vēl pētīt)

 

Best tool for reading PDFs (or find others using langchain):

  1. https://chatpdf.com

  2. perplexity.ai PDF upload function

 

 

Tool to access any publication:

  1. http://sci-hub.hkvisa.net

 

Use these databases for searching papers:

  1. http://semanticscholar.org

  2. http://researchrabbitapp.com

  3. https://deeplearn.org

  4. https://scirate.com

  5. https://arxiv-sanity-lite.com

  6. http://perplexity.ai (academic section)

  7. https://typeset.io

 

Obligāti datu kopām pārmeklēt līdzīgas ar:

  1. http://zenodo.org

  2. http://paperswithcode.com