SLR: https://krsaulitis.notion.site/SLR-d5f432b90c8b49aa83de786c879b0a94
Github: https://github.com/krsaulitis/course-project
Atziņas:
Inference https://github.com/jaywalnut310/vits (robotic)
TODO:
SLR pāraisīt Multi-speaker kolona nevis tag, jo nevar saprast vai pielikts
Atrast validācijas teksta kopu uz kuras testēt nelielu (ar ko bija apmācīti) un vienu uz kuras nebija apmācīts piemēram (Turmp tweets vai kaut kas tāds)
Inferencē pārbāudīt visus modeļus (pašam klausīties vienu un otru paraugus) arī ViT2 strukturizēt Github
Speaker z - jāņem no tiem, kurus viņi paši iesaka
Github: /inference_test /vit.py /glow_tts.py
Palaist uz paraugiem ViSQL metriku - noteikt kuri pieejamie pre-trained modeļi ir labākie
Pēc tā izveidot kvalitātes kritērijus literatūrai un tabulu
Pārnest tabulas iekš Overleaf - nodzēst paula saturu https://www.overleaf.com/project/654bb8edd43eb0ea752346cb
Vēlams SLR rakstīt šādā veidā (vertikālas tabulas): http://share.yellowrobot.xyz/quick/2023-11-8-C8BA5CFB-675C-477E-82B8-8E9BD405488A.pdf
Dokumentēt ”why latest STT research do not use WER/CER as metric?” https://www.perplexity.ai/search/list-of-typical-HoB0Aet2SP2I9Ti6azldzQ?s=c https://www.perplexity.ai/search/why-latest-STT-5rPIh1ORTG6WvJuTxDEo6g?s=c ^ Kvalitāte - robota balss
Dokumentēt - ViSQL
Dokumentēt - Kādā veidā tiek rēķināts “pronounciation error rate”?
Dokumentēt - Kāds ir uzdevums Monotonic Alignement Search? Izskaidrot ko dara nevis kā strādā precīzi
Visa darba nodaļas
Darba struktūra:
Ievads (bez apakš nodaļām) - 1lpp
Super vienkāršots ievads
Uzdevumi
Mērķi
Saistītie pētījumi
Nevar uzreiz sekot apakš nodaļas jābūt nelielam saistošam tekstam
Rīki pētījumā - TTS kā vispār veic, sheamtiski - 3lpp * 3
Atsaukties uz Deep Learning pamat-teoriju, bet neaprakstīt - data processing, modelis, loss func, backprop, optimizer, metric, overfitting.. (katru pieminam 2-3 teikumi + atsauce) - 3lpp
Sistemātiskā literatūras analīze
Tabulas
Kvalitātes kritēriji
Zem katras tabulas paskaidorojumi
Mērķis “izvēlēties” labāko modeli un metrikas tālākam darbam
Metodoloģija - 15 lpp
Datu kopa
Datu Paraugi, Histogrammas pēc klasem ut
Paši paraugi kā piemēri
Apmācību un testēšanas protokls
Shēma kā tiks apmācīts un testēts rezultāts
Metrikas
Modeļu arhitektūras
Modeļu shemas
Rezultāti - 10 lpp
Tabula ar Validācijas kopām
[Rezultātu analīze / Diskusija]
Tālākie pētījumi - 1lpp
Secinājumi - 1lpp
Some of books to use:
https://www.math.uwaterloo.ca/~hwolkowi/matrixcookbook.pdf https://www.deeplearningbook.org/contents/mlp.html https://d2l.ai/d2l-en.pdf http://152.67.89.169/1629722468-deep-learning-theory
Great explanations of basic maths: http://mathproofs.blogspot.com/2006/07/dot-product-and-cosine.html