2025-04-16 Meeting 65

Done

Majority vote tabulā parādīt ka nestrās
Pamēģināt papildus structured COT elementus kā think_step_by_step, extract_key_variable pirms atbildes choice!
1. Palīdz uzlabot

Gatavot rezultātu tabulu, kuru prezentēt arī prezentācijā (kā stabiņus)

Tabula (Katrai datu kopai):

Accuracy ar prompt kas ir mutēts pret visu datu kopu Ground truth - statiski pret visu kopu: 86.22% -> Not real-life, theoretically best
Accuracy ar prompt kas ir mutēts katram sample pret Ground truth - dinamiskais: 94.43%
1. Visi paveidi 98.82% -> Not real-life
2. …
Accuracy ar prompt kas ir mutēts katram sample (dynamic) - pēc vairākuma balsojuma: 77.56% (major) -> Real-life, bet vanilla
Accuracy ar prompt kas ir mutēts katram sample (dynamic) - CoT+atbilde -> ranking
1. Notestēt dažādus ranking modeļus
2. …
Accuracy ar prompt kas ir mutēts katram sample (dynamic) - CoT+atbilde -> citu valodas modeli (score dodot pa vienai, rank dod visas), Gemini kā vērtētājs

Tēmas aktualitāte - zinātnisko rakstu, datu kopu, modeļu pieejamības statistika

Literatūra

Obligāti prezentācijā ielikt: