Majority vote tabulā parādīt ka nestrās
Pamēģināt papildus structured COT elementus kā think_step_by_step, extract_key_variable pirms atbildes choice!
Palīdz uzlabot
Gatavot rezultātu tabulu, kuru prezentēt arī prezentācijā (kā stabiņus)
Tabula (Katrai datu kopai):
Accuracy ar prompt kas ir mutēts pret visu datu kopu Ground truth - statiski pret visu kopu: 86.22% -> Not real-life, theoretically best
Accuracy ar prompt kas ir mutēts katram sample pret Ground truth - dinamiskais: 94.43%
Visi paveidi 98.82% -> Not real-life
…
Accuracy ar prompt kas ir mutēts katram sample (dynamic) - pēc vairākuma balsojuma: 77.56% (major) -> Real-life, bet vanilla
Accuracy ar prompt kas ir mutēts katram sample (dynamic) - CoT+atbilde -> ranking
Notestēt dažādus ranking modeļus
…
Accuracy ar prompt kas ir mutēts katram sample (dynamic) - CoT+atbilde -> citu valodas modeli (score dodot pa vienai, rank dod visas), Gemini kā vērtētājs
Tēmas aktualitāte - zinātnisko rakstu, datu kopu, modeļu pieejamības statistika
Literatūra
Cik metodes kopā apskatītas
Cik datu kopas kopā apskatītas
Cik izvēlētas
Par cik šis metodes uzlabo rezultātu zinātniskajā rezultātus
Obligāti prezentācijā ielikt:
Mutācijas shēmas
Paris paraugu Jautājums (+ mutāciju paraugus) -> CoT, Atbilde -> GT
Rezultātu salīdzinājumu tabulu (Eksperimentu skaits 346 pieraktīt)