Structured izslēdzot reasoning(solution explanation )
Salīdzināt Plan-and-solve VS Chain-of-thought
Notestēt bez structured output ar 2 vaicājumiem - viens Task un otrs piespiest uz precīzu atbildi
Prompt breeder, Pārrakstīt mutation, lai ir kvalitatīvi vaicājumi uzdevums no pagājušas nedēļas note
Pārsaukt: no-struct - tikai task prompt struct - ar papildus instrukcijām
Mutējumi real-time uz katru vaicājumu VS uz visu kopu
Mutācijas novērtēt ar LLM estimator nevis ground truth un tad salīdzīnāt vai ir līdzīgs efekts kā mutēt ar ground truth
Priekšaizstāvēšanās Darba nodošana - 9. aprīlis 75%
Pievienot darbam
xxxxxxxxxx
11Hipotēze: Izmantojot automātiski mutētus vaicājumus, kuri tiek pielāgoti konkrētai datu kopai un uzdevumam, iespējams sasniegt augstāku precizitāti matemātikas un simbolu loģikas uzdevumos, izmantojot lielos valodas modeļus.