2025-03-20 Meeting 62

 

TODO

  1. Structured izslēdzot reasoning(solution explanation )

  2. Salīdzināt Plan-and-solve VS Chain-of-thought

  3. Notestēt bez structured output ar 2 vaicājumiem - viens Task un otrs piespiest uz precīzu atbildi

  4. Prompt breeder, Pārrakstīt mutation, lai ir kvalitatīvi vaicājumi uzdevums no pagājušas nedēļas note

  5. Pārsaukt: no-struct - tikai task prompt struct - ar papildus instrukcijām

  6. Mutējumi real-time uz katru vaicājumu VS uz visu kopu

  7. Mutācijas novērtēt ar LLM estimator nevis ground truth un tad salīdzīnāt vai ir līdzīgs efekts kā mutēt ar ground truth

 

Priekšaizstāvēšanās Darba nodošana - 9. aprīlis 75%

 

Pievienot darbam