2025-04-03 Meeting 63

 

TODO

  1. Palaist uz visas datu kopas nevis pirmie 100

  2. Pamēģināt papildus structured COT elementus kā think_step_by_step, extract_key_variable pirms atbildes choice!

  3. Mutation metodēs arī obligati lietojam labāko sturctured COT metodi

  4. Implementēt un ievākt rezultātus no vismaz 2 mutation metodēm

  5. Fokusēties uz rakstu darbiem CleanShot 2025-04-03 at 10.16.40@2x

  6. Mutācijas novērtēt ar LLM estimator nevis ground truth un tad salīdzīnāt vai ir līdzīgs efekts kā mutēt ar ground truth

 


 

 

Done

  1. Plan & Solve

  2. Zero shot

  3. 2 prompts

Prompt+ -> system prompt ar structure

Vienā jautājuma -> Structured output + chain of thought

 

CleanShot 2025-04-03 at 10.09.01

 

think_step_by_step, extract_key_variable

 

Mutation major -> pēc vairākuma Structured outputs -> ar un bez chain of thought efekts

 

dynamic vs viss

CleanShot 2025-04-03 at 10.11.29