Sākotnējo prompt nevajadzētu aiztikt
Pašu mutācijas uzdevumu arī vajadzētu mainīt jēgpilni nevis random, izdomāt metodi kā mainīt
Noskaidrot precīzi iemeslu kāpēc pasliktinājās rezultāts (pēc TODO nr2. nedrīkstētu būt ka rezultāts pasliktinās salīdzinot ar single-shot no mutation)
Mutāciju skaitu vajadzētu dinamisku nevis statiski hard-coded
Pamēģināt papildus structured COT elementus kā think_step_by_step, extract_key_variable pirms atbildes choice!
Mutation metodēs arī obligati lietojam labāko sturctured COT metodi
Mutācijas novērtēt ar LLM estimator nevis ground truth un tad salīdzīnāt vai ir līdzīgs efekts kā mutēt ar ground truth (Re-ranking, cits LLM)