2024-04-24 Meeting 15

Plans:

Metrikas - 1-cos (alpaca, pirmos tasks), perplexity (alpaca), labākas vēl 3 metrikas (COPA, MULTIRC, BoolQ)
Modeļi
1. LLama3
2. Mistral
3. (Optional) Zepyhr https://huggingface.co/HuggingFaceH4/zephyr-7b-beta
Add Hebo search
1. reward: validation loss (hugghingFaceH4/no_robots)
2. Quantizing dataset (GPTQ)
  1. C4
  2. Wiki2
3. Quantize each model once
4. Test 5 x save results - Metrikas
5. Test 1x ar temperature = 0
Runot orģinālos modeļus

Hipotēzes:

Salīdzinājumi esošajos pētījumos nav uzticami, jo modeļos ir temperatūras metodes, kuras ietekmē rezultātu
Kvantizējot ar GPTQ, izmantojot dažādas datu kopas ir ievērojama ietekme uz rezultātu
Semantiskās līdzības rādītājs ievērojami atšķirīgs no citiem izplatītiem LLM rādītājiem (vairāk piemērots ģeneratīviem uzdevumiem)