TODO:
Izpētīt un atrast galvenās Quantizing metodes SLR tabulā.
Vai visas metodes ir tikai programmatiskas vai ir arī matemātiski modeļi / AI risinājumi, kas to dara?
Kādus datasets citi izmanto priekš quantizing? Cik paraugu, kādas valodas utt?
Vai dataset jābūt chat stilā? Kas notiek ja nav chat stilā? Kā tiek parasti formatēts
Kādas metrikas izmanto, lai novētētu cik ātri un/vai precīzi strādā quantized modelis?
Izveidot Github repo Mistral Chat modeli, kurš strādā caur FastAPI WebSocket ar Mistral7B uz vast.ai https://github.com/asya-ai/asya-gpt
Piemērs kā mārcis jau uztaisīja ļoti līdzīgu translate api ar Websockets, kuru izmantojam eldigen https://github.com/asya-ai/api_gramatins
Nomērīt precizitāti ar metriku
Veikt pašiem savu quantizing
Izvēlētties dataseti
Izvēlēties quantizing metodes
Varam veikt quantizing uz HPC (Mārcis var palaist vai parādīt kā izdarīt)
Pētījumu idejas
Kā ietekmē performance quantizing dataset - vai piem LV korpuss palīdzēt tieši LV strādāt labāk
Izveidot Hugging face asya.ai un nopublicēt mūsu quantized modeļus, lai dabūt traffic uz eldigen un asya