2025-03-17 Waterson Nodevums #3Nodevuma failiModeļu novērtējumsDokumentācijaasya_model.py izmaiņasmodel demo izmaiņasPapildus komentāri
GDrive nodevumi: https://drive.google.com/drive/folders/1vqlVzzu1CI4RvFYO_JcKf9sqJKKy4l7S
Nodevums kā ZIP fails:
Zemāk dotās Confusion Matrix ir veidotas, izmantojot ansambļus ar konkrēta tipa modeļiem.
Vecais modelis
Labāk spēj atpazīt Groundwater par jaunajiem modeļiem, bet kopumā sliktāk atpazīst anomālijas, pārāk daudz Dalse positives. Precizitāte uz anomāliju noteikšanu 71.8%, bet tieši uz konkrēto piesārņojuma veidu ir 39.9% F1.
Jaunais modelis apmācīts uz visām pieejamām datu kopām WT_DB1,2,3,4
Labāk spēj atpazīt Wastewater un Discoloration. Kopā ir labāks nekā vecais uz anomāliju noteikšanu ar ievērojami mazāk False Positive rate (neesošie piesārņojuma notikumi). Precizitāte uz anomāliju noteikšanu 75.6%, bet tieši uz konkrēto piesārņojuma veidu ir 49.5% F1.
Jaunais modelis apmācīts uz WT_DB1,3,4. WT2 bija trokšņaina datu kopa, tāpēc iepriekš nebija labākie rezultāti, to pievienojot, bet pēc mūsu datu tīrīšanas, izskatās, ka turpmāk varēs pievienot šo kopu, jo rezultāti pasliktinās, noņemot šo datu kopu.
Divas jaunas palīgmetodes:
timepoint_extractor demonstrācija un apskate pievienota demo, bet šo metodi nav nepieciešams izmantot, lai strādātu ar ansambļu modeli. Ja TC un TN ir noformēti atbilstoši prasībām, tad tos var veidot arī jebkurā citā veidā pēc ieskatiem un nepieciešamības.
Īss ieskats validācijas kopā:
Ansambļa demonstrācijas:
Šobrīd uzstādītie deltu intervāli katrai anomālijai tika izvēlēti manuāli testējot un atbilst tiem, kas redzami apjukuma matricās pie modeļu novērtējuma. Ar šīm vērtībām noteikti var eksperimentēt, lai iegūtu labākus rezultātus.
timepoint_extractor
metodei nav svarīgi, kāds skaits laika soļu tiek prasīts un ar kādiem intervāliem - var izmantot nevis 5, bet, piemēram 10, laika soļus. Arī maksimālais laiks nav ierobežots - vienīgi jāpatur prātā, ka metode izņem tos punktus no TC, kuriem nevar atrast derīgus vēsturiskos lasījumus (ārpus pieļaujamās kļūdas minūtēs).