Darbību secība:
Tiek pieslēgtas integrācijas, viena no:
Sharepoint, NextCloud faili no konkrētas direktorijas. Taisam, ka Ja direktorija satur apakšdirektorijas, tad katra jaunā direktorija ir jauna failu grupa, jeb iesniegums. Ja satur tikai failus, tad katrs fails atsevišķi ir iesniegums.
Epastos saņemtie attachements faili, atfiltrējot pēc tēmu kritērijiem (kā jau tas tagad ieplānots). Vienā epastā var būt vairāki faili, kas visi tiks apstrādāti vienā grupā.
Formas no Custom business.gov.lv vai nākotnē google forms, airtable, typeform, HTML formas
Vēl var arī vispār neizmantot nekādas integrācijas un manuāli augšupielādēt failus. Faili var saturēt arī vairākus failus, jeb failu grupu. Pievienojot jaunus submissions nav jānorāda checklists, jo visi būs aktīvi konkrētajam agent.
Tiek izveidoti checklists, kur var izvēlēties:
Visi pievienotie checklists tiks izpildīti uz attiecīgā aģenta pievienotajiem dokumentiem caur integrācijām vai manuāli. Jāspē Pārkopēt checklists no cita agent savā organizācijā, lai nav vēlreiz manuāli jāievada.
Minimālo procentu pie kura dokuments kvalificējas - nevis jautājumu, bet tieši kritēriju procentu
Piesaisti konkrētai Formai vai Failiem
Ja ir izvēlēts Fails, tad nenorāda vispār nekādu lauku pie jautājuma un tiks izmantots RAG, lai meklētu teksta gabalus, kas pamato atbildes. Jair izvēlēts fails jābūt iespējai pievienot opcionāli Zvaigznīšu filename atpazīšanu, lai atpazītu, kuram failam jāpielieto konkrētais checlist!
Ja ir izvēlēta Forma , tad pārbauda katru definēto lauku
Kvalifikācijas kritērijus
Pats kritērijs var būt "Kritisks" pārsaukt "Obligāts" nevis Jautājumi Kritiski 🔴 Viktors.
Katrs kritērijs sastāv no jautājumiem Jā/Nē
Nosaka vai visi jautājumi izpildās kā OR vai kā ANY
Nosaka, kuram laukam atbilst Jautājums, ja ir izvēlēta Formai
Svarīgi, ka ievades lauks Formai arī var būt Fails (vai vairāki faili!), tādā gadījumā tiks izmantots RAG
🔴 Raitis - Neveiksmīgs dizains (līdzīgi kā pie topics editora), kur vienā pusē ļoti garš scroll
Checklists pārskatā qualified documents varētu rādīt kā procentus ar domu, lai saprastu cik daudz dokumenti spējuši izturēt atlasi
Dokumentu skati (pārsaukt Submissions / Iesniegumi)
Dokumentu skati ir paši galvenie ikdienā, tur parāda cik daudz saturs ir noprocesēts un kādu kvalifikācijas kritērija vērtību esam ieguvuši
Jārāda cik kritēriji ir % noprocesēti un cik ir % kritēriju izpildās no katra checklist, ja visi izpildās ir Qualified. Jārada arī no kuras formas nāk dokuments, ka tāda forma eksistē.
Šeit vara arī manuāli augšupielādēt dokumentus, kuri izprocēsēs visus checklists, kas ir pievienoti agent.
Ja būs 3 checklisti, tad katram dokumentam būs 3 kvalifikācijas rezultāti - būtu labi tos sagrupēt vizuāli, bet lielākajā daļā gadījumu būs tikai viens checklist.
Ja izpildās visi checklists, tad dokuments vai forma ir Qualified. Var redzēt arī katras apakš cheklist statusu. Ja ir tikai viens checklist visu rādam vienā rindā bez grupas.
Šādā veidā vizuāls saturs būtu labāk, jāņem vērā, ka būs daudz lapas un vajadzētu
Atvērt var katra checklist rezultātus atsevišķi
AI pārbaudes daļa
Submission sastāv no submission_files un submission_forms (var saturēt vienu vai vairākus failus vai vienu vai vairākas formas). Katram checklist pretī ir submission_checklist_result, kas saturēs submission_checklist_criteria_result un katrai criteria ir submission_checklist_criteria_question_result. Tas nav pretī visam submission, bet tikai pretī checklist. Submission statistika ir pašā submission tabulā.
Jāatceras, ka vienā submission var saturēt N submission_checklist_result un katrai checklist var būt N files piesaistīti vai viena forma. Bet formā var būt lauki, kurā ir N files. Submission progress sastāv no visu apakš cheklistu progresu summas, bet qualified_percentage ir minimālā vērtība, lai novērstu, to, ka kā deal apakš checklist ir disqualified, bet kopējais ir qualified.
submission saturēs failus datu struktūrā submission_files, tāpāt jābūt submission_forms, kuri sasaistīti ar submission. Katru failu varētu parsēt ar jau esošo facts processing, bet nav nepieciešams izveidot Jautājums - Atbildes daļu, jāizmanto Raw translated teksts.
Faili tiek apstrādāti kā Facts un tiek meklēta atbilde jebkuram no piesaistītajiem jautājumiem. Checklist sadaļā varēs ievadīt regex filename filtru, lai atrastu konkrētus failus. Jo piemēram, viens submission saturēs dažādus failus piemēram CV, motivācijas raksts, portfolio, etc. Katram var tikt uzmantots cits checklist.
Formas tiek piesaistītas tiešā veidā checklistam ar dropdown un katrs jautājums arī tiek piesaistīts formas laukam. šajā gadījumā nav vajadzīgs RAG, lai atrastu atbildi, kuru jāievada forms laukā.
Number laukiem, jautājumus jāpārvērš python code un jātaisa (jāuztaisa aizsardzība pret injections). Kodā ir jāpārvērš cilvēka dotais jautājums, lai atbilde netiktu ģenerēta ar LLM. Piemēram vismaz 2000 EUR apgrozījums. input >= 2000
jo laukā nevar ievadīt tekstu.
31 code_with_math = "sum = 5 + 4\nprint(sum)"
2 exec(code_with_math)
3
Failu gadījumā - Jāveic semantic un BM25 search no translated teksta un jāpiemeklē chunks pārbaudei, lai nebūtu pilnīgi viss jāpārbauda. BM25 implementāciju paņemt no tā, ko Reinis izveidoja.
Nedrīkst izmantot Jauātājums - Atbildes daļu, jāizmanto Raw translated teksts, jāveic prompt engineering pēc principa:
31Classify Question using only "Yes" or "No" based on Fact.
2Question: {}
3Fact: {}