2025-02-13 Eldigen Document Checker Task V2

 

Galvenās izmaiņas

Pēc darba ar klientu noskaidrojās, ka ir nepieciešamas svarīgas strukturālas izmaiņas, bet tās var veikt stipri nemainot UX un DB.

Jāmaina UX izkārtojums Submissions lapā.

image-20250213121939414

Jāņem vērā, ka nākotnē nāksies atpazīt dokumentus pēc satura nevis failu nosaukuma, piemēram, pēc tā vai dokumenta virsraksts liecina par Pieteikumu.

Neļaut ievadīt variable based jautājumu pirms dotā variable ir iegūta. Pārbaudīt vai pēc izmaiņām variables secīgi tiek iegūtas un vai netiek izmantota nedefinēta variable.

image-20250213124648021

 

⚠️Svarīgi, lai settings, katru reizi saglabājas no pēdējā pievienotā, citādi būs murgs pievienot jautājumus

image-20250213122712572

 

Datu struktūrā izmaiņas, lūdzu nekādā gadījumā netaisīt, ka strādā abos veidos kā iepriekš un pēc jaunā veida!

submission tabulā nāk nost lauki checklist_criteria_question tabulā nāk klāt jauni lauki submission_checklist_criteria_question_result nāk klāt jauni statusi

1 to N
1 to N
checklist_criteria_question
checklist_criteria_question_id: PK
checklist_id: FK
criteria_id: FK
question_id: FK
question_order: number
question_type: yes_no | info_extract
question_source: file | variables | form | lursoft
submission_form_id: FK | null
submission_filename_pattern: string | null
variable_name_info_extract: string | null
question_form_field_name: string
submission
submission_id: PK
assistant_id: FK
submission_name: string
submission_status: qualified | not_qualified
submission_qualified_percentage: number
submission_progress_percentage: number
submission_checklist_criteria_question_result
submission_id: FK
checklist_id: FK
checklist_criteria_id: FK
checklist_criteria_question_id: FK
question_original_text: string
question_status: qualified | not_qualified | cannot_find | no_reg_number | contradiction
question_reference_text: string
question_reference_source_name: string
question_reference_source_id: FK
question_reference_source_url: string
question_reference_source_chunk_id: FK
question_reference_source_page_number: number
question_reference_fact_id: FK

Jaunais apstrādes princips submissions Facts scraper - Sources

ja ir questions ar file type
ja ir questions ar lursoft type
ja ir questions ar form type
Jauns submission
Pēc checklist_questions filtrēt failus
izveidot sources
no lursoft izveidot sources
Pēc checklist_questions atlasīt formas

Vairāki rezultāti uz vienu jautājumu

Šī problēma, jau eksistē šobrīd.

Katram submission_checklist_criteria_question_result var būt vairāki dokumenti vai apgabali vienā dokumentā, kā arī tie var būt pretrunīgi, tāpēc attēlojumā jāievieš veids kā to parādīt. Nav nepieciešams implementēt, ka var izvēlēties kurš fakts ir pareizais.

Var būt arī vairāki izgūti dati pie “Data retrieval” ⚠️ AI pusē, ja ir vairāki “Data retrieval” un pēc tam seko Variable based jautājums, tad salīdzinam visus variable pārus, ja atrodam nesaderīgus un saderīgus reizē, tad tas arī būs contradiction

image-20250213130101637

 

Variable extraction Excel

Low Priority, bet vajag būt šādm issue

Auditēšanas uzņēmumiem būs svarīgi variable jeb Data extraction funkciju izmantot ne tieši caur mūsu sistēmas salīdzināšanu, bet iegūstot starp Excel šādi:

Ielādē N dokumentus
izgūst ar checklists datus
iegūst Excel, kur N * Y rindas ar iegūtajiem datiem

Pie submission results jābūt šadai export funkcijai

image-20250213131013954

 

Lursoft

Sasaiste starp ārējiem resursiem un jautājumiem notiks caur dropdown pie katra jautājuma. By default tips: Fails.

Ja ir izvēlēts lursoft, tad sistēma izpildās šādā secībā. Reģistrācijas numuru aizliegts prasīt ievadīt! ir jāpieņem, ka tam ir jābūt iekšā dokumentos, ja tiek izmantots Lursoft. Lursoft dati tiek ielādēti kā sources

Saņemts Submission
atpazīst reģistrācijas numuru
atrasts?
ielādē faktu par pieprasījumu
turpina apstrādi nākamiem
Izlaiž Lursoft jautājumus
statuss: Nav atrasts reģ. nr

 

Subissions pievienošana

 

⚠️Svarīgi, lai settings, katru reizi saglabājas no pēdējā pievienotā, šeit arī bija jāsaglabājas no pēdējā izveidotā checklist, jo loģiski, ka cilvēkus nokaitinās 100x spiest English -> Latvian utt

image-20250213123100253