2024-09-09 Valodu Vēstniecība Eldigen PitchPatterns Task

 

Pitch Patterns daļa (Toms, Ričards - Paula vadībā)

Vārdi, kurus nepieciešams atpazīt (jādabon limiti occurance count no Andra) pēc kuriem nofiltrēt biežāk sastopamos līdz retāk sastopamiem: https://share.yellowrobot.xyz/quick/2024-9-9-46B640A2-4E16-4564-BFBD-880C15B0B442.zip

UX izmaiņas:

image-20240909200520816

Labajā panelī jauna sekcija tikai “Valodu Vēstniecība” klientam

Deals section pēc zvaniem kā notes var pievienot informāciju par Līmeni un histogrammu un jautājumus.

DB izmaiņas:

Jāizveido jauna tabula, kur katram deal_id tiek atsekoti vārdi, kuri parādās histogrammās visos zvanos laikā, tā, lai var aprēķināt visus nezināmos vārdos un līmeni pēc N nodarbībām

Loģikas izmaiņas:

Jautājumus ģenerē ar valoduvestniecība.eldigen.com API, tiek nosūtīti 200 nezināmie vārdi no histogrammas augšgala (balstoties uz lemmu failiem un noņemot vārdus, kuri atkārtojušies sarunās vairāk kā 2x reizes) un 1000 random vārdi kuri ir bijuši jau izmantoti līdz līmeņa slieksnim ejot no biežāk izmantotajiem uz rētāk izmantotajiem.

API atgriež 40 jautājumus, kuri izmanto maksimāli daudz nezināmos vārdus, kuri ir atzīmēti BOLD un dotos zināmos vārdus.

Eldigen daļa (Betija, Adrians, Reinis)

FastAPI ar atsevišķu worker, kurš saņem POST JSON

un uzģenerē sarakstu ar jautājumiem HTML formatējumā, kur katram jautājumam obligāti jāsatur vuienu vai vairākus required_words un tikai supported_words. Drīkst pievienot saikļus, bet aizliegts izmantot citus vārdus. Jāsašķiro jautājumi tā, lai pirmie tiek atgriezti tādi jautājumi, kuros ir pēc iespējas vairāk required_words.

Jautājumi jāģenerē par vienu tēmu - tēmu klasifikātors ir ierobežots. Jautājumus ģenerēt līdzīgā formātā kā Andra resursā, kur atrodās Tēmas un jautājumi (🔴 Evalds nevar atrast pagaidām linku, bet jādabon no Andra)

 

 


 

No Epastiem apraksti

  1. Martai ir jāpieslēdz Valodu Vēstniecībai Leaderboards un jākonfigurē tēmas - ievads, iebildumi, cenas apskats utt. Visi galvenie aspekti Andra skriptam jābūt sakarā ar šiem tematiem, lai viņš varētu izveidot Leaderboards ar mūsu palīdzību un atsekot cik punktus iegūst katra saruna. Pēc tam šī informācija jāsavieno ar Pipedrive (yes/no tagiem), lai vēl vairāk uzlabotu potenciālo klientu konversiju pirmajam zvanam. Šobrīd ir grūti iegūt kādas noderīgas atziņas no zvaniem, ja Topics nav konfigurētas!

  2. Atlasam 10k biežākos vārdus no Angļu valodas korpusa pēc kritērijiem zemāk, šo failu un nosacijumus atsūta Valodu Vēstniecība.

  3. pitchpattens automātiski Valodu Vēstniecības account uztur informāciju par vārdiem Klientam (savelkam klientus kopā pēc klienta vārda - jāpievieno arī kāds klienta numurs, drīzumā Andris ieviesīs pipedrive), kuri palikuši neizmantoti no dotā saraksta, no saraksta izņem vārdus, ja pieminēti vismaz 2x reizes (lai novērstu atpazīšanas kļūdas). Informācija par vārdiem glabājas speciālā DB tabulā. Plāns, ka skolnieks virzās no biežāk izmantotajiem vārdiem, uz leju uz retākiem un sarežģītākiem vārdiem.

  4. Skolotāji PitchPatterns kontā var atvērt Sadaļu "Valodu vēstniecība", kur izvēlas skolnieku no dropdown, uzpiež "Uzģenerēt jautājumus", un tiks paņemti top 200-300 vārdi, kuri vēl nav tikuši izmantoti un no tiem attiecībā 9:1 (izmantotie : neizmantotie vārdi) tiek ar LLM uzģenerēti 40 jautājumi no kuriem speciālā UX pitch patterns sadaļā skolotājs atzīmē ar thumbs up/down tie kuri patīk jautājumi, tie kas patīk var tikt lejupielādēti kā Word dokuments, kuru skolotājs izmantot, lai mācītu skolniekus nākamā nodarbībā un process atkārtojas (Jautājumu ģenerēšanu spēs nodrošināt Eldigen AI komanda atsevišķā Python modulī)

Pēc šodienas sarunas daži jautājumi Andrim:

  1. Kuru no failiem izmantot, lai noteiktu vārdus. screenshot zemāk

image-20240909194552172

  1. Tā kā lielākā daļa vārdu augšgalā satur vienādas lemmas/saknes, lai nebūtu vienādi teikumi gala rezultātā, jautājums pēc kāda apjoma sliekšņa konkrētajā failā nofiltrēt vārdus? screenshot zemāk

image-20240909194540410