Pārslēgties uz main
un Merge visu iekš main
branch
Pārbauda un palielina versiju numurus iekš model_versions.json
Iepusho GIT version: X
Vispirms lokāli notestēt visus features caur SwaggerUI
Kad viss strādā, augšupielādēt uz visiem serveriem izmainītās koda daļas, lielos pre-trained weights tikai tur kur nepieciešams (Uztaisīt PyCharm visas nodes kā upload vides, nokonfigurēt ērtu keyboard shortcut piem ctrl+shift+u)
Ar SSH pieslēgties visām nodēm (ērti caur PyCharm uz tām pašām vidēm)
Secīgi visās screens pievienoties un Ctrl+C apturēt, sagaidīt, ka beidzas
Iestartēt pa jaunu
Pārbaudīt, ka oracle-4 (kas ir bez GPU bet jaudīgu SSD un tīklu) coordinator viss ir OK (to arī iespējams vajag restartēt, ja ir izmaiņas)
Pārbaudīt, ka API dashboard ir viss ok http://dashboard.asya.ai/d/yvNWVN5Vz/api?orgId=1&refresh=10s
Novērst, ka starp dienām krājas taski
Pārbaudīt, ka var caur https://api.asya.ai palaist task veiksmīgi un tas iziet cauri visām funkcijām, palaist ar HIGH priority
Palaiž worker_api.py -is_debug True
Iesniedz pieprasījumu uz vidām features http://127.0.0.1:8000/docs#/default/task_submit_task_submit_post
ar reālu BPO sarunu un endpoint uz epastu BPO key: 3e995f31-f686-450c-8364-010ca85262fb
Piefiksē worker_api konsolē taksk_id, palaiž pēc kārtas katru feature worker
⚠️ Salabot visos workers, ka is_debug nepieļauj heartbeat un file_cache_manager palaišanu
Izpētīt un ņemt vērā kā darbojas multiprocessing workeri
Vajadzības gadījumā uz DEV servera testēt, izmantojot pdb
PDB ļauj veikt koda pieprasījumus un turpina ar continue
vai exit
izslēdz skriptu
Visur by default uzstādam is_debug = True
Palaižot worker is_debug režīmā, tā, ka tas NETIEK reģistrēts coordinator, piefiksē worker_uuid
pēc feature_id atrod to features_in_task
tabulā un piešķir katram feature manuāli worker_uuid
, tajā brīdī worker vajadzētu izpildīt uzdevumu
Sastādīt note, kur uzskaitīti visi pieejamie GPU un uzmanīgi izrēķina cik uz kura var palaist uzdevumus, tos arī jākoriģē izmantojot dashboard datus par pieprasījumu un processing ilgumu.
Screen names formatēti sekojoši
Ja nepieciešams atrast procesu, to dara ar ps aux | grep PID
Pašlaik uz katras nodes ir viens is_main_on_server (jābūt uz katras nodes šobrīd). Bet uz visiem workeriem DENOISE un VoiceID jābūt arī vienam is_master (šobrīd tikai šiem 2 tipa workeriem is_master)
Uzdevumus graciosly killo un gaida, kamēr tie beidzas: ctrl+C
Ja nevar nokillot izmanto kill -9 PID
Uzspiežot bultiņu uz augšu iegūsti iepriekšējo komandu workerim, kas bija screenā
Notestēt un uzstādīt jauno versiju
Palīdzēt un pārbaudīt, ka pauls sāk aktīvi izmantot PP pusē text_intent un text_sentiment (text_sentimnent nav īpaši jāatēlo tam vajadzētu uzlabot emotions darbību, jāpārliecinās, ka tas tiešām tā ir)
💡 Iesaku izmantot clipboard managers
Ditto Listary
oracle-4, 132.226.193.4:22, u: ubuntu (oracle-4-p100.key)
aws-3, 54.145.228.121:22, u: ubuntu (aws-2023.pem)
aws-4, 54.196.87.160:22, u: ubuntu (aws-2023.pem)
aws-6, 3.239.49.88:22, u: ubuntu (aws-2023.pem)
oracle-20, 129.159.100.102:22, u:ubuntu (oracle-20.key)
asya-1, 80.232.224.165:10122, u: asya, key (pauls iedod key)
asya-2, 80.232.224.165:10222, u: asya, key
asya-3, 80.232.224.165:10322, u: asya, key
asya-3, 80.232.224.165:10422, u: asya, key
Īpaša versija Assistentis, šobrīd offline:
aws-5-assistentis, 54.235.65.103:22, u: ubuntu (aws-2023.pem)
Pēc veiksmīgas nākamās versijas uzstādīšanas
Šobrīd tā ir nedroša, jo viegli aizmirst pielikt pareizi argumentus. Uztaisīt, ka to organizē pats heartbeat controller un workers tabula. Tāpat ļoti nepieciešams salabot beidzot hostname, lai var atsekot uz kuras nodes, kas ir palaists.
Šie jālikvidē
DB izmaiņas
Heartbeat ar saprotamu funkciju pēc vai pirms iestartēšanās vajag iedot šos params balstoties uz DB (atceries, ka tas ir multiprocess worker!)
Saskaņot, ka pauls noņem arī savā pusē visu kas ar to saistīts