Kodu iepušot šajā GIT https://github.com/asya-ai/word-cloud-demo
Nepieciešams izveidot Web sistēmu, kas klausās konferences livestream un iegūst Vārdu bubuļus par biežak izmantotajiem vārdiem konferencē
Nepieciešams implementēt 2 workers
RTMP server, kas saņem audio latviešu valodā (izmanto OBS vai kādu citu rīku, lai testētu streamot audio)
Flask based app, kas attēlo vārdu mākoni kā Web app (sākotnēji debug režīmā uztaisi arī, ka var redzēt transcript)
RTMP worker
Izveidot RTMP server un WAV decoder - https://www.perplexity.ai/search/example-python-rtmp-N1ZAgS4bTjCAefMLb7uVnQ?s=c (ja kaut kas nesanāk uzreiz zvani Evaldam)
WAV saglabāt ik pa 30 sek. un nosūtīt uz asya API
audio faili tiek nosūtīti uz API ari HTTP POST /task_submit
(nepieciešams aizpildīt pēc iespējas vairāk parametrus, sākotnēji lūdzu sūti tikai features: audio_denoise, audio_diarization, audio_text; obligāti sūtīt arī language_codes: ['en'] un known_user_ids: [1]) - vēlāk uzliksim 'lv' - šis kā konstantes
Iegūto JSON un WAV tu vari ielikt šajā toolī un palaist kā visual debugging (šo rīku nevajag iekodēt, app, bet tas tev palīdzēs saprast vai pareizi izmantots)
http://share.yellowrobot.xyz/quick/2023-9-27-1F4EEE0A-ECFB-47DD-930B-46EDF4F25A05.zip
Rezultātus no katra chunk vajag strukturizēt un saglābāt SQLLite file based datu bāzē (to arī pievienot git)
Datu struktūra datu bāzē varētu būt aptuveni šāda (source filenames kā UUID4)
Abas tabulas aizpilda workeris, bet Flask based app tikai lasa!
Flask based app, apmēram izskatās šādi (atrodi JS, CSS based library, kura zīmē šādus grafikus, ja nav tad netērē uz to laiku, primāri sakodēt RTMP worker)