2023-05-10 Prototech Pieteikuma detaļas

Pamatojums

Problēmsituācija ir mākslīgā intelektā balstīti gramatikas un stila labošanas risinājumi latviešu valodai, kur mēs šobrīd atpaliekam no citu valstu valodām pieejamo rīku klāstā. Projekta mērķis ir izveidot mākslīgā intelektā balstītu produktu, līdzīgu kā visiem zināmais Grammarly, kuru varētu lietot, lai automātiski atrastu un salabotu komatu, rakstības, teikuma struktūras un stila kļūdas tieši latviešu valodas tekstā. Šobrīd pieejamie gramatikas labošanas risinājumi “Tildes birojs” programmatūra aprobežojas ar vārdu gramatikas labojumiem vai vienkāršiem pieturzīmju labojumiem, kuri balstīti uz likumiem. Vēl joprojām šie risinājumi pat nav spējīgi labot teikuma kļūdas saliktiem sakārtotiem teikumiem vai divdabja teicieniem. Taču ar mūsdienās pieejamiem risinājumiem mākslīgajā intelektā šādas kļūdas būtu iespējams izlabot. Vēl jo vairāk šīs kļūdas modelis var iemācīties izlabot pat bez ekspertu klātbūtnes algoritma sagatavošanas procesā. Ekspertu iesaiste varētu būt noderīga, lai pārbaudītu iegūto rezultātu. Par pamatu modeļa apmācībai tiks lietotas latviešu valodas datu kopas no latviešu literatūras avotiem un nacionālajiem ziņu portāliem. Modeļi tiks apmācīti nepārraudzīta veidā bez marķējumiem kā valodas modelēšanas uzdevumu. Pēcāk šādu modeli būtu salīdzinoši viegli bez papildus marķēšanas pielāgot arī citām valodām, piemēram, lietuviešu, igauņu vai skandināvu valodām. Modelis lietotājam būs pieejams kā programmatūras spraudnis Chrome interneta pārlūkam vai kā spraudnis Microsoft Word teksta procesoram. Rakstot dinamiski tiks piedāvāti labojumi, kurus lietotājs var pieņemt vai arī noraidīt. Abos gadījumos tiks iegūti vēl dati, ar kuru palīdzību uzlabot modeļa precizitāti. Visbeidzot modeli plānots pielietot un testēt projekta ietvaros, lai uzlabotu automātiskās runas atpazīšanas sistēmu rezultātus teksta ģenerēšanai, izmantojot dabīgā valodā ierunātu tekstu. Iepriekšējā projekta ietvaros izpētījām “Tilde” piedāvāto automātisko runas atpazīšanas tehnoloģiju un secinājām, ka tās rezultāti, diemžēl, satur daudz kļūdas, kuras varētu salabot ar šādu modeli kā piedāvājam šī projekta ietvaros. Jāpiemin, ka šobrīd SIA "Asya" jau ir vairāki citi mākslīgā intelekta modeļi, piemēram, runas atpazīšanas modelis, kurš ir ievērojami precīzāks par SIA "Tilde" piedāvāto un tiek izmantots citā produktā pitchpatterns.com. Esam pārliecināti, ka varam apsteigt SIA "Tilde" arī šajā produktā un PROTOTECH projekts ievērojami palīdzētu ar nepieciešamo finansējumu šī produkta radīšanai.

Sniedz pamatojumu produkta vai pakalpojuma atbilstībai kādai no RIS3 noteiktajām specializācijas jomām:

Produkts lieliski iederas RIS3 “Informācijas un komunikācijas tehnoloģijas” nozarē, jo balstās gan uz datorlingvistiku, algoritmiem, mašīnmācīšanos, izglītības tehnoloģijām un lielajiem datiem. Daudziem no šīs nozares uzņēmumiem un iestādēm produkts dotu pozitīvu ieguvumu, uzlabotu darba kvalitāti un automatizētu procesus. Tas būtu nozīmīgs gan akadēmiskajā un arī komerciālajā vidē.

 

Pretendenta ideja ir inovatīva

Galvenā priekšrocība pret konkurentiem tirgū ir lokalizācija, mazo Eiropas valodu atbalsts, sākot ar latviešu valodu, bet pēc tam strādājot ar kaimiņvalstu valodām un citām Eiropas valodām. Vēl viena priekšrocība piedāvātajam risinājumam ir tas, ka nav nepieciešami marķēti dati vai ekspertu klātbūtne sistēmas izstrādē, kas ir ievērojama inovācija, jo parasti nepieciešami lieli ieguldījumi, lai marķētu datus. SIA “Asya” pētnieki ir izstrādājuši un zinātniski publicējuši vairākas metodes, kas sniedz šādas iespējas ar nepārraudzītu modeļu apmācību. Modelis būs spējīgs iemācīties valodas gramatiku, likumus un stilus no datu kopām, kuras satur pārsvarā jau rediģētus, skaidrus un pareizus tekstus. Modeļi būs balstīti uz inovatīviem pētījumiem, nevis uz ārējo piegādātāju API risinājumiem. Visbeidzot valodās, kur būtu konkurenti, būtu iespējams konkurēt ar cenu, jo jauni veidotie modeļi būs spējīgi darboties uz lietotāju darba stacijām nevis tikai uz jaudīgiem serveriem, kuri aprīkoti ar GPU, tādejādi ievērojami samazinot operatīvās izmaksas un uzlabojot cenu patērētājam.

 

Pretendenta ideja atbilst ilgtspējīgas attīstības principiem

Produkts stimulē ilgtspējīgus risinājumus, jo motivē izmantot digitālus dokumentus nevis papīra formātā un vēl jo vairāk palīdz saglabāt arī kulturālas vērtības – mazās Eiropiešu valodas, tai skaitā latviešu valodu. Lai nodrošinātu energoefektivitāti modeļi tiks uzstādīti arī uz zemas skaitļošanas spējas iekārtām kā mobilajām ierīcēm iOS, Andriod un personiskajiem datoriem. Lai šos modeļus darbinātu nebūs nepieciešami lieli skaitļošanas resursi.

 

Pretendenta ieguvums no dalības Tehnoloģiju biznesa centrā

Galvenais ieguvums būtu finansējums, lai produktu varētu laist tirgū un arī tā reklamēšanai un sabiedrības izglītošanai par šādu produktu, kuru jau plaši lieto angliski runājoša pasaule. Vēl redzam sadarbības iespēju mentorēšanas programmās, konsultācijās, tīklošanās un semināros, kurus rīko tehnoloģiju biznesa centrs. Visbeidzot novērtēsim arī iespēju popularizēt produktu caur tehnoloģiju biznesa centra kanāliem.

 

3.1. Produkta/ pakalpojuma apraksts

Produkts “Grāmatiņš” (apzināti kļūda nosaukumā), kuram jau ir izveidota mājaslapa http://gramatins.lv , bet produkts vēl nav izveidots, būs inovatīvs un mūsdienīgs rīks latviešu valodai dažādu nozaru speciālistu darbiniekiem un izglītības nozarē iesaistītajiem. Rīks būs līdzīgs angļu valodā pieejamajam “Grammarly”, taču mūsu valodā un ar lielu potenciālu arī citās mazajās Austrumeiropas un Centrāleiropas valodās. Šobrīd pieejamie gramatikas labošanas risinājumi “Tildes birojs” programmatūra aprobežojas ar vārdu gramatikas labojumiem vai vienkāršiem pieturzīmju labojumiem, kuri balstīti uz likumiem. Vēl joprojām šie risinājumi pat nav spējīgi labot teikuma kļūdas saliktiem sakārtotiem teikumiem vai divdabja teicieniem. Taču ar mūsdienās pieejamiem risinājumiem mākslīgajā intelektā šādas kļūdas būtu iespējams izlabot. Mūsu rīks būs pieejams gan kā interneta pārlūka spraudnis, MS Word spraudnis un pat kā iOS un Android klaviatūra. Mūsu rīka iespējas nebeidzas tikai ar pieturzīmju, gramatikas un stila kļūdu labošanu, bet tas spēs arī veikt citus mūsdienās populārus uzdevumus, kuri šobrīd pieejami kvalitatīvi tikai angļu valodā, piemēram, pārfrāzēšana, teksta stila maiņa un automātiska kopsavilkuma uzrakstīšana. Visi mākslīgā intelekta modeļi būs balstīti uz Latvijā radītiem pētījumiem un netiks izmantoti ārējie servisu pakalpojumi.

image-20230510153229928

Skaidrojums par tehnoloģijas gatavību un plānoto attīstību, izstrādājot prototipu

Šobrīd SIA “Asya” sadarbībā ar dažādām pētniecības organizācijām ir jau publicējuši vairāk 10 zinātniskas publikācijas mākslīgā intelekta jomā un daļa no nepieciešamajām zināšanām ir iekļautas pitchpatterns.com produktā, kas paraudzēts klientu apkalpošanas un pārdošanas zvanu automātiskai analīzei. Balstoties uz esošajiem pētījumiem un jau savāktajām liela apmēra latviešu valodas datu kopām (50 miljoni teikumu) varam argumentēt pašreizējo TRL 4, kur komandrindā jau dažas no funkcijām varam demonstrēt tagad. Projekta noslēgumā būs visiem pieejams komerciāls produkts ar TRL 8. Mums jau ir pieredze novest inovatīvus produktus līdz peļņai kā to jau esam darījuši ar mobilo lietotni “Closer to you” un arī ar mūsu B2B platformu pitchpatterns.com

Prototipa tehniskais raksturojums un sagaidāmais rezultāts

Projektu plānots implementēt PyTorch matemātiskajā satvarā, kurš ir īpaši piemērots dziļās mašīnmācīšanās modeļu implementācijai. Izveidotos modeļus plānots apmācīt, izmantojot RTU HPC superdatoru un līdz ar projekta veikšanu plānots strādāt pie zinātniskām publikācijām. Projekta ietvaros plānots pielietot valodas modelēšanas uzdevumu ar nepārraudzīto apmācību. Tiks izmantoti Transformer tipa modeļi kā GPT-3, BERT u.c., kuri tiks pielāgoti latviešu valodas datu kopām. Tiks implementēta gan regresīva nākamo vārdu vai pieturzīmju prognozēšanas funkcija, gan vārdu un pieturzīmju maskēšanas funkcija. Iegūtos rezultātus plānots testēt arī ar runas atpazīšanas modeļiem, kurus piedāvā Tilde. Visbeidzot produktu plānots implementēt kā Python FastAPI servisu un tam izveidot ērtu lietotāju interfeisu, lai attēlotu iegūtos rezultātus. Lietotāju interfeisu plānots implementēt kā Web lietotni, izmantojot Python Flask. Lai implementētu Microsoft Word programatūras spraudni plānots izmanto Visual Studio, C# un .net vidi, bet Chrome interneta pārlūka spraudņa implementācijai plānots izmantot TypeScript un JavaScript.

Gala rezultātā plānoti ērti lietojami spraudņi MS Word, Chrome, Safari, iOS un Android programmatūrā, kurus varēs uzstādīt jebkurš lietotājs ar datora pamatprasmēm.

 

Prototipa novērtēšanas, testēšanas un validēšanas plāns

Projekta ietvaros plānots sākotnēji veikt sistemātisko zinātniskās literatūras analīzi, lai noteiktu vai plānotais risinājums ir konkurētspējīgs ar citiem jau publicētiem modeļiem. Pēc tam plānots implementēt modeļa prototipu, kuru nepieciešams apmācīt modeli uz GPU, bet pēcāk varētu izmantot uz CPU platformas. Kad modelis būs apmācīts to būs nepieciešams implementēt kā servisu jeb API, kuru plānots testēt ar vairākām publiski pieejamām validācijas kopām no LUMI latviešu valodas korpusiem. Tiks iegūtas precīzas skaitliskas kvantificējamas vērtības, lai noteiktu risinājuma precizitāti. Tiks validēta un testēta ne tikai tehnoloģiskā puse, bet arī saderība ar tirgu, cenu un risinājuma pieejamību. Lai modeli varētu piedāvāt kā B2C produktu un kā spraudni, nepieciešams vizuāli uzskatāma un ērta lietotāja saskare Microsoft Word procesoram vai Chrome interneta pārlūkam, kuru varētu izmantot reālā laikā, rakstot tekstus latviešu valodā. Visbeidzot jaunizveidoto modeli būs nepieciešams validēt un noskaidrot tā precizitāti, lietojamību un rentabilitāti. Tiks izstrādāts detalizēts komercializācijas plāns un mājaslapa, kur pieteikties sākotnējai testēšanai, norādot, kādu summu potenciālie lietotāji būtu gatavi par šo produktu mēnesī maksāt.

 

Produkta/pakalpojuma konkurētspējas un komercializācijas potenciāla apraksts

 

Pirmā produkta klientu grupa ir gala patērētājs jeb B2C, kur precedentu, izmantojot angļu valodu, jau ir realizējuši ietekmīgi uzņēmumi kā Grammarly, LanguageTool un Writefull. Šo tirgus dalībnieku fokuss ir uz angļu valodas tirgu, bet šajā projektā piedāvātais risinājums būtu piemērots tieši mazākām Eiropas valodām un pēcāk arī visām valodām pasaulē. Latvijas mērogā tirgus apmērs varētu būt līdz 30 000 EUR/mēn, pieņemot, ka Latvijā ir ap 300 000 cilvēku, kuri ir izglītoti un ikdienā izmanto teksta procesoru programmatūru. No tiem 10% jeb 30 000 varētu būt ieinteresēti un spējīgi lietot šādu programmatūru, savukārt no tiem 10% jeb 3 000 būtu gatavi un spējīgi maksāt 10 EUR abonēšanas maksu mēnesī. Kopā Baltijas tirgū apjoms varētu būt ap 100 000 EUR/mēn. Savukārt, Skandināvijas tirgū apjoms varētu būt 500 000 EUR/mēn. Otra produkta klientu grupa ir B2B, kā piemēram, telefonijas programatūras firmas kā, piemēram, TelTel, Tele2 Teamer, Telemagic u.c. Produkts uzlabo telefonijas programatūras konkurētspēju un pakalpojuma kvalitāti. To var lietot kombinācijā ar automātiskās runas atpazīšanas risinājumiem, lai pēcapstrādē salabotu kļūdas ģenerētajā tekstā. Produkta izmantošana varētu tikt pielāgota dažādām valodām tāpēc aptuvenais tirgus izmērs šobrīd ir mērāms 1.3 miljardi ASV dolāru un tam ir sagaidāms pieaugums līdz 3 miljardiem ASV dolāru līdz 2027. gadam (https://www.fortunebusinessinsights.com/speech-to-text-api-market-102781).

Galvenā priekšrocība pret konkurentiem tirgū ir lokalizācija, mazo Eiropas valodu atbalsts. Vēl viena priekšrocība piedāvātajam risinājumam ir tas, ka nav nepieciešami marķēti dati vai ekspertu klātbūtne sistēmas izstrādē. Studenti, kuri ir iesaistīti šajā projektā veic pētniecisko darbu maģistra studiju programmas ietvaros ar nepārraudzītu modeļu apmācību. Modelis būs spējīgs iemācīties valodas gramatiku, likumus un stilus no datu kopām, kuras satur pārsvarā jau rediģētus, skaidrus un pareizus tekstus. Modeļi būs balstīti uz inovatīviem pētījumiem, nevis uz ārējo piegādātāju API risinājumiem. Visbeidzot valodās, kur būtu konkurenti, būtu iespējams konkurēt ar cenu, jo jauni veidotie modeļi būs spējīgi darboties uz lietotāju darba stacijām nevis tikai uz jaudīgiem serveriem, kuri aprīkoti ar GPU, tādejādi ievērojami samazinot operatīvās izmaksas un uzlabojot cenu patērētājam.

 

Pretendenta komandas apraksts

Komanda sastāv no speciālistiem, kas nosedz visas nepieciešamās jomas – uzņēmēji, kas ir piesaistījuši vairāk 500k EUR privāto riska kapitālu iepriekšējiem produktiem, pieredzējuši marketinga, projektu vadības un finanšu speciālisti kā arī sevi pierādījuši mākslīgā intelekta eksperti un lietotņu izstrādātāji.

 

Izmaksu apraksts

15000 - mākslīgā intelekta modeļu izstrādei (gramatikas, pieturzīmju un stila kļūdu labošanai, min. kļūda 2% CER) 5000 – MS Word spraudņa izstrādei 4000 – Chrome spraudņa izstrādei 6000 – iOS/Android lietotne (tastatūras spraudni) 1000 – Testēšanas bužets 5000 – Sākotnējais digitālā marketinga budžets (CAC 2.5 EUR, 2000 sākotnējie lietotāji, organiski plānots iegūt vismaz 1000 lietotājus)

 

Gatavība finansēt izstrādi

Jau līdz šim, lai sagatavotos šim pieteikumam esam investējuši aptuveni 3000 EUR mākslīgā intelekta modeļu priekšizpētē, mājaslapas sagatavošanā http://gramatins.lv un arī plānojam investēt atlikušo daļu, kas nepieciešama projekta laišanai tirgū.

image-20230510153410669