2024-07-06 Eldigen Blog post rakstītājs

 

Jāizveido jauns aģenta tips “Blog postu rakstnieks”

Pielietojums

Mārketinga aģentūrām ir līgumi ar lielākiem uzņēmumiem kā, piemēram, AirBaltic, Rimi utt., kur nedēļā prasīts publicēt 3-4 kvalitatīvus bloga rakstus. Raksti nav bieži, tāpēc automātiski rakstītus rakstus būs grūti atpazīt. Tas var samazināt nepieciešamību pēc vismaz viena rakstnieka, kas strādā tikai pie šiem uzdevumiem.

Funkcionalitāte

  1. Izveido aģentu tipu “Blog postu rakstnieks”

  2. "Avoti" sadaļā uzstādā mājas lapas, publikāciju avotus (nākotnē nepieciešama integrācija ar LETA un līdzīgām vietnēm, kur jaunumi ir aiz maksas sienas). Tie indeksējas ar definētu laika periodu.

  3. Jāizveido jauna sadaļa “Blogi”, “Čats” sadaļas vietā, ja pašreizējais aģenta tips ir “Blog postu rakstnieks” (Lūdzu deleģēt šo daļu, ja nepieciešams Evertam vai kādam citam) image-20240706155701402

Pēc ģenerēt pogas nospiešanas parādās AJAX loading, jo to blog nevarēs super ātri uzģenerēt un tad atveras ar redirect “Melnraksti” sadaļa, kur pirmie parādās uzdotie blogu melnraksti

  1. Melnraksti izskatās šādi, kur iespējams kopēt postus, lejupielādēt bildes (kuras nāk no sources, ja tādas vispār ir). Katru reizi ģenerējot dodam līdz 3 blog variantiem un līdz 5 social media variantiem. Var redzēt arī visus iepriekēšjos melnrakstus vēsturiski dilstošā secībā līdz maksimums 100 pēdējiem, lai pārāk nenoslogojam šo skatu.

Šeit jābūt autocomplete drop-down (kā pitchpatterns), kur izvēlēties no jau esošiem tags

awdddawawd

  1. Ja nav pievienoti sources, "Melnraksti" un "Jauns" sadaļā rādīt tekstu "Lai izveidotu rakstus, pievienojiet informācijas avotus un pagaidiet līdz tie tiek noprocesēti."

Datu bāzes struktūra

Nepieciešamas jaunas relāciju datubāzes tabulas, piemēram:

  1. blog_request - kur glabājās formas prasības: blog_period, blog_format (enum STR), blog_desc, blog_language, assistant_id, blog_request_status (kamēr ģenerējas)

  2. blog_tags_in_request - kur glabājas nepieciešamie tags

  3. blog_posts - kur glabājas visi blog posti, kas ir ģenerēti.

  4. blog_tags - kur glabājas visi tagi, kas ir pievienoti blog postiem

  5. blog_tags_in_posts

  6. blog_images_in_posts - saglabāt attēlus arī uz eldigen servera no publiskas static direktorijas, lai ir pieejami pārpostējot (BET attēlus glabājam tikai ģenerētiem postiem, savukārt sources, lai glabā URLs uz ārējiem resursiem šobrīd)

  7. blog_facts_in_posts

  8. blog_trends - periodiski reizi 1h apkopotie trendi, assistant_id

  9. blog_tags_in_trends

Blog worker

Nepieciešams izveidot jaunu python worker, kurš apstrādā blog_request nevis ģenerē postus uz lietotāja klikšķa flask pusē. Kā arī šis worker no indeksētajām lapām iegūst tags un aprēķina trends pēdējām 2 nedēļām reizi 1h. Ārējo rakstu tagošanai izmantot Hugging face modeli nevis zero-shot GPT - piemēram šādu: https://huggingface.co/fabiochiu/t5-base-tag-generation

Non-English, mēs tulkojam un visu procesējam un ģenerējam kā English.

Pirmo reizi pievienojot vai tos mainot sources, nepieciešams uzreiz iegūt tags nevis gaidīt 1h!

Bloga, Twitter un LinkedIn ģenerēšanai jāizdomā uzmanīgi prompt engineering. Pieļauju, ka, lai būtu jēgpilns blogs tas jāģenerē ar vairākiem prompts, jo vienā prompt vairākas lietas ģenerējot kvalitāte būs ļoti zema. Piemēram: Write "1 paragraph" as "Introduction to problem" based on Facts: Write "1 paragraph" as "Controversial twist" based on Facts: (šeit katram no 3 blog veidiem varētu dāžadus variantus) utt. Kopā salīmējot vienu postu, iekļaujot dažās bildes.

Viena blog ietvaros izmantot vienus un tos pašus sources, bet variantiem jābūt katram ar saviem sources combinations.