2024-Q4-AI-LV-Business 5. Lielie Valodas Modeļi un Vaicājumu Inženierija

 

5.1. Video / Materials (9 Dec 2024, 18:00)

Zoom (jānospiež ieraksts sākumā, pēc tam tiks ielikts youtube unlisted mode): https://us06web.zoom.us/j/81532941877?pwd=L1IgtKhCzcsLfxa5OKjB4N6ChulOab.1 Meeting ID: 815 3294 1877 Passcode: 388048

Whiteboard: https://www.figma.com/board/Ol6MFqQgIJ7glpJ5UJDLP8/2024-Q4-AI-LV-Business-5.-Lielie-Valodas-Mode%C4%BCi-un-Vaic%C4%81jumu-In%C5%BEenierija?node-id=0-1&t=ZidpIx1mdHs9RoyX-1

ChatGPT Prompt guidelines: https://share.yellowrobot.xyz/quick/2024-12-2-35F17AEF-11F5-4CC6-B20B-B67AAE8E2ED6.html

5.2. ChatGPT izmantošana, lai izveidotu atbildi uz vēstures eksāmena jautājumu

ChatGPT izmantošana atbildes izveidošanai uz Latvijas vēstures eksāmena jautājumu.

Jautājums: "Kāda bija Latviešu leģiona nozīme Otrajā pasaules karā, un vai latvieši tajā pievienojās brīvprātīgi, vai arī tika piespiesti? Kādi bija galvenie iemesli viņu lēmumiem?"

Atbildei jāietver pēc iespējas vairāk konkrētu faktu un skaitļu. Jāiesniedz ekrānuzņēmums ar ģenerēto atbildi no ChatGPT (vai līdzīgiem rīkiem) un pamudinājums kā teksts Word formātā.

 

image-20241202194336624

 

 

image-20241219192137098

 

 

Iepriekšējo lekciju piemēri

Video: https://youtube.com/live/E8sOov821wE?feature=share

Whiteboard: https://www.canva.com/design/DAGYKYzsVoE/rDeTztaHOaR3f4yvfqBioA/edit

Citi Video lekciju piemēri:

  1. https://www.youtube.com/watch?v=dOxUroR57xs

    https://github.com/dair-ai/Prompt-Engineering-Guide

  2. https://learn.deeplearning.ai/courses/chatgpt-prompt-eng/lesson/1/introduction

  3. Tricks: https://www.superannotate.com/blog/llm-prompting-tricks

 

Saturs

PPTX prezentācija, kuru var ņemt par pamatu: https://share.yellowrobot.xyz/quick/2025-1-11-1DC5A6A4-211D-41C3-B03D-BA7905B1F6C1.pptx

Sākumā iedot pamatprincipus kā strādā LLM:

  1. Valodas modeļēšanas uzdevums

  2. Uzmanības mehānisms

  3. Orģinālais pielietojums valodas modelēšana Color of the sky is

  4. N-Shot piemēri kā strādāja GPT-2 un Language models are few shot learners

  5. Pastāsīt kā strādā RAG

 

ChatGPT pamatprincipi:

  1. Halucinations - Search vs Generation. Piemērs meklējumiem īstas un neīstas zinātniskās publikācijas.

    Jāatvieno visi RAG elementi arī ChatGPT settings

    alt text

    Bez RAG:

    image-20241209093708184

    Neeksistē zinātniskais raksts: alt text

    Ar RAG parādās īstās zinātniskās publikācijas: alt text

 

  1. Facts 10x more important than prompt itself. Fakti 10x savarīgāki par vaicājumu, lai Self-Attention var pārkopēt tos atbildē

🔴 Rakstīt kā temporary chat, jo citādi ChatGPT izmantos iepriekšējās sesijas saturā

alt text

https://www.mdpi.com/1422-0067/25/8/4346

  1. Order and structure of words important. Svarīgākie pirmie vārdi (nākamajā punktā demonstrācija vārdu secības nozīmei) https://github.com/tatsu-lab/stanford_alpaca#data-generation-process

    Best structure:

     

     

     

     

     

    image-20231229183844711

    Useful first words based on datasets used in LLM training:

    1. create list

    2. rewrite sentence

    3. rewrite paragraph

    4. generate list

    5. generate sentence

    6. write sentence

    7. write story

    8. explain concept

    9. explain difference

    10. give example

    11. edit sentence

    12. describe process

    13. describe difference

    14. describe impact

    15. classify sentence

    16. classify item

    17. classify concept

    18. summarize article

    19. summarize text

    20. find word

    21. find synonym

    22. translate

  2. Repeat facts for more emphasis

Pievienojot šo vairākas reizes parādīsies rezultāts tekstā

Ja šos pašus vārdus pārvieto uz beigām nav nekāds efekts rezultātā:

  1. Output primers, Output primers involve concluding your prompt with the beginning of the desired output. Use output primers by ending your prompt with the start of the expected response.

Atkal, ja primer daļu pārvieto teksta beigās, vairs tas nestrādā!

  1. Sadalīt uzdevumu pa daļām nevis visus reizē

Perplexty example, netiek galā ar daudziem uzdevumiem vienlaicīgi

alt text

Sadalot pa daļām tiek galā

Ja nenostrādā turpina prasīt

 

  1. Atbildes formāts, piemēri atbildes formātam

  1. Jaunas sessijas

Turpinot iepriekšējo piemēru, ja dara pretējo, sāk prasīt uzdevumus ne par tēmu vienā čatā, tad sāk kopēt nekorektus rezultātus.

  1. Ierobežojums garumā (vai nu RAG ar failiem, vai arī 2 lpp tekstā - teksts ir precīzāks risinājums) Piemērs kā strādājot ar vairākiem dokumentiem var atrast vajadzīgo informāciju un no tās uzrakstīt tekstu.

  2. Ierobežojumi ievades saturā. Tekošs teksts strādās daudz precīzāk tabulu dati.

  1. Chain of Thought (CoT), jau iebūvēts vaicājumā vai ar sekojošiem vaicājumiem https://heidloff.net/article/chain-of-thought/?utm_source=perplexity

    image-20241208224144137

  1. Noderīgākie piemēri

    1. Tulkošana

  1. Salabot gramatiku

  1. Pārfrāzēšana

  1. Kopasavilkums

Kopsavilkumam parasti nepieciešams turpināt ar sekojošiem vaicājumiem, lai uzlabotu uzsvarus

  1. E-Pasta virsraksts

  1. Saīsināšana

  1. Paplašināšana

  1. Skaidrāk uzrakstīt

  1. Profesionāli uzrakstīt

  1. Uzģenerēt jautājumus

  1. Explain as for high school student

Kā izmantot ```python uttpierakstus

  1. MermaidJS ģenerēšana

  1. Jailbreaking & Injections

    1. Tips for model, threatenig model alt text

How to bypass:

 

Papildus materiāli

image-20241208230408188

 

 

 

image-20241208223445843

image-20241208223653631

 

https://arxiv.org/pdf/2411.10541

 

image-20241208221913783

image-20241208221440427

 

 

https://www.prompthub.us/blog/prompt-engineering-principles-for-2024

 

image-20241208222211825

 

 

OpenAI guidelines https://help.openai.com/en/articles/6654000-best-practices-for-prompt-engineering-with-the-openai-api

https://platform.openai.com/docs/guides/prompt-engineering

 

image-20241208222937920