2024-Q4-AI-LV-Business 8. Stimulētā mašīnmācīšanās un robotika

 

8.1. Video / Materiāli

Video: https://us06web.zoom.us/j/81532941877?pwd=L1IgtKhCzcsLfxa5OKjB4N6ChulOab.1 Meeting ID: 815 3294 1877
Passcode: 388048

Whiteboard: https://www.figma.com/board/yQ79uSJQGAU7LHhUELAGHy/2024-Q4-AI-LV-Business-8.-Stimul%C4%93t%C4%81-ma%C5%A1%C4%ABnm%C4%81c%C4%AB%C5%A1an%C4%81s-un-robotika?node-id=0-1&t=5c2wtt9V8sZpxkSz-1

Invite nosūtīts: aigaandrijanova@gmail.com

 

8.2. Atrast vismaz vienu uzņēmumu, kurš pielieto stimulēto māšīnmācīšanos (Reinforcement learning) Savos biznesa procesos

Atrast vismaz vienu uzņēmumu, kurš pielieto stimulēto māšīnmācīšanos (Reinforcement learning) savos biznesa procesos. Nedrīkst izmantot manis minētos piemērus - datorspēles, analītsko ķīmiju, akciju tirgošanā, ChatGPT vai Robotiku. Norādīt uzņēmuma nosaukumu (ar atsauci) un kā viņi pielieto stimulēto māšīnmācīšanos (Reinforcement learning). Iesniegt PDF.

 

 

Saturs

  1. Pastāstīt par apmācību veidiem, kurus esam apguvuši - nepārraudzītā apmācība, parraudzītā apmācība un visbeidzot stimulētā māšīnmācīšanās. Yann LeCunn metofara ar kūku. Pastāstīt katrā veidā, kur ir atsķirības un kādi galvenie pielietojumi.

    image-20250203202343717

Reinforcement learning

image-20231109172637191

 

Supervised learning

Untitled (263)

 

Unsupervised learning (Pastāstīt, kā šos var lietot anomāliju noteikšanā un sejas re-identifikācijā piemēram)

Untitled (260)

 

Untitled (259)

 

  1. Pastāstīt par modeļu veidiem un darbības principiem

    1. Stāvokļa vērtības modelis

    2. Pasaules modelis (rollout)

    3. Aģents un Kritiķis pieeja

  2. Pastātīt par plusiem un mīnusiem citām metodēm un RL metodēm

    Plusi: Vajag tikai balvas signālu - nevajag detalizētu plānu

    Mīnusi: Vajag dinamisku vidi, kur veikt apmācību uz 1000+ epizodēm

    ^ iznīcīnātu rēalu virtuvi

    ^ Vispirms iemācās pasaules modeli un tad RL (Tesla world model)

 

  1. Piemērots:

    1. Problēmām, kuras nevar izskaitļot, piemēram, Traveling Salesman Problem (TSP). Transportā un loģistikā image-20250203203347225

    1. Vērtspapīru, resursu, elektroenerģijas tirzniecības lēmumu pieņemšanā image-20250203203700662

    2. Robotizācijā, automatizācijā, datorspēlēs kur sarežģīti aprakstīt ar likumiem visu darbības plānu image-20250203203633387

    3. Farmācijā zāļu atklāšanā un dažādu analītisko procesu prognozē. Piemēram ASYA projekts hromotagrofijā un masas spektometrijā vielu sadalīšanai. Kā vērtības funkcija tiek izmantota pīķu sadalīšanās kritērijs, bet mainīgie ir sistēmas paramateri. Pirmais eksperiments pret pēdējo, kur vielas daudz labāk atdalījušas. Iepriekš vajadzēja 2 nedēļas manuāli meklēt parametrus, tagad 2h automātiski atrod image-20250203203733775 image-20250203203746465

    1. LLM, ChatGPT RLHF daļa arī balstās uz stimulēto mašīnmācīšanos. Bez tās mums šodien nebūtu ChatGPT un tas spētu tikai atbildēt ar atbildēm, kuras ir līdzīgas datu kopā nevis veidot atbildes pēc mūsu patikas.

      image-20231109174328729

  1. Pastāstīt par datorspēļu pielietojumiem un RL attīstību

  2. Pastāstīt par Robotiku un to pielietojumiem

  3. Pastāstīt par Robot Operating System un robotizētajām platformām gan ražotnēs, gan mobilajiem robotiem - cik tie izmaksā un kādas funkcijas ir spējīgi veikt

 

Datorspēles

Tikpat labi jebkura biznesa problemātika, kuru var ietērpt simulācijas vidē un veikt eksperimentus 1000+ reizes bez ievērojamiem zaudējumiem.

Vēsture:

  1. Deep Blue, Chess, 1997 IBM

  2. Watson, Jeopardy!, 2011 IBM

  3. Deep Q-Network (DQN) for Atari games, 2023, DeepMind

  4. AlphaGo, Go, 2016, Google DeepMind

  5. Multi-Agent RL, 2020, Google DeepMind

  6. OpenAI Five, Dota2, 2020

  7. AphaStar, Starcarft 2, 2020, Google DeepMind

  8. ChatGPT - Reinforcement Learning from Human Feedback (RLHF), 2022

  9. Self-Driving Tesla FSD, Waymo, Comma One 2024

  10. Robotics (FigureOne, Tesla bot, Unitree, Boston Dynamics), 2026-2028

Atrast varbūt vēl kādu noderīgu piemēru

Par katru pastāstīt vairāk kontekstu.

Deep Blue

Ļoti maz no RL, bet pirmais notietnais mēģinājums

https://www.youtube.com/watch?v=NJarxpYyoFI image-20250203204124398

 

IBM Watson, Jeopardy

Arī maz RL

https://www.youtube.com/watch?v=WFR3lOm_xhE

image-20250203204220809

Deep Q-Network (DQN) for Atari games

Pirmie funkcionāli spējīgie RL modeļi, kuri tika apmācīti tikai ar tiem pašiem ievades-izvades laukiem kā cilvēki spēlē Atari spēles. Darbs publicēt prestižajā žurnālā Nature.

https://www.youtube.com/watch?v=rQIShnTz1kU

image-20250203205146036

AlphaGo

Patiess RL modelis. Pirms tam simtiem gadus tika sarakstītas grāmatas par Go spēli, bet AI spēja atrast paņēmienus, kurus neviens nebija iedomājies.

image-20250203204320670

image-20250203204259830

 

Multi-Agent R

Multi-agents surf boxes, hide and seek piemērs un dažādi interesanti paņēmieni, kurus aģenti iemācījās spēlē. Neviens nesaporgrammēja tos gājienus, bet aģents pats iemācījās.

https://www.youtube.com/watch?v=kopoLzvh5jY

image-20250203204536542

OpenAI Five, Dota2

Čatā spēlētāji sarakstījās ar AI, izsmēja un tieši, kad AI rakstīja, ka uzvarēs ar 99% varbūtību pēc brīža sakāva labākos pasaules Dota2 spēlētājus. AI tika ierobežots click-rate. Pēc spēles intervijā spēlētāji teica, ka bija sajūta kā spēlēt ar pārcilvēku / citplanētieti.

https://www.youtube.com/watch?v=tfb6aEUMC04&t=373s

image-20250203204633709

 

AphaStar, Starcarft 2

AI atšķirībā no cilvēka ir spējgs paralēli fokusēties uz visām vienībām spēlē (super micro-management) https://www.youtube.com/watch?v=FWbVseLiopw

image-20250203205320679

 

Robotika

Senāk robotus programmēja izmantojot RobotStudio atzīmējot katru kustību un darbību secīgi. https://www.youtube.com/watch?v=SqZUfTOnfLY image-20250203205428309

Mūsdienās ir iespējams

Robota roka simulācijā https://youtu.be/ub4ZyegbTSw?t=269 Robota roka reālā dzivē https://www.youtube.com/watch?v=ZVIxt2rt1_4

image-20250203205126352

Google PaLM-E roboti jau tiek savienoti ar LLM, lai varētu tos ērti vadīt bez nekādas sarežģītas apmācības

https://www.youtube.com/watch?v=j6O_uePUKKI

image-20250203205929263

Praktiski vēljoprojām lielākā daļa robotu tomēr nav tik attīstīti.

Amazon rūpnīca Roboti pilda loģistikas fukciju (šeit visticamāk nav nepieciešams RL, bet tik un tā tos jau praktiski var izmantot biznesā)

https://www.youtube.com/watch?v=TUx-ljgB-5Q image-20250203205545772

 

 

Par Times 2024 lielāko izgudrojumu sarakstā bija vesela sadaļa par robotiku. https://time.com/collection/best-inventions-2024/

image-20250203210054889

Pašlaik komerciāli risinājumi, kuri jau var tikt izmantoti biznesā:

  1. Boston Dynamics - Spot & Atlas - sākotn no 100k https://www.youtube.com/watch?v=50eli-eOPO4&pp=ygUVYm9zdG9uIGR5bmFtaWNzIHJvYm90 https://www.youtube.com/watch?v=bmNaLtC6vkU&t=202s&pp=ygUVYm9zdG9uIGR5bmFtaWNzIHJvYm90

  2. Unitree Go2 - sākot no 3000 EUR izklaidei, praktiskāki modeļi sākot no 20k EUR

    https://www.youtube.com/watch?v=6zPvT0ig1VM&pp=ygUMdW5pdGVlIHJvYm90 https://www.youtube.com/watch?v=GzX1qOIO1bE&pp=ygUMdW5pdGVlIHJvYm90

  3. Figure 01 (Sadarbība ar BMW rūpnīcām) https://www.youtube.com/watch?v=Sq1QZB5baNw&t=56s&pp=ygUJZmlndXJlIDAx

^ Uz robotsuņa platformas var uzstādīt arī roku un dāžadus citus sensorus

Komerciāli risinājumi roboti apsardzē, kuri spēj pilnībā aizstāt cilvēku (Robot as a service apmēram 3000EUR/mēn)

  1. https://smprobotics.com/usa/smp-robotics-launches-leasing-program-usa-security-companies

  2. https://www.ascento.ai/

  3. https://www.runningbrainsrobotics.com/en/

  4. https://www.knightscope.com/

 

Jāmeklē pielietojumi, kur tie atmaksājas

image-20250203210704682

Piemēram neatmaksājas Starship robots pēdējā km piegādei, kur 10 gadi un 200m EUR ieguldīti, bet tas nav darbs, kuru ir vērts automatizēt.

image-20250203210756091

image-20250203210803388

Vēl citi pielietojumi: https://x.com/chris_j_paxton/status/1818015665472815564

 

Robot Operating System

Var mazliet ieskicēt kā strādā šī modulārā sistēma un kādi moduļi pieejami kā atvērtais kods:

  1. SLAM (Gmapping, Cartographer) - kas tas ir un kas pieejams

  2. RViz, MoveIT, Gazeebo - Simulāciju vides, lai sagatavotu robotu darbam virtuāli. Kā arī inversās kinemātikas funkcijas, lai izrēķinātu trajektorijas kā manipulators nonāk līdz viotai kur nepieciešams

  3. Iebūvēti draiveri visām galvenājām robotu platformām mūsdienās

  4. Vision_OPENCV

 

image-20250203210910950