2025-Q1-AI 12. Laika rindu uzdevumi, Rekurentie neironu tīkli, RNN, LSTM - Majasdarbi

 

Labs mēģinājums, bet modeļus nekad neapmāca vienlaicīgi vienā apmācību ciklā, pareizi ir apmācīt atsevišķi, ko var darīt arī paralēli! Liels potenciāls kļūdām, gradienta noplūdēm kā arī katrs modelis koverģēs savā laikā!

CleanShot 2025-05-06 at 09.21.18@2x

 

 

Nepareizi implementēts output gate vienādojums:

python o_t = torch.tanh(W_o_dot_x + U_o_dot_h + self.b_o)

Jābūt sigmoid funkcijai (σ), nevis tanh:

python o_t = torch.sigmoid(W_o_dot_x + U_o_dot_h + self.b_o)

 

CleanShot 2025-05-06 at 09.26.30@2x

 

 

CleanShot 2025-05-06 at 09.29.42@2x

 

 

CleanShot 2025-05-06 at 09.33.03@2x

 

CleanShot 2025-05-06 at 09.34.44@2x