F F antigradient - F ( x1 ,K x n ) = - K- näitab funktsiooni F vähenemise suunda. x1 x 2 Veafunktsiooni ( J (W , ) ) gradient on vektor, mis koosneb selle funktsiooni tuletistest kõikide kaalukoefitsientide ja nihete järgi. Kuna meil on vaja minimiseerida veafunktsiooni, J J muudame tema parameetreid antigradiendi ( - J (W , ) = - - )suunas. Siit ka W gradient meetodi nimetus. Kolmandas peatükis see meetod on põhjalikult kirjeldatud kahekihilise pertseptroni õpetamise näitel. 1.4.2 Widrow-Hoff'i algoritm (Widrow-Hoff delta learning rule, -) Selle meetodi tuletamiseks eeldame, et neuronid koosnevad ainult summaatorist ja nendel ei
F F antigradient - F ( x1 ,K x n ) = - K- näitab funktsiooni F vähenemise suunda. x1 x 2 Veafunktsiooni ( J (W , ) ) gradient on vektor, mis koosneb selle funktsiooni tuletistest kõikide kaalukoefitsientide ja nihete järgi. Kuna meil on vaja minimiseerida veafunktsiooni, J J muudame tema parameetreid antigradiendi ( - J (W , ) = - - )suunas. Siit ka W gradient meetodi nimetus. Kolmandas peatükis see meetod on põhjalikult kirjeldatud kahekihilise pertseptroni õpetamise näitel. 1.4.2 Widrow-Hoff'i algoritm (Widrow-Hoff delta learning rule, -) Selle meetodi tuletamiseks eeldame, et neuronid koosnevad ainult summaatorist ja nendel ei