TALLINNA TEHNIKAÜLIKOOL Automaatikainstituut
Automaatjuhtimise ja süsteemianalüüsi õppetool
HÄGUSAD SÜSTEEMID Õppematerjal
Koostas: Andri Riid
Tallinn 2004 Sissejuhatus 2
Sissejuhatus
Viimaste aastakümnete jooksul on hägus
loogika leidnud edukat
rakendust mitmesuguste juhtimis- ja modelleerimisprobleemide
lahendamisel. Informatsiooni esitus hägusloogikasüsteemides on lähedane
nendele mehhanismidele, mida inimene igapäevaelus otsuste tegemisel
kasutab, mis võimaldab hägusloogikasüsteemide kaudu teha
kättesaadavaks traditsioonilistele vahenditele halvasti alluv inimteadmus
näiteks protsesside modelleerimis- ja juhtimisrakendustes. Teksti esimeses peatükis antakse kompaktne, kuid piisav ülevaade
hägusloogikasüsteemide aluseks
olevast hägusast hulgateooriast,
hägusloogikasüsteemide
arhitektuurist ja erinevat tüüpi
hägusloogikasüsteemidest. Peatüki teine pool käsitleb
hägusloogikasüsteemide interpreteeritavusega
seonduvaid probleeme (tegu
ei ole süsteemi vaikimisi tagatud omadustega ja selleks et saaksime
hägusloogikasüsteemide reeglite interpretatsiooni
usaldada , on vajalik, et
rahuldatud oleksid nn. läbipaistvuse tingimused). Lisaks vaadeldakse
reeglite
interpolatsiooni iseloomu ja selle sõltuvust süsteemi erinevatest
parameetritest. Peatüki lõpetab lühiülevaade hägusate süsteemide
konstrueerimispõhimõtetest. Sisukord 3
Sisukord
1. Hägusad süsteemid .................................................. 4 1.1 Hägus
hulgateooria .............................................. 4 1.2 Hägusate hulkade omadused .................................... 5 1.3 Hägus tükeldus ................................................... 7 1.4
Tehted hägusate hulkadega ..................................... 7 1.5 Hägusad süsteemid............................................... 11 1.6 Järeldusalgoritm üldkujul ....................................... 12 1.7 Järeldusalgoritmi töö näide ..................................... 16 1.8 Järeldusalgoritmi lihtsustatud
erikujud ........................ 16 1.9 Takagi-Sugeno süsteemid ....................................... 22 1.10 Hägusate süsteemide läbipaistvus ....................... 24 1.11 Interpolatsioon hägusates süsteemides .................. 26 1.11.1 Häguärastamine ........................................... 27 1.11.2 Liikmesfunktsioonide tüübi roll......................... 28 1.11.3 Järeldusalgoritmi
parameetrid .......................... 29 1.11.4 Interpolatsioon mitmemõõtmelises ruumis ........... 31 1.12 Esimest järku TS süsteemide läbipaistvus ............. 32 1.13 Hägusate süsteemide
konstrueerimine .................. 33 Kasutatud kirjandus ................................................... 36 1.1 Hägusad hulgad 4
1. Hägusad süsteemid
1.1 Hägusad hulgad
Hägusa hulga mõiste ja vastav teooria pärineb L.A. Zadeh'lt [1]. Hägus
hulgateooria kujutab endast klassikalise hulgateooria laiendust, mis
avaldub järgnevas:
klassikalises hulgateoorias on element x kas hulga A
(mis on omakorda kõiki võimalikke elemente koondava universaalhulga X
alamhulk) liige või pole seda, muud võimalust ei ole. Elemendi x
liikmesust hulka A saab seega esitada järgmiselt: 1, if x A (1) µ A ( x) = . 0, if x A Reaalne elu pakub seevastu näiteid, kus taoline üheselt määratud
liikmesus pole hulgakuuluvuse kirjeldamiseks piisavalt paindlik, kuna
sellest tuleneb järsk piir kuuluvuse ja mittekuuluvuse vahel. Tüüpiline
näide oleks situatsioon, kus lähtuvalt inimese
vanusest aastates peame me
järeldama, kas tegu on noore inimesega (näiteks, et arvutada mingit
terviseriski). Küsimuse lahendamiseks vajame hulga "noor" definitsiooni.
On ilmne, et
nooremad kui 20-aastased inimesed võib sellesse hulka
paigutada
pikemalt mõtlemata, samamoodi nagu võib hulgast välja jätta
üle 40-aastased inimesed. Vanusevahemik 20-40 a. on lood pisut
keerukamad. Siin ongi abiks hägus hulgateooria, mis lubab liikmesusele
anda kõiki väärtusi nulli ja ühe vahel,
viimased kaasa arvatud (vt. joonis
1). Erinevalt klassikalisest hulgateooriast kus peale kuuluvuspiiri
kindaksmääramist tuleb meil tegeleda olukorraga, kus päev vanem inimene
arvatakse noorte hulgast välja, võimaldab hägus hulgateooria sujuvat siiret
kuuluvusest mittekuuluvusse, mis on ühtlasi paremas kooskõlas üldise
ettekujutusega nooruse mõistest. Hägusaid hulki võib esitada järjestatud paaride hulgana µ A ( x), (2)
kus igale x-i väärtusele vastab tema kuuluvus hulka A. Kuigi selline
esitusviis on väga paindlik (lubades kirjeldada suvalisi liikmesusseoseid),
on hägusa hulgateooria rakendustes eelkõige arvutuslikel põhjustel
enamasti kasutusel funktsionaalne esitusviis µ A ( x) = f ( x) . (3) 1. 2 Hägusate hulkade omadused. 5
1.0
0.8
µ(iga) 0.6 0.4
0.2
0 20 25 30 35 40 45 50 iga
Joonis 1. Klassikaline hulk ja hägus hulk.
Ehk siis joonisel 1 oleva hägusa hulga näitel: 0, x 40 (4) µ noor ( x) = 1, x 20 (40 - x) 20, 20 1. 2 Hägusate hulkade omadused.
Selles jaotises on antud mõningad hägusate hulkade põhimõisted ja
omadused, mis on vajalikud järelejääva materjali mõistmiseks. Hägusa hulga kõrgus on antud avaldisega (5) hgt ( A) = sup µ A ( x) (5) xX
Hägusaid hulki mille kõrgus on võrdne ühega nimetatakse
normaalseteks. Hägusa hulga tuum on universaalhulga X mittehägus alamhulk, mis
rahuldab tingimust (6)
core ( A) (6)
Hägusa hulga alus on universaalhulga X mittehägus alamhulk, mis
rahuldab tingimust (7)
supp ( A) (7)
Kui hägusa hulga alus on lõplik hulk, nimetatakse seda kompaktseks
aluseks. Kumer hägus hulk rahuldab tingimust (8) x1 , x 2 , x3 X , x1 x 2 x3 µ A ( x 2 ) min( µ A ( x1 ), µ A ( x3 )) (8) 1. 2 Hägusate hulkade omadused. 6
Normaalseid, tükati pidevaid ja
kumeraid hägusaid hulki, mille tuum
koosneb ühest elemendist, nimetatakse hägusateks numbriteks. Sarnaseid
hägusaid hulki, mille tuum moodustub rohkem kui ühest elemendist,
nimetetakse hägusateks intervallideks. Rakendustes kasutatavad hägusad hulgad ongi enamasti hägusad
numbrid või
intervallid . Tihti on kasutusel tükati lineaarsed standartsed
funktsioonid nagu trapets- ja kolmnurkfunktsioon. Trapetsikujuline
liikmesfunktsioon (9) on määratud nelja parameetriga a b c d,
kusjuures a = min(supp(A)), b = min(core(A)), c = max(core(A)), d =
max(supp(A)) (joonis 2). Kolmnurkne liikmesfunktsiooni saab käsitleda
trapetsikujulise liikmesfunktsiooni erijuhuna (b = c).
1.0
0.8 µA(x) 0.6 hgt (A) 0.4
0.2
0 a b c d x core (A)
supp (A)
Joonis 2. Trapetsikujulise hägusa hulga alus, tuum ja kõrgus
x - a b - a , a xb d - x , cxd µ A ( x) = (9) d - c 1, bxc 0, d 0 , (12)
elik S (13) x X : µ Ai ( x) > 0 , s =1 1.3 Hägus tükeldus 8
kus S on hägusate alamhulkade arv (antud juhul 3), millest tükeldus koosneb. Öeldakse, et tükeldus, mis rahuldab tingimust (13), katab muutujat x.
IGA Lingvistiline
muutujanoor keskealine vana
Lingvistilised märgendid 1.0 0.8
µA(x) 0.6 Liikmesfunktsioonid
0.4
0.2 0 0 20 40 60 80 100 Numbrilised väärtused
x (iga) Numbriline muutuja
Joonis 3. Muutuja hägus tükeldus.
Teised tükelduse omadused on empiirilisemalt määratletud. Reeglina on soovitatav, et hägusad hulgad, mis tükelduse moodustavad on kumerad, normaalsed, "piisavalt" eristuvad ja et nende arv on suhteliselt väike (maksimaalselt 7-10 [2]). Hägusa tükelduse semantiline adekvaatsus.ripub ära
jooksva ülesande kontekstist ja kujutab endast lingvistiliste märgendite ja neile vastavate liikmesfunktsioonide kooskõla. Siinkohal on oluline märkida, et mitte alati ei kasutata ära hägusloogikasüsteemide semantilisi tõlgendusvõimalusi (s.o. lingvistilised märgendid võivad kanda minimaalset infot väljendavaid nimetusi nagu "liikmesfunktsioon 1", "liikmesfunktsioon 2"). Kujutlegem ette hägusat hulka, mis on tähistatud märgendiga "noor" ja mille alus paikneb vahemikus [30, 40]. Semantiline kooskõla sõltub sellest, milline on muutuja universaalhulk X, näiteks kui X = [30, 100], on kõik korras, kuid juhul kui X = [0, 40], on raske rääkida tükelduse semantilisest mõtestatusest. Samamoodi on oluline hulkade järjestus, näiteks kui hägus hulk, mis vastab lingvistilisele märgendile "vana", asetseb vasakul
lingvistilise märgendile "noor" vastavast liikmesfunktsioonist on ilmselgelt tegu valesti moodustatud tükeldusega. 1. 4 Tehted hägusate hulkadega 9
1. 4 Tehted hägusate hulkadega
Selles lõigus käsitleme põhilisi tehteid hägusate hulkadega nagu
ühisosa, ühend ja täiend. Erinevalt klassikalisest hulgateooriast pole need
tehted üheselt määratud, kuna liikmesfunktsioon võib omada
suvalist väärtust vahemikus [0, 1]. Ühisosa ja ühend on üldkujul esitatud vastavalt kolmnurksete normide
(t-normid) ja kolmnurksete kaasnormide (s-norm või t-kaasnorm) kaudu. T-norm on kahe muutuja funktsioon ([0,1] × [0,1] [0,1]), mis
rahuldab järgmisi tingimusi: T(a,1) = a T(a, b) T(c, d), kui a c, b d T(a, b) = T(b, a) T(T(a, b), c) = T(a, T(b, c)) Tingimused mis defineerivad s-normi (t-kaasnormi), (S: [0,1] × [0,1] [0, 1]), on S(a,0) = a S(a, b) S(c, d), kui a c, b d S(a, b) = S(b, a) S(S(a, b), c) = S(a, S(b, c)) Hägusa hulga A täiend on antud järgnevalt: c(0) = 0, c(1) = 1 c(a) b c(c(a)) = a Tüüpilised praktikas kasutatavad t-normid on miinimum (14) ja korrutis
(15). Vt. ka joonis 4. A I B = min(µ A ( x), µ B ( x)) (14)
A I B = µ A ( x) µ B ( x) (15) Tüüpilised s-normid on maksimum (16) ja tõenäosuslik summa 1 (17).
Vt. ka joonis 5.
1 Siinkohal on huvitav märkida, et tegelikes rakendustes on kõige tüüpilisem s-
normi valik tavaline summa, seda hoolimata asjaoluks, et resulteeruv hägus hulk
võib osutuda supernormaalseks (s.t. et tema kõrgus ületab ühte, s.o. tegu pole
üldse s-normiga). Viimast asjaolu praktikas siiski kuigi oluliseks ei peeta. 1. 4 Tehted hägusate hulkadega 10
A U B = max(µ A ( x), µ B ( x)) (16)
A U B = µ A ( x) + µ B ( x) - µ A ( x) µ B ( x) (17)
1.0 1.0
0.8 0.8
0.6 0.6
0.4 0.4
0.2 0.2
0 0 x x
Joonis 4. Kahe hägusa hulga ühisosa arvutatuna miinimumi (vasakul) ja korrutise (paremal) kaudu.
1.0 1.0
0.8 0.8
0.6 0.6
0.4 0.4
0.6 0.6
0 0 0 x x
Joonis 5. Kahe hägusa hulga ühend arvutatuna
maksimumi (vasakul) ja tõenäosuslik summa (paremal) kaudu.
Nii nagu klassikaline hulgateooria on aluseks
klassikalisele loogikale, on hägus hulgateooria aluseks hägusale loogikale, mis tähendab, et juba defineeritud tehetele hägusate hulkadega (ühend, ühisosa, täiend) vastavad
loogilised operatsioonid (või, ja, mitte) mis baseeruvad sarnaselt t-
normil , s-normil ja tingimustel, mis on antud täiendi jaoks.
1.0
0.8
0.6
0.4
0.2
0 x
Joonis 6. Hägus hulk ja tema täiend. 1.5 Hägusad süsteemid 11
1.5 Hägusad süsteemid
Hägus hulgateooria ja hägus loogika varustavad meid aparatuuriga
põhjuslike seosete kirjeldamist lubavate hägusloogikasüsteemide
konstrueerimiseks [3]. Hägus süsteem koosneb KUI-SIIS tüüpi reeglite
kogumist, mis määravad süsteemi
sisend - ja väljundmuutujate vahelise
lingvistilise seose. Iga üksik hägus reegel (18) on sedastus, mille eeldus ja
järeldus koosnevad määratlustest a la "x on suur", mis seovad muutuja
sellele muutujale defineeritud lingvistilise märgenditega.
KUI U1 on A1r JA U2 on A2r ... JA Ui on Air ... JA UN on ANr (18)
SIIS V1 on B1r JA V2 on B2r ... JA Vj on Bjr ... JA VM on BMr
VÕI... Air ja Bjr tähistavad siin vastavalt inda sisendmuutuja xi ja j-nda
väljundmuutuja yj (i = 1 ... N, j = 1 ... M) lingvistilisi märgendeid, mis on
seotud r-nda
reegliga (r = 1 ... R). Selline tähistusviis ei tähenda, et üht lingvistilist märgendit tohib
kasutada vaid ühe korra ühesainsas reeglis. Üldjuhul on olukord hoopis
vastupidine vabade
kohtade arv
reeglites ületab tunduvalt lingvistiliste
märgendite koguarvu ning konkreetne lingvistiline märgend esineb
tavaliselt mitmetes reeglites. Eeldades et iga sisendmuutuja Ui on tükeldus koosneb Si hägusast
alamhulgast, iga väljundmuutuja Vj tükeldus koosneb Tj hägusast
alamhulgast ja et hägus süsteem koosneb R
reeglist , vajame me eraldi
struktuuri mis
defineerib lingvistiliste märgendite ja nende kasutamise
erinevates reeglites. MATLABi
pakett Fuzzy
Logic Toolbox säilitab sellekohast
informatsioon R × (N + M) maatriksis, kus iga element mrp, kujutab endast
kas sisend- (if p N) või väljundmuutuja (if p > N) liikmesfunktsiooni
indeksit, mida kasutatakse rndas reeglis. m11 ... m1 p ... m1, M + N ... ... ... .... ... mr1 ... m rp ... m r , M + N , (19) ... ... ... ... ... m ... m Rp ... m R , M + N R1 Hägusa süsteemi reeglite maksimaalne arv (sisendi lingvistiliste
märgendite kõikvõimalikud kombinatsioonid) on antud järgnevalt 1.6 Järeldusalgoritm üldkujul. 12
N
Rmax = S i . (20) i =1
Süsteemi tegeliku reeglite arvu võrdlus arvuga Rmax annab
informatsiooni selle kohta, kas reeglibaas on korralikult koostatud: i. R Rmax tähendab seda, et eksisteerib mitu ekvivalentse tingimuspoolega, mis on seotud kas ·
samade väljundi lingvistilisete märgenditega tulemuseks on redundantne reeglibaas; · erinevate väljundi lingvistilisete märgenditega tulemuseks on vastuolusid sisaldav reeglibaas. iii. R = Rmax tavaliselt soovitud situatsioon
Reeglibaas annab lingvistilise seose süsteemi sisend-väljundmuutujate
vahel. Samas on tegu vaid hägusate süsteemide ühe osaga, täpsemalt selle
lingvistilise pealiskihiga (joonis 8). Muutujatevahelise numbrilise seose
arvutamiseks kasutatakse alumist, nn. järelduskihti, mis sisaldab
hägustamise, häguärastamise ning järeldamise protseduure ning mis
opereerib lingvistilistele märgenditele vastavate hägusate hulkadega
(liikmesfunktsioonidega). Hägusa süsteemi järelduskihti on detailsemalt
käsitletud järgmises osas.
Teadmusbaas Reeglid Liikmesf.-d
Hägustamine Hägus järeldusalgoritm Häguärastamine
Joonis 7. Hägusa süsteemi kahekihiline olemus
1.6 Järeldusalgoritm üldkujul.
Lihtsuse huvides
vaatleme esialgu mitme sisendi ja ühe väljundiga
süsteeme (M = 1). Järeldusalgoritm, millele sisend-väljundseose
arvutamise protsessis eelneb sisendite hägustamine ja järgneb
häguärastamine väljundis, on ise neljaetapiline protseduur, mille etapid on 1.6 Järeldusalgoritm üldkujul. 13
koos igale etapile vastavate lingvistiliste operaatoritega näidatud joonisel
5. Sisendite hägustamine osutub vajalikuks juhul, kui meil on vaja
modelleerida määramatust või ebatäpsust süsteemi sisendis. Hägustamise
käigus asendatakse
reaalsuses süsteemi sisendisse antavad konkreetsed
arvud hägusate numbritega. Tegelikkuses jäetakse see samm siiski tihti ära
kuna too lisab järeldusmehhanismile lihtsalt ebavajalikku keerukust ja
samas pole ka eriti palju näiteid, kus sisendite hägustamine ennast
õigustaks. Järeldusalgoritmi esimeses
etapis leitakse reeglite tingimuspoole
eelduste täidetus, mida iseloomustab liikmesfunktsiooni µir väärtus kohal x ir = hgt ( µ i' µ ir ) , kus µ i' on i-nda sisend hägus väärtus. Kui aga
hägustamist ei toimu, taandub operatsioon
kujule ir = µ ir ( xi ) , (i = 1, ..., N; r = 1, ..., R) (21)
Järeldusalgoritmi teises etapis arvutatakse mil määral jooksvad sisendid
aktiveerivad kogu reegli (ehk reegli tabatusmäär r).
Operaator JA, mis
seob tingimuspoole
eeldusi vastab hägusas loogikas t-
normile , seega N (22) r = I ir , (r = 1, ..., R) i =1
Järeldusalgoritmi järgmiseks sammuks on iga üksiku reegli (hägusa)
väljundi Fr(y) arvutamine e. implikatsioon, mida esindab lingvistiline
operaator SIIS. Klassikalises loogikas on implikatsioon defineeritud kui A B = ¬A U B . (23) Selle (materiaalse) implikatsiooni ebasoovitavate
interpolatsiooniomaduste tõttu leiab too hägusloogikas siiski vähe
kasutamist; reeglina on SIIS realiseeritud t-
normina 2 Fr ( y ) = r r , (r = 1, ..., R) (24)
Kus r tähistab r-nda reegliga seotud väljundi liikmesfunktsiooni. Süsteemi summaarne (hägus) väljund saadakse üksikute reeglite
väljundite agregeerimisel lingvistilisele operaatorile VÕI vastava s-
normiga.
2 Robert Babuska [4] väitel esindab materiaalne implikatsioon suunatud seost "Ast järeldub B", samas kui t-normi peaks antud juhul interpreteerima kui suunamata seost "A kehtib ja B kehtib". 1.6 Järeldusalgoritm üldkujul. 14
R (25) F ( y ) = U Fr ( y ) r =1
Pannes kokku
avaldised (21,22,24,25) saame, et R N (26) F ( y ) = U I µ ir ( xi ) r r =1 i =1
implikatsioon
reegli
aktivatsiooneelduste täidetus
IF U1 is A11 AND U2 is A21 THEN V1 is B1
agregeerimine OR IF U1 is A12 AND U2 is A22 THEN V1 is B2
Joonis 8. Järeldusalgoritmi operatsioonid ja nendele vastavad lingvistilised
operaatorid.
Mitme väljundiga süsteemide hägusa väljundi arvutamise eripäraks on,
et
operaatorit JA reegli väljundpooles ei käsitleta loogilise JA-na (mida
tuleks realiseerida t-normi kaudu), vaid et iga hägus väljund F(yj)
arvutatakse sõltumatult R N F ( y j ) = U I µ ir ( xi ) jr . (27) r =1 i =1 Viimasest asjaolust tuleneb ühtlasi, et iga mitme sisendi ja mitme
väljundiga süsteemi võib tükeldada M-iks mitme sisendi ja ühe väljundiga
süsteemiks. Süsteemi hägus väljund (26) omab reaalelus väikest praktilist väärtust.
Süsteemi numbrilise väljundi tuletamiseks kasutatakse häguärastamis-
protseduuri. Kaks levinumat häguärastamismeetodit on raskuskeskme ja
maksimumide keskmise meetodid. 1.6 Järeldusalgoritm üldkujul. 15
Neist esimene on tegelikult sama meetod, mida kasutatakse massi
raskuskeskme arvutamiseks. Erinevus seisneb selles, et punktmasside
asemel on liikmesuse väärtused F(y).
yF ( y)dy Ycog ( F ( y )) = Y (28) F ( y)dy Y
Praktikas kasutatakse enamasti avaldise diskreetset vormi: Q
F(y q =1 q ) yq Ycog ( F ( y )) = Q . (29) F(y q =1 q )
Maksimumide keskmise meetod kuulub indekseeritud
häguärastamismeetodite hulka, mis jätavad arvestamata hägusa väljundi
selle osa, mille liikmesfunktsiooni väärtus jääb alla teatud taset.
Maksimumide keskmise meetodi puhul võetakse arvesse ainult see osa
hägusast väljundist, mis vastab maksimaalsele liikmesusele 1 Ymom ( F ( y )) = q F(y j ) , (30) jJ *
kus J* tähistab F(y) maksimaalväärtuste alamhulka ja q on tema
elementide arv. Pannes avaldise (26) avaldisse (29) saame me lõpliku valemi hägusa
süsteemi väljundi arvutamiseks R U r I r Y T y = Ycog ( F ( y )) = R r =1 , (31) U r I r 1 r =1 [ ] [
kus r = r ( y1 ) r ( y 2 ) ... r ( y q ) ... r ( y Q ) , Y = y1 y 2 ... y q ... y Q ] ja 1 on
Q-elemendiline ühtedest koosnev veeruvektor. 1.7 Järeldusalgoritmi töö näide 16
1.7 Järeldusalgoritmi töö näide
Toome illustratiivse näite eelnevale. Vaatleme kahe sisendi ja ühe
väljundiga süsteemi, mille kumbki sisendmuutuja omab kahte
liikmesfunktsiooni ja väljund kolme. Süsteemi (täielik) reeglibaas on antud
järgmiselt 1. IF U1 is A11 AND U2 is A21 THEN V is B2 2. IF U1 is A11 AND U2 is A22 THEN V is B1 3. IF U1 is A12 AND U2 is A21 THEN V is B3 4. IF U1 is A12 AND U2 is A22 THEN V is B2
Lähtuvalt etteantud reeglitest
1 1 2 1 2 1 M = . 2 1 3 2 2 2
Antud hägusat süsteemi on võimalik kujutada võrkstruktuurina (joonis
9). Iga võrgu kiht esindab vastavat sammu järeldusalgoritmis.
Liikmesfunktsioonide parameetrid on talletatud hägustamis/eelduse
tabatuse kihis. Seos M on määratud ühendustega esimese ja teise kihi ning
väljundi liikmesfunktsioonide ja järelduskihi vahel. Me vaatleme, kuidas jõutakse süsteemi väljundini y etteantud
sisendite väärtuste x1 = x1* , x 2 = x 2* puhul kui
i) Järeldusalgoritmi operaatorid konjunktsiooni, implikatsiooni ja agregatsiooni osas on minimum, minimum ja maksimum ning häguärastamiseks kasutatakse raskuskeskme meetodit (lk 20).
ii) Korrutis-korrutis-summa järeldusskeem on
kombineeritud maksimumide keskmise meetodiga (lk 21).
1.8 Järeldusalgoritmi lihtsustatud erikujud
Lõplik süsteemi sisendite ja väljundi vahelist seost esitav
avaldis (31)
on küll üldine, kuid
kohmakas ja reaalsuses palju arvutusvõimsust nõudev.
Järgnevas näitame, kuidas teatud järeldusalgoritmi parameetrite korral on
võimalik jõuda lihtsamate kujudeni. Kasutades implikatsioonioperaatorina korrutist ja agregeerimiseks
summat , teiseneb avaldis (28) kujule 1.8 Järeldusalgoritmi lihtsustatud erikujud 17
R y max (32) r R
yF ( y)dy r =1 r ( y) ydy y min r Cr S r y = Ycog ( F ( y )) = Y = = r =1 , F ( y)dy y max R
r S r R
Y r =1 r r ( y )dy r =1 y min
kus y max (33) r ( y ) ydy (liikmesfunktsiooni r raskuskese) y min Cr = y max
y min r ( y )dy
ja y max (34) Sr = r ( y)dy ( liikmesfunktsiooni r pindala). y min
eelduste reegli täidetuse implikatsioon agregeerimine aktivatsioon kontroll
x1 µ11
µ12 F(y) x2 µ21
µ22
1 2 3
Joonis 9. Hägus süsteem võrkstruktuurina
Kuna antud järeldusalgoritmi operaatorite valikuga omavad väljundi
liikmesfunktsiooni
seisukohast tähtsust ainult nimetatud kaks suurust 1.8 Järeldusalgoritmi lihtsustatud erikujud 18
(33,34), tähendab see seda, et
piisab kui väljundi liikmefunktsioonina
kasutada sümmeetrilist kolmnurkfunktsiooni, mille puhul Cr = br. ja Sr =
sr/2, kus br on sümmeetrilise kolmnurga keskpunkt ja sr selle alus.
Tulemusena teiseneb avaldis (28) kujule R R (35) y = r br s r r s r , r =1 r =1
Juhul kui süsteemi (32) kõikide väljundi liikmesfunktsioonide
pindalad (e. alused) on võrdsed, lihtsustub avaldis veelgi kuna need võib avaldisest
(35) välja taandada R R (36) y = r br r r =1 r =1
Viimasel juhul on tegu hägusa süsteemiga, mille väljundi
liikmesfunktsioonideks on numbrid väärtustega br. Võrreldes avaldisega (28) on
lihtsama järeldusfunktsiooni avaldiseni
võimalik jõuda ka siis kui kui implikatsioonioperaatoriks on korrutise
asemel miinimum (väljundi liikmesfunktsioondeks sümmeetrilised
kolmnurgad) [5]. R R (37) y = r br s r (1 - r / 2) r s r (1 - r / 2) r =1 r =1
Mõnedes rakendustes [6] on hägusad reeglid varustatud lisaparameetri
reegli kaaluga, mis peaks (sõltuvalt interpretatsioonist) väljendama reegli
olulisust, usaldatavust või tõenäosust. Iga r-nda reegli järelduspool
sisaldab T-d erinevat järeldust (kus T on süsteemi väljundi
liikmesfunktsioonide arv), mida
kirjeldavad vastavad kaalud wtr.
KUI U1 on A1r JA ... JA Ui on Air ... JA UN on ANr (38) SIIS V on B1 kaaluga w1r V on B2 kaaluga w2r ..... V on BT kaaluga wTr
VÕI... Reegli kaalu olemasolu mõjutab süsteemi järeldusalgoritmis iga üksiku
reegli väljundi arvutamist Ftr ( y ) = wtr r t , (t = 1, ..., T), (r = 1, ..., R). (39) 1.8 Järeldusalgoritmi lihtsustatud erikujud 19
mistõttu üldine avaldis (31) teisendub kujule
R T (40) UU wtr r I tr Y T y = Ycog ( F ( y )) = R T r =1 t =1
UU wtr r I tr 1 r =1 t =1 ning
taaskord , on võimalik summa ja korrutise valikuga vastavalt
agregeerimis- ja implikatsioonioperaatoriteks jõuda lihtsama avaldiseni R T (41) r bt s t wtr y= r =1 t =1 R T , r =1 t =1 r s t wtr
kusjuures avaldise (41) võib edukalt
asendada avaldisega (35), kus T T T (42) br = bt wtr s t wtr st , s r = wtr st t =1 t =1 t =1 1.8 Järeldusalgoritmi lihtsustatud erikujud 20
A11 A12 A2 1 A2 2 B1 B2 B3 1 1 1
µ11(x1) µ21(x2) 1 0 0 0 x1 x2 y x1* x 2*
A11 A12 A21 A22 B1 B2 B3 1 1 1
µ11(x1) µ22(x2) 2
0 0 0 x1 x2 y x1* x 2*
A11 A12 A21 A22 B1 B2 B3 1 1 1
µ12(x1) µ21(x2) 3 0 0 0 x1 x2 y x1* x 2*
A11 A12 A21 A22 B1 B2 B3 1 1 1 µ22(x2)
µ12(x1) 4 0 0 0 x1 x2 y x1* x 2* B1 B2 B3 1
0 y* y 1.8 Järeldusalgoritmi lihtsustatud erikujud 21
A 11 A12 A21 A22 B1 B2 B3 1 1 1
µ11(x 1) µ21(x 2) 1 0 0 0 x1 * x2 y x1* x2
A 11 A12 A21 A122 B1 B2 B3 1 1 1
µ11(x 1) µ22(x 2) 2
0 0 0 * x1 * x2 y x1 x2
A 11 A12 A21 A122 B1 B2 B3 1 1 1
µ12(x 1) µ21(x2) 3 0 0 0 * x1 x2 y x1 x *2 1 A 11 A12 A21 A22 B1 B2 B3 1 1 1 µ 22(x2)
µ12(x 1) 4 0 0 0 x1 x2 y x1* x *2 B1 B2 B3 1
0 * y y 1.9 Takagi-Sugeno süsteemid 22
1.9 Takagi-Sugeno süsteemid
Hägusad süsteemid, mida oleme siiamaani käsitlenud, nimetatakse
klassikalisteks hägusateks süsteemideks (ka lingvistilised, Mamdani).
Klassikalised hägusad süsteemid osutuvad kasulikuks, kui
rakenduse eesmärgina nähakse mingit inimese ja arvuti vahelise
liidese vormi.
Teisalt on aga nende piiratud või pole neid küllalt efektiivsed. Seda lünka oli
mõeldud täitma Takagi ja Sugeno [7] poolt väljapakutud reegliformaat ja
vastav järeldusfunktsiooni kuju. IF U1 is A1r AND U2 is A2r ... AND Ui is Air ... AND UN is ANr (43) THEN yr = p0r + p1rx1 + ... + pirxi + ... + pNrxN Takagi-Sugeno (TS) reeglites on hägus sedastus asendatud süsteemile
täiendavaid vabadusastmeid pakkuva funktsiooniga; enamikul juhtudel on
selleks
lineaarkombinatsioon sisendite väärtustest ja täiendav vabaliiga
(esimest järku funktsioon). Iga süsteemi üksikut reeglit võib seega
käsitleda lokaalse lineaarse mudelina, mis on seejärel
agregeeritud saamaks süsteemi globaalset väljundit y. Järeldusalgoritmis on
eelnevast käigust mõjutatud järeldusalgoritmi
kolmas etapp implikatsioon N Fr ( y ) = r y r = r ( p0 r + pir xi ) . (44) i =1
ning häguärastamine. TS süsteemides on implikatsiooni ja
agregeerimisoperaatorid fikseeritud (vastavalt korrutis ja summa), mille
järel raskuskeskme häguärastamine teiseneb algoritmiks, mida tuntakse
hägusa c-keskmistamise nime all. Viimane ühendab agregeerimise ja
häguärastamise üheks operatsiooniks ja on seetõttu midagi
enamat kui
pelgalt häguärastamismeetod [8]. R N
r ( p0r + pir xi ) r =1 i =1 y = Y fcm ( F ( y )) = R (45) r r =1
Üheks 2.37 erijuhuks on kui reegli väljundpooles kasutatav funktsioon
on konstant (pir = 0, i =1...N, r = 1...R), mille tagajärjel saame, et (43)
asemele tekib (46) ja (45) asemele (47). IF U1 is A1r AND U2 is A2r ... AND Ui is Air ... AND UN is ANr (46) THEN yr = p0r 1.9 Takagi-Sugeno süsteemid 23
R R y = Y fcm ( F ( y )) = r p0 r r (47) r =1 r =1
On kerge näha, et tegu pole millegi muu kui eelmises jaotises käsitletud
süsteemiga (35).
p11x1 + p21x2 +
µ11 x1
µ12 N y µ21 x2 N µ22
p12x1 + p22x2 +
Joonis 10. Esimest järku TS süsteem ja tema esitus närvivõrguna.
Mõnedes rakendustes on kasutatud hägusat c-keskmistamist
klassikaliste hägusate süsteemid häguärastamisprotseduurina, nii et
kaalutud keskmise arvutamisel asendatakse iga väljundi liikmesfunktsioon
tema numbrilise ekvivalendiga, milleks on tavaliselt liikmesfunktsiooni
raskuskese Cr. Tulemuseks on aga järeldusfunktsiooni kuju, mis on
sisuliselt ekvivalentne avaldisega (47), seega taandab hägus c-
keskmistamine hägusa süsteemi 0-ndat järku TS süsteemiks, kuna
liikmesfunktsiooni muud parameetrid ei oma mitte mingit mõju süsteemi
väljundile. Samuti võib lisada, et 0-ndat järku TS süsteemid (vastandina tavalistele,
1-st järku TS süsteemidele) on interpretatsiooni seisukohast analoogilised
klassikaliste hägusate süsteemidega. 1.10 Hägusate süsteemide läbipaistvus 24
Ka TS süsteeme võib esitada võrkstruktuurina, sel juhul on analoogia
närvivõrkudega veelgi ilmsem3 (joonis 10).
1.10 Hägusate süsteemide läbipaistvus
Süsteemi läbipaistvuse mõiste antud tekstis baseerub
Browni ja Harrise
definitsioonil [10], mille järgi läbipaistvus on omadus, mis võimaldab meil
mõista iga üksiku süsteemi parameetri mõju süsteemi väljundile. Hägusa süsteemi läbipaistvus iseloomustab seda, mil määral on kehtiv
või usaldatav on süsteemi reeglite lingvistiline interpretatsioon.
Mitteläbipaistva hägusa süsteemi puhul võiks tõmmata kaudse paralleeli
inimesega, kes mõtleb ühte kuid räägib teist. Osutub, et läbipaistvus ei ole
hägusate süsteemide vaikimisi tagatud omadus. Üks tähtis tegur, mis
mõjutab niihästi interpolatsiooni hägusas süsteemis kui süsteemi
läbipaistvust, on sisendi liikmesfunktsioonide eristatavus, mida näiteks
kolmnurksete liikmesfunktsioonide puhul iseloomustab liikmesuse väärtus
punktis, kus naaberliikmesfunktsioonid lõikuvad (ülekate). Praktikas jääb
see näitaja enamasti 0.25 ja 0.75 vahele [11] ning tüüpiline väärtus on 0.5.
Vaatleme ülekatte mõju reeglite interpolatsioonile lihtsa näite abiga.
Kontrueerime viis 6-reeglilist hägusat süsteemi, mille
sisendliikmesfunktsioonide ülekate on vastavalt 0.0, 0.25, 0.5, 0.75 ja 1.0.
Kuigi muud parameetrid (miinimum t-norm, maksimum s-norm ja
raskuskeskme häguärastamine) on kõigil süsteemidel samad, tingib
ülekatte varieerimine üsna drastilised resultaadid (Joonis 11). Ülekatte
puudumisel, puudub reeglitevaheline interpolatsioon, süsteemis puudub
sealjuures ka hägusus ja väljund lülitub
relee kombel ühelt jooksva
reegliga määratud väljundliikmesfunktsiooni raskuskeskme väärtuselt
teisele. 0.25-se ülekattega säilib mingi osa neist konstantse väärtusega
lõikudest, kuid tänu ülekatte eksisteerimisele tekib interpolatsioon,
mistõttu lülitumine ühelt etteantud väljundi väärtuselt teisele on sujuvam. 0.5-se ülekattega jäävad intervallidest kus süsteemi väljund on
määratud vaid ühe reegli poolt järgi vaid üksikud punktid. Veel suurema
ülekatte määra puhul, on iga sisendi väärtuse puhul aktiivsed vähemalt
kaks reeglit, seega on süsteemi väljund alati interpoleeritud kahest või
enamast reeglist. See asjaolu muudab reegli
globaalses väljundis teatud
mõttes nähtamatuks (eristamatuks). Nähtus on
viidud äärmuseni 1.0-se
ülekatte puhul, kus kõik reeglid on ühekorraga täielikult aktiveeritud ja
3
Jang [9] ja mitmed teised autorid on oma töödes näidanud ekvivalentsi 0-ndat järku TS süsteemide ning radiaalbaasi närvivõrkude vahel. 1.10 Hägusate süsteemide läbipaistvus 25
süsteem väljastab konstantse väärtuse, milleks on väljundi liikmesfunktsioonide ühendi raskuskese. Vaatleme veelkord lähemalt 0.5-se ülekatte juhtumit ja nimetagem punkte, kus globaalne väljund on määratud vaid ühe, täielikult aktiveeritud reegli poolt, läbipaistvuse kontrollpunktideks (joonis 12). Läbipaistvuse kontrollpunktid eksisteerivad vaid juhul kui liikmesfunktsioonide ülekate on 0.5 või vähem. Nende punktide koordinaadid sisendtelgedel on määratud tingimusega x i* = arg(µ ir ( x i ) = 1) . Punkti väljundkoordinaat on määratud analoogiliselt y * = arg( r ( y ) = 1) . Läbipaistvuse kontrollpunktide olemasolu tagab, et reeglibaasi ja liikmesfunktsioonide kombineeritud tähendus omab korrektset seost süsteemi poolt genereeritud sisend-väljundseosega nendes punktides. Viimane ongi see, mida me antud kontekstis
nimetame läbipaistvuseks. 4 50% 3 0% 75%
2 0% 100% 25% 1
y 0 50% IF x is mf1 THEN y is mf3 -1 IF x is mf2 THEN y is mf1 -2 IF x is mf3 THEN y is mf2 75% IF x is mf4 THEN y is mf4 -3 25% IF x is mf5 THEN y is mf5 IF x is mf6 THEN y is mf3 100% -4 0 2 4 6 8 10 0 2 4 6 8 10 x x
Joonis 11. Liikmesfunktsioonide ülekate (paremal) ja selle mõju süsteemi väljundile (vasakul).
Definitsioon 1: Mitme sisendi ja mitme väljundiga hägusa süsteemi r-s reegel on läbipaistev, kui reegli täieliku tabatuse korral N r = I µ ir ( xi ) = 1 , (48) i =1
on süsteemi numbrilised väljund(id) võrdsed avaldisega 1.11 Interpolatsioon hägusates süsteemides 26
y max
y jr ( y )dy y j = cog ( jr ( y j )) = = core( jr ( y j )) y min y max (49) y min jr ( y )dy
kus jr on j-nda väljundi r-nda reegliga seotud liikmesfunktsioon. mf1 mf2 mf3 mf4 mf5 mf6 5
4 mf1 3
2 mf2
1 mf3 y 0
-1 mf4 -2
-3 mf5 -4
-5 0 2 4 6 8 10 x
Joonis 12. Läbipaistvuse kontrollpunktid tähistatuna sümboliga .
Definitsioon 2: Hägus süsteem on läbipaistev kui kõik tema reeglid on
läbipaistvad.
Teatud liikmesfunktsioonide (9,11) tüüpide puhul võib läbipaistvuse
tingimuse sisendi liikmesfunktsioonidele esitada järgnevalt: Si x X : µis ( xi ) 1 (47) s =1
1.11 Interpolatsioon hägusates süsteemides
Hägusa süsteemi läbipaistvuse korral on võimalik ennustada tema
väljundit läbipaistvuse kontrollpunktides ilma järeldusalgoritmi
kasutamata. Nendes muudes punktides on globaalne väljund reeglite
interpolatsiooni
resultaat . Interpolatsiooni olemus sõltub süsteemi
parameetritest häguärastamine, järeldusalgoritmi parameetrid, 1.11 Interpolatsioon hägusates süsteemides 27
liikmesfunktsioonide kuju. Järgnevates osades vaatleme nende rolli
lähemalt.
1.11.1 Häguärastamine
Antud jaotises vaatleme peamiste häguärastamismeetodite mõju
interpolatsioonile süsteemis, 0.5-se liikmesfunktsioonide ülekattega
süsteemi näitel jättes muud süsteemi parameetrid samaks. Kõige silmatorkavam on asjaolu, et maksimumide keskmise meetod
realiseerub omalaadses treppfunktsioonis. See on ka põhjus miks
arvutuslikult odav maksimumide keskmise meetod on modelleerimises,
kus me enamasti ootame sujuvat interpolatsiooni, harva kasutusel. Samuti
muutub antud meetodi puhul muude interpolatsiooni iseloomule
mõjutavate tegurite roll olematuks ja multitasemeline relee, milleks hägus
süsteem maksimumide keskmise meetodiga muutub (eeldusel, et väljundi
liikmesfunktsioonid on sümmeetrilised), võib hägusloogika asemel
realiseerida klassikalise loogika vahenditega 4
3
2
1
y 0
-1
-2
-3
-4 0 2 4 6 8 10 x
Joonis 13. Läbipaistvuse kontrollpunktide vahel interpoleeritud süsteemi väljund
maksimumide keskmise (tavaline joon), hägusa c-keskmistamise (paks joon) ja
raskuskeskme (katkendlik joon) häguärastamismeetoditega.
Nagu näidatud jaotises 8 on hägusa c-keskmiste häguärastusmeetodi
rakendamise tulemuseks 0-ndat järku TS süsteemiga ekvivalentne süsteem
ja läbipaistvuse kontrollpunktide vaheline interpolatsioon on sel juhul
lineaarne (joonis 13). Raskuskeskme meetodiga interpoleeritakse kõver, mille täpne kuju
sõltub süsteemi ülejäänud parameetritest, millest olulisemaks on aktiivsete
reeglitega seotud väljundi liikmesfunktsioonide aluste suhe teineteise 1.11.2 Liikmesfunktsioonide tüübi roll 28
suhtes. Kui kaks liikmesfunktsiooni on võrdsed, kulgeb väljund ümber
lineaarse interpolatsiooni lõigates seda
keskpunktis . Kui üks
liikmesfunktsioonidest on teisest suurem, kaardub interpoleeritud väljund
suurema liikmesfunktsiooni suunas (joonis 14). A B 1.0
µ(x)
0 bA bB y
A B supp(A) µ(x) supp(A) = supp(B)
y 0 bA bB y
A B supp(A) > supp(B) 1.0
bA µ(x) x
0 bA bB y
Joonis. 14. Reeglite interpolatsioon raskuskeskme häguärastusmeetodiga
(lineaarne intepolatsioon läbipaistvuse kontrollpunktide vahel on kujutatud punkt-
kriipsjoonega).
1.11.2 Liikmesfunktsioonide tüübi roll
Liikmesfunktsioonide kuju järgi võib neid jagada kahte kategooriasse
a) Tükati lineaarsed liikmesfunktsioonid (kolmnurksed, trapetsikujulised)
b) Siledad liikmesfunktsioonid (splainipõhised liikmesfunktsioonid)
Veel on võimalik rühmitada liikmesfunktsioone selle järgi, kas nende tuum
koosneb ühestainsast või rohkemast punktist.
a) hägusad numbrid (kolmnurkne liikmesfunktsioon, 3-
parameetriline splainipõhine liikmesfunktsioon s.o. b = c avaldises (11))
b) hägusad intervallid (trapetsikujuline liikmesfunktsioon, 4- parameetriline splainipõhine liikmesfunktsioon (11)) 1.11.3 Järeldusalgoritmi parameetrid 29
Hägusate intervallide kasutamine tingib omalaadse tundetuse tsooni tekke läbipaistvuse kontrollpunkti ümbruses, mille suurus on proportsionaalne asjassepuutuva liikmesfunktsiooni tuuma suurusega. Efekt sarnaneb sellega, mida kogesime 0.5-st väiksema sisendi liikmesfunktsioonide ülekattega (vt.
jaotis 1.10). Tulemuseks on lineaarsest interpolatsioonist tunduvalt erinev sisend-väljundseos (joonis 15, vasakul) Siledad liikmesfunktsioonid
lisavad väljundisse mittelineaarsust. Jällegi on erinevus lineaarsest interpolatsioonist proportsionaalne liikmesfunktsioonide erinevusega originaalliikmesfunktsioonidest (joonis 15, paremal). 4 4
3 3
2 2
1 1
y 0 y 0
-1 -1
-2 -2
-3 -3
-4 -4 0 2 4 6 8 10 0 2 4 6 8 10
mf1 mf2 mf3 mf4 mf5 mf6 mf1 mf2 mf3 mf4 mf5 mf6
1.0 1.0
0 0 0 2 4 6 8 10 0 2 4 6 8 10 x x
Joonis 15. Trapetsikujuliste ja siledate liikmesfunktsioonide kasutamise mõju reeglite interpolatsioonile.
1.11.3 Järeldusalgoritmi parameetrid
On huvitav märkida, et järeldusalgoritmi parameetrid mõjutavad interpolatsiooni oluliselt vaid siis kui kasutatakse raskuskeskme häguärastamismeetodit. Vastavalt jaotisele 1.12.1 nimetatule muutis maksimumide keskmise meetod hägusa süsteemi interpolatsiooni mittesõltuvaks muudest parameetritest, hägusa c-keskmistamise puhul võib lisada järgmist. 1.11.3 Järeldusalgoritmi parameetrid 30
a) Väljundi liikmesfunktsioonid pole hägusad, järelikult r p0 r min( r , p 0 r ) R
b) r p0r max( 1 p01 , ... , R p0 R ) kui väljundparameetrid p0r ei r =1 osutu samaväärtuslikuks. Tegelikkuses see enamasti ongi nii, kuna reeglina on 0ndat järku reeglid varustatud igaüks unikaalse parameetriga. Eelnevast võib üldistada, et interpolatsioon 0-ndat järku TS süsteemides
sõltub vähe järeldusalgoritmi parameetritest (samuti mängib väikest rolli
tingimuste eelduste täidetuse arvutamiseks kasutatav operaator) Raskuskeskme häguärastusega on siiski nii agregeerimis- kui
implikatsioonioperaatoreil tuntav mõju interpolatsioonile. Joonisel 16
kujutatud süsteemi väljundi liikmefunktsioonid on erineva suurusega ja
osalise ülekattumisega (mis tingib erinevuse summa ja maksimumiga
agregeerides). On näha et mitteanalüütilised operaatorid (s.o. minimum ja
maksimum) tingivad suurema mittelineaarsuse. Samas on maksimumiga
agregeerimisel teatud negatiivsed kõrvalnähud, mida illustreerib joonisel
17 kujutatud näide. 0.8 0.8
0.75 0.75
0.7 0.7
0.65 0.65
y 0.6 y 0.6 minimum minimum 0.55 0.55
0.5 0.5
0.45 product 0.45 product
0.4 0.4 0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1 x x 0.6 mf1 mf2
0.4
0.2
0 0 0.2 0.4 0.6 0.8 1 y
Joonis 16. Implikatsioon korrutise ja miinimumiga koos agregeerimisega summa
kaudu (ülal vasakul) ja maksimumi kasutades (ülal paremal). Väljundmuutuja
liikmesfunktsioonid (all) 1.11.4 Interpolatsioon mitmemõõtmelises ruumis 31
(a) (b) br + 1 (c) µ (d)
(b) br br + 1 br br + 1 y y (a)
(c) (d)
µ br
br br + 1 br br + 1 ar ar + 1 y x
Joonis 17. Hägusa süsteemi reeglite interpolatsioon, kui agregeerimisoperaatorina
kasutatakse summat.
Me kasutame nelja erineva väljundi liikmesfunktsiooniga mudelit, mis
erinevad liikmesfunktsioonide aluste suuruse ja sellest tuleneva
ülekattumise määra poolest. Samas on suhe sr/sr + 1 on kõikidel juhtudel
sama, mistõttu agregeerimisoperaatorina summat (ja
implikatsioonioperaatorina korrutist) kasutades oleks sisend-väljundseos
kõikidel juhtudel sama (kõver (a), parempoolsel joonisel). Kui väljundi
liikmesfunktsioonid ei kattu, on ka maksimumiga agregeerimisel
tulemuseks kõver (a). Mida suurem on ülekate, seda rohkem hakkab
interpolatsioonis domineerima liikmesfunktsioon, mille keskpunkt on
punktis br + 1. Suurte ülekattumiste määrade korral (nagu variant (d))
hakkab domineeriv reegel teist reeglit "lämmatama" tekitades konstantse
väärtusega piirkonnad sisend-väljundseoses. Veelgi olulisem on aga
asjaolu, et sel moel muutub väljundi liikmesfunktsioonide ülekate teguriks,
mis mõjutab interpolatsiooni rohkem kui liikmesfunktsioonide suurus ja on
seetõttu eksitava kõrvaltoimega.
1.11.4 Interpolatsioon mitmemõõtmelises ruumis
Kuigi järeldused süsteemide interpolatsiooni kohta, mis baseeruvad toodud
lihtsatel näidetel võib üldjuhul üldistada keerukamatele süsteemidele,
eksisteerivad siiski mõningad erinevused, näiteks pole vaadeldud lineaarne
seos 1 sisendi ja 1 väljundiga 0-ndat järku TS süsteemides
mitmedimensionaalses ruumis enam lineaarne. 1.12 Esimest järku Takagi-Sugeno süsteemide läbipaistvus 32
Põhjus on lihtne: 2 sisendiga süsteemis 4-st reeglist interpoleeritud väljund
(joonis 18) pole lineaarne kuna
tasapinna defineerivad 3 punkti. Erinevus
interpoleerivate reeglite arvu (2N ) ja hüpertasapinda defineerivate punktide
arvu (N + 1) vahel kasvab sedavõrd kuidas kasvab sisendite arv N (need
kaks arvu on võrdsed vaid siis kui N = 1).
y
x2 x1
Fig. 18. Interpolation
between 4
rules in a MISO 0th
order TS system.
1.12 Esimest järku Takagi-Sugeno süsteemide läbipaistvus
Erinevalt intuitiivselt interpreteeritavatest klassikalistest hägusatest
süsteemidest, toimub esimest järku TS süsteemide interpreteerimine
lokaalsete mudelite kaudu (mille mõjupiirkond on määratud vastava reegli
tabatusega). Seda tüüpi süsteemide vabadusastmete suur arv, mis ühest
küljest tagab ülihead aproksimatsiooniomadused tingib aga selle, et
süsteemide, mille
lokaalsed mudelid omavad kardinaalselt erinevaid
parameetreid, reeglite interpolatsiooni kaudu
saadavad globaalsed väljundid võivad erineda ainult pisiasjades (joonis 19). Teatud
piirini on võimalik süsteemi vabadusastmeid piirata ning
läbipaistvust suurendada reeglite isoleerimisega üksteisest
(liikmesfunktsioonide ülekatte vähendamise kaudu) kuna sisendruumi
piirkondades kus on aktiivne vaid üks reegel on globaalne väljund y
paratamatult identne vastava lokaalse mudeli väljundiga yr, kuid see ei ole
optimaalne lahendus antud probleemile, kuivõrd kõige läbipaistvama TS
süsteemi
same situatsioonis, kus liikmesfunktsioonide ülekate puudub ja
on raske rääkida hägusast süsteemist. 1.13 Hägusate süsteemide konstrueerimine 33
2 2 y1 = 7.897x 1.248 1.5 y1 = 0.191x + 1.081
1.5 1 y2 = -0.333x + 0.804 1 y2 = 7.306x - 6.453
0.5 0.5
0 0
-0.5 y3 = 8.046x - 12.87 -0.5 y3 = 0.341x - 0.556 -1 -1 0.4 0.6 0.8 1 1.2 1.4 1.6 0.4 0.6 0.8 1 1.2 1.4 1.6
2 2
1.5 y1 = -0.502x + 1.282 1.5 y2 = -9.831x + 9.827 1 y2 = -1.076x + 1.513 1
0.5 0.5 y3 = -9.089x + 14.55 0 0 y3 = -0.355x + 0.555 y1 = -9.239x + 3.892
-0.5 -0.5
-1 -1 0.4 0.6 0.8 1 1.2 1.4 1.6 0.4 0.6 0.8 1 1.2 1.4 1.6
Joonis 19. Neli sisuliselt identse globaalse väljundiga TS süsteemi. Pöörake tähelepanu lokaalsete mudelite (näidatud punktiirjoonega) erinevustele. Vaid alumisel vasakul joonisel kujutatud süsteemi lokaalsed mudelid annavad adekvaatse pildi süsteemi käitumisest. 3
2.8 0% 50% 2.6 0% 2.4 25% 100% 2.2
y 2 75% 50% 1.8 25% 1.6 75% 1.4
1.2
1 100% 0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1 x x
Joonis 20. TS süsteemi läbipaistvuse
suurendamine liikmesfunktsioonide ülekatte vähendamise kaudu
Teatud kompromisslahendusi on probleemile võimalik leida, kuid tegu on
keeruka probleemiga, mille lähem käsitlemine väljub käesoleva teksti raamest (detailsem analüüs allikates [12] ja [13]).
1.13 Hägusate süsteemide konstrueerimine
Kaks tähtsat hägusate süsteemide rakendusala on protsesside hägus
modelleerimine ja protsesside hägus juhtimine. Allikateks, millest hägusaid süsteeme luuakse, on protsessi alane inimteadmus ja protsessi 1.13 Hägusate süsteemide konstrueerimine 34
käitumist kajastavad mõõteandmed. Inimteadmus, mis enamasti tuleb
"ekspertidelt" (nt. vaadeldava protsessi operaatorid või
insenerid , kellel
palutakse oma
know -howd väljendada hägusate reeglite vahendusel), võib
olla esitatud üsnagi ähmasel kujul. Järelikult võib selliseid hägusaid
süsteeme nimetada hägusateks ekspertsüsteemideks. Paljude protsesside puhul on käitumise monitoorimine ja andmete
jooksev
salvestamine tavaline tegevus. Kui see ka pole nii, on võimalik
sooritada spetsiaalseid
eksperimente vajalike andmete hankimiseks.
Hägusa süsteemi konstrueerimine andmete baasil eeldab vastava
algoritmi olemasolu. Nimetatakse hägusaks identifitseerimiseks. The acquisition or
tuning of fuzzy systems by
means of data is
usually termed fuzzy
identification. Eelnevas võib täheldada teatud sarnasust klassikalise modelleerimisega.
Teadmuspõhine meetod on mõnes mõttes analoogiline esimese printsiibi
modelleerimisele ning hägus identifitseerimine kuulub ühte gruppi
süsteemide identifitseerimiseks kasutatavate statistiliste meetoditega.
Klassikalises modelleerimises on võrdlemisi tihti kasutusel kombineeritud
lähenemine, kus füüsikaseaduste baasil konstrueeritakse üldised
diferentsiaalvõrrandid, mida loodetakse süsteemi käitumist kajastavat ning
seejärel viiakse läbi eksperimente määramaks teatud süsteemi parameetrid
või funktsioonid. Sarnast lähenemist on kasutatud ka hägusate süsteemide
konstrueerimisel. Hägusate süsteemide konstrueerimist võib käsitleda kui 6-st sammulise
eeskirja järgi toimuvat protseduuri [6]. i. Sisend- ja väljundmuutujate valik; ii. Hägusa süsteemi järeldusalgoritmi parameetrite valik; iii. Muutujate muutumispiirkondade määramine; iv. Lingvistiliste märgendite ja vastavate hägusat tükeldust moodustavate liikmesfunktsioonide
defineerimine ; v. Hägusa süsteemi reeglibaasi konstrueerimine; vi. Süsteemi
adekvaatsuse hindamine.
Küllaltki tihti realiseerub eeltoodud tegevuste sooritamine vaid
lõppresultaadina soovitud hägusa süsteemi alghinnangus (seda juhul kui
süsteemi kvaliteeti hinnates
selgub , et advekvaatsuse mõõt ei ole soovitud
tasemel), mistõttu osutub vajalikuks edasine süsteemi parameetrite
optimeerimise faas, milles süsteemi liikmesfunktsioonide parameetrid
omandavad eeldatavalt optimaalsed väärtused. Kui eksisteerivad sisend-
väljundmõõtmised, mis peegeldavad süsteemi optimaalset käitumist, on
loomulik kasutada andmepõhiseid identifitseerimistehnikaid, mis leiavad 1.13 Hägusate süsteemide konstrueerimine 35
lähema käsitluse allpool. Samas eksisteerib ka
olukordi kus kogu
konstrueerimisprotsessi tuleb puhtalt lehelt
alata . Keerukate süsteemide puhul pole alati selge, milliseid muutujaid tuleks
kasutada mudeli sisenditena. Eelnevalt teadaolev informatsioon, arusaam
protsessi olemusest ja
modelleerimise eesmärk on tüüpilised infoallikad
sellise valiku jaoks. Hägusa süsteemi järeldusmootori kindlaksmääramisel (mille alla
kuuluvad süsteemi tüüp, järeldusalgoritmi parameetrid,
häguärastamismeetod, liikmesfunktsioonide tüübid) on otsustavateks
faktoriteks jällegi modelleerimise eesmärk ja teadaolev informatsioon.
Tähtsust võib selles mõttes omada ka identifitseerimiseks kasutatav
algoritm, nt. tuletise arvutamisel põhinevad algoritmid eeldavad, et hägusa
süsteemi väljundi arvutamiseks kasutatav avaldis peab olema
diferentseeritav, mis oluliselt piirab järeldusalgoritmi parameetrite valikut.
Samuti võib määravaks osutuda järeldusavaldise arvutuslik "maksumus"
nt. on raskuskeskme häguärastamine arvutuslikult
kulukam kui
maksimumide keskmise meetod või hägus c-keskmistamine (samuti on
siinkohal ilmne eelis lihtsustatud järeldusalgoritmidel). Valikul võib olla
oma osa ka järeldusmootori poolt süsteemile dikteeritud
interpolatsiooniomadustel. Hägusa süsteemi
disain on suuresti sõltuv konkreetsest rakendusest,
mistõttu täpset konstrueerimiseeskirja anda pole võimalik. Siinkirjeldatud
üldised põhimõtted üritasid kaardistada mängumaad, mille piires see
toimub. Konstrueerimise põhimõtted modelleerimise ning juhtimise
kontekstis leiavad lähemat käsitlust järgnevates peatükkides. Kasutatud kirjandus 36
Kasutatud kirjandus
1. Zadeh, L.A. (1965), "Fuzzy
Sets ," Information and
Control , vol. 8, pp. 338-353.
2. de Oliveira J.V (1999) "Semantic constraints for
membership function
optimization ". IEEE Trans. Systems, Man and Cybernetics, vol. 29, no. 1, pp. 128 -138.
3. Zadeh L.A. (1973), "
Outline of a New
Approach to the
Analysis of Complex Systems and
Decision Processes," IEEE Trans. On Systems, Man, and Cybernetics, vol. 3, pp. 28-44.
4. Babuska, R. (1997), Fuzzy
Modeling and Identification, Ph.D. dissertation. Technical University of
Delft , Delft.
5. Riid, A. and Rüstern, E. (2003), "On the interpretability and representation of linguistic fuzzy systems",
Proc . IASTED International Conference on
Artificial Intelligence and Applications, Benalmadena,
Spain , pp. 88-93
6. Yager, R. and Filev, D. (1994), Essentials of Fuzzy Modeling and Control. Wiley, New
York .
7. Takagi, T. and Sugeno, M. (1985), "Fuzzy identification of systems and its applications to modeling and control," IEEE Trans. Syst., Man, Cybern., vol. SMC-15, no. 1, pp. 116-132.
8. Jager, R. (1995), Fuzzy Logic in Control, Ph.D. dissertation, Technical University of Delft, Delft.
9. Jang, J.-S.R. (1993), "
Functional equivalence between radial
basis function
networks and fuzzy inference systems," IEEE Trans. Neural Networks, vol. 4, no.1, pp. 156-159.
10.
Brown , M. and
Harris , C.J. (1994), Neurofuzzy Adaptive Modelling and Control, Prentice Hall, Englewood
Cliffs .
11. Shaw, I.S. (1998), Fuzzy Control of
Industrial Systems, Kluwer Academic Publishers,
Boston .
12. Yen, J.,
Wang , L. and Gillespie, C.W. (1998) "Improving the Interpretability of TSK Fuzzy Models by Combining
Global Learning and
Local Learning", IEEE Trans. Fuzzy Systems, vol. 6, no. 4, pp. 530-537. Kasutatud kirjandus 37
13. Riid, A. and Rüstern, E. (2004) "Takagi-Sugeno Systems with
Improved Interpretability and Interpolation using a Complementary Interpolation Model", ootab publitseerimist.
Viide:
http://www.dcc.tt u.ee/LAS/ISS0010/H%C3%A4gusad-s%C3%BCsteemid-Andri 2004.pdf
Kui teie olete Andri Riid, siis vabandan, kuid vastasel juhul müüte teise inimese tööd.
Kõik kommentaarid