{"id":5,"date":"2024-04-04T00:11:59","date_gmt":"2024-04-03T21:11:59","guid":{"rendered":"https:\/\/sisu.ut.ee\/samm\/sissejuhatus-klasteranaluusi\/"},"modified":"2025-09-19T15:46:33","modified_gmt":"2025-09-19T12:46:33","slug":"sissejuhatus-klasteranaluusi","status":"publish","type":"page","link":"https:\/\/sisu.ut.ee\/samm\/sissejuhatus-klasteranaluusi\/","title":{"rendered":"Sissejuhatus klasteranal\u00fc\u00fcsi"},"content":{"rendered":"<p class=\"MsoSubtitle\" style=\"text-align: right;\"><span style=\"line-height: normal;\">Paketi SPSS enamlevinud meetodid<\/span><br>Liina-Mai Tooding<br>2020<\/p>\n<p><strong>Mis on klasterdus?<\/strong><\/p>\n<p><span style=\"line-height: normal;\">Klasteranal\u00fc\u00fcs on nimetus suure andmeanal\u00fc\u00fcsi meetodite kogu jaoks, mille eesm\u00e4rgiks seatakse objektide r\u00fchmitus viisil, kus \u00fche ja sama r\u00fchma liikmed on \u00fcksteisele mingis m\u00f5ttes l\u00e4hemal kui teise r\u00fchma liikmetele. Objektiks ehk indiviidiks v\u00f5ib olla mis tahes f\u00fc\u00fcsiline v\u00f5i loogiline \u00fcksus: inimene, hoone, riik, kooliklass, tunnus, kontseptsioon. Objekte kirjeldatakse nende omaduste \u2013 klasterdustunnuste \u2013 kaudu, mis v\u00f5ivad p\u00f5him\u00f5tteliselt olla klasterdusmeetodeid varieerides mis tahes formaalset ja statistilist t\u00fc\u00fcpi: arvulised, j\u00e4rjestusega v\u00f5i nominaaltunnused, pidevad v\u00f5i kategoriaalsed. Eesm\u00e4rgid, mille puhul klasteranal\u00fc\u00fcs ette v\u00f5etakse, v\u00f5ivad samuti olla erisugused: r\u00fchmitamine, t\u00fcpoloogia loomine, eristustunnuste v\u00e4ljaselgitamine jm. Kaugust ja l\u00e4hedust objektide vahel iseloomustatakse samuti erisuguselt, nagu n\u00e4eme allpool. L\u00f5puks erinevad ka arvutusalgoritmid, mille kohaselt koostatakse vastav tarkvara (ilma selleta on klasteranal\u00fc\u00fcs m\u00f5eldamatu). See k\u00f5ik kokku t\u00e4hendab, et klasteranal\u00fc\u00fcs, mille ideestik kerkis esile 1930. aastatel, on t\u00e4naseks p\u00e4evaks arenenud v\u00e4ga suure variatiivsusega matemaatiliselt p\u00f5hjendatud metoodikaks. \u00dcks oluline arenguh\u00fcpe j\u00e4\u00e4b 1960.\u20131970. aastatesse, mil (suur)arvutite kasutus laienes praktiliselt k\u00f5igile uurimisaladele, ja teine l\u00e4himinevikku, mil kerkis esile \u201esuurandmete\u201c idee, taas t\u00e4nu arvutikasutuse ja interneti uuele levikulainele v\u00f5imsate v\u00e4ikearvutite ilmudes. Klasteranal\u00fc\u00fcs kui mitmeste optimeerimiseesm\u00e4rkidega metoodika on tugevalt seotud tehnoloogilise alusega. T\u00e4htsateks klasteranal\u00fc\u00fcsi rakendusaladeks v\u00f5ib pidada statistilist andmeanal\u00fc\u00fcsi k\u00f5ikv\u00f5imalikel elualadel ja andmekaevet.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Mis on klaster? K\u00f5ige \u00fcldisemalt \u00f6eldes: objektikogum. Edasine t\u00e4psustus oleneb meetodist (mudelist), mis on v\u00f5etud klasterduse aluseks. Nimetame siin sagedamini kasutatavaid \u00fcldisemaid p\u00f5him\u00f5tteid, mida ka allpool, tarkvara kaasates, l\u00e4hemalt k\u00e4sitleme. Oluline on seejuures arvestada, et klaster on mitmem\u00f5\u00f5tmeline objekt, st selle loomise aluseks on mitmest tunnusest (sageli paljudest tunnustest) koosnev andmestik. Klasterdustunnuste valik m\u00e4\u00e4rab klastri t\u00e4henduse ja lisab veelgi tulemuste varieerimise v\u00f5imalusi.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Laialt levinud on kaugusep\u00f5hine klastrite moodustamine. See t\u00e4hendab objektidevaheliste ja (juba moodustatud) objektir\u00fchmade vaheliste v\u00f5imalike suhete kasutamist, et otsustada klastrikuuluvuse \u00fcle. Kauged objektid on eraldi klastreis ja l\u00e4hedased \u00fches. Kaugus v\u00f5ib t\u00e4hendada ka mittesarnasust ja l\u00e4hedus sarnasust mingi kriteeriumi alusel. Sellisel p\u00f5him\u00f5ttel toimivad allpool k\u00e4sitletavad hierarhilised klasterdusmeetodid.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Teine laialt kasutusel olev klasterdust\u00fc\u00fcp p\u00f5hineb mitmem\u00f5\u00f5tmelise klastrikeskmise (tsentroidi, <i>k-<\/i>keskmise, <i>k<\/i> viitab mitmem\u00f5\u00f5tmelisusele) m\u00f5istel. Otsitakse klasterdust, mille korral etteantud arvu klastrite puhul on klastrisisesed ruutkaugused klastrikeskmisest minimaalsed. See on rohkete variatsioonidega protseduuride r\u00fchm, mida tuntakse <i>k<\/i>-keskmise klasterdusena.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Nimetame veel otseselt statistilise iseloomuga klasterdust, kus \u00fchte klastrisse kogutakse t\u00f5en\u00e4oselt \u00fche ja sama statistilise jaotusega objektid, ja klasterdust v\u00f5imalikult \u201etihedate\u201c mitmem\u00f5\u00f5tmelise ruumi osade eritlemise nimel.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Mis kohal on klasterdamine andmeanal\u00fc\u00fcsis? Siin valitseb suur loominguline ja rakendusalati erinev variatiivsus: eritleda t\u00fc\u00fcbid (nt isiksuse ps\u00fchholoogias), teha kindlaks r\u00fchmi eristavad tunnused ja uurida nende eristusv\u00f5imet (klassifitseerimine), luua klastrikuuluvuse tunnus sotsiaalse indeksina, jaotada kogum homogeenseteks alaosadeks jpm. Homogeensete alakogumite loomine t\u00e4hendab suure mitmekesise andmekogumi teatud viisil p\u00f5hjendatud \u201et\u00fckeldamist\u201c, et statistilised kokkuv\u00f5tted oleksid enam asjakohased (nt \u00fcldkeskmine, soov eristada jaotuste segu \u00fcksikjaotusi). Andmekaeve eesm\u00e4rki m\u00e4\u00e4ratletakse \u00fcldiselt kui mustrite leidmist andmeis ja jaotus klastreiks t\u00e4hendab samuti mustri esiletoomist. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Mis on klasterduse l\u00e4hteks? Eelk\u00f5ige uurimis\u00fclesanne ja selle aineteoreetiline alus, aga ka v\u00e4ljavalitud tunnused, mille asjakohasuse ja komplektsuse eest \u00fclesande seisukohalt vastutab uurija. L\u00e4hteks on ka hea kirjeldav info klasterdustunnuste kohta (jaotused, tunnuste omavaheline seos) v\u00f5i m\u00f5ne eelneva analoogilise uuringu k\u00e4igus selgunud eelteave klastriteks jagunemise kohta (klastrite oletatav arv, v\u00e4iksema pilootandmestiku klasterdus).<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Mis on klasterduse tulemuseks? Erip\u00e4ra eirates v\u00f5iks \u00f6elda, et klasterdus t\u00e4hendab klastreid ja suhete osutamist nende vahel: \u00fcksteise katvuse poolest (klastrid ei pruugi olla objektide \u00fchisosata), sisalduvuse poolest \u00fcksteises (klastrite hierarhia) jm m\u00f5ttes. Tulemust iseloomustab alati ka subjektiivsus, sest valikuv\u00f5imaluste rohkuse t\u00f5ttu klasterdus\u00fclesande p\u00fcstitamisel, lahendamisel ja lahendi t\u00f5lgendamisel on uurijal v\u00e4ga suur voli. Eri klasterdusmeetodid v\u00f5ivad anda vaid osaliselt kokku langevaid klasterdusi ja \u201et\u00f5elisest\u201c r\u00fchmitusest v\u00f5iks k\u00f5nelda nende kokkulangevate osade alusel. Enamasti on arvutiprogrammides ette n\u00e4htud v\u00f5imalus klasterdustulemuse edasiseks kaasamiseks anal\u00fc\u00fcsi sel teel, et igale objektile m\u00e4\u00e4ratakse klastrikuuluvus andmestiku uue tunnusena, mille anal\u00fc\u00fcs toimub tavap\u00e4rasel viisil. See on koht, kus uurija lisaks tehnilistele oskustele klastreid moodustada peab rakendama erialap\u00e4devust uuele tunnusele sisulise t\u00e4henduse andmisel. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Klasteranal\u00fc\u00fcsil ei ole olemas \u201e\u00f5iget\u201c lahendust. V\u00e4liste n\u00e4itajate kaudu v\u00f5i ekspertotsuse alusel saab vahel, kui objektide kohta on teada tausta- v\u00f5i lisaandmeid, hinnata tekkinud klasterduse t\u00f5ep\u00e4ra ja klasterduse sisehindamise teel iseloomustada klastrite seesmist \u00fchetaolisust. Selleks on kasutusel suur hulk erinevaid kordajaid \u2013 nii suur hulk, et nende vahelise koosk\u00f5la leidmine on omakorda \u00fclesanne (vt nt Desgraupes). Klasterdust on vahel kasulik valideerida andmestiku juhuslike l\u00f5igete alusel. Klasteranal\u00fc\u00fcs on lahenduse mitmesusele vaatamata v\u00f5i hoopis t\u00e4nu sellele rikas ideede allikas konkreetse andmestiku tundma\u00f5ppimisel.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Klasteranal\u00fc\u00fcsi ulatuslikkust piirame k\u00e4esolevas sissejuhatuses praktika kriteeriumi kohaselt ja tutvustame osa neist m\u00f5isteist ja meetodeist, mis on realiseeritud suuremates professionaalsetes laialt levinud statistikapakettides (SAS, SPSS, Stata, Statistica). Klasteranal\u00fc\u00fcsi tarbeks on loodud ka hulk eriprogramme, sh vabavara, aga ka nendega t\u00f6\u00f6tamisel v\u00f5iks olla kasu \u201esuurte\u201c l\u00e4henemisviisi tundmisest. Lisame veel, et siinkohal me ei ammenda oma sissejuhatavate selgitustega kaugeltki k\u00f5iki v\u00f5imalusi klasterdamiseks, mis on neljas nimetatud paketis.<\/span><\/p>\n<p><\/p><div class=\"accordion mb-3\">\n        <div class=\"accordion-item accordion-item--white\">\n        <h2 class=\"accordion-header\" id=\"accordion-69de5cf5dddd9-heading\">\n            <button class=\"accordion-button collapsed\" type=\"button\" data-bs-toggle=\"collapse\" data-bs-target=\"#accordion-69de5cf5dddd9-collapse\" aria-expanded=\"true\" aria-controls=\"accordion-69de5cf5dddd9-collapse\">Kaugus objektide vahel<\/button>\n        <\/h2>\n        <div id=\"accordion-69de5cf5dddd9-collapse\" class=\"accordion-collapse collapse\" aria-labelledby=\"accordion-69de5cf5dddd9-heading\">\n            <div class=\"accordion-body\">\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Kauguse (ik <i>distance<\/i>) ja sarnasuse (ik <i>similarity<\/i>) m\u00f5\u00f5dikuid on praktikas kasutusel ohtrasti. Nende seas orienteerumiseks l\u00e4htume klasterdustunnuste t\u00fc\u00fcbist. Enamasti on kaugusm\u00f5\u00f5dud defineeritud \u00fcht ja sama t\u00fc\u00fcpi tunnuste korral, sh valdavalt kas arvtunnuste v\u00f5i dihhotoomsete tunnuste jaoks. Tuntud v\u00f5te on nominaaltunnuse (kategoriaalse tunnuse) esitus dihhotoomsete indikaatorite (ik <i>dummy variables<\/i>) kaudu, mis t\u00e4hendab, et ka nominaaltunnused on kaugustega kaetud. J\u00e4rjestustunnuste puhul v\u00f5iks kaaluda v\u00f5imalust nende t\u00f5lgendamiseks arvulistena, eeldades \u00fchetaolist meetrikat (\u00fchesuurusi t\u00e4henduslikke vahesid astmete vahel) v\u00f5i nominaaltunnustena. Eri t\u00fc\u00fcpi tunnuste kombineerimise ideed \u00fches kaugusm\u00f5\u00f5dus kohtab harva. K\u00fcll aga leidub algoritme, kus klasterdustunnustena saab korraga kasutada nii mittepidevaid (kategoriaalseid) kui ka pidevaid tunnuseid.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Kauguse puhul l\u00e4htume selle intuitiivsest m\u00f5ttest. R\u00e4pina on Tartule l\u00e4hemal kui P\u00e4rnu, kuid kaugus P\u00e4rnusse oleneb sellest, kas m\u00f6\u00f6duda V\u00f5rtsj\u00e4rvest l\u00f5una v\u00f5i p\u00f5hja poolt, st sellest, kuidas on kaugus m\u00e4\u00e4ratud. <span style=\"color: black;\">Kauguste liike on andmeanal\u00fc\u00fcsis kasutusel v\u00e4ga arvukalt (vt \u00fcldmulje saamiseks nt Vikipeedia vastava teema sisukorda <i>Category: Similarity and distance measures<\/i>).<\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Kaugus m\u00e4\u00e4ratakse kahe objekti vahel, kusjuures kaugus iseendani on 0. Kaugusi mitme objekti vahel v\u00f5ib korrastada kauguste maatriksiks analoogiliselt korrelatsioonimaatriksiga. Kaugus on enamasti lokaalne, konkreetse \u00fclesande kohane, ei pruugi olla arvuliselt t\u00f5kestatud ja v\u00f5ib ulatuda mis tahes arvuni olenevalt kasutatavatest tunnustest ning kauguse arvutusreeglist. V\u00f5rreldavuse huvides m\u00f5nikord kaugused standarditakse mingil viisil, nt v\u00f5etakse kauguste maatriksi suurim kaugus v\u00f5rdseks \u00fchega ja teised vastavalt jagatakse suurima kaugusega. Standarditud kaugused v\u00e4ljendavad objektide l\u00e4hedusastet suhteliselt (ja \u00fchikuta ka juhul, kui kaugusel on \u00fchik).<\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><strong><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Kaugus arvtunnuste alusel<\/span><\/span><\/strong><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\">Eukleidiline kaugus.<\/span> Sageli kasutatavaks kau<span style=\"color: black;\">guseks arvuliste tunnuste korral on eukleidiline ehk linnulennukaugus (ik <i>Euclidean distance<\/i>, <i>bird\u2019s-eye distance<\/i>). Olgu kaks indiviidi <i>o<\/i><sub>1<\/sub> ja <i>o<\/i><sub>2<\/sub> tasandil vastavalt punktides (<i>x<\/i><sub>1<\/sub>,<i>y<\/i><sub>1<\/sub>) ja (<i>x<\/i><sub>2<\/sub>,<i>y<\/i><sub>2<\/sub>). Joonisel 1 on kujutatud linnulennukaugus <i>d<\/i> tasandi kahe punkti vahel ja selle arvutus koolikursusest tuttava Pythagorase teoreemi abil. Sellist kaugust \u00fcldistatuna mis tahes tunnuste arvule tuntaksegi eukleidilise kaugusena. <\/span><\/span><\/p>\n<figure id=\"attachment_121\" aria-describedby=\"caption-attachment-121\" style=\"width: 414px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-121\" title=\"Joonis 1. Linnulennukaugus ehk eukleidiline kaugus kahe punkti vahel tasandil\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.20.09.png\" alt=\"Joonis 1. Linnulennukaugus ehk eukleidiline kaugus kahe punkti vahel tasandil\" width=\"414\" height=\"252\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.20.09.png 414w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.20.09-300x183.png 300w\" sizes=\"auto, (max-width: 414px) 100vw, 414px\"><figcaption id=\"caption-attachment-121\" class=\"wp-caption-text\">Joonis 1. Linnulennukaugus ehk eukleidiline kaugus kahe punkti vahel tasandil<\/figcaption><\/figure>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Vaatleme indiviidide paigutust <i>M<\/i>-m\u00f5\u00f5tmelises ruumis <i>M<\/i> erisuguse (v\u00f5imalik et omavahel seotud) tunnuse alusel. Vaatleme kaht indiviidi <i>o<\/i><sub>1<\/sub><i> ja o<\/i><sub>2 <\/sub>vastavalt m\u00f5\u00f5tmistega <i>x<\/i><sup>1<\/sup><sub>1<\/sub>, <i>x<\/i><sup>1<\/sup><sub>2<\/sub>, \u2026, <i>x<\/i><sup>1<\/sup><i><sub>M<\/sub><\/i> ja <i>x<\/i><sup>2<\/sup><sub>1<\/sub>, <i>x<\/i><sup>2<\/sup><sub>2<\/sub>, \u2026, <i>x<\/i><sup>2<\/sup><i><sub>M<\/sub><\/i> . Kahe indiviidi vaheline<i> <\/i>eukleidiline kaugus <i>d(<\/i>o<sub>1<\/sub><i>,o<\/i><sub>2<\/sub><i>)<\/i> leitakse valemist:<\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><img loading=\"lazy\" decoding=\"async\" width=\"673\" height=\"105\" class=\"wp-image-122 aligncenter\" title=\"tehe\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.20.59.png\" alt=\"tehe\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.20.59.png 673w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.20.59-300x47.png 300w\" sizes=\"auto, (max-width: 673px) 100vw, 673px\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Eukleidiline kaugus toetub k\u00f5igile tunnustele \u00fchtmoodi, sest k\u00f5igi tunnuste ruutvahed liituvad. See t\u00e4hendab, et tunnused peaksid olema sama suurusj\u00e4rku, kui tahame, et need osaleksid kauguse m\u00e4\u00e4ramisel v\u00f5rdv\u00e4\u00e4rselt. \u00dcksiktunnuse alusel leitud vahe v\u00f5etakse kauguse arvutamisel ruutu, et mitte teha vahet objektide erinevuses m\u00e4rgi alusel. Seejuures ruutu t\u00f5stmine v\u00f5imendab nende tunnuste t\u00e4hendust, mille korral objektide vahe on suur. Eukleidiline kaugus on s\u00fcmmeetriline: <i>d(o<\/i><sub>1<\/sub><i>,o<\/i><sub>2<\/sub><i>)<\/i> = <i>d(o<\/i><sub>2<\/sub><i>,o<\/i><sub>1<\/sub><i>)<\/i>. Kasutatakse ka eukleidilist ruutkaugust (ik <i>Squared Euclidean distance<\/i>), mille puhul eelnevas valemis j\u00e4etakse ruutjuur v\u00f5tmata. <\/span><\/span><\/p>\n<p style=\"margin-bottom: .0001pt; text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Olgu n\u00e4iteks kolme objekti m\u00f5\u00f5tmisel ruumis (nt pikkus, laius, k\u00f5rgus) saadud j\u00e4rgmine andmetabel:<\/span><\/span><\/p>\n<p style=\"text-align: justify; margin: 0cm 0cm .0001pt 35.4pt;\"><span style=\"line-height: normal;\"><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">1<\/span><\/sub><span lang=\"ET\" style=\"color: black;\">\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 1\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 1\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 1<\/span><\/span><\/p>\n<p style=\"text-align: justify; margin: 0cm 0cm .0001pt 35.4pt;\"><span style=\"line-height: normal;\"><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">2<\/span><\/sub><span lang=\"ET\" style=\"color: black;\">\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 2\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 3\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 4<\/span><\/span><\/p>\n<p style=\"text-align: justify; margin: 0cm 0cm .0001pt 35.4pt;\"><span style=\"line-height: normal;\"><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">3<\/span><\/sub><span lang=\"ET\" style=\"color: black;\">\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 2\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 5\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 3<\/span><\/span><\/p>\n<p style=\"margin-bottom: .0001pt; text-align: justify;\">Eukleidilised kaugused v\u00f5imalikus kolmes objektipaaris on j\u00e4rgmised:<\/p>\n<p style=\"margin-bottom: .0001pt; text-align: justify;\"><img loading=\"lazy\" decoding=\"async\" width=\"510\" height=\"125\" class=\"alignnone wp-image-123\" title=\"screen_shot_2020-03-09_at_09.22.43.png\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.22.43.png\" alt=\"jhl\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.22.43.png 510w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.22.43-300x74.png 300w\" sizes=\"auto, (max-width: 510px) 100vw, 510px\"><\/p>\n<p style=\"margin-bottom: .0001pt; text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Eukleidilised ruutkaugused on vastavalt 14, 21 ja 5. M\u00f5lema kauguse t\u00fc\u00fcbi alusel on objektid 2 ja 3 teineteisele l\u00e4hemal kui objektid \u00fclej\u00e4\u00e4nud paarides. Kauguste maatriks on j\u00e4rgmine (s\u00fcmmeetria t\u00f5ttu piisab \u00fchest poolest, millele on parema loetavuse nimel lisatud ka diagonaal (vasakpoolne standardimata, parempoolne standarditud suurima v\u00e4\u00e4rtuse j\u00e4rgi):<\/span><\/span><\/p>\n<p style=\"text-align: justify; margin: 0cm 0cm .0001pt 35.4pt;\"><span style=\"line-height: normal;\"><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">1\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><\/sub><span lang=\"ET\" style=\"color: black;\">0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">1\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><\/sub><span lang=\"ET\" style=\"color: black;\">0<\/span><\/span><\/p>\n<p style=\"text-align: justify; margin: 0cm 0cm .0001pt 35.4pt;\"><span style=\"line-height: normal;\"><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">2\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><\/sub><span lang=\"ET\" style=\"color: black;\">3,74\u00a0\u00a0\u00a0\u00a0 0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">2\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><\/sub><span lang=\"ET\" style=\"color: black;\">0,82\u00a0\u00a0\u00a0\u00a0 0<\/span><\/span><\/p>\n<p style=\"text-align: justify; margin: 0cm 0cm .0001pt 35.4pt;\"><span style=\"line-height: normal;\"><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">3\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><\/sub><span lang=\"ET\" style=\"color: black;\">4,58\u00a0\u00a0\u00a0\u00a0 2,24\u00a0\u00a0\u00a0\u00a0 0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">3\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><\/sub><span lang=\"ET\" style=\"color: black;\">1,00\u00a0\u00a0\u00a0\u00a0 0,49\u00a0\u00a0\u00a0\u00a0 0<\/span><\/span><\/p>\n<p style=\"text-align: justify; margin: 0cm 0cm 6.0pt 35.4pt;\"><span style=\"line-height: normal;\"><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">1\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><\/sub><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">2\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><\/sub><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">3<\/span><\/sub><span lang=\"ET\" style=\"color: black;\">\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <i>o<\/i><sub>1\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/sub><i>o<\/i><sub>2\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/sub><i>o<\/i><sub>3<\/sub><\/span><\/span><\/p>\n<p style=\"margin-bottom: 6.0pt; text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Kordame \u00fcle, kui kaugust m\u00e4\u00e4ravad tunnused on m\u00f5\u00f5detud erinevatel skaaladel (on erineva variatiivsusega, erinevat suurusj\u00e4rku), siis tuleb tunnuseid kauguse arvutamise eel kindlasti standardida ja muuta <\/span>v\u00f5rreldavateks. Suurearvuliste v\u00e4\u00e4rtustega tunnus (nt t\u00f6\u00f6tasu eurodes) ei tohiks kauguse arvutamisel domineerida v\u00e4ikesearvuliste v\u00e4\u00e4rtustega tunnuse \u00fcle (nt t\u00f6\u00f6kogemus aastates).\u00a0 \u00a0<span style=\"color: black;\">Standardimiseks on mitmeid eri viise, sagedasim neist on skooride arvutamine kogumi keskmise ja standardh\u00e4lbe suhtes (saadakse v\u00e4\u00e4rtused keskmisega 0 ja standardh\u00e4lbega 1). <\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\">Linnakaugus <\/span><span lang=\"ET\">(Manhattani kaugus, plokk-kaugus, ik <i>block distance<\/i>)<\/span> <span style=\"color: black;\">kahe objekti vahel on l\u00e4hedane eukleidilisele kaugusele, kuid vahe m\u00e4rgist vabanemiseks kasutatakse ruutu t\u00f5stmise asemel absoluutv\u00e4\u00e4rtust, st vaadeldakse absoluutseid h\u00e4lbeid:<\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><img loading=\"lazy\" decoding=\"async\" width=\"303\" height=\"103\" class=\"wp-image-124 aligncenter\" title=\"screen_shot_2020-03-09_at_09.24.06.png\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.24.06.png\" alt=\"thes\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.24.06.png 303w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.24.06-300x102.png 300w\" sizes=\"auto, (max-width: 303px) 100vw, 303px\"><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">K\u00f5neldes joonisele 1 toetudes, v\u00f5iks \u00f6elda, et m\u00f5\u00f5detakse kaugust kolmnurga k\u00fclgi (kaateteid) m\u00f6\u00f6da, mitte h\u00fcpotenuusil. See p\u00f5hjendab ka nimevalikut, sest linnas liigutakse enamjaolt m\u00f6\u00f6da majaplokkide servi, mitte diagonaalis \u00fcle kvartali. <\/span><\/span><\/p>\n<p style=\"margin-bottom: .0001pt; text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Olgu n\u00e4iteks kolme objekti m\u00f5\u00f5tmisel ruumis saadud j\u00e4rgmine andmetabel:<\/span><\/span><\/p>\n<p style=\"text-align: justify; margin: 0cm 0cm .0001pt 35.4pt;\"><span style=\"line-height: normal;\"><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">1<\/span><\/sub><span lang=\"ET\" style=\"color: black;\">\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 1\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 1\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 1<\/span><\/span><\/p>\n<p style=\"text-align: justify; margin: 0cm 0cm .0001pt 35.4pt;\"><span style=\"line-height: normal;\"><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">2<\/span><\/sub><span lang=\"ET\" style=\"color: black;\">\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 2\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 3\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 4<\/span><\/span><\/p>\n<p style=\"text-align: justify; margin: 0cm 0cm .0001pt 35.4pt;\"><span style=\"line-height: normal;\"><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">3<\/span><\/sub><span lang=\"ET\" style=\"color: black;\">\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 2\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 5\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 3<\/span><\/span><\/p>\n<p style=\"margin-bottom: .0001pt; text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Linnakaugused v\u00f5imalikus kolmes objektipaaris on j\u00e4rgmised:<\/span><\/span><\/p>\n<p style=\"margin-bottom: 6.0pt; text-align: justify;\"><span style=\"line-height: normal;\"><i><span lang=\"ET\"><span style=\"color: black;\">d<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">o<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">1<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">,<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">o<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">2<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">=<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">1-2<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">+<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">1-3<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">+<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">1-4<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">=6<\/span><\/span><\/i><span lang=\"ET\" style=\"color: black;\">,<\/span><\/span><\/p>\n<p style=\"margin-bottom: 6.0pt; text-align: justify;\"><span style=\"line-height: normal;\"><i><span lang=\"ET\"><span style=\"color: black;\">d<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">o<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">1<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">,<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">o<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">3<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">=<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">1-2<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">+<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">1-5<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">+<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">1-3<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">=7<\/span><\/span><\/i><span lang=\"ET\" style=\"color: black;\">,<\/span><\/span><\/p>\n<p style=\"margin-bottom: 6.0pt; text-align: justify;\"><span style=\"line-height: normal;\"><i><span lang=\"ET\"><span style=\"color: black;\">d<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">o<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">2<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">,<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">o<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">3<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">=<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">2-2<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">+<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">3-5<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">+<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">4-3<\/span><\/span><\/i><i><span lang=\"ET\"><span style=\"color: black;\">=3<\/span><\/span><\/i><span lang=\"ET\" style=\"color: black;\">, <\/span><\/span><\/p>\n<p style=\"margin-bottom: 6.0pt; text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">ja kauguste maatriksid standardimata (vasakul) ja standarditud kujul on j\u00e4rgmised:<\/span><\/span><\/p>\n<p style=\"text-align: justify; margin: 0cm 0cm .0001pt 35.4pt;\"><span style=\"line-height: normal;\"><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">1\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><\/sub><span lang=\"ET\" style=\"color: black;\">0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">1\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><\/sub><span lang=\"ET\" style=\"color: black;\">0<\/span><\/span><\/p>\n<p style=\"text-align: justify; margin: 0cm 0cm .0001pt 35.4pt;\"><span style=\"line-height: normal;\"><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">2\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><\/sub><span lang=\"ET\" style=\"color: black;\">6\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">2\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><\/sub><span lang=\"ET\" style=\"color: black;\">0,86\u00a0\u00a0\u00a0\u00a0 0<\/span><\/span><\/p>\n<p style=\"text-align: justify; margin: 0cm 0cm .0001pt 35.4pt;\"><span style=\"line-height: normal;\"><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">3\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><\/sub><span lang=\"ET\" style=\"color: black;\">7\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 3\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">3\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><\/sub><span lang=\"ET\" style=\"color: black;\">1,00\u00a0\u00a0\u00a0\u00a0 0,43\u00a0\u00a0\u00a0\u00a0 0<\/span><\/span><\/p>\n<p style=\"text-align: justify; margin: 0cm 0cm 6.0pt 35.4pt;\"><span style=\"line-height: normal;\"><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">1\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><\/sub><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">2\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/span><\/sub><i><span lang=\"ET\" style=\"color: black;\">o<\/span><\/i><sub><span lang=\"ET\" style=\"color: black;\">3<\/span><\/sub><span lang=\"ET\" style=\"color: black;\">\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <i>o<\/i><sub>1\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/sub><i>o<\/i><sub>2\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/sub><i>o<\/i><sub>3<\/sub><\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Paaride j\u00e4rjestus kauguse alusel on sama nagu eukleidilise kauguse puhul, aga paarisisesed kaugused on suuremad kui eukleidilise kauguse puhul. Ka linnakauguse puhul on vajalik tunnuste standardimine, kui soovime nende \u00fchetaolist m\u00f5ju kauguse kujunemisele. <\/span><\/span><\/p>\n<p style=\"margin-bottom: 6.0pt; text-align: justify;\"><span style=\"line-height: normal;\">Korrelatiivne kaugus p\u00f5hineb kahe objekti vahelisel <a href=\"https:\/\/samm.ut.ee\/korrelatsioonikordajad\/\">korrelatsioonikordajal<\/a>. Oleme harjunud, et tavaliselt uuritakse kahe tunnuse vahelist korrelatsiooni ja selle aluseks on kahe tunnuse individuaalsed v\u00e4\u00e4rtused k\u00f5igi objektide\/indiviidide korral. Objektidevahelise korrelatsiooni arvutamise aluseks on analoogselt sellele kummagi objekti\/indiviidi individuaalsed v\u00e4\u00e4rtused klasterdamiseks v\u00f5etud tunnuste korral, st tunnused ja objektid\/indiviidid on m\u00f5tteliselt oma kohad vahetanud. Ku<span style=\"color: black;\">i vaadelda kaht tunnust, siis positiivse objektidevahelise korrelatsioonseose korral, kui \u00fche objekti v\u00e4\u00e4rtus \u00fchel tunnusel on suurem kui teisel, on see keskmiselt n\u00f5nda ka teise objekti korral. Positiivne tugev korrelatsioonseos objektide vahel peegeldab objektide tunnuste alusel arvestatavate profiilide sarnasust, negatiivne tugev korrelatsioonseos \u2013 olukorda, kus \u00fcks profiil on teise suhtes \u201eotse vastupidine\u201c (suurele tunnuse v\u00e4\u00e4rtusele \u00fchel objektil vastab v\u00e4ike teisel tunnusel ja v\u00e4iksele suur). N\u00e4iteks kahe \u00f5pilase vaheline korrelatsioonseos p\u00f5hiainete hinnete profiilide alusel on positiivne siis, kui neil on \u00fchtedes ja samades ainetes paremad ja \u00fchtedes ja samades ainetes halvemad hinded.<\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Olgu <i>r<\/i>(<i>o<\/i><sub>1<\/sub>,<i>o<\/i><sub>2<\/sub>) = <i>r<\/i> kahe objekti vaheline korrelatsioonikordaja. Korrelatiivse kauguse arvutamiseks kasutatakse mitmeid erisuguseid eeskirju, <\/span>millest n\u00e4itena m\u00f5nesid iseloomustame tabelis 1 (tabeli neljas reas neli erinevat korrelatiivset kaugust). Esimene <span style=\"color: black;\">ja viimane kaugus peegeldavad objektide l\u00e4hedust ainult korrelatsioonseose tugevuse alusel, m\u00e4rgist olenemata. Nende puhul on kaugus mittekorreleerituse (<i>r<\/i> = 0) olukorra suhtes s\u00fcmmeetriline, aga m\u00e4rki arvestavate definitsioonide korral ei ole (vrd kaugusi -0,5 ja 0,5 korral). Viimane tabelis toodud kaugus s\u00f5ltub korrelatsioonikordajast mittelineaarselt.<\/span><\/span><\/p>\n<p>Tabel 1. Korrelatiivse kauguse definitsioone<\/p>\n<p style=\"text-align: justify;\"><img loading=\"lazy\" decoding=\"async\" width=\"729\" height=\"154\" class=\"alignnone wp-image-125\" title=\"Tabel 1. Korrelatiivse kauguse definitsioone\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.26.02.png\" alt=\"Tabel 1. Korrelatiivse kauguse definitsioone\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.26.02.png 729w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.26.02-300x63.png 300w\" sizes=\"auto, (max-width: 729px) 100vw, 729px\"><\/p>\n<p style=\"text-align: justify;\"><strong>Sarnasusm\u00f5\u00f5dud mittearvuliste tunnuste korral<\/strong><\/p>\n<p style=\"text-align: justify; margin: 6.0pt 0cm 6.0pt 0cm;\"><span style=\"line-height: normal;\"><span lang=\"ET\">Sarnasuskordajad sagedustabeli alusel<\/span><span lang=\"ET\" style=\"color: black;\"> v\u00f5imaldavad uurida objektivahelist kaugust dihhotoomsete tunnuste puhul. Dihhotoomsete indikaatorite r\u00fchmana saab esitada ka iga nominaaltunnust (\u00fche v\u00f5rra v\u00e4hem indikaatoreid kui on nominaaltunnusel mitteolemasolu alusel, ik <i>dummy variables<\/i>). <\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Vaatleme kahe objekti (nt isiku) <i>o<\/i><sub>1 <\/sub>ja <i>o<\/i><sub>2 <\/sub>kohta <i>M<\/i> dihhotoomse tunnuse alusel moodustatud sagedustabelit (tabel 2) v\u00e4\u00e4rtustega 0 ja 1 (nt 1 \u2013 osales \u00fcritusel , 0 \u2013 ei osalenud, vaatluse all <i>M<\/i> \u00fcritust ehk juhtu).<\/span><\/span><\/p>\n<p>Tabel 2. Neljav\u00e4ljatabel tunnusr\u00fchma alusel<\/p>\n<p style=\"text-align: justify;\"><img loading=\"lazy\" decoding=\"async\" width=\"396\" height=\"90\" class=\"alignnone wp-image-126\" title=\"Tabel 2. Neljav\u00e4ljatabel tunnusr\u00fchma alusel\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.27.01.png\" alt=\"Tabel 2. Neljav\u00e4ljatabel tunnusr\u00fchma alusel\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.27.01.png 396w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.27.01-300x68.png 300w\" sizes=\"auto, (max-width: 396px) 100vw, 396px\"><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Sagedus <i>N<\/i><sub>11<\/sub> n\u00e4itab \u00fchtivuste arvu kahel objektil vaadeldava n\u00e4htuse olemasolu\/esinemise alusel (m\u00f5lemal isikul v\u00e4\u00e4rtus 1, nt <i>N<\/i><sub>11 <\/sub>\u00fcritusel osalesid m\u00f5lemad) ja <i>N<\/i><sub>00 <\/sub>mitteolemasolu alusel (nt <i>N<\/i><sub>00<\/sub> \u00fcritust olid sellised, kus kumbki isikuist ei osalenud). Sagedused <i>N<\/i><sub>01<\/sub> ja <i>N<\/i><sub>10 <\/sub>n\u00e4itavad mitte\u00fchtivuste arvu, kui \u00fchel objektil n\u00e4htus esineb ja teisel mitte. Mida enam on \u00fchtivusi, seda sarnasemad on objektid, mida enam mitte\u00fchtivusi, seda mittesarnasemad (kaugemad) on objektid. Kaugus kahe objekti vahel arvutatakse tabelisageduste kaudu, kusjuures kasutusel on palju erinevaid arvutusreegleid. Toome m\u00f5ned n\u00e4ited sellisel teel saadud kaugustest ja sarnasuskordajatest.<\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: #2f5496;\">Jaccardi sarnasuskordaja <\/span><span lang=\"ET\" style=\"color: black;\">(ik <i>Jaccard similarity coefficient<\/i>):<\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><img loading=\"lazy\" decoding=\"async\" width=\"208\" height=\"53\" class=\"wp-image-127 aligncenter\" title=\"screen_shot_2020-03-09_at_09.27.46.png\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.27.46.png\" alt=\"tehe34\"><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">v\u00f5tab arvesse \u00fchtivuste arvu olemasolu alusel (m\u00f5lemal on \u00fcrituse kohta \u00fcheaegselt jaatav vastus) ja suhestab selle v\u00f5imaluste \u00fcldarvu, millest on v\u00e4lja j\u00e4etud \u00fchtivuste arv mitteolemasolu alusel (m\u00f5lemal objektil on eitav vastus). Mida suurem on jaatuste arv korraga m\u00f5lemal, seda sarnasemad on objektid (n\u00e4ites: m\u00f5lemad v\u00f5tsid osa samadest \u00fcritustest). Arvu <i>N<\/i><sub>00<\/sub> k\u00f5rvalej\u00e4tmine on p\u00f5hjendatud, et v\u00e4ltida sarnasuse tugevdamist mitteesinemise arvelt, kuigi millegi \u00fcheaegne puudumine on ka sarnasus. V\u00f5imalikud v\u00e4\u00e4rtused on 0 (\u00fcheaegseid jaatavaid vastuseid ei ole) kuni 1 (k\u00f5ik vastused on \u00fcheaegselt jaatavad). <\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: #2f5496;\">Lihtne \u00fchtivuskordaja <\/span><span lang=\"ET\" style=\"color: black;\">(ik <i>simple matching coefficient<\/i>) arvestab m\u00f5lemat liiki sarnasust, nii olemasolu kui puudumise m\u00f5ttes: <\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><img loading=\"lazy\" decoding=\"async\" width=\"321\" height=\"83\" class=\"wp-image-128 aligncenter\" title=\"screen_shot_2020-03-09_at_09.28.28.png\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.28.28.png\" alt=\"jala\u00f6a\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.28.28.png 321w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.28.28-300x78.png 300w\" sizes=\"auto, (max-width: 321px) 100vw, 321px\"><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Siin tuleb j\u00e4lgida, et valitud <i>M <\/i>tunnust sisaldaksid \u00fchetaolist t\u00e4hendust k\u00f5igi objektide seisukohalt (k\u00fcsitavaks \u00fcrituseks ei sobi nt konkreetne V\u00f5rumaa k\u00fclasimman, k\u00fcll aga lihtsalt simman, mida v\u00f5ib ette tulla igal pool). V\u00f5imalikud v\u00e4\u00e4rtused on 0 (ei ole \u00fcheaegseid jaatavaid ega eitavaid vastuseid) kuni 1 (k\u00f5ik vastused on kas \u00fcheaegselt jaatavad v\u00f5i eitavad). <\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: #2f5496;\">Lance\u2019i-Williamsi mittesarnasuse kordaja <\/span><span lang=\"ET\" style=\"color: black;\">(ik <i>Lance-Williams dissimilarity coefficient<\/i>) leiab mitte\u00fchtivuste arvu suhte juhtude \u00fcldarvu, millest \u00fchtivuste arv mitteolemasolu alusel (\u00fcheaegsete eitavate vastuste arv) on k\u00f5rvale j\u00e4etud, kuid selle asemel kasutatud kahekordselt \u00fchtivuste arvu olemasolu alusel (\u00fcheaegselt jaatavate vastuste arvu). Arvutusvalem on j\u00e4rgmine:<\/span><\/span><img loading=\"lazy\" decoding=\"async\" width=\"308\" height=\"101\" class=\"wp-image-129 aligncenter\" title=\"screen_shot_2020-03-09_at_09.29.05.png\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.29.05.png\" alt=\"poi\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.29.05.png 308w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.29.05-300x98.png 300w\" sizes=\"auto, (max-width: 308px) 100vw, 308px\"><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Kordaja muutub v\u00e4\u00e4rtusest 0 (mitte\u00fchtivusi ei ole) kuni v\u00e4\u00e4rtuseni 1 (\u00fchtivusi ei ole). <\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: #2f5496;\">Yule\u2019i kordaja Q<\/span> <span lang=\"ET\" style=\"color: black;\">m\u00f5\u00f5dab assotsiatsiooni neljav\u00e4ljatabelis (2\u00d72-tabelis) j\u00e4rgmise eeskirja kohaselt:<\/span><\/span><\/p>\n<p><img loading=\"lazy\" decoding=\"async\" width=\"225\" height=\"83\" class=\"wp-image-130 aligncenter\" title=\"screen_shot_2020-03-09_at_09.29.47.png\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.29.47.png\" alt=\"bhg\"><\/p>\n<p><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Kui v\u00e4hemalt \u00fcht laadi mitte\u00fchtivusi ei <\/span>ole (st kahe objekti puhul kas varianti \u201eosales-ei osalenud\u201c v\u00f5i varianti \u201eei osalenud-osales\u201c v\u00f5i kumbagi varianti ei esine), <span style=\"color: black;\">siis <i>Q<\/i> = 1. Kui v\u00e4hemalt \u00fcht laadi \u00fchtivusi ei ole <\/span>(st kas varianti \u201eosales-osales\u201c v\u00f5i \u201eei osalenud-ei osalenud\u201c v\u00f5i kumbagi varianti ei esine), <span style=\"color: black;\">siis <i>Q<\/i> = -1. \u00dclej\u00e4\u00e4nud olukorrad annavad -1 ja 1 vahepealse v\u00e4\u00e4rtuse. Siinkohal on kasulik meenutada <\/span><span lang=\"ET\" style=\"color: black;\">\u0161<\/span><span lang=\"ET\" style=\"color: black;\">ansside suhte kordajat (ik <i>odds ratio<\/i>) <i>e<\/i>, kus <\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><img loading=\"lazy\" decoding=\"async\" width=\"193\" height=\"82\" class=\"wp-image-131 aligncenter\" title=\"screen_shot_2020-03-09_at_09.30.19.png\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.30.19.png\" alt=\"hsgs\"><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Kui <i>e<\/i> = 1, st sagedustabeli alusel objektid ei ole seotud, siis<i> N<\/i><sub>00<\/sub><i>N<\/i><sub>11<\/sub> = <i>N<\/i><sub>10<\/sub><i>N<\/i><sub>01<\/sub> ja <i>Q<\/i> = 0.<\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: #2f5496;\">Yule\u2019i kordaja Y <\/span><span lang=\"ET\" style=\"color: black;\">m\u00f5\u00f5dab assotsiatsiooni neljav\u00e4ljatabelis samuti piirides -1 kuni 1 ja selle arvutusvalem on sageduste suhtes kordajale <i>Q<\/i> analoogiline:<\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><img loading=\"lazy\" decoding=\"async\" width=\"278\" height=\"108\" class=\"wp-image-132 aligncenter\" title=\"screen_shot_2020-03-09_at_09.30.54.png\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.30.54.png\" alt=\"lkhjg\"><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Yule\u2019i kordaja Y <span style=\"color: black;\">avaldub v\u00e4ikeste algebraliste teisenduste j\u00e4rel <\/span><span lang=\"ET\" style=\"color: black;\">\u0161<\/span><span lang=\"ET\" style=\"color: black;\">ansside suhte kordaja kaudu j\u00e4rgmiselt<\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><img loading=\"lazy\" decoding=\"async\" width=\"149\" height=\"69\" class=\"wp-image-133 aligncenter\" title=\"screen_shot_2020-03-09_at_09.31.32.png\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.31.32.png\" alt=\"awq\"><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">millest n\u00e4htub, et objektidevahelise seose puududes (st kui <i>e<\/i> = 1) on kordaja v\u00e4\u00e4rtuseks 0. Vahetult valemist tuleneb, kui v\u00e4hemalt \u00fcht laadi mitte\u00fchtivusi ei ole, siis <i>Y<\/i> = 1. Kui ei ole v\u00e4hemalt \u00fcht laadi \u00fchtivusi, siis <i>Y <\/i>= -1. <\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Yule\u2019i kordajad on omavahel seotud valemiga <i>Q<\/i> = 2<i>Y<\/i>\/(1+<i>Y<\/i><sup>2<\/sup>).<\/span><\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Paketis SPSS on realiseeritud mituk\u00fcmmend erinevat kordajat dihhotoomsete tunnuste alusel kauguse, sarnasuse ja erinevuse hindamiseks. Vahe kordajate vahel seisneb sagedustabeli elementide erinevas suhestamises (vt nt <i>Distancies<\/i> \u2026, <\/span>Choi jt 2010).<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Tabelis 3 on Euroopa sotsiaaluuringu kodanikuaktiivsuse tunnusploki eeskujul toodud n\u00e4ide kolme isiku A, B ja C tegevusest, esitatud nendevahelised sagedustabelid ja arvutatud mitmeid kordajaid. Teineteisest k\u00f5ige kaugemal ja k\u00f5ige erinevamad on A ja B, k\u00f5ige sarnasemad \u2013 B ja C. Isikute A ja C sarnasuses on \u00fclekaalus sarnasus mitteesinemise (\u201eei\u201c) poolest, mida Jaccard\u2019i ja Lance\u2019i-Williamsi kordajates k\u00e4sitletakse teistmoodi kui sarnasust esinemise poolest.<\/span><\/p>\n<p>Tabel 3. N\u00e4ide sagedustabelil p\u00f5hinevate m\u00f5\u00f5dikute kohta<\/p>\n<p>Algandmed<br><img loading=\"lazy\" decoding=\"async\" width=\"702\" height=\"173\" class=\"alignnone wp-image-134\" title=\"Tabel 3. N\u00e4ide sagedustabelil p\u00f5hinevate m\u00f5\u00f5dikute kohta\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.32.53.png\" alt=\"Tabel 3. N\u00e4ide sagedustabelil p\u00f5hinevate m\u00f5\u00f5dikute kohta\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.32.53.png 702w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.32.53-300x74.png 300w\" sizes=\"auto, (max-width: 702px) 100vw, 702px\"><\/p>\n<p style=\"text-align: justify;\">Sagedustabelid ja kordajad<br><img loading=\"lazy\" decoding=\"async\" width=\"702\" height=\"151\" class=\"alignnone wp-image-135\" title=\"screen_shot_2020-03-09_at_09.33.42.png\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.33.42.png\" alt=\"Tabel 3\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.33.42.png 702w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.33.42-300x65.png 300w\" sizes=\"auto, (max-width: 702px) 100vw, 702px\"><\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 6.0pt 0cm;\"><span style=\"line-height: normal;\">Kauguste arvutamiseks loendustulemuste kaudu on k\u00f5ige sagedamini kasutusel tavaline hii-ruut-statistik sagedustabeli alusel ja sellest tuletatud standarditud m\u00f5\u00f5dikud.<\/span><\/p>\n<a href=\"#\" data-bs-toggle=\"modal\" data-bs-target=\"#popup-modal\" data-title=\"Kauguste arvutamine paketi SPSS abil\" data-content='&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;K\u00e4surea &lt;i&gt;Analyze \u2013 Correlate \u2013 Distances&lt;\/i&gt; j\u00e4rel avanevas aknas teha j\u00e4rgnevad valikud. Et kauguste nimetused ei ole erinevais allikais samad, siis on kasulik alati vaadata programmi juhendmaterjale, (siinkohal: &lt;i&gt;Distances. IBM Knowledge Center &amp;#8230; &lt;\/i&gt;)&lt;i&gt;.&lt;\/i&gt;&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Variables&lt;\/i&gt; \u2013 valida tunnused, mille alusel kaugused arvutada.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Label cases by&lt;\/i&gt; \u2013 m\u00e4\u00e4rata objektide nime tunnus, kui see on andmestikus olemas.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Compute distances&lt;\/i&gt; \u2013 m\u00e4rkida, kas leida kaugused indiviidide vahel (&lt;i&gt;Between cases&lt;\/i&gt;, andmestiku read) v\u00f5i tunnuste vahel (&lt;i&gt;Between variables&lt;\/i&gt;, andmestiku veerud).&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Measure&lt;\/i&gt; \u2013 valida, kas leida kaugused (&lt;i&gt;Dissimilarities&lt;\/i&gt;) v\u00f5i l\u00e4hedus- ehk sarnasusm\u00f5\u00f5dud (&lt;i&gt;Similarities&lt;\/i&gt;).&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Measures&lt;\/i&gt; \u2013 selle sildi alt saab valida tunnuset\u00fc\u00fcbile vastavad kaugus- ja sarnasusm\u00f5\u00f5dud.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;Valik &lt;i&gt;Dissimilarities.&lt;\/i&gt; Vahemikskaala (&lt;i&gt;Interval&lt;\/i&gt;, arvskaala) korral on v\u00f5imalik kasutada:&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;eukleidilist kaugust (&lt;i&gt;Euclidean distance&lt;\/i&gt;),&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;eukleidilist ruutkaugust (&lt;i&gt;Squared Euclidean distance&lt;\/i&gt;),&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;T\u0161eb\u00f5\u0161evi kaugust (&lt;i&gt;Chebyshev distance&lt;\/i&gt;), kauguseks objektide v\u00e4\u00e4rtuste vahe absoluutv\u00e4\u00e4rtuse maksimum,&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;linnakaugust (&lt;i&gt;Block distance&lt;\/i&gt;),&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;Minkowski kaugust (&lt;i&gt;Minkowski distance&lt;\/i&gt;), eukleidilise kauguse \u00fcldistus, kus ruutut\u00f5stmise asemel kasutatakse etteantud astet ja sellele vastavalt ka ruutjuure asemel vastavat juurt,&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;kasutaja enda defineeritud kaugust (&lt;i&gt;Customized&lt;\/i&gt;).&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;Valik &lt;i&gt;Dissimilarities.&lt;\/i&gt; Loendustulemuste (&lt;i&gt;Count&lt;\/i&gt;) alusel saab kaugust hinnata hii-ruut-statistiku abil (&lt;i&gt;Chi-square measure&lt;\/i&gt;) v\u00f5i selle standardimisel phi (fii)-statistiku abil (&lt;i&gt;Phi-square measure&lt;\/i&gt;).&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; text-align: justify; padding: 0cm; margin: 6.0pt 0cm .0001pt 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;Valik &lt;i&gt;Dissimilarities. &lt;\/i&gt;Dihhotoomsete (binaarsete, &lt;i&gt;Binary&lt;\/i&gt;) tunnuste alusel saab kasutada eukleidilist kaugust (&lt;i&gt;Euclidean distance&lt;\/i&gt;), eukleidilist ruutkaugust (&lt;i&gt;Squared Euclidean distance&lt;\/i&gt;), Lance\u2019i-Williamsi kordajat ja mitmeid teisi dihhotoomsete tunnuste neljav\u00e4ljatabelilt arvutatavaid kordajaid: &lt;i&gt;Size difference, Pattern difference, Variance, Shape&lt;\/i&gt;. Dihhotoomsete tunnuste puhul tuleb ka osutada, mis koodiga on olemasolu (jaatust) m\u00e4rkiv vastus (&lt;i&gt;Present&lt;\/i&gt;, vaikimisi 1) ja mis koodiga alternatiiv (&lt;i&gt;Absent&lt;\/i&gt;, vaikimisi 0).&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; text-align: justify; padding: 0cm; margin: 6.0pt 0cm .0001pt 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;Valik &lt;i&gt;Similarities&lt;\/i&gt;. Vahemikskaala tunnuste (&lt;i&gt;Interval&lt;\/i&gt;) korral on v\u00f5imalik kasutada &lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;korrelatsioonikordajat (&lt;i&gt;Pearson correlation&lt;\/i&gt;) traditsioonilises m\u00f5ttes,&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;koosinus-m\u00f5\u00f5tu (&lt;i&gt;Cosine&lt;\/i&gt;), mis kasutatavate tunnusvektorite geomeetrilise t\u00f5lgenduse kohaselt t\u00e4hendab nendevahelise nurga koosinust (nurk 0 ehk koosinus 1 t\u00e4hendab \u00fchtelangevust, nurk 90 ehk ristseis t\u00e4hendab mittesarnasust).&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; text-align: justify; padding: 0cm; margin: 6.0pt 0cm .0001pt 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;Valik &lt;i&gt;Similarities&lt;\/i&gt;. Dihhotoomsete tunnuste (&lt;i&gt;Binary&lt;\/i&gt;) korral on v\u00f5imalik rakendada 20 erinevat sarnasusm\u00f5\u00f5tu, millest osa on eespool k\u00e4sitletud ja \u00fclej\u00e4\u00e4nute puhul tuleks toetuda eespool nimetatud originaaljuhendile. Taas tuleb osutada mis koodiga on olemasolu (jaatust) m\u00e4rkiv vastus (&lt;i&gt;Present&lt;\/i&gt;, vaikimisi 1) ja mis koodiga alternatiiv (&lt;i&gt;Absent&lt;\/i&gt;, vaikimisi 0).&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; text-align: justify; padding: 0cm; margin: 6.0pt 0cm .0001pt 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;Vahemikskaala tunnuste ja loendustulemuste kaugus- ja sarnasusm\u00f5\u00f5tude korral on v\u00f5imalik aluseks olevaid tunnuseid k\u00e4sitleda v\u00f5rreldavuse suurendamiseks teisendatult. Sildi &lt;i&gt;Transform Values&lt;\/i&gt; alt saab valida j\u00e4rgmisi viise, kusjuures tuleb n\u00e4idata, kas teisendada tunnuse piires (&lt;i&gt;By variable&lt;\/i&gt;) v\u00f5i indiviidi piires (&lt;i&gt;By case&lt;\/i&gt;):&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 standardimine keskmise ja standardh\u00e4lbe suhtes (&lt;i&gt;Z scores&lt;\/i&gt;), &lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 teisendamine skaalale -1 kuni 1 (&lt;i&gt;Rang&lt;\/i&gt;e -1 &lt;i&gt;to&lt;\/i&gt; 1), iga v\u00e4\u00e4rtus jagatakse haardega,&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;teisendamine skaalale 0 kuni 1 (&lt;i&gt;Range&lt;\/i&gt; 0 &lt;i&gt;to&lt;\/i&gt; 1), v\u00e4\u00e4rtus, millest on lahutatud v\u00e4him v\u00e4\u00e4rtus, jagatakse haardega,&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;teisendamine maksimumi j\u00e4rgi (&lt;i&gt;Maximum magnitude of&lt;\/i&gt; 1), v\u00e4\u00e4rtus jagatakse suurima v\u00e4\u00e4rtusega, &lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;teisendamine keskmise j\u00e4rgi (&lt;i&gt;Mean of&lt;\/i&gt; 1), v\u00e4\u00e4rtus jagatakse keskmisega,&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;teisendamine standardh\u00e4lbe j\u00e4rgi (&lt;i&gt;Standard deviation of&lt;\/i&gt; 1), v\u00e4\u00e4rtus jagatakse standardh\u00e4lbega.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; text-align: justify; padding: 0cm; margin: 6.0pt 0cm .0001pt 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;Kaugusi ja sarnasusm\u00f5\u00f5dikuid on v\u00f5imalik v\u00f5rreldavuse suurendamiseks standardida j\u00e4rgmiselt (sildi &lt;i&gt;Measures&lt;\/i&gt; alt valikud &lt;i&gt;Transform Measures&lt;\/i&gt;):&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 v\u00f5tta esialgse v\u00e4\u00e4rtuse absoluutv\u00e4\u00e4rtus, st loobuda m\u00e4rgist (&lt;i&gt;Absolute values&lt;\/i&gt;),&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 paremaks t\u00f5lgenduseks vahetada m\u00e4rk, st kauged objektid saavad l\u00e4hedasteks ja vastupidi (&lt;i&gt;Change sign&lt;\/i&gt;),&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 v\u00f5rreldavuseks standardida skaalale 0 kuni 1 (&lt;i&gt;Rescale&lt;\/i&gt; to 0\u20131 &lt;i&gt;range&lt;\/i&gt;).&lt;\/span&gt;&lt;\/p&gt;\n&lt;p&gt;'>Kauguste arvutamine paketi SPSS abil<\/a>\n<p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">Esitame kauguste teema <\/span>l\u00f5petuseks n\u00e4ite Eesti maakondade vaheliste kauguste kohta, mis on leitud j\u00e4rgmisi tunnuseid arvestades: t\u00f6\u00f6h\u00f5ive m\u00e4\u00e4r 2018<span style=\"color: black;\">, kuukeskmine brutotulu 2018, \u00fclalpeetavate m\u00e4\u00e4r 2019, demograafiline t\u00f6\u00f6turusurveindeks 2019, eeloleva eluea pikkus s\u00fcnnimomendil 2018 (allikas Eesti statistika andmebaas, vastavalt <\/span>tabelid TT4662, ST004, RV063U, RV06U, RV0452)<span style=\"color: black;\">. V\u00f5iks \u00f6elda, et need tunnused peegeldavad kokkuv\u00f5ttes maakondade heaolu ja eluj\u00f5udu. Tunnuseid kasutasime standarditult maakondade keskmise ja standardh\u00e4lbe suhtes, seega kaugusel ei ole \u00fchikut ja arvud on kasutatavad \u00fcksnes selle kauguste maatriksi piires v\u00f5rdlemiseks. Kauguse t\u00fc\u00fcp on eukleidiline kaugus. <\/span><\/span><\/p>\n<p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"><span lang=\"ET\"><span style=\"line-height: 107%;\"><span style=\"color: black;\">N\u00e4itega soovime r\u00f5hutada kauguste maatriksi olulisust ka omaette anal\u00fc\u00fcsi vahendina, kui on vaja m\u00f5nd v\u00e4iksemat objektikogumit kirjeldada. Nii n\u00e4eme maakondade kauguste maatriksist (tabel 4), et suurim kaugus on Harjumaa ja Ida-Virumaa vahel (kaugus 7,4), aga ka Valgamaa ei ole Harjumaa l\u00e4hedal. Valitud tunnuste alusel j\u00e4\u00e4b ka Hiiumaa teistest suhteliselt kaugele. Et kasutame sama n\u00e4idet veel ka edaspidi, siis j\u00e4tame uurimise, mis viib m\u00f5nd maakonda teistest eemale, hilisemaks. <\/span><\/span><\/span><\/p>\n<p>Tabel 4. Eukleidiline kaugus maakondade vahel<\/p>\n<p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"><img loading=\"lazy\" decoding=\"async\" width=\"714\" height=\"367\" class=\"alignnone wp-image-136\" title=\"Tabel 4. Eukleidiline kaugus maakondade vahel\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.35.26.png\" alt=\"Tabel 4. Eukleidiline kaugus maakondade vahel\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.35.26.png 714w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.35.26-300x154.png 300w\" sizes=\"auto, (max-width: 714px) 100vw, 714px\"><\/p>\n<p style=\"text-align: justify; margin: 6.0pt 0cm 6.0pt 0cm;\"><span style=\"line-height: normal;\">Kauguste maatriks sisaldab huvitavat infot ja v\u00e4\u00e4rib omaette anal\u00fc\u00fcsi, nt erindite (teistest silmapaistvalt kaugete objektide) m\u00e4rkamisel, kuid on v\u00e4ga mahukas ja v\u00e4he\u00fclevaatlik. Mida teha? Kauguste maatriksi alusel v\u00f5iks leida konkreetse objekti keskmisi kaugusi teistest, tuua esile teineteisest kaugeimad ja l\u00e4himad objektid jne, teha tavaline andmehulga (andmestikuks kaugused) anal\u00fc\u00fcs. \u00dcks v\u00f5imalusi oleks paigutada objektid nendevaheliste kauguste alusel parimal viisil teatavasse uude teljestikku (1\u20132 telge), mis v\u00f5tavad kokku ja peegeldavad kaugusi ja seega kauguste aluseks olevaid tunnuseid (mitmem\u00f5\u00f5tmelise skaleerimise idee). Teine v\u00f5imalus oleks tuletada objektide r\u00fchmad klasteranal\u00fc\u00fcsi teel kaugusi aluseks v\u00f5ttes, mida allpool ka teeme. <\/span><\/p>\n<p style=\"text-align: justify; margin: 6.0pt 0cm 6.0pt 0cm;\"><span style=\"line-height: normal;\">Kuidas k\u00e4sitleda kauguste arvutamisel andmel\u00fcnki? V\u00e4ga v\u00e4heste andmetega objektid v\u00f5iks k\u00f5rvale j\u00e4tta ja \u00fclej\u00e4\u00e4nute seas kasutada konkreetse objektipaari kohast andmehulka, seda muidugi juhul, kui l\u00fcnki ei ole palju. Eelnev l\u00fcnkade \u201et\u00e4itmine\u201c puuduva v\u00e4\u00e4rtuse prognoosimise teel muid tunnuseid kasutades on samuti asjakohane.<\/span><\/p>\n<p><\/p><\/div>\n        <\/div>\n        <\/div>\n    <\/div>\n<p><\/p><div class=\"accordion mb-3\">\n        <div class=\"accordion-item accordion-item--white\">\n        <h2 class=\"accordion-header\" id=\"accordion-69de5cf5dde23-heading\">\n            <button class=\"accordion-button collapsed\" type=\"button\" data-bs-toggle=\"collapse\" data-bs-target=\"#accordion-69de5cf5dde23-collapse\" aria-expanded=\"true\" aria-controls=\"accordion-69de5cf5dde23-collapse\">Hierarhilised klasterdusmeetodid<\/button>\n        <\/h2>\n        <div id=\"accordion-69de5cf5dde23-collapse\" class=\"accordion-collapse collapse\" aria-labelledby=\"accordion-69de5cf5dde23-heading\">\n            <div class=\"accordion-body\">\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Hierarhiline klasterdus kujutab endast \u00fcksteisega suhestuvate klasterduste jada, millest uurija ise valib sobiva(d) klasterduse(d) ja t\u00f6\u00f6tab nendega edasi muude meetoditega. Klasterdused kujunevad sammuviisiliselt, kus klastrite \u201eevolutsioon\u201c on h\u00e4sti j\u00e4lgitav ja v\u00f5ib t\u00f5lgenduses anda kasulikku lisainfot. Hierarhiline klasterdusviis on m\u00f5eldav v\u00e4ikesemahuliste objektikogumite klasterdamisel, seda eesk\u00e4tt tulemuste loetavuse huvides, sest arvutuste mahukus, mis klasteranal\u00fc\u00fcsi algp\u00e4evil oli probleem, kujuneb t\u00e4nap\u00e4eval takistuseks alles v\u00e4ga suure objektihulga korral. T\u00e4nu ka tulemuste ilmekale graafilisele kujutamisele on hierarhilised meetodid laialt levinud.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Hierarhilised meetodid jagunevad kaheks: \u00fchendavad (ik <i>agglomerative<\/i>) meetodi ja lahutavad (ik <i>divisible<\/i>) meetodid, kusjuures lahutavad meetodi on v\u00e4hem kasutusel. Hierarhilise \u00fchendava klasterdusmeetodi esimesel sammul (hierarhia esimesel tasemel) on iga objekt omaette klaster ja viimasel sammul (hierarhia viimasel tasemel) moodustavad k\u00f5ik objektid \u00fchise klastri. Igal hierarhia tasemel tehakse \u00fcks liigutus klastrite \u00fchendamiseks teatud printsiibi kohaselt. Igal sammul (esimene v\u00e4lja arvatud) on eelmine klasterdus k\u00e4esoleva klasterduse teatav liigendus. Analoogiliselt on iga klasterdus (viimane v\u00e4lja arvatud) omakorda j\u00e4rgneva teatav liigendus. Hierarhiline lahutav klasterdus t\u00e4hendab vastupidist \u2013 esimesel sammul on k\u00f5ik objektid \u00fchises klastris ja viimases iga\u00fcks eraldi. Tegevus igal sammul t\u00e4hendab \u00fche klastri lahutamist. Millised klastrid konkreetsel sammul teisenevad, see oleneb klastritevahelise kauguse valikust, mis omakorda m\u00e4\u00e4rab klasterdusmeetodi. Klastrite arvu ette ei pea m\u00e4\u00e4rama ja klasterduste anal\u00fc\u00fcsis v\u00f5ib (sh klastrite t\u00f5lgendusele toetudes) pakkuda l\u00f5pptulemusena mitmeid versioone. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Vaatleme tuntumaid \u00fchendavaid hierarhilisi klasterdusmeetodeid. Neil on \u00fchine see, et igal sammul \u00fchendatakse omavahel kaks klastrit, mille vaheline kaugus on v\u00e4him. Meetodeid eristab muuhulgas see, kuidas on m\u00e4\u00e4ratud klastritevaheline kaugus. Objektidevaheline kaugus tuleb uurijal m\u00e4\u00e4rata \u00fclesandest ja klasterdustunnuste iseloomust olenevalt (vt eelnevat, kauguste alaosa k\u00e4esolevas tekstis). Tunnuste valik meetodi rakendamisel on seejuures samuti sisuline otsus.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: #2f5496;\">\u00dche seose meetod ehk l\u00e4hima naabri meetod (<\/span>ik <i>single linkage, nearest neighbor method<\/i>). Kaugus kahe klastri vahel on nende klastrite l\u00e4himate elementide vaheline kaugus. Omavahel \u00fchendatakse k\u00f5igi v\u00f5imalike klastripaaride seast need klastrid, mille l\u00e4himad elemendid on teineteisele k\u00f5ige l\u00e4hemal. Praktikas on meetodile sageli omane ahelaefekt: objekte lisatakse j\u00e4rjest olemasolevatesse klastritesse juurde ja uut klastrit alustatakse vastumeelselt. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: #2f5496;\">T\u00e4ieliku seose meetod ehk kaugeima naabri meetod <\/span>(ik <i>complete linkage, furthest neighbor method<\/i>). Kaugus kahe klastri vahel on nende klastrite kaugeimate elementide vaheline kaugus. Omavahel \u00fchendatakse k\u00f5igi v\u00f5imalike klastripaaride seast need klastrid, mille kaugeimad elemendid on teineteisele k\u00f5ige l\u00e4hemal. T\u00e4ieliku seose meetod arvestab ka objektide paigutust klastri sees ja seega kasutab \u00e4ra klastrite \u00fchendamisel konkreetsel sammul rohkem teavet kui \u00fche seose meetod. Kui tegelikult on klastrid k\u00fcllalt kompaktsed r\u00fchmad, siis see meetod avastab need h\u00e4sti.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: #2f5496;\">Klastritevahelise keskmise kauguse meetod <\/span>(ik <i>between-groups linkage method, unweighted\/weighted pair group method with arithmetic mean<\/i>, UPGMA, WPGMA). Kahe klastri vaheliseks kauguseks loetakse keskmine kaugus k\u00f5igis objektipaarides, mil \u00fcks paariline kuulub \u00fchte ja teine teise klastrisse. Omavahel \u00fchendatakse need klastrid, mille puhul selline keskmine kaugus on v\u00e4him. Kui on sisuliselt p\u00f5hjust objekte k\u00e4sitleda nende t\u00e4htsust v\u00e4ljendavate kaaludega, siis arvutatakse kaalutud keskmine kaugus ja vastav meetod on klastritevahelise kaalutud keskmise kauguse meetod. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: #2f5496;\">Klastritesisese keskmise kauguse meetod <\/span>(ik <i>within-groups linkage method<\/i>). Kahe klastri vaheliseks kauguseks loetakse keskmine kaugus k\u00f5igis objektipaarides, mida saab moodustada klastrite \u00fchendamisel tekkinud objektihulgas. Omavahel \u00fchendatakse need klastrid, mille puhul selline keskmine kaugus on v\u00e4him. Kui on sisuliselt p\u00f5hjust objekte k\u00e4sitleda nende t\u00e4htsust v\u00e4ljendavate kaaludega, siis arvutatakse kaalutud keskmine kaugus ja vastav meetod on klastritesisese kaalutud keskmise kauguse meetod. See klasterdusviis v\u00f5tab otseselt arvesse ka \u00fchendatavate klastrite seesmist \u00fclesehitust.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: #2f5496;\">Wardi meetod <\/span>(ik <i>Ward\u2019s method<\/i>) on kujunenud praktikas hierarhilistest klasterdusmeetoditest soosituimaks ja seda peetakse heaks klastrite \u00e4ratundjaks. Meetod erineb eelnevas kirjeldatuist ja toetub klastreis arvutatud summaarsetele ruuth\u00e4lvetele klastrikeskmise suhtes (klastrikeskmise m\u00e4\u00e4ravad klasterdustunnuste keskmised). Mida v\u00e4iksem on summaarne ruuth\u00e4lve, seda \u201etihedam\u201c on klaster klastrikeskmise \u00fcmber. Omavahel \u00fchendatakse need klastrid, mille puhul summaarse ruuth\u00e4lbe kasv \u00fchendklastris v\u00f5rreldes klastritesiseste summaarsete ruuth\u00e4lvete summaga on v\u00e4him. Saab n\u00e4idata, et see t\u00e4hendab kaalutud ruutkaugust \u00fchendatavate klastrite klastrikeskmiste vahel (kaal klastrite suuruste kaudu). See \u00fchendamisreegel on loomulik: esimesel sammul on klastri (\u00fcksikobjekti) ruuth\u00e4lve null, iga \u00fchendamisega summaarne ruuth\u00e4lve kasvab ja hea on, kui kasv on v\u00f5imalikult v\u00e4ike. Wardi meetod eelistab omavahel \u00fchendada l\u00e4hendaste klastrikeskmistega klastreid. Kauguseks selle meetodi korral v\u00f5etakse eukleidiline ruutkaugus (toetub ruuth\u00e4lbeile).<\/span><\/p>\n<a href=\"#\" data-bs-toggle=\"modal\" data-bs-target=\"#popup-modal\" data-title=\"Hierarhiline klasteranal\u00fc\u00fcs paketis SPSS\" data-content=\"&lt;\/p&gt;\n&lt;p&gt;Vt ka Hierarchical &lt;em&gt;Cluster Analysis. IBM Knowledge Center&lt;\/em&gt; &amp;#8230; .&lt;\/p&gt;\n&lt;p&gt;K\u00e4surida&lt;em&gt; Analyze \u2013 Classify \u2013 Hierarchical cluster&lt;\/em&gt; avab akna, milles saab teha j\u00e4rgmisi valikuid.&lt;\/p&gt;\n&lt;p&gt;&lt;em&gt;Variables&lt;\/em&gt; \u2013 kanda sellele v\u00e4ljale klasterdamise aluseks olevad tunnused ehk klasterdustunnused.&lt;\/p&gt;\n&lt;p&gt;&lt;em&gt;Label Cases by &lt;\/em&gt;\u2013 valida objektide nimesid sisaldav tunnus, kui selline on olemas; vaikimisi v\u00f5etakse objekti j\u00e4rjekorranumber.&lt;\/p&gt;\n&lt;p&gt;&lt;em&gt;Cluster&lt;\/em&gt; \u2013 valida, kas r\u00fchmitada indiviide (&lt;em&gt;Cases, &lt;\/em&gt;andmestiku read) v\u00f5i tunnuseid (&lt;em&gt;Variables, &lt;\/em&gt;andmestiku veerud).&lt;\/p&gt;\n&lt;p&gt;&lt;em&gt;Display&lt;\/em&gt; \u2013 valida, kas n\u00e4idata statistikuid (&lt;em&gt;Statistics&lt;\/em&gt;) ja\/v\u00f5i jooniseid (&lt;em&gt;Plots&lt;\/em&gt;).&lt;\/p&gt;\n&lt;p&gt;&lt;em&gt;Statistics&lt;\/em&gt; \u2013 valida, kas tuua esile&lt;\/p&gt;\n&lt;p&gt;\u00fchendamistabel (&lt;em&gt;Agglomeration Schedule&lt;\/em&gt;), \u00fclevaade, mida tehakse igal \u00fcksiksammul alustades seisust, kus iga indiviid on omaette klaster ja l\u00f5petades sellega, et k\u00f5ik indiviidid moodustavad \u00fchise klastri);&lt;\/p&gt;\n&lt;p&gt;kauguste maatriks (&lt;em&gt;Proximity matrix&lt;\/em&gt;) indiviidide\/objektide vahel.&lt;\/p&gt;\n&lt;p&gt;&lt;em&gt;Cluster Membership&lt;\/em&gt; \u2013 valida, kas tuua esile (valik &lt;em&gt;None&lt;\/em&gt; ei tee seda)&lt;\/p&gt;\n&lt;p&gt;\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 konkreetse etteantud klastrite arvuga klasterduse klastrite loetelu objektide kaupa (&lt;em&gt;Single solution&lt;\/em&gt; koos soovitava klastrite arvuga),&lt;\/p&gt;\n&lt;p&gt;\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 mitme erineva klasterduse klastrite loetelu objektide kaupa (&lt;em&gt;Range of solutions&lt;\/em&gt;), kusjuures klasterduste valiku saab m\u00e4\u00e4rata klastrite arvu vahemikuga (t\u00e4ita v\u00e4ljad &lt;em&gt;Minimum number of clusters&lt;\/em&gt; ja &lt;em&gt;Maximum number of clusters&lt;\/em&gt;).&lt;\/p&gt;\n&lt;p&gt;&lt;em&gt;Plots&lt;\/em&gt; \u2013 valida, kas tuua esile&lt;\/p&gt;\n&lt;p&gt;liigituspuu ehk dendrogramm (&lt;em&gt;Dendrogram&lt;\/em&gt;), millelt on n\u00e4ha klasterduse samm-sammuline k\u00e4ik,&lt;\/p&gt;\n&lt;p&gt;\u201ej\u00e4\u00e4purika\u201c ehk \u201eseina\u201c diagramm (&lt;em&gt;Icicle&lt;\/em&gt;), mille esiletoomise keelab valik &lt;em&gt;None&lt;\/em&gt;, valik &lt;em&gt;All clusters&lt;\/em&gt; toob diagrammi esile igal sammul ja valik &lt;em&gt;Specified range of clusters&lt;\/em&gt; kasutaja poolt ette antud klastrite arvu vahemikus; valida vahemiku m\u00e4\u00e4ramiseks &lt;em&gt;Start cluster &lt;\/em&gt;esimese seda t\u00fc\u00fcpi diagrammina huvi pakkuva klasterduse klastrinumbrite m\u00e4rkimiseks, &lt;em&gt;Stop claster &lt;\/em&gt;viimase huvipakkuva klasterduse klastrite arvu m\u00e4rkimiseks ja &lt;em&gt;By&lt;\/em&gt; selle m\u00e4rkimiseks, iga mitmes klasterdus selles klastrinumbrite vahemikus esile tuua;&lt;\/p&gt;\n&lt;p&gt;&lt;em&gt;Orientation&lt;\/em&gt; \u2013 valida seinadiagrammi suund kas p\u00fcstsuunas (&lt;em&gt;Vertical&lt;\/em&gt;) v\u00f5i r\u00f5htsuunas (&lt;em&gt;Horizontal&lt;\/em&gt;).&lt;\/p&gt;\n&lt;p&gt;&lt;em&gt;Method&lt;\/em&gt; \u2013 selle sildi alt saab valida klasterdusmeetodi (&lt;em&gt;Cluster method&lt;\/em&gt;), kaugusm\u00f5\u00f5du (&lt;em&gt;Measure&lt;\/em&gt;) ja klasterdustunnuste soovitava teisenduse (&lt;em&gt;Transform values&lt;\/em&gt;) ning kaugusm\u00f5\u00f5du soovitava teisenduse (&lt;em&gt;Transform Measure&lt;\/em&gt;). Kaugusm\u00f5\u00f5du ja teisenduste valikuid on kirjeldatud tekstikastis \u201eKauguste arvutamine paketi SPSS abil\u201c.&lt;\/p&gt;\n&lt;p&gt;&lt;em&gt;Cluster Method&lt;\/em&gt; \u2013 valik seitsme erineva klasterdusmeetodi vahel, millest enamik on eespool kirjeldatud:&lt;\/p&gt;\n&lt;p&gt;\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 klastritevahelise keskmise kauguse meetod (&lt;em&gt;Between-groups linkage&lt;\/em&gt;);&lt;br \/&gt;\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 klastritesisese keskmise kauguse meetod (&lt;em&gt;Within-groups linkage&lt;\/em&gt;);&lt;\/p&gt;\n&lt;p&gt;\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 l\u00e4hima naabri meetod (&lt;em&gt;Nearest neighbor&lt;\/em&gt;);&lt;\/p&gt;\n&lt;p&gt;\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 kaugeima naabri meetod (&lt;em&gt;Furthest neighbor&lt;\/em&gt;);&lt;\/p&gt;\n&lt;p&gt;\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 tsentroidmeetod (&lt;em&gt;Centroid method&lt;\/em&gt;) \u2013 kaugust klastrite vahel m\u00f5\u00f5dab nende keskpunktide kaugus;&lt;\/p&gt;\n&lt;p&gt;\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 mediaanidele toetuv meetod (&lt;em&gt;Median clustering&lt;\/em&gt;) \u2013 kaugust klastrite vahel peegeldavad klasterdustunnuste mediaanid;&lt;\/p&gt;\n&lt;p&gt;\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 Wardi meetod (&lt;em&gt;Ward\u2019s clustering&lt;\/em&gt;).&lt;\/p&gt;\n&lt;p&gt;&lt;em&gt;Save&lt;\/em&gt; \u2013 selle sildi all saab osutada, kas salvestada andmestiku l\u00f5ppu individuaalsete klastrinumbrite tunnus (valik &lt;em&gt;None&lt;\/em&gt; ei tee seda):&lt;\/p&gt;\n&lt;p&gt;\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 \u00fche etteantud klastrite arvu korral (&lt;em&gt;Single Solution&lt;\/em&gt;);&lt;\/p&gt;\n&lt;p&gt;\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 klastrite arvu vahemikus olevate klasterduste korral (&lt;em&gt;Range of solutions&lt;\/em&gt;), kusjuures klastrite arvude vahemik tuleb ette anda v\u00e4\u00e4rtustega &lt;em&gt;Minimum number of clusters&lt;\/em&gt; ja &lt;em&gt;Maximum number of clusters&lt;\/em&gt;. Klastrinumbrite tunnustel on automaatselt pandud nimed, aga neid on soovitav ise muuta klasterduse sisu kajastamiseks.&lt;\/p&gt;\n&lt;p&gt;\">Hierarhiline klasteranal\u00fc\u00fcs paketis SPSS<\/a>\n<p style=\"margin-top: 12.0pt; text-align: justify;\"><span style=\"line-height: normal;\">Hierarhilised klasterdusmeetodid toetuvad erinevatele kriteeriumidele ja seega v\u00f5ivad ka tulemused teatavas ulatuses lahkneda. Mida selgepiirilisem on kogumi jaotus alaosadeks, seda enam on kokkulangevusi eri meetodil saadud klasterdustes. <\/span><\/p>\n<p style=\"margin-bottom: 6.0pt; text-align: justify;\"><span style=\"line-height: normal;\">Vaatleme n\u00e4idet Eesti maakondade klasterdamisest teatud heaolun\u00e4itajate alusel, kasutades sama andmestikku nagu kauguste maatriksi (tabel 4) n\u00e4ites. Tunnuseid k\u00e4sitleme standarditult tunnuse keskmise ja standardh\u00e4lbe suhtes, l\u00fcnklikke objekte j\u00e4tame k\u00f5rvale paarikaupa. Rakendame klasterdamiseks Wardi meetodit ja t\u00e4ieliku seose meetodit eukleidilise ruutkauguse alusel. Klastrinumbrite tunnuse salvestame neljaklastrilise liigenduse kohalt ja toome esile klasterdustunnuste profiili neis neljas klastris. <\/span><\/p>\n<p style=\"margin-bottom: 6.0pt; text-align: justify;\"><span style=\"line-height: normal;\">Dendrogrammil n\u00e4idatakse, kuidas on toimunud j\u00e4rjestikune klastrite liitumine alustades seisust, kus iga maakond moodustab omaette klastri (joonis 2). Selle arvestamiseks, millal klasterduse algusest arvates mingi \u00fchinemine toimub, on antud vasakult paremale kulgev kaugust peegeldav skaala v\u00e4\u00e4rtustega 0 kuni 25. Klastrite liitumiskoht kauguse skaalal n\u00e4itab ka, kui l\u00e4hedased on \u00fcksteisele klastri liikmed teatud sammul (nt Ida-Viru suhteliselt hiline liitumine). Nii n\u00e4eme, et \u00fcheks klastriks \u00fchinetakse l\u00f5pus n\u00f6 j\u00f5uga ja kaks klastrit p\u00fcsib eraldiseisvana kuni l\u00f5puni. Kahjuks tekkis meil liigitus, kus \u00fcks klastritest (Hiiu maakonda sisaldav klaster) j\u00e4\u00e4b klasterdusprotsessis pikaks ajaks eraldi ja enne, kui see \u00fchineb suurt hulka maakondi sisaldava klastriga, olid selle \u00fclej\u00e4\u00e4nud liikmed ammu juba \u00fchinenud, seega Hiiumaa on sinna paigutatud formaalselt. Ilmselt oleks m\u00f5istlik vaadelda liigituspuud umbes suhtelise kauguse 6 kohalt, kus on moodustunud neli klastrit, kahjuks k\u00fcll \u00fcks klaster \u00fcheliikmeline. R\u00f5hutame, et uurija valib ise, mitme klastriga ta t\u00f6\u00f6tab, sealhulgas tugevalt subjektiivsete kaalutluste saatel (t\u00f5lgenduslikult). Kuidas nimetada klastreid, on vastutusrikas ja hoolikat kaalumist vajav otsus.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Lahendasime sama \u00fclesande veel ka t\u00e4ieliku seose meetodil ja n\u00e4eme nii \u00fchtelangevusi kui ka erinevusi (joonis 3). Viieklastrilises liigituses n\u00e4eme \u00fcht suuremat maakondade r\u00fchma samas koosseisus ja teist ilma Ida-Viru maakonnata. Hiiu ja Ida-Viru maakonnad j\u00e4\u00e4vad eraldiseisvateks \u00fchest elemendist koosnevateks klastriteks. Tartu ja Harju maakonnad on \u00fchinenud nagu Wardi meetodi puhulgi. Neljaklastriline liigitus t\u00e4ieliku seose meetodil ei erista maakondi kuigi h\u00e4sti. <\/span><\/p>\n<figure id=\"attachment_137\" aria-describedby=\"caption-attachment-137\" style=\"width: 615px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-137\" title=\"Joonis 2. Maakondade klastrid Wardi meetodil eukleidilise ruutkauguse alusel. T\u00f5lge: Dendrogramm Wardi meetodil. Skaleeritud kaugus klastrite \u00fchendamisel.\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.39.50.png\" alt=\"Joonis 2. Maakondade klastrid Wardi meetodil eukleidilise ruutkauguse alusel. T\u00f5lge: Dendrogramm Wardi meetodil. Skaleeritud kaugus klastrite \u00fchendamisel.\" width=\"615\" height=\"496\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.39.50.png 615w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.39.50-300x242.png 300w\" sizes=\"auto, (max-width: 615px) 100vw, 615px\"><figcaption id=\"caption-attachment-137\" class=\"wp-caption-text\">Joonis 2. Maakondade klastrid Wardi meetodil eukleidilise ruutkauguse alusel. T\u00f5lge: Dendrogramm Wardi meetodil. Skaleeritud kaugus klastrite \u00fchendamisel.<\/figcaption><\/figure>\n<br><br>\n<figure id=\"attachment_138\" aria-describedby=\"caption-attachment-138\" style=\"width: 597px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-138\" title=\"Joonis 3. Maakondade liigituspuu t\u00e4ieliku seose meetodil eukleidilise ruutkauguse alusel. T\u00f5lge: Skaleeritud kaugus klastrite \u00fchendamisel.\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.40.18.png\" alt=\"Joonis 3. Maakondade liigituspuu t\u00e4ieliku seose meetodil eukleidilise ruutkauguse alusel. T\u00f5lge: Skaleeritud kaugus klastrite \u00fchendamisel.\" width=\"597\" height=\"488\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.40.18.png 597w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.40.18-300x245.png 300w\" sizes=\"auto, (max-width: 597px) 100vw, 597px\"><figcaption id=\"caption-attachment-138\" class=\"wp-caption-text\">Joonis 3. Maakondade liigituspuu t\u00e4ieliku seose meetodil eukleidilise ruutkauguse alusel. T\u00f5lge: Skaleeritud kaugus klastrite \u00fchendamisel.<\/figcaption><\/figure>\n<p style=\"margin-bottom: 6.0pt; text-align: justify;\"><span style=\"line-height: normal;\">Et paremini n\u00e4ha \u00fchinemise k\u00e4iku, esitatakse liigitus veel \u00fchel kujul, nimelt omap\u00e4rase nn j\u00e4\u00e4purika ehk seina diagrammina (joonis 4), mida tuleb joonisel esitatud kujul vaadelda alt \u00fclespoole. Esialgu on k\u00f5ik 15 maakonda \u00fcksteisest eraldatud valge tulbaga (seinaga). Kohe esimesel sammul kaob sein kahe k\u00f5ige l\u00e4hema objekti vahelt (Viljandi ja J\u00e4rva maakond), seej\u00e4rel kahe j\u00e4rgmisena l\u00e4hedaste vahelt (V\u00f5ru ja P\u00f5lva maakond) ja n\u00f5nda edasi, kuni k\u00f5ik maakonnad moodustavad \u00fche klastri (seinad on kadunud). Klastrite arvu mingil sammul n\u00e4itab p\u00fcsttelg. See diagramm on dendrogrammile heaks t\u00e4ienduseks, sest dendrogrammi formaat (eriti suurema indiviidide arvu korral) ei suuda \u00fcksteisest eristada l\u00e4hedasel kaugusl\u00e4vel toimunud \u00fchendamisi. Sama otstarve \u2013 liigituspuu t\u00e4iendamine \u2013 on \u00fchendamistabelil (\u00fchendamisplaanil).<\/span><\/p>\n<figure id=\"attachment_139\" aria-describedby=\"caption-attachment-139\" style=\"width: 753px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-139\" title=\"Joonis 4. Klasterduse k\u00e4ik Wardi meetodil (Case \u2013 objekt, indiviid)\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.41.00.png\" alt=\"Joonis 4. Klasterduse k\u00e4ik Wardi meetodil (Case \u2013 objekt, indiviid)\" width=\"753\" height=\"441\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.41.00.png 753w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.41.00-300x176.png 300w\" sizes=\"auto, (max-width: 753px) 100vw, 753px\"><figcaption id=\"caption-attachment-139\" class=\"wp-caption-text\">Joonis 4. Klasterduse k\u00e4ik Wardi meetodil (Case \u2013 objekt, indiviid)<\/figcaption><\/figure>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">\u00dchendamistabelis (tabel 5) n\u00e4idatakse eriti detailselt, kuidas \u00fchendamine toimus (kahjuks kasutatakse siin objektide numbreid, mitte nimesid). Igale \u00fchinemissammule vastab oma rida, st tabelis on ridu \u00fche v\u00f5rra v\u00e4hem kui objekte. Esimesel sammul \u00fchinesid maakonnad 5 ja 14 (Viljandi ja J\u00e4rva). J\u00e4rgmine tegevus selle klastriga toimub 7. sammul, mil nende juurde \u00fchineb maakond 6 (L\u00e4\u00e4ne), kusjuures maakonnaga 6 toimus eelmine tegevus 4. sammul (\u00fchinemine P\u00e4rnuga). Seega seitsmendal sammul \u00fchinevad maakonnad 6, 9, 5 ja 14. J\u00e4rgmine tegevus toimub 10. sammul, kus nende juurde \u00fchineb 6. sammul \u00fchinenud paar \u2013 10 ja 11 (Saare ja Rapla). Viimasel sammul \u00fchinevad k\u00f5ik maakonnad.<\/span><\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 6.0pt 0cm;\"><span style=\"line-height: normal;\">Tabelis olev \u00fchendamiskordaja n\u00e4itab, kui suurel kaugusel \u00fchinemine toimus, kusjuures kaugused kasvavad samm-sammult, sest esmalt \u00fchendatakse v\u00f5imalikult l\u00e4hedased klastrid. Suurema h\u00fcppe koht \u00fchinemiskordajates n\u00e4itab k\u00e4tte, mis sammul \u00fchendamisel tekkis suhteliselt v\u00e4hem\u00fchtne klaster. Selle eel olev seis v\u00f5iks olla valitud l\u00f5ppklasterduseks. Suuremale h\u00fcppele vastab dendrogrammil pikem horisontaalne joon kahe \u00fchinemiss\u00f5lme vahel. Joonisel 5 on kujutatud maakondade n\u00e4ite \u00fchendamiskordajad. <\/span><\/p>\n<p>Tabel 5. Klasterduse k\u00e4ik Wardi meetodil<\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 6.0pt 0cm;\"><img loading=\"lazy\" decoding=\"async\" width=\"695\" height=\"408\" class=\"alignnone wp-image-140\" title=\"Tabel 5. Klasterduse k\u00e4ik Wardi meetodil\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.41.51.png\" alt=\"Tabel 5. Klasterduse k\u00e4ik Wardi meetodil\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.41.51.png 695w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.41.51-300x176.png 300w\" sizes=\"auto, (max-width: 695px) 100vw, 695px\"><\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 6.0pt 0cm;\"><span style=\"line-height: normal;\">Klasterduse algus kulgeb \u00fchetaoliste vahedega, mida n\u00e4itab dendrogrammil \u00fchinemiss\u00f5lmede kuhjumine diagrammi vasakpoolsesse ossa. Suuremad h\u00fcpped on n\u00e4ha alates 10. sammust, mis vastabki meie poolt valitud neljaklastrilisele liigitusele. <\/span><\/p>\n<figure id=\"attachment_141\" aria-describedby=\"caption-attachment-141\" style=\"width: 577px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-141\" title=\"Joonis 5. \u00dchendamiskordajad maakondade n\u00e4ites\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.42.34.png\" alt=\"Joonis 5. \u00dchendamiskordajad maakondade n\u00e4ites\" width=\"577\" height=\"334\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.42.34.png 577w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.42.34-300x174.png 300w\" sizes=\"auto, (max-width: 577px) 100vw, 577px\"><figcaption id=\"caption-attachment-141\" class=\"wp-caption-text\">Joonis 5. \u00dchendamiskordajad maakondade n\u00e4ites<\/figcaption><\/figure>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 6.0pt 0cm;\"><span style=\"line-height: normal;\">Mida teha klasterdusega edasi? Tekkinud r\u00fchmi v\u00f5iks iseloomustada klasterdustunnuste v\u00f5i ka m\u00f5nede teiste tunnuste v\u00e4\u00e4rtuste poolest. Tabelis 6 on esile toodud maakondade nelja klastri puhul klasterdustunnuste v\u00e4\u00e4rtuste piirid. N\u00e4eme, et klastrid eristuvad \u00fcksteisest p\u00e4ris selgesti.<\/span><\/p>\n<p>Tabel 6. Klastrite iseloomustus klasterdustunnuste v\u00e4hima ja suurima v\u00e4\u00e4rtuse alusel Wardi meetodil saadud neljaklastrilises klasterduses<\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 6.0pt 0cm;\"><img loading=\"lazy\" decoding=\"async\" width=\"711\" height=\"284\" class=\"alignnone wp-image-142\" title=\"Tabel 6. Klastrite iseloomustus klasterdustunnuste v\u00e4hima ja suurima v\u00e4\u00e4rtuse alusel Wardi meetodil saadud neljaklastrilises klasterduses\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.43.15.png\" alt=\"Tabel 6. Klastrite iseloomustus klasterdustunnuste v\u00e4hima ja suurima v\u00e4\u00e4rtuse alusel Wardi meetodil saadud neljaklastrilises klasterduses\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.43.15.png 711w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.43.15-300x120.png 300w\" sizes=\"auto, (max-width: 711px) 100vw, 711px\"><\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 6.0pt 0cm;\"><span style=\"line-height: normal;\">Klastrid 3 ja 4 on sarnased \u00fclalpeetavate m\u00e4\u00e4ra ja prognoositava eluea poolest, kuid kuu keskmine brutotulu j\u00e4\u00e4b eri vahemikesse, samuti t\u00f6\u00f6h\u00f5ive m\u00e4\u00e4r. Klastri 1 n\u00e4itajad on \u201cparemad\u201d kui \u00fclej\u00e4\u00e4nud klastreis. Hiiumaa erip\u00e4ra on k\u00f5rge kuu keskmine brutotulu suhteliselt k\u00f5rge t\u00f6\u00f6h\u00f5ive m\u00e4\u00e4ra ja madala \u00fclalpeetavate m\u00e4\u00e4ra ning madala demograafilise t\u00f6\u00f6turusurveindeksi korral. Hiiu maakonnas elab t\u00f6\u00f6ealine ja t\u00f6\u00f6l k\u00e4iv rahvas, aga noori ei ole peale tulemas v\u00f5i on t\u00f6\u00f6turult peatselt lahkujate hulk suur (maakonna elanike vanuseline struktuur ei v\u00e4lista sellist seletust). <\/span><\/p>\n<figure id=\"attachment_143\" aria-describedby=\"caption-attachment-143\" style=\"width: 668px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-143\" title=\"Joonis 6. Klasterdustunnuste standarditud v\u00e4\u00e4rtused klastrite kaupa\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.44.01.png\" alt=\"Joonis 6. Klasterdustunnuste standarditud v\u00e4\u00e4rtused klastrite kaupa\" width=\"668\" height=\"527\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.44.01.png 668w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.44.01-300x237.png 300w\" sizes=\"auto, (max-width: 668px) 100vw, 668px\"><figcaption id=\"caption-attachment-143\" class=\"wp-caption-text\">Joonis 6. Klasterdustunnuste standarditud v\u00e4\u00e4rtused klastrite kaupa. Tunnused: 1\u2013t\u00f6\u00f6h\u00f5ive indeks 2018, 2\u2013kuukeskmine brutotulu 2019, 3\u2013\u00fclalpeetavate m\u00e4\u00e4r 2019, 4\u2013demograafiline t\u00f6\u00f6turusurve indeks 2019, 5\u2013eeloleva eluea pikkus s\u00fcnnimomendil 2018<\/figcaption><\/figure>\n<p style=\"text-align: justify; margin: 6.0pt 0cm 6.0pt 0cm;\"><span style=\"line-height: normal;\">Tunnused: 1\u2013t\u00f6\u00f6h\u00f5ive indeks 2018, 2\u2013kuukeskmine brutotulu 2019, 3\u2013\u00fclalpeetavate m\u00e4\u00e4r 2019, 4\u2013demograafiline t\u00f6\u00f6turusurve indeks 2019, 5\u2013eeloleva eluea pikkus s\u00fcnnimomendil 2018<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Klastrite v\u00f5rdlus on ilmekam joonise 6 abil, kus on esitatud klasterdustunnuste v\u00e4\u00e4rtused klastrite kaupa standarditud kujul (tulp \u00fclespoole t\u00e4hendab v\u00e4\u00e4rtust \u00fcle maakondade keskmise ja tulp allapoole \u2013 alla maakondade keskmist). Klastrit 3 iseloomustavad allapoole suunatud tulbad, v\u00e4lja arvatud \u00fclalpeetavate m\u00e4\u00e4r, mis samuti ei k\u00f5nele eluj\u00f5ulisusest. Neljanda klastri maakondades on keskmist \u00fcletavaid positiivseid n\u00e4itajaid, kuid \u00fclalpeetavate m\u00e4\u00e4r on keskmiselt veel k\u00f5rgem kui kolmandas klastris. Saare maakond sarnaneb muidu Hiiu maakonnaga, aga demograafiline t\u00f6\u00f6turusurve indeks on k\u00f5rgem.\u00a0<\/span><\/p>\n<p><\/p><\/div>\n        <\/div>\n        <\/div>\n    <\/div>\n<p><\/p><div class=\"accordion mb-3\">\n        <div class=\"accordion-item accordion-item--white\">\n        <h2 class=\"accordion-header\" id=\"accordion-69de5cf5dde50-heading\">\n            <button class=\"accordion-button collapsed\" type=\"button\" data-bs-toggle=\"collapse\" data-bs-target=\"#accordion-69de5cf5dde50-collapse\" aria-expanded=\"true\" aria-controls=\"accordion-69de5cf5dde50-collapse\">k-keskmiste meetod<\/button>\n        <\/h2>\n        <div id=\"accordion-69de5cf5dde50-collapse\" class=\"accordion-collapse collapse\" aria-labelledby=\"accordion-69de5cf5dde50-heading\">\n            <div class=\"accordion-body\">\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Mittehierarhilistest meetoditest on laialt levinud ja osutub enamjaolt efektiivseks <i>k<\/i>-keskmiste meetod. Klasterdus on kiire ka suure objektide arvu korral, sest meetod toetub klastrikeskmistele ega vaja k\u00f5igi objektipaaride kaugusi. Tutvustame allj\u00e4rgnevalt paketi SPSS v\u00f5imalusi selle meetodi rakendamiseks (standardalgoritm). Siin tekstiosas on objekti asemel suup\u00e4rasem k\u00f5nelda indiviididest, milleks v\u00f5ib olla suvaline uurimis\u00fchik (<i>k<\/i>-keskmiste meetodi sagedane rakendusala on k\u00fcsitlusandmete anal\u00fc\u00fcs). <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Kirjeldame l\u00fchidalt klasterduse k\u00e4iku. Toimub indiviidide iteratiivne (ts\u00fckliline) koondamine teatud punktide \u2013 klastrite keskpunktide ehk tsentroidide \u00fcmber, kuni tsentroidid stabiliseeruvad. Igal iteratsioonisammul tehakse kaks tegevust: indiviidi paigutamine l\u00e4hima keskpunktiga (tsentroidiga) klastrisse ja seej\u00e4rel klastri keskpunti \u00fcmberarvutus klastri uue koosseisuga. Klastrite arv tuleb ette anda (on miinus selle hea meetodi puhul), kusjuures esimese sammu klastrite keskpunktid kas valitakse vaikimisi (nt teatud v\u00f5imalikult \u00fcksteisest eraldiseisvad indiviidid) v\u00f5i kasutatakse etteantud keskpunkte. H\u00e4sti ja p\u00f5hjendatult valitud klastrikeskmiste etteandmisega saab klasterdust <i>k<\/i>-keskmise meetodil muuta veelgi efektiivsemaks ja kiiremaks. Suure mahuga andmestiku korral v\u00f5iks l\u00e4htekeskpunktide leidmiseks teha esialgsest andmestikust v\u00e4iksemal andmestikul (juhuslikul alaosal) eelklasterduse koos klastrikeskmiste salvestusega, mis hiljem on p\u00f5hilahenduse alguspunkt. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Algoritmi on v\u00f5imalik varieerida veel sel viisil, et iteratsioonisammu teist osa \u2013 klastrikeskmise \u00fcmberarvutust \u2013 teha indiviidikaupa, iga uue indiviidi lisandumisel (v\u00f5tmes\u00f5na <i>running means<\/i>). Ohuks kujuneb sel juhul lahenduse v\u00f5imalik s\u00f5ltuvus indiviidide j\u00e4rjekorrast. Et seda v\u00e4ltida (selle t\u00f5sidust uurida) v\u00f5iks lahendusi teha ja v\u00f5rrelda mitme indiviidide juhusliku \u00fcmberj\u00e4rjestuse korral. Ka siis, kui kasutada etteantud klastrikeskmisi, v\u00f5iks koostada erinevaid klasterdusi keskpunktide erineva j\u00e4rjestusega ning saadud tulemusi \u00fchitada kokkulangevuste poolest. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Klasterdustunnused peavad olema arvulised (v\u00f5i sellistena t\u00f5lgendatavad). Kaugusena kasutatakse eukleidilist kaugust, mis t\u00e4hendab, et eri skaalade ja varieeruvusega tunnused tuleb v\u00f5rdse m\u00f5ju saavutamiseks klasterdamisel eelnevalt standardida. Enne klasterdamist v\u00f5iks uurida erandlike indiviidide olemasolu, et neid klasterdusest v\u00e4lja j\u00e4tta ja hiljem eraldi k\u00e4sitleda (selleks vaadelda n\u00e4iteks klasterdustunnuste jaotusi \u00fchekaupa, seej\u00e4rel erindi kahtlusega indiviide ka mitme tunnuse poolest korraga). <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Klastrite arvu m\u00e4\u00e4ramine on t\u00f5sine otsustuskoht. L\u00e4hteks v\u00f5iksid olla aineteoreetilised kaalutlused v\u00f5i m\u00f5ni analoogiline juba tehtud t\u00f6\u00f6. Samuti v\u00f5iks uurida klastrite arvu idee otsimiseks klasterdustunnuste (paarikaupa) hajuvusdiagramme ja panna t\u00e4hele \u201etihedamaid\u201c punktikogumeid. Kui tunnuse jaotusdiagrammil on mitu tipukohta, siis v\u00f5ib olla tegemist mitmeosalise kogumiga \u2013 sellised jt esmasanal\u00fc\u00fcsi v\u00f5tted v\u00f5iksid olla abiks. Kindlasti tuleks teha lahendusi mitme klastrite arvuga ja tulemusi individuaalse klastrikuuluvuse alusel uurida, millised klastrid on p\u00fcsivad klastrite arvu suurendamisel, millised lagunevad kergesti osadeks. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Andmel\u00fcnkade k\u00e4sitlus on samuti raske valiku koht, sest klasterdustunnuseid v\u00f5ib olla k\u00fcllalt suur arv ja k\u00f5igi v\u00e4hemalt \u00fche andmel\u00fcngaga indiviidide k\u00f5rvalej\u00e4tmine v\u00f5ib andmestikku moonutada. V\u00f5iks esmalt uurida andmel\u00fcnkade osat\u00e4htsust tunnustes ja kaaluda v\u00e4ga l\u00fcnklike tunnuste k\u00f5rvalej\u00e4tmist klasterdusest, kui \u00fclesande t\u00e4hendus sellest ei muutu. Seej\u00e4rel v\u00f5iks uurida indiviide klasterdustunnuste poolest ja j\u00e4tta v\u00e4lja need, kellel on palju klasterdustunnuseid m\u00f5\u00f5tmata. Nii kujunenud andmestikus (kui see on v\u00e4hegi kvaliteetne) v\u00f5iks l\u00fcnkade arv olla juba selline, et kaugused indiviidide vahel v\u00f5iks leida paarikaupa valimeid kasutades.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\"><i>k<\/i>-keskmiste meetodil saadud klasterduse standardsed osad on j\u00e4rgmised: soovi korral klastrite l\u00e4htetsentroidid, iteratsioonisammude tabel, l\u00f5plikud klastrite tsentroidid, soovi korral klasterdustunnuste dispersioonanal\u00fc\u00fcs klastrinumbri suhtes, klastrite suuruste tabel ja soovi korral individuaalse klastrikuuluvuse tabel ning klastritevahelise kauguse maatriks. Soovi korral on v\u00f5imalik andmestikku salvestada uute tunnustena klastrikuuluvuse tunnus klastrinumbrite kaudu ja individuaalne kaugus klastri keskpunktist. Viimatinimetatu annab v\u00f5imaluse hinnata klastri homogeensust n\u00e4iteks klastrisse kuuluvate indiviidide keskmise kauguse kaudu klastri tsentroidi suhtes.<\/span><\/p>\n<a href=\"#\" data-bs-toggle=\"modal\" data-bs-target=\"#popup-modal\" data-title=\"k-keskmiste meetodi rakendus paketis SPSS\" data-content='&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;Vt ka &lt;i&gt;k-Means Cluster Analysis. IBM Knowledge Center&lt;\/i&gt; &amp;#8230; .&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;K\u00e4surida &lt;i&gt;Classify \u2013 k-means Cluster Analysis &lt;\/i&gt;toob esile valikud k-keskmiste meetodi korraldamiseks.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Variables&lt;\/i&gt; \u2013 sellele v\u00e4ljale kanda klasterdustunnused.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Label cases by&lt;\/i&gt; \u2013 sellele v\u00e4ljale kanda objektide nimede tunnus, kui selline on olemas; suure indiviidide arvu korral tavaliselt ei kasutata.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Number of clusters &lt;\/i&gt;\u2013 anda ette klastrite arv. &lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Method&lt;\/i&gt; \u2013 valida &lt;i&gt;Iterate and classify&lt;\/i&gt;, kui on vaja iteratiivselt leida klastrite tsentroidid ja r\u00fchmitada; valida &lt;i&gt;Classify only&lt;\/i&gt;, kui klastrite tsentroidid on v\u00e4lja Cluster Centers abil ette antud m\u00f5ne varasema lahenduse v\u00f5i muu allika abil saaduna.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Cluster Centers&lt;\/i&gt; \u2013 v\u00f5imaldab korraldada klastrikeskpunktide valikuid:&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Read initial&lt;\/i&gt; \u2013 kasutada varem salvestatud klastrite tsentroide; selleks kas avada (ajutine, eelmisel lahendusk\u00e4igul salvestatud tsentroidide fail, &lt;i&gt;Open dataset&lt;\/i&gt; ja osutada nimi) v\u00f5i salvestatud tsentroide sisaldav fail (valida fail v\u00e4ljal &lt;i&gt;External data file&lt;\/i&gt;);&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Write final&lt;\/i&gt; \u2013 kirjutada kas eraldi (ajutise) andmestikuna (&lt;i&gt;New dataset&lt;\/i&gt; koos nime osutamisega) v\u00f5i salvestada p\u00fcsiva failina (&lt;i&gt;Data file&lt;\/i&gt; koos nime osutamisega) tsentroide sisaldav andmestik, mida m\u00f5nes j\u00e4rgnevas lahenduses kasutada k-keskmiste meetodi l\u00e4hteks, et lahendust veelgi kiirendada&lt;i&gt;.&lt;\/i&gt;&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Iterate&lt;\/i&gt; \u2013 puudutab arvutusi tsentroidide leidmisel:&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Maximum Iterations&lt;\/i&gt; \u2013 suurim tsentroidide nihutuste arv (iteratsioonide arv), siin v\u00f5iks olla k\u00fcllalt suur arv, kui andmestik ei ole hiigelsuur ja lahendus v\u00f5iks kesta v\u00e4ga kaua); kui selle arvu kohane hulk ts\u00fckleid on l\u00e4bi tehtud, siis tsentroidide t\u00e4psustamine peatub; kui tsentroidide p\u00fcsivus saabub varem, siis protsess samuti peatub;&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Convergence criterion&lt;\/i&gt; \u2013 teine iteratsiooniprotsessi juhtimise vahend; tsentroide parandatakse seni, kuni need siin antud koondumiskriteeriumi kohaselt enam ei muutu; mida v\u00e4iksem kriteerium, seda kauem tsentroide viimistletakse;&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Use running means&lt;\/i&gt; \u2013 selle nupu sissel\u00fclitamisel arvutatakse tsentroidid \u00fcmber iga \u00fcksiku objekti juurdetoomise j\u00e4rel; kui see nupp ei ole sisse l\u00fclitatud, siis tehakse \u00fcmberpaigutus konkreetsel iteratsioonil seej\u00e4rel, kui k\u00f5ik objektid on mingi tsentroidi juurde paigutatud; selle nupu kasutamisel v\u00f5ib tulemust m\u00f5jutada objektide (ja tsentroidide) j\u00e4rjestus.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Save&lt;\/i&gt; \u2013 juhitakse klasterdustulemuste salvestamist:&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Cluster membership&lt;\/i&gt; \u2013 andmestiku l\u00f5ppu lisatakse tunnus, mille individuaalseks v\u00e4\u00e4rtuseks on selle klastri number, kuhu indiviid paigutati viimasel klasterdussammul; tunnusel on standardnimi algusega QCL_ .&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Distance from cluster Center&lt;\/i&gt; \u2013 andmestiku l\u00f5ppu lisatakse tunnus, mille individuaalseks v\u00e4\u00e4rtuseks on objekti kaugus selle klastri tsentroidis, kuhu see objekt kuulub; tunnusel on standardnimi algusega QCL_ ; otstarbekas on nime muuta sisu kajastavaks.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Options &lt;\/i&gt;\u2013 suvandite abil saab kujundada klasterdustulemust ja korraldada andmel\u00fcnkade k\u00e4sitlust:&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Statistics &lt;\/i&gt;\u2013 vajadusel saab esile tuua l\u00e4hteks olnud\/valitud klastrite keskpunktid (valida &lt;i&gt;Initial cluster centers&lt;\/i&gt;);&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;ANOVA table&lt;\/i&gt; \u2013 soovi korral v\u00f5ib l\u00e4bi teha klasterdustunnuste dispersioonanal\u00fc\u00fcsi klastrinumbri suhtes ja tuua esile vastava dispersioonitabeli;&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Cluster information for each case&lt;\/i&gt; \u2013 kui indiviide ei ole v\u00e4ga palju, siis v\u00f5ib tuua esile nimestiku, millest n\u00e4eb iga indiviidi korral, mis klastrisse ta kuulub;&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Missing values&lt;\/i&gt; \u2013 saab m\u00e4\u00e4rata, kas indiviidid, kelle vastustes on puuduvaid v\u00e4\u00e4rtusi, j\u00e4etakse anal\u00fc\u00fcsist v\u00e4lja klasterdustunnuste loetelu alusel (&lt;i&gt;Exclude cases listwise&lt;\/i&gt;) v\u00f5i tehakse arvutused paarisvalimite alusel (&lt;i&gt;Exclude cases pairwise&lt;\/i&gt;).&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;b&gt;N\u00e4pun\u00e4ide klasterdustunnuste standardimiseks&lt;\/b&gt;: &lt;i&gt;Descriptives \u2013 &lt;\/i&gt;valida&lt;i&gt; Save standardized values as variables&lt;\/i&gt;; standarditud v\u00e4\u00e4rtused salvestatakse andmestiku l\u00f5ppu standardnimega, mille alguseks on &lt;i&gt;Zscore:&lt;\/i&gt;.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p&gt;'>k-keskmiste meetodi rakendus paketis SPSS<\/a>\n<p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"><span style=\"line-height: normal;\"><i>k<\/i>-keskmiste meetodi n\u00e4itena vaatleme Eesti inimeste klasterdust poliitilise usalduse hinnangute alusel, kasutades Euroopa sotsiaaluuringu andmeid 2018. aasta kohta (vt <i>European Social Survey<\/i> \u2026; andmed on vabakasutuses). Poliitilise usalduse tunnuste plokis on vastused k\u00fcsimusele \u201eKuiv\u00f5rd Te usaldate j\u00e4rgmisi institutsioone?\u201c Eesti Riigikogu, \u00f5iguss\u00fcsteemi, politsei, poliitikute, poliitiliste parteide ja erakondade kohta ning Euroopa Parlamendi ja \u00dchinenud Rahvaste Organisatsiooni kohta. Vastati skaalal, kus 0 t\u00e4hendab \u201eei usalda \u00fcldse\u201c kuni 10, mis t\u00e4hendab \u201eusaldan t\u00e4ielikult\u201c. Tabelis 7 on n\u00e4idatud vastuste arvud ja esmased statistikud. Tunnused on erisuguse variatiivsusega skaalal 0 kuni 10 (keskmised 4 kuni 7, standardh\u00e4lbed 2,2 kuni 2,6), mis t\u00e4hendab kindlat standardimise vajadust.<\/span><\/p>\n<p>Tabel 7. <em>k<\/em>-keskmiste meetodi n\u00e4ite alustunnuste p\u00f5hin\u00e4itajad<\/p>\n<p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"><img loading=\"lazy\" decoding=\"async\" width=\"696\" height=\"262\" class=\"alignnone wp-image-144\" title=\"Tabel 7. k-keskmiste meetodi n\u00e4ite alustunnuste p\u00f5hin\u00e4itajad\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.45.40.png\" alt=\"Tabel 7. k-keskmiste meetodi n\u00e4ite alustunnuste p\u00f5hin\u00e4itajad\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.45.40.png 696w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.45.40-300x113.png 300w\" sizes=\"auto, (max-width: 696px) 100vw, 696px\"><\/p>\n<p style=\"text-align: justify; margin: 6.0pt 0cm 6.0pt 0cm;\"><span style=\"line-height: normal;\">Uurisime ka klasterduseks valitud tunnuste vahelisi korrelatsioonikordajaid, mis osutusid olevat valdavalt m\u00f5\u00f5dukal tasemel. Siiski poliitikute ja poliitiliste parteide usaldushinnangute vaheline seos on kordajaga 0,84 (vastastikuse kirjelduse m\u00e4\u00e4r 71%, mis l\u00e4heneb dubleerimisele), mist\u00f5ttu j\u00e4tsime v\u00e4lja poliitikute usaldushinnangu, et seda sisulist aspekti mitte \u00fcle t\u00e4htsustada. \u00dclej\u00e4\u00e4nud tunnuste vahelised korrelatsioonikordajad on vahemikus 0,37\u20130,76. Tehniliselt ei ole <i>k<\/i>-keskmiste meetodi puhul klasterdustunnuste seos keelatud, aga siin v\u00f5iks m\u00f5elda pigem sisule. Mis t\u00e4hendusega tunnused klasterdustunnusteks v\u00f5tame, sellise t\u00e4hendusega saame ka klastrid.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Nagu n\u00e4ha tabelist 7, koosneks loetelup\u00f5hine t\u00e4isvastustega andmestik 1709 indiviidi andmeist. Siiski l\u00e4ksime siin teist teed (v\u00f5ib-olla mitte k\u00f5ige \u00f5igemat) ja kasutasime kauguste arvutamisel paarisvalimeid. Julgust andis hinnangute ploki l\u00fcnklikkuse anal\u00fc\u00fcs, millest selgus, et on \u00fcks indiviid, kes ei ole \u00fchelegi k\u00fcsimusele vastanud (j\u00e4\u00e4b muidugi v\u00e4lja), aga alla pooleteise protsendi on neid, kes on vastanud mitte rohkem kui kolmele k\u00fcsimusele kuuest. K\u00f5igile k\u00fcsimustele vastas 90% ja neljale v\u00f5i viiele kuuest \u2013 9%.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Tutvustame neljaklastrilist klasterdust. Koostasime ka kolmeklastrilise, mis osutus suhteliselt ettearvatuks: tekkisid (kokkuleppeliselt nimetades) madala, keskmise ja k\u00f5rge poliitilise usaldusega isikute r\u00fchmad (vastavalt 431, 842 ja 630 indiviidi), milles oli siiski ka huvitavaid momente. N\u00e4iteks keskmise usalduse r\u00fchmas on poliitiliste parteide usaldus keskmiselt madalam kui \u00fcldiselt, mille t\u00f5ttu on k\u00f5rge poliitilise usalduse r\u00fchmas usaldus parteide ja erakondade vastu eriliselt k\u00f5rge (keskmise tasakaalustamiseks). Neljaklastrilise liigituse tulemused esitatakse sama \u00fclesehitusega tabelitena, nagu paketi SPSS v\u00e4ljundtulemustes, et saaks n\u00e4idet kaasa lahendada. Artiklis v\u00f5i muus kirjutises esitamiseks on kindlasti otstarbekas tabeleid koondada.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Rakendatud iteratsiooniprotsessi l\u00e4hteks olid n\u00e4ite korral tabelis 8 esitatud keskpunktid iga klasterdustunnuse ja klastri kohta \u2013 neli v\u00f5imalikult erinevat indiviidi. Selle tabeli vastu v\u00f5iks olla huvi n\u00e4gemaks, kui palju klastri keskpunktid l\u00f5ppseisuni on muutunud, sisulist infot siin ei ole. Kui anname lahenduseks tsentroidid ise ette, siis muidugi on sel tabelil t\u00e4htsus identifitseerimaks konkreetset klasterdust. \u00a0<\/span><\/p>\n<p>Tabel 8. Klastrite l\u00e4htekeskpunktid<\/p>\n<p style=\"text-align: justify;\"><img loading=\"lazy\" decoding=\"async\" width=\"673\" height=\"208\" class=\"alignnone wp-image-145\" title=\"Tabel 8. Klastrite l\u00e4htekeskpunktid\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.46.23.png\" alt=\"Tabel 8. Klastrite l\u00e4htekeskpunktid\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.46.23.png 673w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.46.23-300x93.png 300w\" sizes=\"auto, (max-width: 673px) 100vw, 673px\"><\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 12.0pt 0cm;\"><span style=\"line-height: normal;\">Iteratsiooniprotsess indiviidide \u00fcmberpaigutamise ja klastrikeskmiste \u00fcmberarvutusega v\u00f5ib l\u00f5ppeda kahel viisil: saab t\u00e4is etteantud arv ts\u00fckleid v\u00f5i klastrite tsentrid enam ei muutu teatud l\u00e4ve kohaselt. Tabelist 9 on n\u00e4ha, et seekord kulus 21 \u00fcmberpaigutust, enne kui keskpunktid stabiliseerusid (praegu oli l\u00e4veks v\u00e4ga v\u00e4ike arv ja v\u00e4ga suur lubatav iteratsioonide arv). Iteratsioonide arvu on m\u00f5tet t\u00f5kestada v\u00e4ga suuremahuliste andmestike korral, et lahendusaega piirata, muidu v\u00f5iks siin piirarv olla suur, et protsess l\u00e4heks klastrikeskmiste stabiliseerumise l\u00f5puni. See tabel on informatiivne lahenduse tehnilise k\u00fclje huvilistele. <\/span><\/p>\n<p>Tabel 9. Klastrikeskmiste iteratiivse \u00fcmberpaigutamise k\u00e4ik<\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 12.0pt 0cm;\"><img loading=\"lazy\" decoding=\"async\" width=\"701\" height=\"605\" class=\"alignnone wp-image-146\" title=\"Tabel 9. Klastrikeskmiste iteratiivse \u00fcmberpaigutamise k\u00e4ik\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.47.29.png\" alt=\"Tabel 9. Klastrikeskmiste iteratiivse \u00fcmberpaigutamise k\u00e4ik\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.47.29.png 701w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.47.29-300x259.png 300w\" sizes=\"auto, (max-width: 701px) 100vw, 701px\"><\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 12.0pt 0cm;\"><span style=\"line-height: normal;\">J\u00e4rgneb klasterdustulemust sisuliselt peegeldav tabel l\u00f5plike klastrite keskpunktidega (tabel 10). Nende kaudu saame anda klastritele t\u00e4henduse ning v\u00f5imaluse ja vajaduse korral suure ettevaatusega ka nime. Ettevaatust on vaja selleks, et nimes kajastuks klastri sisu v\u00f5imalikult t\u00e4pselt, mis ei ole uurijale lihtne valik.<\/span><\/p>\n<p>Tabel 10. L\u00f5plikud klastrite keskpunktid<\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 12.0pt 0cm;\"><img loading=\"lazy\" decoding=\"async\" width=\"654\" height=\"234\" class=\"alignnone wp-image-147\" title=\"Tabel 10. L\u00f5plikud klastrite keskpunktid\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.48.08.png\" alt=\"Tabel 10. L\u00f5plikud klastrite keskpunktid\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.48.08.png 654w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.48.08-300x107.png 300w\" sizes=\"auto, (max-width: 654px) 100vw, 654px\"><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Klastrisse 1 kuuluvad indiviidid, kellel on k\u00f5ik poliitilise usalduse hinnangud keskmiselt \u00fcle \u00fcldise taseme, milleks on standarditud andmetel 0 (vt ka joonist 7 klastrite keskpunktide kohta). H\u00e4lve \u00fcldisest tasemest \u00fclespoole on olenevalt tunnusest 0,8\u20130,9 v\u00f5rra. Klastrile 1 moodustab tugeva kontrasti klaster 3, kus k\u00f5ik usaldushinnangud on tugevalt alla \u00fcldise taseme (1,1 kuni 1,4 v\u00f5rra). Klastrid 2 ja 4 omavahel moodustavad samuti teatava kontrasti. Klastri 2 indiviidid annavad suhteliselt madala hinnangu Riigikogule, parteidele ja kahele v\u00e4lisinstitutsioonile, kuid on keskmisel tasemel v\u00f5i \u00fcle selle \u00f5iguss\u00fcsteemi ja politsei usalduse poolest. Klaster 4 koosneb \u00fcldiselt \u201ekeskmiste\u201c vaadetega indiviididest: \u00f5iguss\u00fcsteemi ja politsei usaldus keskmise l\u00e4hedal natuke alla selle, kuid \u00fclej\u00e4\u00e4nud institutsioonide usaldus keskmise l\u00e4hedal, natuke \u00fcle selle. Need on usaldushinnangute n\u00f6 t\u00fc\u00fcbid Eestis aastal 2018 (kui otsida nelja usaldusr\u00fchma \u2013 klastrite arv on meie valik). <\/span><\/p>\n<figure id=\"attachment_148\" aria-describedby=\"caption-attachment-148\" style=\"width: 664px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-148\" title=\"Joonis 7. Klastrite keskpunktid\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.48.50.png\" alt=\"Joonis 7. Klastrite keskpunktid\" width=\"664\" height=\"384\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.48.50.png 664w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.48.50-300x173.png 300w\" sizes=\"auto, (max-width: 664px) 100vw, 664px\"><figcaption id=\"caption-attachment-148\" class=\"wp-caption-text\">Joonis 7. Klastrite keskpunktid<\/figcaption><\/figure>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Soovi korral v\u00f5ib j\u00e4rele uurida, kuiv\u00f5rd suurt rolli ja kas \u00fchetaolist m\u00e4ngivad klastrite eristamisel valitud klasterdustunnused. Selleks tuuakse esile dispersioonanal\u00fc\u00fcsi tabel (koos ettevaatusele kutsuva m\u00e4rkusega olulisuse t\u00f5en\u00e4osuse kasutamisel, tabel 11). Siin v\u00f5iks <i>F<\/i>-suhteid t\u00e4hele panna.<\/span><\/p>\n<p>Tabel 11. Klasterdustunnuste dispersioonanal\u00fc\u00fcsi klastrite suhtes<\/p>\n<p style=\"text-align: justify;\"><img loading=\"lazy\" decoding=\"async\" width=\"847\" height=\"510\" class=\"alignnone wp-image-149\" title=\"Tabel 11. Klasterdustunnuste dispersioonanal\u00fc\u00fcsi klastrite suhtes\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.49.38.png\" alt=\"Tabel 11. Klasterdustunnuste dispersioonanal\u00fc\u00fcsi klastrite suhtes\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.49.38.png 847w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.49.38-300x181.png 300w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.49.38-768x462.png 768w\" sizes=\"auto, (max-width: 847px) 100vw, 847px\"><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Tabelis 12 n\u00e4idatakse klastrite suurused samas j\u00e4rjekorras nagu eespool. \u00dchtlaselt suure usaldusega klastris on 584 indiviidi (31%) ja v\u00e4hese usalduse klastris 325 indiviidid (17%). V\u00e4hese usalduse r\u00fchmas, politsei ja \u00f5iguss\u00fcsteem v\u00e4lja arvatud, on 350 indiviidi (18%) ja keskelt l\u00e4bi keskmise usaldusega, v\u00e4ikeste k\u00f5ikumistega siia-sinna, on r\u00fchm, mis koosneb 644 indiviidist (34%). R\u00fchmitus on suuruse poolest vastuv\u00f5etav: mitte \u00fckski r\u00fchm ei ole v\u00e4ga v\u00e4ike, suurima-v\u00e4hima suhe on 2 ringis.<\/span><\/p>\n<p>Tabel 12. Klastrite suurus<\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 12.0pt 0cm;\"><img loading=\"lazy\" decoding=\"async\" width=\"477\" height=\"182\" class=\"alignnone wp-image-150\" title=\"Tabel 12. Klastrite suurus\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.50.48.png\" alt=\"Tabel 12. Klastrite suurus\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.50.48.png 477w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.50.48-300x114.png 300w\" sizes=\"auto, (max-width: 477px) 100vw, 477px\"><\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 12.0pt 0cm;\"><span style=\"line-height: normal;\">Klastritevaheliste kauguste maatriksist (tabel 13) n\u00e4eme juba tuttavat pilti: teineteisest suhteliselt kaugel on klastrid 1 ja 3 (kaugus 5,2). Klastrid 2 ja 4 on teineteisele suhteliselt k\u00f5ige l\u00e4hemal (kaugus 1,8), mis klastrikeskmiste vaatlemisel tabelis 10 ja joonisel 7 v\u00e4ga v\u00e4lja ei paistnudki. Klastritevahelise kauguse tabel t\u00e4iendas meie ettekujutust klastreist. T\u00e4psustame seda veelgi, kasutades muid andmestikus olevaid tunnuseid peale klasterdustunnuste.<\/span><\/p>\n<p>Tabel 13. Klastritevaheline kaugus<\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 12.0pt 0cm;\"><img loading=\"lazy\" decoding=\"async\" width=\"423\" height=\"180\" class=\"alignnone wp-image-151\" title=\"Tabel 13. Klastritevaheline kaugus\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.51.28.png\" alt=\"Tabel 13. Klastritevaheline kaugus\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.51.28.png 423w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.51.28-300x128.png 300w\" sizes=\"auto, (max-width: 423px) 100vw, 423px\"><\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 12.0pt 0cm;\"><span style=\"line-height: normal;\">Tabelis 14 on esitatud m\u00f5ned t\u00e4iendavad keskmised andmed moodustatud klastrite kohta tunnuste abil, mis ei olnud klasterduse aluseks. See annab v\u00f5imaluse klastreid t\u00e4iendavalt iseloomustada ja nende t\u00e4hendust t\u00e4psustada lisaks klasterdustunnuste kaudu arvutatud tsentroididele. Esimese, suure usalduse klastri liikmed on teistest keskmiselt nooremad, pikema kooliajaga, enam rahul niih\u00e4sti eluga \u00fcldiselt kui ka majanduse olukorraga Eestis. Nad pooldavad Euroopa j\u00e4tkuvat \u00fchinemist. Teist klastrit eristab neljandast k\u00f5rgem vanus ja veidi l\u00fchem kooliaeg, madalam rahulolu ja eitav suhtumine Euroopa \u00fchinemisse. Kolmandasse klastrisse kuuluvad indiviidid on suhteliselt l\u00fchema kooliajaga, k\u00f5ige v\u00e4hem rahulolevad ja Euroopa j\u00e4tkuva \u00fchinemise vastu. See n\u00e4ide r\u00f5hutab klastrite t\u00e4henduse avamise vajadust ka indiviidide tausta poolest, mis klastrinumbrite tunnuse loomise kaudu on tehniliselt lihtsalt tehtav.<\/span><\/p>\n<p>Tabel 14. Klastrite iseloomustus m\u00f5nede taustatunnuste kaudu<\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 12.0pt 0cm;\"><img loading=\"lazy\" decoding=\"async\" width=\"764\" height=\"198\" class=\"alignnone wp-image-152\" title=\"Tabel 14. Klastrite iseloomustus m\u00f5nede taustatunnuste kaudu\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.52.32.png\" alt=\"Tabel 14. Klastrite iseloomustus m\u00f5nede taustatunnuste kaudu\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.52.32.png 764w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.52.32-300x78.png 300w\" sizes=\"auto, (max-width: 764px) 100vw, 764px\"><\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 12.0pt 0cm;\"><span style=\"line-height: normal;\"><sup>a<\/sup>K\u00f5ike kokkuv\u00f5ttes, kuiv\u00f5rd rahul Te oma eluga \u00fcldiselt olete praegu? <sup>b<\/sup>Kuiv\u00f5rd rahul olete \u00fcldiselt Eesti praeguse majandusliku olukorraga? 0-ei ole \u00fcldse rahul, 10-olete v\u00e4ga rahul. <sup>c<\/sup>M\u00f5eldes Euroopa Liidule \u00fctlevad m\u00f5ned, et Euroopa \u00fchinemine peaks j\u00e4tkuma. Teised aga arvavad, et see on l\u00e4inud juba liiga kaugele. Milline number skaalal kirjeldab k\u00f5ige paremini Teie arvamust? 0-\u00fchinemine on l\u00e4inud juba liiga kaugele, 10-\u00fchinemine peaks j\u00e4tkuma <\/span><\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 12.0pt 0cm;\"><span style=\"line-height: normal;\">Kui \u00fchtsed on moodustatud klastrid? Sellele saame vastuse, kui arvutame klasteranal\u00fc\u00fcsi k\u00e4igus ka iga indiviidi kauguse selle klastri tsentrist, kuhu indiviid l\u00f5puks paigutati. Tabelist 15 n\u00e4eme, et meie n\u00e4ites on k\u00f5ige kompaktsem (klasterdustunnuste alusel) esimene, suure usalduse klaster (keskmine kaugus klastri keskmest 1,3 teistest v\u00e4iksema standardh\u00e4lbega 0,53). Suhteliselt \u201dh\u00f5redamalt\u201d paiknevad kolmanda ja teise klastri indiviidid: keskmine kaugus tsentrist \u00fcle 1,65\u20131,67, seega suurem kui \u00fcldkeskmine kaugus 1,46. <\/span><\/p>\n<p>Tabel 15. Keskmine kaugus klastri keskpunktist<\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 12.0pt 0cm;\"><img loading=\"lazy\" decoding=\"async\" width=\"415\" height=\"158\" class=\"alignnone wp-image-153\" title=\"Tabel 15. Keskmine kaugus klastri keskpunktist\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.53.13.png\" alt=\"Tabel 15. Keskmine kaugus klastri keskpunktist\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.53.13.png 415w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.53.13-300x114.png 300w\" sizes=\"auto, (max-width: 415px) 100vw, 415px\"><\/p>\n<p style=\"margin: 6.0pt 0cm 6.0pt 0cm;\"><span style=\"line-height: normal;\">Individuaalseid klastrinumbreid selles n\u00e4ites tabelina esile ei toodud, kuid see oleks v\u00f5imalik ja v\u00f5iks huvi pakkuda m\u00f5ne v\u00e4iksema andmestiku puhul. V\u00f5imalus lisada klastrinumbrid andmestikku nende edasiseks kasutamiseks on klasterdusprogrammides tavaliselt olemas.<\/span><\/p>\n<p><\/p><\/div>\n        <\/div>\n        <\/div>\n    <\/div>\n<p><\/p><div class=\"accordion mb-3\">\n        <div class=\"accordion-item accordion-item--white\">\n        <h2 class=\"accordion-header\" id=\"accordion-69de5cf5dde87-heading\">\n            <button class=\"accordion-button collapsed\" type=\"button\" data-bs-toggle=\"collapse\" data-bs-target=\"#accordion-69de5cf5dde87-collapse\" aria-expanded=\"true\" aria-controls=\"accordion-69de5cf5dde87-collapse\">Kahesammuline klasteranal\u00fc\u00fcs<\/button>\n        <\/h2>\n        <div id=\"accordion-69de5cf5dde87-collapse\" class=\"accordion-collapse collapse\" aria-labelledby=\"accordion-69de5cf5dde87-heading\">\n            <div class=\"accordion-body\">\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Kahesammuline klasterdus (ik <i>TwoStep Cluster Analysis<\/i>), mis on realiseeritud paketis SPSS, on kiire ja sobib ka suurte andmekogumite klasterdamiseks, kusjuures \u00fcheaegselt on v\u00f5imalik kasutada nii kategoriaalseid kui ka pidevaid tunnuseid. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Esimene samm on eelklasterdamine (ik <i>pre-clustering<\/i>), kus vaadatakse l\u00e4bi k\u00f5ik indiviidid ja paigutatakse iga indiviid kauguse alusel kas m\u00f5nesse olemasolevasse eelklastrisse v\u00f5i luuakse vajadusel uus. Saadud eelklastrite andmestik on l\u00e4hteks teisele sammule, kusjuures eelklastri liikmeid k\u00e4sitletakse \u00fchtmoodi, koos, \u00fche objektina. See t\u00e4hendab teise sammu l\u00e4hteks andmestikku, mille objektide arv on esialgsest indiviidide arvust m\u00e4rgatavalt v\u00e4iksem, nimelt eelklastrite arv, ja see tagabki algoritmi suure kiiruse. Teine samm on eelklastrite hierarhiline klasterdamine. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Algoritm toetub klasterdamisel t\u00f5ep\u00e4rafunktsiooni kasutavatele informatsioonikriteeriumidele <i>AIC<\/i> (Akaike kriteerium) ja<i> BIC<\/i> (Bayesi informatsioonikriteerium). Soovitav on kasutada m\u00f5lemat teineteise j\u00e4rel ja pakutud lahendused ka t\u00f5lgenduslikult ja rakenduslikult l\u00e4bi m\u00f5elda. M\u00f5lemad kriteeriumid t\u00f6\u00f6tavad p\u00f5him\u00f5ttel \u201ev\u00e4hem on parem\u201c. \u00dcht klasterdust samas \u00fclesandes v\u00f5ib pidada paremaks ja paremini sobitunuks andmetega kui teist (nt teise klastrite arvu korral), kui selle informatsioonikriteerium on v\u00e4iksem kui teisel. Kordajatel <i>AIC<\/i> ja <i>BIC<\/i> ei ole normv\u00e4\u00e4rtusi ega \u00fclemt\u00f5ket ja neid k\u00e4sitletakse v\u00f5rdlevalt.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Kaugusena on v\u00f5imalik kasutada t\u00f5ep\u00e4rafunktsioonil p\u00f5hinevat kaugust ja pidevate tunnuste puhul ka eukleidilist kaugust. Kahe klastri vaheline kaugus logaritmilise t\u00f5ep\u00e4rafunktsiooni kaudu defineeritakse selle alusel, kui palju kasvab t\u00f5ep\u00e4rafunktsioon, kui klastrid liita \u00fcheks (l\u00fchike sissevaade matemaatilisse k\u00fclge nt Bacher jt 2004). Eeldatakse indiviidide s\u00f5ltumatust \u00fcksteisest, pidevate tunnuste normaaljaotuse kohast jaotumist ja \u00fcksteisest s\u00f5ltumatust. Kategoriaalsete tunnuste puhul eeldatakse jaotumist klastreis multinomiaalse jaotuse kohaselt. Need on p\u00e4ris ranged piirangud ja selliseid l\u00e4hteandmeid on klasteranal\u00fc\u00fcsi jaoks raske leida (sh mittekorreleeritus). Siiski m\u00e4rgitakse ka mooduli tehnilistes saatematerjalides, et meetod on k\u00fcllaltki tundetu nende eelduste rikkumise suhtes (vt <i>TwoStep Cluster Analysis. IBM Knowledge Center<\/i> \u2026). <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Praktika on n\u00e4idanud, et kahesammulise protseduuri eristusv\u00f5ime on hea, kui klasterdustunnused on pidevad, kuid kategoriaalseid tunnuseid kaasates kaldutakse klasterdamisel neid \u00fcle t\u00e4htsustama ja vahel m\u00e4\u00e4ratakse klastrid eelk\u00f5ige kategoriaalsete tunnuste j\u00e4rgi. Algoritm m\u00e4\u00e4rab soovi korral ise klastrite arvu, valides liigitust optimeeriva hulga klastreid. Pakutud klastrite arvu tuleb suhtuda kriitiliselt ja arvestada selle heakskiitmisel konkreetse uurimis\u00fclesande vajadustega. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Kahesammulise klasteranal\u00fc\u00fcsi \u00fcheks plussiks on tulemuste lihtne loetavus. Arvutabelite kujul v\u00e4ljundiga harjunud uurijale v\u00f5ib selle mooduli visualiseeritud tulemuste esitus tunduda ehk pisut liiga \u201eligikaudsena\u201c, aga klasteranal\u00fc\u00fcsi v\u00e4ltimatut subjektiivset komponenti arvestades on \u00fcldmulje loomine vahel olulisemgi kui arvude n\u00e4iline v\u00e4\u00e4rikus. <\/span><\/p>\n<a href=\"#\" data-bs-toggle=\"modal\" data-bs-target=\"#popup-modal\" data-title=\"Kahesammuline klasteranal\u00fc\u00fcs paketi SPSS abil\" data-content='&lt;\/p&gt;\n&lt;p style=\"border: none; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;Lihtrakendus&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;Vt ka &lt;i&gt;TwoStep Cluster Analysis. IBM Knowledge Center&lt;\/i&gt; \u2026 .&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;K\u00e4surida &lt;i&gt;Analyze \u2013 Classify \u2013 Two-Step Cluster Analysis&lt;\/i&gt; avab akna kahesammulise klasteranal\u00fc\u00fcsi p\u00f5hivalikute tegemiseks.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Categorical Variables&lt;\/i&gt; &lt;i&gt;\u2013&lt;\/i&gt; sellele v\u00e4ljale kanda kategoriaalsed klasterdustunnused.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Continuous Variables&lt;\/i&gt; &lt;i&gt;\u2013 &lt;\/i&gt;sellele v\u00e4ljale kanda&lt;i&gt; &lt;\/i&gt;pidevad (pidevana t\u00f5lgendatavad) klasterdustunnused.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Distance Measure &lt;\/i&gt;\u2013 kauguse valik kas t\u00f5ep\u00e4rafunktsiooni kaudu (&lt;i&gt;Log-likelihood&lt;\/i&gt;) v\u00f5i eukleidiline kaugus (&lt;i&gt;Euclidean&lt;\/i&gt;); eukleidilist kaugust saab valida siis, kui ei kasutata kategoriaalseid tunnuseid; t\u00f5ep\u00e4rafunktsiooni p\u00f5hine kaugus v\u00e4ljendab klasterduse t\u00f5ep\u00e4rafunktsiooni muutust, kui konkreetne objekt paigutada teatud klastrisse; eeldatakse tunnuste s\u00f5ltumatust ja jaotust normaaljaotuse kohaselt.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Number of clusters&lt;\/i&gt; &lt;i&gt;\u2013&lt;\/i&gt; klastrite arvu saab lasta leida automaatselt (&lt;i&gt;Determine Automatically&lt;\/i&gt;) piirates klastrite arvu maksimumi etteandmisega&lt;i&gt; &lt;\/i&gt;v\u00f5i nimetada ise (&lt;i&gt;Specify fixed&lt;\/i&gt;).&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Count of Continuous Variables &lt;\/i&gt;\u2013 klasterdustunnuseid on tungivalt soovitav standardida ja siin n\u00e4idatakse, kui mitu neist tuleb standardida lahenduse k\u00e4igus ja kui mitu on juba eelnevalt standarditud.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Clustering criterion &lt;\/i&gt;\u2013 klastrite arvu ja klastrite m\u00e4\u00e4ramiseks iseloomustatakse klasterstruktuuri sobitust andmetega t\u00f5ep\u00e4rafunktsiooni kaudu kasutades kas Schwarzi (Bayesi) kriteeriumi &lt;i&gt;BIC &lt;\/i&gt;v\u00f5i Akaike kriteeriumi &lt;i&gt;AIC&lt;\/i&gt; (traditsioonilised suurused t\u00e4nap\u00e4evase regressioonanal\u00fc\u00fcsi juures; \u201ckaristavad\u201d suure indiviidide arvu ja suure tunnuste arvu eest mitmem\u00f5\u00f5tmelise mudeli koostamisel); ei teeks paha lahendada j\u00e4rjest m\u00f5lema kriteeriumiga; toimivad p\u00f5him\u00f5ttel \u201cv\u00e4iksem on parem\u201d.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Options &lt;\/i&gt;\u2013 suvandite kaudu saab reguleerida lahendust enamjaolt selliste parameetritega, mis n\u00f5uavad aluseks oleva algoritmi detailsemat tundmist kui siinkohal jutuks (avage silmitsemiseks nupp &lt;i&gt;Advanced&lt;\/i&gt; \u2013 kehtestatakse anal\u00fc\u00fcsi aluseks oleva liigituspuu konstruktsiooni piirangud, sh eelklastrite arv; j\u00e4\u00e4b vaikimisi).&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Outlier treatment \u2013 &lt;\/i&gt;nupp&lt;i&gt; Use noise handling &lt;\/i&gt;korraldab erindite k\u00e4sitlust; ligil\u00e4hedaselt selles m\u00f5ttes, kas j\u00e4tta erindid k\u00f5rvale (kood -1) v\u00f5i p\u00fc\u00fcda neid mahutada liigituspuusse; erindite olemasolu v\u00f5iks v\u00f5imaluse korral uurida juba enne klasteranal\u00fc\u00fcsi.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: 6.0pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Standardization of continuous variables &lt;\/i&gt;\u2013 n\u00e4idatakse tabelit, kus saab m\u00e4\u00e4rata standardimist vajavad tunnused, suunates need v\u00e4ljale &lt;i&gt;To be standardized; &lt;\/i&gt;vaikimisi standarditakse k\u00f5ik pideval skaalal m\u00f5\u00f5detud tunnused.&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; text-align: justify; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Output &lt;\/i&gt;\u2013 kujundatakse klasterdustulemused:&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Pivot tables \u2013 toob esile klastrikeskmiste tabeli;&lt;\/i&gt;&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Charts and Tables in model Viewer \u2013 valiku Evaluation Fields abil saab m\u00e4\u00e4rata tunnused, mille abil iseloomustada klastreid t\u00e4iendavalt (mitte klasterdustunnused);&lt;\/i&gt;&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;Create cluster membership variable \u2013 seda valides salvestatakse klastrinumbrite tunnus standardnimega, mille algus on TSC_; &lt;\/i&gt;&lt;\/span&gt;&lt;\/p&gt;\n&lt;p style=\"border: none; margin-bottom: .0001pt; padding: 0cm;\"&gt;&lt;span style=\"line-height: normal;\"&gt;&lt;i&gt;XML Files \u2013 klasterduse l\u00f5pptulemused saab salvestada etteantud nimega failidena.&lt;\/i&gt; &lt;\/span&gt;&lt;\/p&gt;\n&lt;p&gt;'>Kahesammuline klasteranal\u00fc\u00fcs paketi SPSS abil<\/a>\n<p style=\"border: none; margin-bottom: .0001pt; padding: 0cm;\"><span style=\"line-height: normal;\">Kahesammulise klasteranal\u00fc\u00fcsi n\u00e4ite toome Euroopa sotsiaaluuringu 2018. aasta andmeil Eesti kohta (<i>European Social Survey<\/i> \u2026). Seame \u00fclesandeks leida klastrid arvamuste alusel immigratsiooni m\u00f5ju kohta Eestile, kaasates vanuser\u00fchma (nooremad kui 35; 35 aastat kuni 64; 65 aastat ja enam) ja kolm hinnangut vastavalt majanduses, kultuurielus ja \u00fcldiselt elus avalduva immigratsiooni efekti kohta. Nagu arvata, ei ole siin tegemist rangelt s\u00f5ltumatute tunnustega, sest hinnang \u00fche eluk\u00fclje puhul korreleerub hinnanguga teise eluk\u00fclje puhul: korrelatsioonikordaja 0,6\u20130,7 ringis. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Mida sellisel juhul teha, et meetodi eeldusi rahuldada, aga info s\u00e4ilitada? \u00dcks v\u00f5imalus on rakendada tunnuste teisendust peakomponentideks, mis teatavasti on mittekorreleeritud ja annavad summaarselt edasi 100% esialgsest variatiivsusest, kui moodustada tunnuste arvuga v\u00f5rdne arv peakomponente. Meie \u00fclesandes osutusid peakomponendid ligikaudu kolme algtunnuse omap\u00e4rakomponentideks (iga\u00fchel \u00fcks suur laadung ja \u00fclej\u00e4\u00e4nud v\u00e4iksed, aga mitte nullid). Siiski me ei l\u00e4he seda teed ja eesk\u00e4tt n\u00f6 didaktilistel kaalutlustel, sest peakomponentide v\u00e4\u00e4rtusi (standarditud, kuid siiski subjektiivse t\u00f5lgendusega) oleks tulemuste seletamisel keeruline kasutada. L\u00e4hme eelduste osalise eiramise teed ja loodame lahendi stabiilsusele eelduste n\u00f5rga arvestamise juhul.<\/span><\/p>\n<p style=\"margin-bottom: .0001pt; text-align: justify;\"><span style=\"line-height: normal;\">Kolm pidevat tunnust, mida lisaks vanuser\u00fchmale (kategoriaalne tunnus) kasutame, on j\u00e4rgmised (hinnangu andnute arvud vastavalt 1860, 1874, 1867). <\/span><\/p>\n<ul>\n<li style=\"text-align: justify;\"><span lang=\"ET\">\u00dcldiselt hinnates, kas see m\u00f5jub Eesti majandusele h\u00e4sti v\u00f5i halvasti, kui teistest riikidest inimesed siia elama tulevad? 0 \u2013 m\u00f5jub majandusele halvasti, 10 \u2013 m\u00f5jub majandusele h\u00e4sti; keskmine 4,8, standardh\u00e4lve 2,4;<\/span><\/li>\n<li style=\"text-align: justify;\"><span lang=\"ET\">Mida Te arvate, kas teistest riikidest inimeste Eestisse elama asumine pigem kahjustab v\u00f5i rikastab Eesti kultuurielu? 0 \u2013 kahjustab kultuurielu, 10 \u2013 rikastab kultuurielu; keskmine 5,1, standardh\u00e4lve 2,4;<\/span><\/li>\n<li style=\"margin-top: 0cm; margin-right: 0cm; margin-bottom: 6.0pt; text-align: justify;\"><span lang=\"ET\">Kas Eesti muutuks elukoha m\u00f5ttes halvemaks v\u00f5i paremaks paigaks, kui teistest riikidest inimesed siia elama tulevad? 0 \u2013 halvemaks elupaigaks, 10 \u2013 paremaks elupaigaks; keskmine 4,4, standardh\u00e4lve 2,1.<\/span><\/li>\n<\/ul>\n<p style=\"margin-bottom: 6.0pt; text-align: justify;\"><span style=\"line-height: normal;\">Saadud klasterduse toome esile v\u00f5imalikult nende tabelite-jooniste kaudu, mis kuuluvad paketi SPSS v\u00e4ljundisse selle mooduli korral. Artiklis v\u00f5i muus publitseeritavas t\u00f6\u00f6s vajavad need kindlasti kohendamist.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Joonisel 8 on esitatud saadud klasterduse \u00fcldvaade. Algoritm pakub (m\u00f5lema kriteeriumi, nii AIC kui BIC korral) seitsmeklastrilist lahendust. Lisaks illustreeritakse graafiliselt klasterduse kvaliteedi iseloomustamiseks siluetikordaja (ik <i>silhouette measure<\/i>) v\u00e4\u00e4rtust. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Siluetikordaja t\u00e4henduse m\u00e4\u00e4ravad kaks keskmist kaugust: elemendi kaugus oma klastri tsentrini ja kaugus l\u00e4hima mitte-oma klastri tsentrini. Parimal klasterdusel on k\u00f5igi indiviidide peale kokku esimene kaugus nullil\u00e4hedane ja halvimal juhul on nullil\u00e4hedane teine nimetatud kaugustest. Nende kauguste kaudu m\u00e4\u00e4ratud vahe teatud standarditud viisil m\u00e4\u00e4rabki siluetikordaja piirides -1 kuni 1. Selles vahemikus on SPSS m\u00e4\u00e4ranud (kokkuleppeliselt muidugi) halva, keskmise ja hea lahenduse tsoonid, mida n\u00e4idatakse v\u00e4rvidega. Negatiivne skaalaosa t\u00e4hendab seda, et oma klastri sees on kaugused suuremad kui klastrite vahel (v\u00e4ga ebaloomulik tulemus). Positiivne skaalaosa t\u00e4hendab vastupidist ja soovitavat olukorda: oma klastri sees on kaugused v\u00e4iksemad kui klastrite vahel. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Et siluetikordaja on meie n\u00e4ites seitsmeklastrilises lahenduses rohelise ala piiril (silma j\u00e4rgi 0,45, vasakpoolne diagramm), siis v\u00f5iksime klasterdust usaldada. Siiski proovime, millise tulemuse saaksime v\u00e4iksema, etteantud klastrite arvu, nt nelja klastri korral. Nagu samalt jooniselt n\u00e4htub, ei v\u00e4henenud kvaliteet m\u00e4rgatavalt (ikka hea klasterduse poolel, parempoolne diagramm), aga klastrid on loodetavasti suuremad ja niiviisi tulemus statistiliselt suurema kaaluga klastri edaspidise anal\u00fc\u00fcsi seisukohalt. Joonisel kujutatu on \u201duks\u201d klasterduse l\u00e4hivaate aknasse (ik <i>Model Viewer<\/i>) ja see avaneb topeltkl\u00f5psuga.<\/span><\/p>\n<figure id=\"attachment_154\" aria-describedby=\"caption-attachment-154\" style=\"width: 794px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-154\" title=\"Joonis 8. Klasterduse kokkuv\u00f5te seitsme (vasakul) ja nelja klastri (paremal) korral. T\u00f5lge: Mudeli kokkuv\u00f5te. Algoritm \u2013 kahesammuline. Sisendtunnused \u2013 4. Klastri kvaliteet; siluetikordaja sidususe ja eraldatuse m\u00f5\u00f5tmiseks.\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.55.26.png\" alt=\"Joonis 8. Klasterduse kokkuv\u00f5te seitsme (vasakul) ja nelja klastri (paremal) korral. T\u00f5lge: Mudeli kokkuv\u00f5te. Algoritm \u2013 kahesammuline. Sisendtunnused \u2013 4. Klastri kvaliteet; siluetikordaja sidususe ja eraldatuse m\u00f5\u00f5tmiseks.\" width=\"794\" height=\"303\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.55.26.png 794w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.55.26-300x114.png 300w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.55.26-768x293.png 768w\" sizes=\"auto, (max-width: 794px) 100vw, 794px\"><figcaption id=\"caption-attachment-154\" class=\"wp-caption-text\">Joonis 8. Klasterduse kokkuv\u00f5te seitsme (vasakul) ja nelja klastri (paremal) korral. T\u00f5lge: Mudeli kokkuv\u00f5te. Algoritm \u2013 kahesammuline. Sisendtunnused \u2013 4. Klastri kvaliteet; siluetikordaja sidususe ja eraldatuse m\u00f5\u00f5tmiseks.<\/figcaption><\/figure>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Mudeli l\u00e4hivaate aknal on kaks poolt: vasak pool klastrite kokkuv\u00f5tteks ning parem pool \u00fcldandmeiks ja vasaku poole \u00fcksikelementide suumitud uurimiseks. Kui avada neljaklastriline klasterdus mudeli aknas, siis n\u00e4eme vasakus aknapooles joonisel 8 (parempoolne diagramm) ja paremas aknapooles joonisel 9 esitatud pilti. <\/span><\/p>\n<figure id=\"attachment_155\" aria-describedby=\"caption-attachment-155\" style=\"width: 442px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-155\" title=\"Joonis 9. Jaotus neljaks klastriks\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.56.09.png\" alt=\"Joonis 9. Jaotus neljaks klastriks\" width=\"442\" height=\"539\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.56.09.png 442w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.56.09-246x300.png 246w\" sizes=\"auto, (max-width: 442px) 100vw, 442px\"><figcaption id=\"caption-attachment-155\" class=\"wp-caption-text\">Joonis 9. Jaotus neljaks klastriks<\/figcaption><\/figure>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Nagu n\u00e4ha jooniselt 9, on kogumi jaotus neljaks klastriks nende suuruse poolest vastuv\u00f5etav. \u00dckski klaster ei ole v\u00e4ga v\u00e4ike ja v\u00e4him klaster on suuruse poolest pisut enam kui pool suurimast. Tabelist 16 n\u00e4eme, et klasterdamises osales 1826 indiviidi. Et kokku k\u00fcsitleti 1904 indiviidi, siis l\u00e4ks l\u00fcnkade t\u00f5ttu kaotsi 78 (4%), mis ei ole palju vastamisel nii keerulisele k\u00fcsimusele, nagu on seda immigratsiooni m\u00f5ju.<\/span><\/p>\n<p>Tabel 16. Klastrite suurus<\/p>\n<p style=\"text-align: justify;\"><img loading=\"lazy\" decoding=\"async\" width=\"251\" height=\"161\" class=\"alignnone wp-image-156\" title=\"Tabel 16. Klastrite suurus\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.56.53.png\" alt=\"Tabel 16. Klastrite suurus\"><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Klastrite profiil klastrite keskpunktide ja vanuser\u00fchmade vahelise jaotuse j\u00e4rgi on kokkuv\u00f5tlikult esitatud tabelis 17. Kommentaari selle jaotuse kohta toome analoogilise teabe kohta tehtud joonise 10 juures.<\/span><\/p>\n<p>Tabel 17. Klastrite profiil<\/p>\n<p style=\"text-align: justify;\"><img loading=\"lazy\" decoding=\"async\" width=\"666\" height=\"435\" class=\"alignnone wp-image-157\" title=\"Tabel 17. Klastrite profiil\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.57.32.png\" alt=\"Tabel 17. Klastrite profiil\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.57.32.png 666w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.57.32-300x196.png 300w\" sizes=\"auto, (max-width: 666px) 100vw, 666px\"><\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 6.0pt 0cm;\"><span style=\"line-height: normal;\">P\u00f6\u00f6rdume tagasi l\u00e4hivaate akna, st graafilise tulemuste esituse juurde.<\/span><\/p>\n<p style=\"text-align: justify; margin: 12.0pt 0cm 6.0pt 0cm;\"><strong>Vasakpoolse akna vaated<\/strong><\/p>\n<p style=\"margin-bottom: 12.0pt; text-align: justify;\"><span style=\"line-height: normal;\">Mudeli akna kummalgi poolel on mitu vaadet. Vasakul poolel n\u00e4eme mudeli kokkuv\u00f5tet (ik <i>Model Summary<\/i>) ja veel on selles aknapooles v\u00f5imalik asuda klastrite vaate juurde (ik <i>Clusters View<\/i>). Nende vahel saab akna seisu vahetada akna allservas oleva nupu <i>View <\/i>abil. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Joonisel 10 on esitatud klastrite vaade \u2013 skeem, kus antakse klastrite iseloomustus suuruse (rohekad tulbad r\u00f5htsel tulpdiagrammil), iga klastri vanuseline iseloomustus ja vaadeldava kolme hinnangu keskmised. Veerg skeemil vastab klastrile ja rida tunnusele. Tunnused on j\u00e4rjestatud selle j\u00e4rgi, kui t\u00e4htis on tunnus klastrite eristajana. Vanuser\u00fchm on praegu suurima t\u00e4htsusega klasterdaja (tumedaim toon). Nagu n\u00e4ha, neljaklastrilises liigenduses noorim ja vanim vanuser\u00fchm edasi ei jaotu, k\u00fcll aga keskmine, milles eristuvad immigratsiooni m\u00f5jule positiivsete (suuremad keskmised) ja negatiivsete (v\u00e4ikesed keskmised) hinnangute andjad. Kui oleksime avanud ka automaatselt pakutud seitsmeklastrilise liigituse, siis oleksime klasterdusena n\u00e4inud k\u00f5igi vanuser\u00fchmade jaotumist osadeks vastavalt positiivsetele ja negatiivsele arvamusele immigratsiooni kohta, keskmine vanuser\u00fchm koguni kolmeks. Paraku oleksid siis osa r\u00fchmi v\u00e4ikesed ja \u00fcldistuseks v\u00e4hese statistilise kindlusega.<\/span><\/p>\n<figure id=\"attachment_158\" aria-describedby=\"caption-attachment-158\" style=\"width: 685px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-158\" title=\"Joonis 10. Klastrite vaade\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.58.44.png\" alt=\"Joonis 10. Klastrite vaade\" width=\"685\" height=\"618\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.58.44.png 685w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.58.44-300x271.png 300w\" sizes=\"auto, (max-width: 685px) 100vw, 685px\"><figcaption id=\"caption-attachment-158\" class=\"wp-caption-text\">Joonis 10. Klastrite vaade<\/figcaption><\/figure>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Klastrite vaadet kujundatakse nupureaga <i>Display<\/i> akna allservas, kusjuures kursori peatumisel nupu juures n\u00e4idatakse selle nime. Samal moel n\u00e4eb skeemi lahtreil liikudes sellele lahtrile vastavat lisateavet: kursori peatamisel lahtri kohal n\u00e4idatakse lahtrit iseloomustavaid arve eraldi h\u00fcpikaknas. Nupu <i>Cells show cluster centers<\/i> abil n\u00e4idatakse iga klastri korral iga tunnuse keskmist (v\u00f5i kategoriaalse tunnuse puhul protsentuaalset osat\u00e4htsust, mis on \u00fchtlasi vaikimisi valik). Samuti osutatakse graafiliselt ja numbriliselt iga klastri suurus. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Tunnuseid saab j\u00e4rjestada tabelis soovitud j\u00e4rjekorras (ja legendi alusel vastavas v\u00e4rvitoonis). Selleks on akna allservas sortimisele viitavad ikoonid ja iga\u00fche juures nimetus: \u00fcldise t\u00e4htsuse j\u00e4rgi (ik <i>Sort features by overall importance<\/i>), t\u00e4htsuse j\u00e4rgi klastri sees (ik <i>Sort features by importance within cluster<\/i>), nime j\u00e4rgi (ik <i>Sort features by name<\/i>) v\u00f5i j\u00e4rjekorra j\u00e4rgi andmestikus (ik <i>Sort features by data order<\/i>). Nupule vajutamisel vastav tegevus k\u00e4ivitub kohe. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Klastritele v\u00f5ib tabelis anda nimed ja kirjutada juurde vajadusel pikema kirjelduse. Ka klastreid v\u00f5ib \u00fcmber sortida nime ja suuruse j\u00e4rgi (ik vastavalt <i>Sort clusters by name\/label, Sort clusters by Size<\/i>). Selleks sobiv nupp on samuti akna allservas.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Peale numbrilise vaate v\u00f5ib esile tuua ka ainult tunnusenimed soovi kohases j\u00e4rjestuses (parempoolseim nupp <i>Cells show basic information<\/i>). Teisalt saab nuppudega <i>Cells show absolute distribution<\/i> ja <i>Cells show relative distribution<\/i> igas lahtris esile tuua vastavalt tunnuse sagedusjaotuse ja protsentjaotuse pinddiagrammide kujul. Sagedusjaotused peegeldavad ka klastrite suurust ja protsentjaotused annavad v\u00f5imaluse v\u00f5rrelda klastreid iseloomu poolest. Joonisel 11 on n\u00e4idatud neljaklastriline liigitus klastrisiseste protsentjaotuste kaudu.<\/span><\/p>\n<figure id=\"attachment_159\" aria-describedby=\"caption-attachment-159\" style=\"width: 692px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-159\" title=\"Joonis 11. Klasterdustunnuste protsentjaotused neljaklastrilise liigituse klastreis\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.59.31.png\" alt=\"Joonis 11. Klasterdustunnuste protsentjaotused neljaklastrilise liigituse klastreis\" width=\"692\" height=\"613\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.59.31.png 692w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_09.59.31-300x266.png 300w\" sizes=\"auto, (max-width: 692px) 100vw, 692px\"><figcaption id=\"caption-attachment-159\" class=\"wp-caption-text\">Joonis 11. Klasterdustunnuste protsentjaotused neljaklastrilise liigituse klastreis<\/figcaption><\/figure>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Klastrid on j\u00e4rjestatud suuruse j\u00e4rjekorras. N\u00e4eme, et suurimas, kolmandas klastris on k\u00f5igi kolme tunnuse jaotused kaldunud positiivse hinnangu poole, kuid neljandas klastris, vastupidi, madalate hinnangute poole. Need m\u00f5lemad klastrid koosnevad 35\u201364-aastastest isikutest. Noorimas vanuser\u00fchmas (kuulub tervikuna klastrisse 2) on hinnangud pigem head (aga leidub ka madalaid hinnanguid, vasak serv lahtri jaotuse skeemil) ja vanimas vanuser\u00fchmas (kuulub tervikuna klastrisse 1) pigem halvad, aga leidub ka m\u00f5ju k\u00f5rgelt hindavaid isikuid (parem serv lahtri jaotuse skeemil).<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Kogu klastrite vaadet saab p\u00f6\u00f6rata: read veergudeks ja vastupidi (vasakpoolseim ikoon aknas, <i>Transpose clusters and Features<\/i>). See on kasulik vaate parandamiseks (ridu mahub aknasse rohkem kui veerge). Kui tahame mis tahes vaate t\u00fchistada, siis aitab nupp <i>Reset<\/i> algseisu taastada (vahel ka siis, kui aken sattub vaadete vahetusega segadusse. Akna vaadete eri kihte saab h\u00f5lpsasti kopeerida akna \u00fclaosas olevate nuppude varal ja eksportida vajalikku kohta.<\/span><\/p>\n<p style=\"text-align: justify;\"><strong>Parempoolse akna vaated<\/strong><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Mudeli l\u00e4hivaate akna paremal poolel on neli vaadet nupu <i>View<\/i> valikuga: jaotus klastreiks <i>Cluster Sizes<\/i>, vasakus aknapooles m\u00e4rgitud lahtri jaotus valikuga <i>Cell Distribution<\/i>, tunnuste t\u00e4htsuse diagramm klasterdamisel valikuga <i>Variable Importance<\/i> ja klastrite v\u00f5rdluse karpdiagramm valikuga <i>Cluster Comparison<\/i>.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Jaotust klastreiks kujutavat ringdiagrammi vaatlesime juba eespool (joonis 9). <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Joonisel 12 on toodud esile suurima r\u00fchma (klaster 3, vanus 35\u201364 aastat) majanduselule avalduva m\u00f5ju hinnangute l\u00e4hivaade: sagedusjaotus (vasakul) ja protsentjaotus (paremal). Sagedusjaotuse puhul on osutatud taustaks ka veel \u00fcldine jaotus (ik <i>overall<\/i>). Suumitult n\u00e4eme \u00fcksikasjalikumalt, kuidas on jaotunud vastused klastris, nt protsentjaotuse tipp 7 ja 8 punkti vahel. Jaotuste \u00fcksikasjalik vaatlus aitab klastreid paremini t\u00f5lgendada. Sellise vaate saamiseks tuleb vastav lahter vasakus aknapoolses aktiviseerida.<\/span><\/p>\n<figure id=\"attachment_160\" aria-describedby=\"caption-attachment-160\" style=\"width: 708px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-160\" title=\"Joonis 12. Immigratsiooni poolt majanduselule avalduva m\u00f5ju hinnangud klastris 3. T\u00f5lge: Lahtri jaotus. Sagedus.\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.01.02.png\" alt=\"Joonis 12. Immigratsiooni poolt majanduselule avalduva m\u00f5ju hinnangud klastris 3. T\u00f5lge: Lahtri jaotus. Sagedus.\" width=\"708\" height=\"377\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.01.02.png 708w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.01.02-300x160.png 300w\" sizes=\"auto, (max-width: 708px) 100vw, 708px\"><figcaption id=\"caption-attachment-160\" class=\"wp-caption-text\">Joonis 12. Immigratsiooni poolt majanduselule avalduva m\u00f5ju hinnangud klastris 3. T\u00f5lge: Lahtri jaotus. Sagedus.<\/figcaption><\/figure>\n<p style=\"text-align: justify; margin: 6.0pt 0cm 6.0pt 0cm;\"><span style=\"line-height: normal;\">Joonisel 13 on graafiliselt iseloomustatud klasterdustunnuste t\u00e4htsust klastrite \u00fcksteisest eristamisel (ik <i>Variable Importance<\/i>)<i>. <\/i>Tunnuse t\u00e4htsus klastrite eristajana peegeldab suhteliselt tunnuse osa klasterstruktuuri tekkimisel. Kategoriaalse tunnuse korral on aluseks tunnuse jaotuse v\u00f5rdlus klastris selle tunnuse \u00fcldjaotusega, pideva tunnuse puhul \u2013 klastrikeskmise ja \u00fcldkeskmise teatav k\u00f5rvutus. <\/span><\/p>\n<p style=\"text-align: justify; margin: 6.0pt 0cm 6.0pt 0cm;\"><span style=\"line-height: normal;\">Olulisim klasterdustunnus on vanuser\u00fchm, nagu juba ka eespool veendusime (joonisel v\u00f5etud v\u00f5rdseks arvuga 1). Hinnangutunnused on suhtelisel skaalal enam kui poole v\u00e4iksema t\u00e4htsusega (eespool mainitud kategoriaalsete tunnuste \u201e\u00fclemv\u00f5im\u201c klasterdamisel), neist t\u00e4htsaim on m\u00f5juhinnang elupaigale. Selle diagrammi alusel v\u00f5ib m\u00f5nikord kaaluda v\u00e4ga v\u00e4ikese t\u00e4htsusega tunnuste k\u00f5rvalej\u00e4tmist klasterdusest. Praegu selleks alust ei ole.<\/span><\/p>\n<figure id=\"attachment_161\" aria-describedby=\"caption-attachment-161\" style=\"width: 487px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-161\" title=\"Joonis 13. Klasterdustunnuste t\u00e4htsus klastrite moodustamisel\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.01.40.png\" alt=\"Joonis 13. Klasterdustunnuste t\u00e4htsus klastrite moodustamisel\" width=\"487\" height=\"373\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.01.40.png 487w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.01.40-300x230.png 300w\" sizes=\"auto, (max-width: 487px) 100vw, 487px\"><figcaption id=\"caption-attachment-161\" class=\"wp-caption-text\">Joonis 13. Klasterdustunnuste t\u00e4htsus klastrite moodustamisel<\/figcaption><\/figure>\n<p style=\"text-align: justify; margin: 6.0pt 0cm 6.0pt 0cm;\"><span style=\"line-height: normal;\">Klastrite omavaheline visuaalne v\u00f5rdlus toimub karpdiagrammi abil.<i> <\/i>Klastrite v\u00f5rdlemiseks tuleb vasakpoolses aknas m\u00e4rkida v\u00f5rreldavate klastrite veerud (kas k\u00f5ik v\u00f5i erihuvi pakkuvad klastrid). Parempoolses aknas osutatakse valiku <i>View \u2013 Cluster Comparison<\/i> korral iga tunnuse jaoks \u00fcldine karpdiagramm (r\u00f5htne ristk\u00fclik) ja igas v\u00f5rreldavas klastris mediaan (marker) ning kvartiilhaare (r\u00f5htsad markerist l\u00e4htuvad jooned kvartiilide kauguseni). See on hea \u00fclevaade tunnuse jaotusest nii \u00fcldiselt kui ka klastreis. Mida enam erinevad klastrid konkreetse tunnuse poolest, seda t\u00e4htsamaks osutus ka see tunnus klastrite koostamisel. <\/span><\/p>\n<figure id=\"attachment_162\" aria-describedby=\"caption-attachment-162\" style=\"width: 569px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-162\" title=\"Joonis 14. Klastrite v\u00f5rdlus mediaanide ja kvartiilide alusel\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.02.16.png\" alt=\"Joonis 14. Klastrite v\u00f5rdlus mediaanide ja kvartiilide alusel\" width=\"569\" height=\"452\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.02.16.png 569w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.02.16-300x238.png 300w\" sizes=\"auto, (max-width: 569px) 100vw, 569px\"><figcaption id=\"caption-attachment-162\" class=\"wp-caption-text\">Joonis 14. Klastrite v\u00f5rdlus mediaanide ja kvartiilide alusel<\/figcaption><\/figure>\n<p style=\"margin-bottom: 6.0pt; text-align: justify;\"><span style=\"line-height: normal;\">Joonisel 14 on kujutatud karpdiagrammide abil k\u00f5ik neli klastrit. Vanuser\u00fchma (kategoriaalne tunnus) jaotus klastrite vahel n\u00e4idatakse klastrile vastava ringi v\u00e4rvi ja suuruse abil. N\u00e4eme juba tuttavat pilti: noorim ja vanim vanuser\u00fchm j\u00e4\u00e4vad kokku ja keskmine lahutub kaheks, suuremaks (helesinine ehk klaster 3) ja v\u00e4iksemaks osaks (roheline ehk klaster 4). \u00dcldise jaotuse karpdiagrammidelt n\u00e4eme, et kultuurielule avalduva m\u00f5ju hinnangud on teistest pisut suurema hajuvusega (karp k\u00f5ige laiem, kvartiilhaare suurim). Elupaiga m\u00f5ju hinnangu puhul langesid mediaan ja \u00fclemine kvartiil kokku (pidev skaala, mida kasutasime t\u00e4isarvuliste vastuste kujul). <\/span><\/p>\n<p style=\"margin-bottom: 6.0pt; text-align: justify;\"><span style=\"line-height: normal;\">Klastrite karpdiagrammi analoogideks on vastavat v\u00e4rvi horisontaaljooned alumise ja \u00fclemise kvartiili kaugusel mediaani m\u00e4rkivast markerist. Rohelise klastri 4 (osa keskmisest vanuser\u00fchmast) hinnangud immigratsioonile on k\u00f5ige halvemad. J\u00e4rgmisteks v\u00f5iks pidada punase klastri 1 liikmete hinnanguid (vanem vanuser\u00fchm) ja tumesinise klastri 2 hinnanguid (noorem vanuser\u00fchm). Suhteliselt veidi paremad on helesinise klastri 3 liikmete hinnangud (suurem osa keskmisest vanuser\u00fchmast). J\u00e4rjekord ei ole muidugi v\u00e4ga selge ja erineb eri tunnuste puhul.<\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Klastrite t\u00e4henduse t\u00e4iendamiseks anname nende iseloomustuse veel ka m\u00f5nede taustatunnuste poolest, milleks kasutame klasterduse k\u00e4igus andmestikule lisatud klastrinumbrite tunnust.<\/span><\/p>\n<figure id=\"attachment_163\" aria-describedby=\"caption-attachment-163\" style=\"width: 594px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-163\" title=\"Joonis 15. Klastrikeskmine poliitiline usaldus\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.02.56.png\" alt=\"Joonis 15. Klastrikeskmine poliitiline usaldus\" width=\"594\" height=\"317\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.02.56.png 594w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.02.56-300x160.png 300w\" sizes=\"auto, (max-width: 594px) 100vw, 594px\"><figcaption id=\"caption-attachment-163\" class=\"wp-caption-text\">Joonis 15. Klastrikeskmine poliitiline usaldus<\/figcaption><\/figure>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Joonisel 15 on n\u00e4idatud eelmises, <i>k<\/i>-keskmiste meetodi osas tutvustatud poliitilise usalduse tunnuste standarditud v\u00e4\u00e4rtuste keskmised klastreis. Kasutatud on samu v\u00e4rve nagu klastrite v\u00f5rdluses joonisel 14. N\u00e4eme neljanda (rohelise, immigratsiooni m\u00f5ju suhteliselt halvemaks hindavate isikute) klastri liikmete keskmiselt teiste klastrite liikmeist madalamat usaldust poliitiliste institutsioonide suhtes. Ka esimese, vanema vanuser\u00fchma isikute klastri (punane) hinnangud olid pigem m\u00f5\u00f5dukad ja nad on poliitilise usalduse poolest keskjoonel v\u00f5i kohati alla-\u00fcle selle. Tumesinise ja helesinise klastri liikmete hinnangud immigratsiooni m\u00f5ju suhtes olid pigem \u00a0hea poole ja poliitiline usaldus ei j\u00e4\u00e4 alla keskmist. N\u00e4eme niisiis, et immigratsiooni suhtes positiivsemate hinnangutega kaasneb teataval m\u00e4\u00e4ral suurem usaldus oma riigi ja t\u00e4htsate globaalsete institutsioonide vastu. <\/span><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Selle peat\u00fcki otste kokkut\u00f5mbamiseks tegime veel \u00fche anal\u00fc\u00fcsi, kus p\u00fc\u00fcdsime v\u00f5rrelda \u00e4sja kirjeldatud klasterdust samade tunnuste alusel <i>k<\/i>-keskmiste meetodil saaduga, kasutades seejuures vanust t\u00e4isaastates, mitte vanuser\u00fchmi. Suhteliselt hea kokkulangevus tekkis <i>k<\/i>-keskmiste meetodi kolmeklastrilise liigitusega. Kolm klastrit <i>k<\/i>-keskmiste meetodil tulid (kokkuleppeliste nimedega) j\u00e4rgmised: 1 \u2013 suhteliselt vanemad ja m\u00f5\u00f5dukalt positiivsed (keskmine vanus 67, kolm hinnangut vastavalt 5,2, 5,5 ja 4,8), 2 \u2013 keskealised negatiivse hinnanguga (keskmine vanus 51, kolm hinnangut vastavalt 2,3, 2,5 ja 2,1), 3 \u2013 suhteliselt nooremad, positiivse hinnanguga (keskmine vanus 34, kolm hinnangut vastavalt 6,4, 6,7, 5,9). Kokkulangevused neljaklastrilise kahesammulise klasterdusega on n\u00e4idatud tabelis 18 (kasutame ettevaatlikult ka nende klastrite puhul kokkuleppelisi nimesid).<\/span><\/p>\n<p>Tabel 18. N\u00e4ite klasterduste kokkulangevusi <em>k<\/em>-keskmiste meetodil ja kahesammulise klasteranal\u00fc\u00fcsiga<\/p>\n<p style=\"text-align: justify;\"><img loading=\"lazy\" decoding=\"async\" width=\"706\" height=\"278\" class=\"alignnone wp-image-164\" title=\"Tabel 18. N\u00e4ite klasterduste kokkulangevusi k-keskmiste meetodil ja kahesammulise klasteranal\u00fc\u00fcsiga\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.03.40.png\" alt=\"Tabel 18. N\u00e4ite klasterduste kokkulangevusi k-keskmiste meetodil ja kahesammulise klasteranal\u00fc\u00fcsiga\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.03.40.png 706w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.03.40-300x118.png 300w\" sizes=\"auto, (max-width: 706px) 100vw, 706px\"><\/p>\n<p style=\"text-align: justify;\"><span style=\"line-height: normal;\">Selgelt eristus negatiivsete hinnangutega keskealiste isikute r\u00fchm, kus kahesammulise klasterduse vastavast klastrist kuulus 93% <i>k<\/i>-keskmiste meetodi analoogilisse klastrisse. Ka vanemaealiste suhteliselt m\u00f5\u00f5dukate hinnangutega indiviidide r\u00fchmad langevad kahes klasterduses suures osas kokku (75%). Samuti moodustavad nooremad positiivsete hinnangute indiviidid m\u00f5lemas klasterduses esiletuleva p\u00fcsiva koosseisuga r\u00fchma (79%). Neljaklastrilise liigenduse \u201ekeskmises vanuses positiivsed\u201c jagatakse <i>k<\/i>-keskmiste meetodil laiali umbes pooleks <i>k<\/i>-keskmiste meetodi kahe r\u00fchma vahel. Kokkulangevusi on seega piisavalt ja erinevuste taga v\u00f5ib olla vanuse erisugune k\u00e4sitlus kord vanuser\u00fchmana, kord t\u00e4isaastates vanusena. Kui koostasime kahesammulise kolmeklastrilise t\u00e4isaastates m\u00f5\u00f5detud vanusega klasterduse, siis saime t\u00f5lgenduslikult samad klastrid nagu <i>k<\/i>-keskmiste meetodil, kusjuures individuaalne kokkulangevus \u00fcletas 80%, seega oli hea.<\/span><\/p>\n<p><\/p><\/div>\n        <\/div>\n        <\/div>\n    <\/div>\n<p><\/p><div class=\"accordion mb-3\">\n        <div class=\"accordion-item accordion-item--white\">\n        <h2 class=\"accordion-header\" id=\"accordion-69de5cf5ddef0-heading\">\n            <button class=\"accordion-button collapsed\" type=\"button\" data-bs-toggle=\"collapse\" data-bs-target=\"#accordion-69de5cf5ddef0-collapse\" aria-expanded=\"true\" aria-controls=\"accordion-69de5cf5ddef0-collapse\">Kasutatud kirjandus<\/button>\n        <\/h2>\n        <div id=\"accordion-69de5cf5ddef0-collapse\" class=\"accordion-collapse collapse\" aria-labelledby=\"accordion-69de5cf5ddef0-heading\">\n            <div class=\"accordion-body\">\n<p style=\"margin-bottom: 6.0pt;\">Bacher, J., Wenzig, K., Vogler, M. (toim.). (2004). SPSS TwoStep Cluster \u2013 a first evaluation. N\u00fcrnberg: Universit\u00e4t Erlangen-N\u00fcrnberg, Sozialwissenschaftliches Institut, Lehrstuhl f\u00fcr Soziologie. URL: <a href=\"http:\/\/nbn-resolving.de\/urn:nbn:de:0168-ssoar-327153\">http:\/\/nbn-resolving.de\/urn:nbn:de:0168-ssoar-327153<\/a>.<\/p>\n<p style=\"margin-bottom: 6.0pt; text-align: justify;\"><span style=\"line-height: normal;\">Choi, S.-S., Cha, S.-H., Tappert, C. (2010). A Survey of Binary Similarity and Distance Measures. <i>Systemics, Cybernetics and Informatics<\/i>, 8, 1, 43\u201348.<\/span><\/p>\n<p style=\"margin-bottom: .0001pt;\"><span style=\"line-height: normal;\">Desgraupes, B. <i>Clustering Indices.<\/i> <\/span><\/p>\n<p style=\"margin-bottom: 6.0pt;\"><span style=\"line-height: normal;\">(<a href=\"https:\/\/cran.r-project.org\/web\/packages\/clusterCrit\/vignettes\/clusterCrit.pdf\">https:\/\/cran.r-project.org\/web\/packages\/clusterCrit\/vignettes\/clusterCrit.pdf<\/a>; vaadatud 31.12.2019).<\/span><\/p>\n<p style=\"margin-bottom: 6.0pt;\"><span style=\"line-height: normal;\"><span lang=\"ET\" style=\"color: black;\">IBM Knowledge Center. <i>Distancies.<\/i> (<\/span><a href=\"https:\/\/www.ibm.com\/support\/knowledgecenter\/SSLVMB_sub\/statistics_mainhelp_ddita\/spss\/base\/idh_prox.html\">https:\/\/www.ibm.com\/support\/knowledgecenter\/SSLVMB_sub\/statistics_mainhelp_ddita\/spss\/base\/idh_prox.html<\/a>; vaadatud <span style=\"color: black;\">30.12.2019). <\/span><\/span><\/p>\n<p style=\"margin-bottom: 6.0pt;\"><span style=\"line-height: normal;\">European Social Survey. (<a href=\"https:\/\/www.europeansocialsurvey.org\/about\/\">https:\/\/www.europeansocialsurvey.org\/about\/<\/a>; vaadatud 30.12.2019). <\/span><\/p>\n<p style=\"margin-bottom: 6.0pt;\"><span style=\"line-height: normal;\">IBM Knowledge Center. <i>Hierarchical Cluster Analysis. <\/i>(<a href=\"https:\/\/www.ibm.com\/support\/knowledgecenter\/SSLVMB_25.0.0\/statistics_mainhelp_ddita\/spss\/base\/idh_clus.html\">https:\/\/www.ibm.com\/support\/knowledgecenter\/SSLVMB_25.0.0\/statistics_mainhelp_ddita\/spss\/base\/idh_clus.html<\/a>; vaadatud 30.12.2019). <\/span><\/p>\n<p style=\"margin-bottom: 6.0pt;\"><span style=\"line-height: normal;\">IBM Knowledge Center. <i>k-Means Cluster Analysis.<\/i> (<a href=\"https:\/\/www.ibm.com\/support\/knowledgecenter\/en\/SSLVMB_24.0.0\/spss\/base\/idh_quic.html\">https:\/\/www.ibm.com\/support\/knowledgecenter\/en\/SSLVMB_24.0.0\/spss\/base\/idh_quic.html<\/a>; vaadatud 30.12.2019). <\/span><\/p>\n<p style=\"margin-bottom: 6.0pt;\"><span style=\"line-height: normal;\">Tooding, L.-M. (2015). <i>Andmete anal\u00fc\u00fcs ja t\u00f5lgendamine sotsiaalteadustes.<\/i> 2. t\u00e4iend tr. Tartu: Tartu \u00dclikooli Kirjastus, ptk 10.<\/span><\/p>\n<p style=\"margin-bottom: 6.0pt;\"><span style=\"line-height: normal;\">IBM Knowledge Center. <i>TwoStep Cluster Analysis.<\/i> (<a href=\"https:\/\/www.ibm.com\/support\/knowledgecenter\/kk\/SSLVMB_24.0.0\/spss\/base\/idh_twostep_main.html\">https:\/\/www.ibm.com\/support\/knowledgecenter\/kk\/SSLVMB_24.0.0\/spss\/base\/idh_twostep_main.html<\/a>; vaadatud 30.12.2019).<\/span><\/p>\n<p><\/p><\/div>\n        <\/div>\n        <\/div>\n    <\/div>\n<p><\/p><div class=\"accordion mb-3\">\n        <div class=\"accordion-item accordion-item--white\">\n        <h2 class=\"accordion-header\" id=\"accordion-69de5cf5ddef9-heading\">\n            <button class=\"accordion-button collapsed\" type=\"button\" data-bs-toggle=\"collapse\" data-bs-target=\"#accordion-69de5cf5ddef9-collapse\" aria-expanded=\"true\" aria-controls=\"accordion-69de5cf5ddef9-collapse\">Kasutatud andmed<\/button>\n        <\/h2>\n        <div id=\"accordion-69de5cf5ddef9-collapse\" class=\"accordion-collapse collapse\" aria-labelledby=\"accordion-69de5cf5ddef9-heading\">\n            <div class=\"accordion-body\">\n<h2>Maakondade andmestik<\/h2>\n<p style=\"margin-bottom: 6.0pt;\"><img loading=\"lazy\" decoding=\"async\" width=\"702\" height=\"425\" class=\"alignnone wp-image-165\" title=\"Maakondade andmestik\" src=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.04.43.png\" alt=\"Maakondade andmestik\" srcset=\"https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.04.43.png 702w, https:\/\/sisu.ut.ee\/wp-content\/uploads\/sites\/110\/screen_shot_2020-03-09_at_10.04.43-300x182.png 300w\" sizes=\"auto, (max-width: 702px) 100vw, 702px\"><\/p>\n<p style=\"text-align: justify;\"><i>Valminud Hariduse Infotehnoloogia Sihtasutuse IT Akadeemia programmi toel<\/i>.<\/p>\n\n<p style=\"text-align: justify;\"><\/p><\/div>\n        <\/div>\n        <\/div>\n    <\/div>\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Paketi SPSS enamlevinud meetodidLiina-Mai Tooding2020 Mis on klasterdus? Klasteranal\u00fc\u00fcs on nimetus suure andmeanal\u00fc\u00fcsi meetodite kogu jaoks, mille eesm\u00e4rgiks seatakse objektide r\u00fchmitus viisil, kus \u00fche ja sama r\u00fchma liikmed on \u00fcksteisele mingis m\u00f5ttes l\u00e4hemal kui teise r\u00fchma liikmetele. Objektiks ehk indiviidiks &#8230;<\/p>\n","protected":false},"author":45,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"_acf_changed":false,"inline_featured_image":false,"footnotes":""},"class_list":["post-5","page","type-page","status-publish","hentry"],"acf":[],"_links":{"self":[{"href":"https:\/\/sisu.ut.ee\/samm\/wp-json\/wp\/v2\/pages\/5","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/sisu.ut.ee\/samm\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/sisu.ut.ee\/samm\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/sisu.ut.ee\/samm\/wp-json\/wp\/v2\/users\/45"}],"replies":[{"embeddable":true,"href":"https:\/\/sisu.ut.ee\/samm\/wp-json\/wp\/v2\/comments?post=5"}],"version-history":[{"count":29,"href":"https:\/\/sisu.ut.ee\/samm\/wp-json\/wp\/v2\/pages\/5\/revisions"}],"predecessor-version":[{"id":2276,"href":"https:\/\/sisu.ut.ee\/samm\/wp-json\/wp\/v2\/pages\/5\/revisions\/2276"}],"wp:attachment":[{"href":"https:\/\/sisu.ut.ee\/samm\/wp-json\/wp\/v2\/media?parent=5"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}