Infootsingu põhimõtted

Päringu koostamine

Päringu sõnastamisel on oluline otsingusõnade oskuslik kombineerimine, et piiritleda teema võimalikult selgelt ja täpselt. Selleks saab kasutada järgmisi tehnikaid: 

Boole’i loogikaoperaatorid

Ühendades otsisõnu Boole’i loogikaoperaatoritega ANDOR või NOT saab otsingut piirata või laiendada.

boolean

Allikas: Boolean machine,http://rockwellschrock.com/rbs3k/boolean/index.htm

AND piirab otsingut, päringus sellega ühendatud sõnad peavad kõik leitavates dokumentides esinema.

Näide:
televisioon AND vägivald – leitakse dokumendid, kus esinevad nii sõna televisioon kui ka vägivald.

OR laiendab otsingut, leitavates dokumentides peab esinema kas üks või teine (vähemalt üks) päringus operaatoriga OR ühendatud sõnadest.

Näide:
vägivald OR agressioon – leitakse artiklid, kus esinevad ainult vägivald, ainult agressioon, või nii vägivald kui ka agressioon

Operaatoriga OR on otstarbekas ühendada:
sünonüüme 
tudeng OR üliõpilane
erineva kirjaviisiga sõnu 
keefir OR kefiir
sarnase tähendusega / seotud sõnu ja fraase
lapsed OR koolieelikud

NOT kitsendab otsingut, esimene sõna peab esinema, teine ei tohi esineda. Nii saab välistada mõne sõna esinemist leitavates artiklites. 

Näide:
rikkumine NOT kuritegu  leitakse dokumendid, kus esineb sõna rikkumine, kuid jäetakse välja dokumendid, kus esineb sõna kuritegu.

Lähedusoperaatorid

Paljudes andmebaasides on kasutusel ka lähedusoperaatorid (NEAR, ADJ jne), mille abil saab täpsemini otsida, kuna saab ette anda, kui lähedal peavad otsitavad sõnad tekstis üksteisele olema. Nii on suurem tõenäosus, et otsitavad sõnad esinevad samas kontekstis. Sageli on otstarbekas asendada operaator AND lähedusoperaatoriga.

Näide:
media N3 violence leitakse dokumendid, kus sõnad media ja violence esinevad teineteisest 3 sõna kaugusel olenemata järjekorrast, leitakse nii media violence kui ka violence in media.

Lähedusoperaatorid ja nende funktsioonid on erinevates andmebaasides erinevad. 

Fraasiotsing

Kui soovite leida mingit kindlat väljendit või lauset sisaldavaid tekste, tuleb otsitav fraas tavaliselt panna jutumärkidesse.


Näide: 
“media violence– leitakse dokumendid, kus on täpselt selline fraas.

Sageli otsitakse mitut sõna koos ka ilma jutumärkidesse panemata automaatselt kui fraasi, mõnikord aga ühendatakse need hoopis operaatoriga AND, st kõik peavad esinema olenemata asukohast.  Enne otsingut või otsingu käigus peate veenduma, milline variant toimib. 

Kärpimine
Kärpimine (ingl k truncation) võimaldab otsida samatüvelisi erinevate lõppudega sõnu. 
Suvaline arv tähemärke sõna lõpus asendatakse sümboliga, enamasti on kasutusel  * (tärn) või ? (küsimärk).

Näide:
question* leitakse ka questions, questioning
child* leitakse ka children, childhood

Sisuliselt asendab see erinevate vormide ühendamist operaatoriga OR. 
Mõelge järele, millise tähe juurest on kõige otstarbekam sõna katkestada ja asendada lõpp sümboliga / metamärgiga. Kui panna metamärk liiga vara, võite saada palju mitterelevantseid tulemusi, kui liiga hilja, jäävad mõned sõnad otsingust välja (adolescent* – leitakse ka adolescents, kuid mitte adolescence; teacher* – ei leita teaching).

Sõna sees kasutatakse sümbolit tähe asemel, kui on võimalik kasutada erinevat kirjaviisi või kui te ei ole kindel, kuidas sõna täpselt kirjutatakse või kui tahate leida korraga mõlema tähega sõnu.

Näide:
organi?ation
 – leitakse nii organization kui organisation
wom?n – leitakse nii woman kui women

Nende sümbolite kasutamine erinevates andmebaasides on erinev. Tutvuge iga andmebaasi puhul kindlasti eraldi selles kasutatavate metamärkidega.

Sulgude kasutamine 

Kui te kasutate ühes päringus erinevaid operaatoreid, tuleb arvestada, et operaatoritega NOT ja AND ühendatud avaldisi otsitakse enne, OR jääb kõige viimaseks. Seega, kui soovite seda järjekorda muuta, tuleb kasutada sulge. Sulgudes olevat avaldist otsitakse enne.

Kasutades eelpool toodud otsingusõnade tabelit, ühendame sünonüümid ja sarnase tähendusega sõnad operaatoriga OR, eraldame need grupid sulgudega ning ühendame operaatoriga AND, et leida nende kõigi ühisosa. Kasutame ka kärpimist, et ei peaks välja kirjutama kõiki sama tüvega erinevate lõppudega sõnu.

(aggressi* OR violen*) AND (tv OR television) AND (child* OR adolescen* OR teen*)