Tenttiarkisto: INFOA32 - Tiedonhaun menetelmät

 

11.5.2009

1. Määrittele lyhyesti (4 p):

a) di-grammi
b) aiherelevanssi
c) hierarkkinen suhde
d) keskiarvotarkkuus
e) perusmuotoistaminen
f) täystäsmäytys
g) dokumenttifrekvenssi
h) saanti-tarkkuus-käyrä

2. Selitä käänteishakemiston rakenne ja toiminta. (6 p)

3. Mitä tarkoitetaan tiedonhaun laboratoriotutkimuksella? (4 p)

4. Mitä ominaisuuksia on digitaalisella dokumentilla? Mitkä ominaisuudet
ovat sen määrittelyn kannalta oleellisia? (6 p)

5. Mitä tarkoitetaan sana- ja fraasifrekvenssillä? Mitkä seikat
vaikuttavat indeksointiyksikön (tallenneyksikön) valintaan? (4 p)

25.2.2008

1. Osittaistäsmäytys: Selosta, miksi tieto avaimen frekvenssistä dokumentissa ei yksin riitä tuottamaan hyviä hakutuloksia. (2p)

2. Pohdi saannin ja tarkkuuden käänteistä suhdetta täystäsmäytyksessä (Toisin sanoen yleensä tarkkuuden parantuessa saanti heikkenee, ja saannin parantuessa tarkuus heikkenee). Ota tarkastelunäkökulmaksi loogiset operaattorit (AND, OR...) ja niiden muuntelu. (3p)

3. Selosta lyhyesti seuraavat käsitteet (2 riviä/käsite) : (2p)

a. n-grammi
b. käänteistiedosto
c. relevanssipalaute
d. fraasi-indeksointi
e. relevanssilajittelu
f. taivutusmuotohomografia

Tee toinen seuraavista kahdesta:
4A. Perusmuotoisen kyselyn muotoilu taivutusmuotoiseen käänteishakemistoon tehtäväksi kyselyksi. (3p)

4B. Selosta Page Rank algoritmin perusperiaate ja tarkoitus. (3p)

9.5.2006

1) Jäsennä täsmäytysmenetelmät

2) Mitä vaihtoehtoja on sanamuotojen normalisointiin tiedonhaun apuna?

3) Määrittelytehtävä

Uudet käyttäjät

  • ApinaSalaatti
  • ailin
  • Wiljam
  • Orbitum
  • Lari

Paikalla olevia

0 käyttäjää ja 1 vieras.