Problemen bij het zoeken van informatie op het internet kunnen veroorzaakt worden door zoekvragen die vaak geen adequate samenvatting zijn van de complexe informatiebehoefte van de gebruiker. Ook kunnen zoeksystemen de inhoud van de documenten niet adequaat interpreteren. Dit leidt tot zoekresultaten die irrelevante en overbodige informatie bevatten. Rianne Kaptein keek hoe ze zoekresultaten beter kan structuren. De context van de zoekvraag kan daarbij gebruikt worden om meer gerichte zoekresultaten terug te kunnen geven. De zoekvraag uitgedrukt in trefwoorden kan aangevuld worden met categorieën van gestructureerde websites zoals DMOZ en Wikipedia. Deze categorieën kunnen gebruikt worden als context om documenten te vinden die niet alleen relevant zijn voor de trefwoorden van de zoekvraag, maar ook behoren tot een relevante categorie. In plaats van het gebruik van labels toegewezen door gebruikers, genereerde Kaptein woordenwolken uit de tekstuele inhoud van de documenten, en de linktekst van Webdocumenten. Woordenwolken kunnen worden gebruikt om groepen van documenten samen te vatten in een set van trefwoorden om snel een eerste indruk te krijgen van de onderliggende gegevens.

J. S. Mackenzie Owen
Universiteit van Amsterdam
hdl.handle.net/11245/1.352509
SIKS Dissertation Series ; 2011-28

Kaptein, A. (2011, October 7). Effective Focused Retrieval by Exploiting Query Context and Document Structure (No. 2011-28). SIKS Dissertation Series. Retrieved from http://hdl.handle.net/11245/1.352509