Analys av lexikal bindning som grund för indexering och sammanfattning vid informationssökning ---------------------------------------------------------------------------------------------- Trött på att bläddra igenom en massa irrelevanta träffar när du använder informationssystem? Kanske kan en analys av lexikal bindning vara till hjälp... I informationssystem indexeras de dokument som ingår i en dokumentsamling så att det ska bli lättare att vid ett senare tillfälle hitta dokument som motsvarar ett visst informationsbehov. Indexeringen ska beskriva vad ett dokument handlar om, och den innehållsanalys som görs använder mer eller mindre lingvistisk kunskap, oftast mindre, och ofta baserad på kunskap om engelska. Under seminariet presenteras en metod som använder analys av lexikal bindning i ett dokument som grund för indexering av svenska dokument. Den lexikala bindningen beräknas utifrån kunskap om semantiska relationer hämtad från ett antal kunskapsbaser, t.ex. ordlassuppmärkare, ordformslexikon och tesaurusar. Resultatet av analysen kan också utnyttjas för framtagning av olika textsammanfattningar, t.ex. sådana som är anpassade efter ett visst informationsbehov (uttryckt som en sökfråga). Dessa sammanfattningar kan användas vid relevansrankning av de dokument som hittas vid en sökning, men också visas för användaren som hjälp för relevansbedömning. Välkommen! ---- Lexical cohesion analysis as a basis for indexing and summarisation in information retrieval -------------------------------------------------------------------------------------------- Tired of browsing loads of irrelevant hits when using information systems? Maybe a lexical cohesion analysis might help... In information systems, the documents of a collection are indexed to help future retrieval based on a certain information need. The index is meant to describe the content of a document, and the content analysis used is based on more or less linguistic knowledge, often less. The knowledge used is also more or less based on knowledge about English. In the seminar, a method will be presented which uses lexical cohesion analysis of a document as a basis for indexing Swedish documents. Lexical cohesion is computed from knowledge on semantic relations collected from a number of knowledge sources, e.g. PoS-taggers, wordform lexicons, and thesauri. The result of such an analysis can also be exploited for extracting text summaries, e.g. summaries adapted to a certain information need (expressed as a query). These summaries can be used in relevance ranking of the documents retrieved for a search, but also be displayed to the user in order to help relevance judgements. Welcome!