Konferenzbeitrag
BINGO! Ein thematisch fokussierender Crawler zur Generierung personalisierter Ontologien
Lade...
Volltext URI
Dokumententyp
Text/Conference Paper
Zusatzinformation
Datum
2002
Autor:innen
Zeitschriftentitel
ISSN der Zeitschrift
Bandtitel
Verlag
Gesellschaft für Informatik e.V.
Zusammenfassung
Fokussierendes Crawling ist ein viel versprechender Ansatz zur Verbesserung der Ausbeute einer Expertensuche über einem spezifischen Themenbereich des Webs. Dieses Verfahren beinhaltet die automatische Klassifikation von Dokumenten in eine benutzerspezifische Hierarchie von Themen, die wir auch als Ontologie bezeichnen. Die Qualität der Trainingsdaten des Klassifikators ist der kritischste Punkt für die Effektivität eines fokussierenden Crawlers. Der BINGO!-Ansatz versucht die Grenzen einer Trainingsbasis mit nur wenigen intellektuell kategorisierten Dokumenten zu überwinden und in einer automatisierten Wachstumsphase selbständig eine breite Trainingsbasis durch die Identifikation themenspezifischer "Archetypen" zu generieren. Die anschließende Erntephase vervollständigt dann die Ontologie nach iterativem Neutrainieren des Klassifikators mit einer verbesserten Ausbeute und Präzision.