| Universitätsbibliothek Regensburg |
| Home| Suchen| Index| Kontakt |
Der Aufbau einer umfangreichen, repräsentativen Sammlung von Lern- und Lehrmaterial wird als besonders kritisch für den Erfolg des Dienstes beurteilt.
Um mit den gesammelten Dokumenten schnell eine kritische Masse zu erreichen wird eine mehrgleisige Strategie gefahren:
An der UB Kaiserslautern wurde bereits vor dem Projekt Meta-Akad ein datenbankgestützes Webportal für Lerndokumente aus Mathematik und Physik für Lerndokumente aus Mathematik und Physik aufgebaut und betrieben. Diese Sammlung wurde während der bisherigen Projektlaufzeit durch intellektuelle Webrecherche erweitert und weitgehend mit Metadaten erschlossen.
Die intellektuelle Webrecherche ist eine sehr zeitintensive Aufgabe, die vom Rechercheur höchste Konzentration erfordert. An der UB Regensburg erkannte man, dass die herkömmlichen Werkzeuge (Browser, Bookmarkverwaltung, Suchmaschinen) für diesen Zweck unbefriedigend sind:
Um die Webrecherche möglichst einfach und effizient zu machen, wurde ein halbautomatisches Unterstützungssystem entwickelt. Dieses System verfügt über folgende Komponenten:
Das System wurde unter dem Namen Pony entwickelt und ist seit November 2001 im Einsatz.
An der Universitätsbibliothek Kaiserslautern wird ein System entwickelt, dass in der Lage ist, automatisch Lerndokumente zu sammeln. Es besteht aus zwei wesentlichen Komponenten:
Für den Indizierer wird die Suchmaschine ASPSeek eingesetzt, die sehr leistungsfähig und leicht anpassbar ist, viele Dateitypen unterstützt und unter einer Open Source Lizenz verfügbar ist.
Der erste Ansatz einer Klassifizierungskomponente basierte zunächst auf intellektuell erzeugten fachspezifischen Wortlisten. Da auf diese Weise keine ausreichende Trefferrate erreicht werden konnte, wurde in einem zweiten Entwurf das Modell der Support Vector Machine (SVM) erprobt. Dabei handelt es ich um ein selbst lernendes Verfahren, welches positive und negative Lernmengen voraussetzt. Nach dem Lernvorgang kann jedes Dokument mit beiden Lernmengen auf Ähnlichkeit verglichen werden. Die positiven Lernmengen können leicht aus dem bereits intellektuell gesammelten Material generiert werden. Für die Erzeugung geeigneter Negativmengen bietet Pony gute Unterstützung. Die Komponente wird mit dem Produkt SVMlight implementiert.