Verschlagwortung

Verschlagwortung
Dieser Artikel beschäftigt sich mit der Erschließung von Dokumenten. Weitere Bedeutungen siehe unter Index und Indizierung.

Als Indexierung oder auch Verschlagwortung (Österreich: Beschlagwortung) bezeichnet man beim Information Retrieval die Zuordnung von Deskriptoren zu einem Dokument zur Erschließung der darin enthaltenen Sachverhalte. Es lassen sich die kontrollierte Indexierung mit einem Thesaurus oder Schlagwortkatalog bzw. Notationen einer Klassifikation und freie Indexierung bzw. freie Verschlagwortung mit nicht vorgegebenen Deskriptoren unterscheiden. Beim Gemeinschaftlichen Indexieren (auch social oder collaborative tagging) mit Hilfe von Sozialer Software spricht man auch von Tagging anstelle von Indexierung und von Tags anstatt von Deskriptoren.

Inhaltsverzeichnis

Indexierungsmethoden

Nach verschiedenen Gesichtspunkten lassen sich jeweils unterschiedliche Indexierungsarten und -methoden unterscheiden:

  • Manuelle, computergestützte und automatische Indexierung
  • Kontrollierte Indexierung und freie Indexierung
  • Gleichordnende Indexierung und Syntaktische Indexierung

Manuelle Indexierung

Die Manuelle Indexierung, Intellektuelle Indexierung oder Verschlagwortung ist ein Verfahren der Sacherschließung von Dokumenten, bei der einem Dokument repräsentative Schlagwörter (engl. "Subjects") durch einen Indexierer zugewiesen werden. Da die freie Indexierung mit beliebigen Wörtern sehr ungenau ist, sollten Schlagwörter aus einem kontrolliertem Vokabular (z. B. der Schlagwortnormdatei) oder einer anderen Dokumentationssprache verwendet werden.

Automatische Indexierung

Ein häufiges Verfahren der automatischen Indexierung ist die Volltextindexierung, bei der bis auf Stoppwörter alle Wörter eines Textes in den Index aufgenommen werden (z. B. für eine Suchmaschine). Ggf. werden Wörter mittels Stemming (dt. Reduktion) auf einen gemeinsamen Wortstamm zurückgeführt.

Mit statistischen Indexierungsverfahren wird durch die Ermittlung von Worthäufigkeiten eine Auswahl getroffen und somit nur Wörter in den Index aufgenommen, die mit einer gewissen Frequenz im Text auftreten. Ein einfaches Verfahren der Termgewichtung ist die inverse Dokumenthäufigkeit. Bei diesem Verfahren wird die Häufigkeit eines Begriffs in einem Dokument ermittelt. Dieser Wert wird mit der Häufigkeit der Dokumente, in denen der Begriff vorkommt, ins Verhältnis gesetzt. So lässt sich leicht der Wert oder die Gewichtung des Begriffs als Deskriptor ablesen. Die Gewichtung eines Begriffs ist höher, je weniger Dokumente mit diesem Begriff es im Archiv gibt und je häufiger der Begriff im zu indexierenden Dokument vorkommt. An der Häufigkeit des Begriffs kann man die Signifikanz ablesen. In diesem Dokument wird zum Beispiel häufig „Begriff“ verwendet, denn dieses Wort ist wichtig für das Thema. Nur: „Begriff“ ist ein zu weiter Begriff in spe. Daran kann man sehen, dass allein an der Häufigkeit nicht erkannt werden kann, ob es ein guter oder schlechter Deskriptor ist. Nur im Zusammenspiel mit dem o. g. Gewichtungsverfahren lassen sich signifikante Deskriptoren erstellen.

Mit Hilfe der Computerlinguistik sind auch intelligentere automatische Verfahren möglich, die zwar nicht an die manuelle Indexierung heranreichen, aber wesentlich stabiler hinsichtlich der Indexierungskonsistenz sind.

Computergestützte Indexierung

Bei der computergestützten Indexierung (auch Indizierung) werden Deskriptoren maschinell vorgeschlagen und manuell ausgewählt. Hierbei erfolgt die Indexierung durch Computer mit Vor- oder Nachbereitung durch Menschen bzw. in Interaktion mit Menschen.

Verschlagwortung von Bildern

Zur inhaltlichen Verschlagwortung von Bildern wird in vielen Museen die Klassifikation Iconclass eingesetzt. Auch die Schlagwortnormdatei findet zunehmend im Museumsbereich Verwendung. Viele Bildagenturen und Bildarchive verwenden den IPTC-NAA-Standard und die darin enthaltenen Regeln für Kategorien und Schlagwörter. Eine große Rolle spielen allerdings auch noch hausinterne Schlagwortlisten. Daneben gibt es verschiedene Verfahren, mit denen sich Bilder mittels Ähnlichkeitssuche und Relevance Feedback recherchieren lassen.

Siehe auch

Literatur

  • Holger Nohr: Grundlagen der automatischen Indexierung. Ein Lehrbuch. 3. Auflage. Logos-Verlag, Berlin 2005, ISBN 3-8325-0121-5
  • Martin Kästner: Vergleich ausgewählter Methoden zur Verschlagwortung und Validierung der Methoden durch ein Test-Verfahren. Ilmenau, Techn. Univ., Diplomarbeit, 2006. 204 S.

Quellen


Wikimedia Foundation.

Игры ⚽ Поможем решить контрольную работу
Synonyme:

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Verschlagwortung — Klassifizierung; Klassifikation; Index * * * Verschlagwortung,   Zuweisen von beschreibenden Begriffen zu Objekten, die entweder selber nicht aus Text bestehen (Abbildungen, Klänge) oder die auf der Basis besonders wichtiger Begriffe schneller… …   Universal-Lexikon

  • Indexierung — Als Indexierung, auch Verschlagwortung (Österreich, Bayern: Beschlagwortung) oder Verstichwortung, bezeichnet man beim Information Retrieval die Zuordnung von Deskriptoren zu einem Dokument zur Erschließung der darin enthaltenen Sachverhalte. Es… …   Deutsch Wikipedia

  • Automatische Indexierung — Dieser Artikel beschäftigt sich mit der Erschließung von Dokumenten. Weitere Bedeutungen siehe unter Index und Indizierung. Als Indexierung oder auch Verschlagwortung (Österreich: Beschlagwortung) bezeichnet man beim Information Retrieval die… …   Deutsch Wikipedia

  • Indexieren — Dieser Artikel beschäftigt sich mit der Erschließung von Dokumenten. Weitere Bedeutungen siehe unter Index und Indizierung. Als Indexierung oder auch Verschlagwortung (Österreich: Beschlagwortung) bezeichnet man beim Information Retrieval die… …   Deutsch Wikipedia

  • Manuelle Indexierung — Dieser Artikel beschäftigt sich mit der Erschließung von Dokumenten. Weitere Bedeutungen siehe unter Index und Indizierung. Als Indexierung oder auch Verschlagwortung (Österreich: Beschlagwortung) bezeichnet man beim Information Retrieval die… …   Deutsch Wikipedia

  • Collaborative Tagging — Auszug einer Wortwolke des Internet Tagebuchs Netbib Gemeinschaftliches Indexieren ist eine Form der freien Verschlagwortung (Indexierung), bei der Nutzer von Inhalten die Deskriptoren (Schlagwörter) mit Hilfe verschiedener Arten von Sozialer… …   Deutsch Wikipedia

  • Collaborative tagging — Auszug einer Wortwolke des Internet Tagebuchs Netbib Gemeinschaftliches Indexieren ist eine Form der freien Verschlagwortung (Indexierung), bei der Nutzer von Inhalten die Deskriptoren (Schlagwörter) mit Hilfe verschiedener Arten von Sozialer… …   Deutsch Wikipedia

  • Document Management System — Dokumentenmanagement dient der datenbankgestützten Verwaltung elektronischer Dokumente. Man versteht darunter in Deutschland die Verwaltung ursprünglich meist papiergebundener Dokumente in elektronischen Systemen. Bei der Verwaltung von… …   Deutsch Wikipedia

  • Dokumenten-Management — Dokumentenmanagement dient der datenbankgestützten Verwaltung elektronischer Dokumente. Man versteht darunter in Deutschland die Verwaltung ursprünglich meist papiergebundener Dokumente in elektronischen Systemen. Bei der Verwaltung von… …   Deutsch Wikipedia

  • Dokumentenmanagementsystem — Dokumentenmanagement dient der datenbankgestützten Verwaltung elektronischer Dokumente. Man versteht darunter in Deutschland die Verwaltung ursprünglich meist papiergebundener Dokumente in elektronischen Systemen. Bei der Verwaltung von… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”