Hubs und Authorities

Hubs und Authorities

Als Hubs und Authorities lassen sich in der Netzwerktheorie herausragende Knoten anhand ihrer Verlinkung einteilen. Vereinfacht gesagt sind Hubs und Authorities dabei Knoten, die mit vielen anderen Knoten verbunden sind – beispielsweise bekannte Persönlichkeiten in sozialen Netzwerken und Linkverzeichnisse im World Wide Web.

Berechnung

Das Konzept der Hubs und Authorities liefert ähnlich wie der PageRank-Algorithmus ein Konzept zur automatischen Beurteilung von Webseiten anhand ihrer Verlinkung, mit dem sich ein Ranking-Verfahren angeben lässt. Es wurde 1999 von Jon Kleinberg vorgeschlagen und ist unter dem Namen hypertext-induced topic selection (HITS) bekannt.

Dabei wird davon ausgegangen, dass jede Seite zum einen als Hub bewertet werden kann, der durch Hyperlinks auf andere Seiten bestimmt, welche Seiten gut sind, und zum anderen als Authority, das heißt als eine Seite, die als besonders gut angesehen wird. Hubs sind beispielsweise populäre Linksammlungen. Authorities sind Seiten, die von Hubs oft verlinkt werden. Jeder Seite i aus einer Grundmenge von i=1\ldots n Seiten wird ein Hub-Gewicht hi und ein Authority-Gewicht ai zugeordnet. Beide Werte hängen folgendermaßen zusammen:

h_i = \delta \sum_{j=1}^n A_{ij} \,a_j
a_i = \lambda \sum_{k=1}^n {A^T}\!_{ik} \,h_k

Dabei ist A die Verlinkungsmatrix, in der Ai,j = 1, falls die Seite i einen Link auf die Seite j besitzt, und Ai,j = 0, falls dies nicht der Fall ist. AT ist die Transponierte Matrix von A, d.h. {A^T}\!_{ij}=A_{ji}. Es gilt also:

  • Der Hub-Wert einer Seite i ergibt sich aus der Summe aller Authority-Werte der Seiten, die von i verlinkt sind.
  • Der Authority-Wert einer Seite i ergibt sich aus der Summe aller Hub-Werte der Seiten, die auf i verlinken.

Die Werte für h und a können folgendermaßen berechnet werden. Durch gegenseitiges Einsetzen der Definitionen erhält man die Gleichungen

h=\delta\,\lambda\, A A^T \,h\,
a=\delta\,\lambda\, A^T\!\!A \,a\,

Mögliche Werte für h und a ergeben sich als Eigenvektoren der Matrizen AAT bzw. ATA.

Siehe auch: Skalenfreies Netzwerk

Literatur

  • Jon Kleinberg: Authoritative sources in a hyperlinked environment. In: Journal of the ACM, vol. 36 nr. 5, S. 604-632, 1999 (pdf)

Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Klassifizierer — Die Artikel Klassifikator (Informatik) und Klassifikationsverfahren überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Beteilige dich dazu an der Diskussion über diese Überschneidungen. Bitte… …   Deutsch Wikipedia

  • HITS-Algorithmus — Als Hubs und Authorities lassen sich in der Netzwerktheorie herausragende Knoten anhand ihrer Verlinkung einteilen. Vereinfacht gesagt sind Hubs und Authorities dabei Knoten, die mit vielen anderen Knoten verbunden sind – beispielsweise bekannte… …   Deutsch Wikipedia

  • Klassifikator (Informatik) — Ein Klassifikator (Informatik) ist ein Algorithmus, der Objekte (z.B. Dokumente) anhand ihrer Merkmale in vorgegebene Kategorien einordnet. Der Begriff Klassifikator wird meist spezifisch für solche Algorithmen verwendet, in denen der… …   Deutsch Wikipedia

  • Web-Mining — Unter Web Mining versteht man die Übertragung von Techniken des Data Mining zur (teil)automatischen Extraktion von Informationen aus dem Internet, speziell dem World Wide Web. Web Mining übernimmt Verfahren und Methoden aus den Bereichen… …   Deutsch Wikipedia

  • Webmining — Unter Web Mining versteht man die Übertragung von Techniken des Data Mining zur (teil)automatischen Extraktion von Informationen aus dem Internet, speziell dem World Wide Web. Web Mining übernimmt Verfahren und Methoden aus den Bereichen… …   Deutsch Wikipedia

  • Page Rank — Der PageRank Algorithmus ist ein Verfahren, eine Menge verlinkter Dokumente, wie beispielsweise das World Wide Web, anhand ihrer Struktur zu bewerten bzw. zu gewichten. Dabei wird jedem Element ein Gewicht, der PageRank, aufgrund seiner… …   Deutsch Wikipedia

  • Page Ranking — Der PageRank Algorithmus ist ein Verfahren, eine Menge verlinkter Dokumente, wie beispielsweise das World Wide Web, anhand ihrer Struktur zu bewerten bzw. zu gewichten. Dabei wird jedem Element ein Gewicht, der PageRank, aufgrund seiner… …   Deutsch Wikipedia

  • Pagerank — Der PageRank Algorithmus ist ein Verfahren, eine Menge verlinkter Dokumente, wie beispielsweise das World Wide Web, anhand ihrer Struktur zu bewerten bzw. zu gewichten. Dabei wird jedem Element ein Gewicht, der PageRank, aufgrund seiner… …   Deutsch Wikipedia

  • Pageranking — Der PageRank Algorithmus ist ein Verfahren, eine Menge verlinkter Dokumente, wie beispielsweise das World Wide Web, anhand ihrer Struktur zu bewerten bzw. zu gewichten. Dabei wird jedem Element ein Gewicht, der PageRank, aufgrund seiner… …   Deutsch Wikipedia

  • Webrank — Der PageRank Algorithmus ist ein Verfahren, eine Menge verlinkter Dokumente, wie beispielsweise das World Wide Web, anhand ihrer Struktur zu bewerten bzw. zu gewichten. Dabei wird jedem Element ein Gewicht, der PageRank, aufgrund seiner… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”