Netzwerkpartner

Qualitätsrichtlinien

Wie Google Internetseiten sortiert

by Dirk Boelsems ~ Juli 31st, 2008

Das wichtigste Kriterium nachdem Google Internetseiten sortiert und somit die Reihenfolge der Indexierungen festlegt ist die Reputation einer Seite.

Bei der Suche nach bekannten Persönlichkeiten werden Sie oft Seiten von Wikipedia auf der ersten Seite vom Google Index finden. Wikipedia hat einfach eine sehr hohe Reputation, weswegen auch ein Eintrag ihres Unternehmens bzw. eines Angebotes von Ihnen bei Wikipedia einem „Ritterschlag“ gleichkommt, der sich sehr positiv auf ihren eigenen PageRank bzw. Indexposition auswirken kann.

Der PageRank ist eine kurze Zusammenfassung der Reputation einer Seite von 0 -10. Kein Pagerank bzw. ein Pagerank 0 ist bei neu gestarteten Seiten die gerade erst ein paar Wochen im Index sind völlig normal. Ein Pagerank von 10 gibt es eigentlich nur für den lieben Gott, so das schon ein Pagerank von 5 ein sehr hoher Wert ist. Nach einer Anlaufphase von etwa 1 – 2 Jahren für eine neu gestartete Seite ist die Pagerankzuweisung von Google schon ein wichtiger Indikator für die Reputation oder Qualität einer Seite aus Suchmaschinensicht. Dies lässt, wie bereits in früheren Artikeln erklärt, aber keine Schlussfolgerung auf gute Indexplatzierungen zu. Denn hier zählen noch über 200 andere Kriterien oder Signale wie Google es nennt.

Beispiel: Suchen Sie einmal nach Angela Merkel. Die angezeigten Seiten sortieren sich nach Kriterien, wie oft die Wörter Angela und Merkel auf der Seite vorkommen. Ist der Name im Titel der Seite oder sogar in der Domain enthalten? Wie eng stehen die Wörter zusammen? Diese Signale werden unter dem Begriff Topicality zusammengefasst. Je höher die Reputation einer Seite in Kombination mit der Bedeutung des Suchbegriffes auf der Seite ist, je besser (höher) ist die Indexlistung.

Dies kann aber manchmal einen Zielkonflikt bedeuten. Die kurze Erwähnung von Angela Merkel in einem Artikel des Stern mit einer sehr hohen Reputation aber einem niedrigen Topicality Wert steht im Wettbewerb zu der sehr ausführlichen Einlassung der unbekannten Seite (des nicht so bekannten Autors) mit einem sehr hohen Topicality Wert aber einer geringen Reputation. Der Nutzer hätte aber gern beides und deshalb versucht Google hier eine entsprechend sinnvolle Basis mit einem Allgorithmus zu berechnen, der sich diesem Wunsch annähert. Dies ist auch der Grund dafür, warum so oft Wikipedia Einträge ganz weit vorn zu finden sind.

Der sogenannte Classifier hat die Aufgabe die 200 Signale zu gewichten. Wenn nun aber der Pagerank und die Zahl der Nennungen eines Suchbegriffs auf einer Seite je zu Hälfte gewichtet würden, hätten Spammer (Leute die Suchmaschinen mit unerlaubten Mitteln austricksen wollen) die Möglichkeit, einfach den genannten Suchbegriff 4000 mal auf einer Seite im Quelltext erscheinen zu lassen und könnten so Google weismachen, diese Seite wäre extrem wichtig zu diesem Begriff. Damit genau dies nicht passiert hat Google aber vorgesorgt und ein sehr kompliziertes Verfahren um dagegen vorzugehen. Am Ende steht eine Signalnummer, die über die Reihenfolge der Indexeintragungen bestimmt.

Die Trefferlisten sehen aber je nach Region auch unterschiedlich aus. So ist es relativ einfach zu verstehen, das die Royal Bank of Scotland in Schottland unter dem Begriff Bank sicherlich deutlich vor der Deutschen Bank zu finden ist und umgekehrt ist die Deutsche Bank in Deutschland sicherlich deutlich vor der Royal Bank of Scotland zu finden. Obwohl beide Bank im Namen haben und sicherlich in großen Teilen das gleiche Geschäft betreiben und die Reputation bei dem Einen wie bei dem Anderen außer Frage steht.

Die Suchergebnisse können sich aber auch innerhalb von Minuten verändern. Google berechnet auch einen so genannten Trendfaktor. Das heißt Google mißt die Zahl der weltweit eingegebenen Suchbegriffe. Wenn bestimmte Suchbegriffe in kurzer Zeit stark ansteigen zeigt Google vermehrt aktuelle Informationen z.B. aus Blogs, Foren oder Nachrichtenagenturen an. Dies geschieht besonders bei Ereignissen von großer Tragweite wie z.B. Terroranschlägen, Naturkatastrophen, Unfälle etc. Der Informationsbedarf ist hier kurzfristig so hoch, das der Aktualität mehr Raum gegeben wird.

Gleichzeitig schickt Google die eingegebenen Suchbegriffe an einen Rechtschreibserver. Hier wird festgestellt, das Angela Merkel gleichbedeutend mit Bundeskanzlerin ist. So das Internetseiten, die vermehrt das Wort Bundeskanzlerin benutzen für den Suchenden genau so gut auffindbar sind wie Seiten, die eher den Namen Angela Merkel benutzen. Diese Prüfung der semantischen Verwandschaft ermöglicht ein noch besseres intuitiveres Suchergebnis. Schließlich würde es eine halbe Ewigkeit dauern, bis wir alle möglichen Schreibweisen bzw. zusammenhängende Bezeichnungen selbst eingegeben hätten.

Ein letzter wichtiger Faktor für Google ist die Mischung von Suchergebnisseiten. So werden nach Möglichkeit zu den Suchbegriffen an vorderster Front gern Contentangebote, also Informationen über Produkte, Themen etc. gezeigt wie auch Shops als Produktanbieter. Stellen Sie sich nur vor, Sie wollen einen Computer kaufen und Sie finden nur Informationen, Testberichte, Funktionsbeschreibungen aber leider keinen, der Ihnen den Computer auch verkauft. Umgekehrt wollen Sie sich vor iher Kaufentscheidung objektiv und unabhängig schlau machen. Wenn Sie dann nur Shops fänden, die unisono ihr angebotenes Produkt in höchsten Tönen loben, wäre Ihnen auch nicht gut geholfen. Also die Mischung machts.

Auch wenn das Internet im Kern einen Informationscharakter hat und sowohl Suchmaschinen wie auch viele Nutzer die Bereitstellung von vielen unterschiedlichen Informationen (Texte) lieben. Auch kleinere Shops oder Unternehmensseiten haben hier und das ist gut so, reelle Möglichkeiten neben den großen Contentportalen auf Seite 1 zu erscheinen.

Es lohnt sich also von den Usern geliebt zu werden. Die reiche Tante Google aus Amerika gibt es dann nämlich mit ein wenig Geduld gratis dazu.


Bio von

4 Kommentare zu Wie Google Internetseiten sortiert

  1. AMUNO

    Hallo,
    ein sehr guter Artikel, den ich gerne gelesen habe. Allerdings meinte ich, dass Google seinen Pagerank demnächst einstellen will und leider sind nicht alle Attribute öffentlich zugänglich.
    Gerade wenn man sich in Deutschland nicht auf das Halbwissen in Wikipedia verlassen will, benötigt man noch einige Kniffe mehr um mit Google anständige Treffer zu landen.

    Gruß

    AMUNO

  2. Dirk Boelsems

    Hallo AMUNO,
    Google will den Pagerank einstellen? Dazu hätte ich gern mehr Informationen. Wer hat vielleicht Infos zu diesem Punkt oder kennt eine Veröffentlichung?

    Denn was kommt nach dem Pagerank? Grundsätzlich halte ich die Idee, die Reputation bzw. den Reputationswert einer Seite in einer Zahl zu erfassen für gut. Der Topicality Wert schwankt je eh mit jeder Veröffentlichung.

    Gruß

    Dirk Boelsems

  3. AMUNO

    Hi Dirk,
    da ich als Halblaie immer wieder alles verschlinge, was ich zum Thema so in der Bloggerspähre zu lesen bekomme, hat sich dies latent bei mir festgesetzt. Ich möchte allerdings nicht ausschließen, dass ich etwas falsch verstanden habe und es vielleicht nur die Visualisierung der Toolbar betzrifft oder als einfach abzulesendes Ergebnis für Außenstehende.
    In den letzten Wochen viel mir aber extrem auf, dass viele Seo-Seiten nur noch Fehlermeldungen auswerfen, wenn man Keyword bezogene Rankings betrachten will. Scheint zumindest so, als hätte Google hier etwas geändert.

    Gruß

    AMUNO

  4. Ralf breuer

    Hallo,
    sehr interessanter Artikel. Google ändert seinen Algorhytmus ständig und entwickelt diesen, so das viele Dinge gebremmst werden. Gruss Ralf

Hinterlassen Sie ein Kommentar.