Online Marketing macht Sie in Google auffindbar

Duplicate Content - Doppelter Inhalt

Viele Inhalte werden im Internet auf verschiedenen Websites gefunden. Dieser Effekt kann ungewollt auftreten: Wenn alte Seiten nicht gelöscht wurden, die URL's (Internet-Adressen) - insbesondere die übergebenen Parameter - nicht immer gleich oder in der gleichen Reihenfolge geschrieben sind oder durch Steuerungsparameter. Steuerungsparameter sind bei dynamischen Websites beispielsweise Sortier-Reihenfolgen, Filter-Kriterien oder Daten, die an die Seite übergeben werden, um dort einzelne Links benutzerspezisch aufzubauen (z.B. ein Zurück-Link auf eine andere dynamisch aufgebaute Seite, Breadcrumbs oder Session-/Tracking-Variablen).
Suchmaschinen identifizieren die indexierten Seiten anhand der gesamten URL. Es ist also unwichtig, welcher Teil davon Verzeichnisse, welches der Dateiname und was die übergebenenen Parameter sind. Und so ergibt es sich, dass mehrere (leicht) unterschiedliche URL's den fast oder genau gleichen Inhalt haben können. Dieses Phänomen nennt man Duplicate Content.

Folgende unterschiedlichen Internet-Adressen sind aus Sicht einer Suchmaschine unterschiedlich, obwohl vermutlich alle die genau gleiche Startseite Ihrer Firma anzeigen:
- www.ihrefirma.ch
- www.ihrefirma.ch/
- ihrefirma.ch
- ihrefirma.ch/
- www.ihrefirma.ch/Index.htm
- ihrefirma.ch/index.htm

Auch das Resultat einer Suchanfrage auf einem Marktplatz kann für die grösstenteils gleichen Daten unterschiedliche URL's haben:
http://www.example.com/product.php?item=swedish-fish
http://www.example.com/product.php?item=swedish-fish&category=gummy-candy

Für die Suchmaschinen ergeben sich in solchen Fällen zentrale Fragen: Wie erkennt man mehrere Seite mit gleichem Inhalt und welche davon zeigt man einer entsprechenden Suchanfrage an? Für das Erkennen gibt es Algorithmen, die eine prozentuale Übereinstimmung bewerten können, so dass daraus Gruppen mit gleichen Inhalten gemacht werden können. Vor einigen Jahren wurde mal die Zahl von 60% Übereinstimmung herumgereicht, welche die Grenze zu Duplicate Content sei.

Wenn nun die gleichen Seiten erkannt sind, ist noch zu bestimmen, welche davon als Suchergebnis angezeigt wird - welches ist die beste für den Suchenden?
Folgende Ansätze zur Auswahl der besten Resultate können beispielsweise angewendet werden:
- Die älteste gefundene Seite
- Die Seite mit den meisten Backlinks (externen Links) auf sich
- Die Seite mit dem höchsten Qualiätsindex (z.B. PageRank bei Google)

Was können Sie als Website-Betreiber machen, um zu verhindern, dass wegen der Duplicate Content Problematik plötzlich genau Ihre oder eine falsche Seite aus den Suchergebnissen ausgeschlossen wird? Mehr dazu in einem weiteren Artikel!

PLAKATIV online marketing am 31/05/2009

Canonical Tag - das kanonische Link-Element

Im letzten Artikel habe ich über die Problematik und Ursachen von Duplicate Content geschrieben. In diesem Beitrag sollen nun verschiedene Möglichkeiten aufgezeigt werden, um dieses Thema zu entschärfen.

Programmierung, Konfiguration
Stellen Sie sicher, dass Entwickler-Richtlinien bzgl. Gross-/Kleinschreibung, abschliessende /, ob die Startseite mit oder ohne Dateiname aufgerufen wird, die Verwendung von www und der Reihenfolge von Parametern bestehen. Und dass deren Einhaltung kontrolliert wird. Falsch eingegebene URL's sind abzufangen und mittels 301-Redirects auf die richtige URL weiterzuleiten. Verwenden Sie immer absolute Pfade.

Webmaster
Hinterlegen Sie XML-Sitemaps, wo die einzig richtigen URL's verwendet werden. Und kontrollieren Sie die Einhaltung obiger Tipps.

Canonical Tag
Im Februar 2009 haben Yahoo!, Google und Microsoft bekannt gegeben, dass sie neu ein kanonisches Link-Element (canonical tag) verarbeiten und als Empfehlung des Website-Betreiber betrachten wollen. Dieses Element soll die richtige/beste bzw. Haupt-URL benennen, die für den Inhalt einer Seite gilt.

Das kanonische Link-Element wird innerhalb des head-Bereichs eingefügt und hat die Syntax http://www.ihrefirma.ch/die_richtige_seite.html" />. Die Seite teilt der Suchmaschine also mit, welches diejenige URL ist, welche diesem Inhalt am besten entspricht. Im Beispiel aus dem letzten Beitrag könnte also die (immer gleiche) zurückgegebene Seite von
- www.ihrefirma.ch
- www.ihrefirma.ch/
- ihrefirma.ch
- ihrefirma.ch/
- www.ihrefirma.ch/index.htm
- ihrefirma.ch/index.htm
- usw.
einheitlich das Canonical Tag mit http://www.ihrefirma.ch/" /> haben. Die Suchmaschinen erkennen nun, dass unabhängig von der Schreibweise diese einzige URL gemeint ist. Diese wird dann auch als Suchergebnis verwendet.

Aus Sicht der Suchmaschinenoptimierung SEO macht die Verwendung eines Canonical Tags ebenfalls Sinn, denn der Linkwert (Link-Gewicht, Link Juice) aller Verweise, die auf eine der unterschiedlichen URL's zeigen, werden der im Canonical Tag genannten Seite zugeschrieben!

PLAKATIV online marketing am 17/06/2009

Haben Sie Erfahrungen zu diesem Thema?

Unsere Beiträge dürfen nun kommentiert werden.

Domainübergreifendes Canonical Tag

An der SMX East hat Google angekündigt, dass sie ab Ende Jahr das Canonical Tag auch domainübergreifend unterstützen werden. So können auch Partnerintegrationen oder WhiteLabel-Lösungen eindeutig zugeordnet werden.

Yahoo! und Bing wollen ebenfalls Ende Jahr das aktuelle Canonical Tag unterstützen.

Duplicate Content zusammenführen

Google Zusammenfassung/Anleitung zum Thema: Duplicate Content.