Canonical-Tag

Das Canonical-Tag wurde von Google eingeführt, um Probleme mit Duplicate Content zu vermeiden. Wird derselbe Content auf mehreren Webseiten veröffentlicht, so muss Google die ursprüngliche Original-Quelle des Contents in Erfahrung bringen. Dazu verwendet Google verschiedene Faktoren, wie z. B. den Veröffentlichungszeitpunkt, die Größe und Relevanz der Website, evtl. Quellenangaben etc. pp. Google schafft es jedoch nicht immer, die richtige Seite als Original-Quelle zu identifizieren.

Um Google die Idenfizierung der richtigen Website zu erleichtern, sollte mit dem Canonical-Tag gearbeitet werden. Das Canonical-Tag wird auf allen Seiten eingebaut, die den gleichen Content veröffentlichen. Auf der Original-Quelle, also derjenigen Seite, die den Content erstellt und zuerst veröffentlicht hat, verweist das Canonical-Tag auf sich selbst. Auf allen anderen Webseiten, die diesen Content ebenfalls veröffentlichen, bei welchen es sich jedoch nicht um die Original-Quelle handelt, wird ebenfalls ein Canonical-Tag gesetzt. Dieses muss die URL der Original-Quelle enthalten.

Beispiel: Das Canonical-Tag bei der Syndizierung von Inhalten (Externer Duplicate Content)

URL der Original-Quelle:

  • http://www.original-quelle.de/schoener-artikel-zum-canonical-tag.html

Das Canonical-Tag auf der Original-Seite:

<link rel="canonical" href="http://www.original-quelle.de/schoener-artikel-zum-canonical-tag.html" />

URLs, die den Inhalt der Original-Quelle syndizieren:

  • http://www.publisher-eins.de/verzeichnis/canonical-tag.html
  • http://www.publisher-zwei.de/verzeichnis/unterverzeichnis/canonical-tag-so-gehts-richtig.html
  • http://www.publisher-drei.de/schoener-artikel-zum-canonical-tag.html

Das Canonical-Tag auf allen Sekundär-Quellen:

<link rel="canonical" href="http://www.original-quelle.de/schoener-artikel-zum-canonical-tag.html" />

Im Canonical-Tag aller Webseiten wird die URL der Original-Quelle angegeben. Der Besucher bekommt davon in der Regel jedoch nichts mit, da das Canonical-Tag im <head> der HTML-Seite eingebaut wird. Dieser Teil der Seite ist nur für Maschinen (z. B. den Googlebot) lesbar. Menschliche Besucher sehen das Tag nur, wenn sie sich den Quellcode der Seite ansehen.

Beispiel 2: Das Canonical-Tag bei internem Duplicate Content

Online-Shops bieten Produkte häufig in verschiedenen Varianten (Farben, Größen, etc.) an. Aus ressourcentechnischen Gründen (Zeit, Geld, etc.) wird meist auf unterschiedliche Produkt-Beschreibungstexte verzichtet. In der Folge existieren dann unterschiedliche URLs mit ein und demselben Content, der sich gar nicht oder nur in Bezug auf Farb- und/oder Größenangaben unterscheidet. Auch dabei handelt es sich Duplicate Content, genauer gesagt um internen Duplicate Content. In so einem Fall rankt häufig keine der Varianten besonders gut, da sich die Seiten gegenseitig im Weg stehen und Google nicht einschätzen kann, welche der Seiten die richtige für den jeweiligen Content ist.

URLs des Produktes A mit verschiedenen Varianten:

  • http://www.optimierter-shop.de/kategorie/produkt-a.html
  • http://www.optimierter-shop.de/kategorie/produkt-a-schwarz-groesse-m.html
  • http://www.optimierter-shop.de/kategorie/produkt-a-weiss-groesse-m.html
  • http://www.optimierter-shop.de/kategorie/produkt-a-weiss-groesse-xxl.html
  • ...

Hinweis: Wir gehen im Beispiel davon aus, dass die Produkt-Seiten alle exakt den gleichen Inhalt tragen, der sich lediglich durch die Angabe von Größen und Farben unterscheidet. In solch einem Fall sollten alle Seiten mittels Canonical-Tag auf die Hauptvariante verweisen.

Das Canonical-Tag aller Seiten sollte auf Produkt A verweisen:

<link rel="canonical" href="http://www.optimierter-shop.de/kategorie/produkt-a.html" />

Wichtiger Hinweis: Achtung, der eben gezeigte Einsatz des Canonical-Tags verhindert zwar Duplicate Content, führt aber dazu, dass alle URLs mit Varianten zu Produkt A aus dem Google Index verschwinden werden. Es wird schließlich nur noch Variante I übrig bleiben. Das kann zu einem Verlust der Longtail-Rankings führen. Ist dies nicht gewünscht, ist das Erweitern und Individualisieren der Beschreibungstexte dem Einsatz des Canonical-Tags vorzuziehen.

Beispiel 3: Das Canonical-Tag bei strukturellem Duplicate Content

Ein ähnliches Problem entsteht dann, wenn eine bestimmte Unterseite über das Content Management System zwei oder mehr Kategorien zugewiesen werden kann. Das CMS produziert dann strukturellen Duplicate Content, d.h. ein und derselbe Inhalt wird auf mehreren URLs veröffentlicht wird.

Vom Content Management System angelegte URLs (Kategorien):

  • http://www.eine-nachrichten-seite.de/news/heute-ist-in-china-ein-sack-reis-umgefallen.html
  • http://www.eine-nachrichten-seite.de/breaking-news/heute-ist-in-china-ein-sack-reis-umgefallen.html
  • http://www.eine-nachrichten-seite.de/china/heute-ist-in-china-ein-sack-reis-umgefallen.html
  • ...

Das Canonical-Tag aller Seiten sollte auf eine(!) Haupt-URL verweisen:

<link rel="canonical" href="http://www.eine-nachrichten-seite.de/news/heute-ist-in-china-ein-sack-reis-umgefallen.html" />

Weitere Einsatzgebiete:

  • Affiliate-Parameter
  • Funktionale Parameter (z. B. Druck-Version etc.)
  • Session IDs

Vorteile

Der Einsatz eines Canonical-Tags hat gegenüber dem Einsatz einer 301-Weiterleitung den Vorteil, dass der User nicht weitergeleitet wird, sondern die Inhalte auf verschiedenen URLs angezeigt bekommt. Das Canonical-Tag ist für den Besucher im Grunde nicht sichtbar (s. o.).

Quellcode

Im Quellcode sieht das Canonical-Tag üblicherweise wie folgt aus:

<link rel="canonical" href="http://www.suchmaschinen-video.de/canonical-tag.html" />
Weiterführende Links zum Canonical-Tag