Suchmaschinenoptimierung: Was sind kanonische URL’s

Bei einem aktuellen Kundenprojekt bin ich über folgende Problematik gestolpert: Auf der zweisprachigen Webseite werden regelmäßig Nachrichten in nur einer Sprachversion veröffentlicht. Das heißt, eine englische oder deutsche Mitteilung erscheint jeweils im englischen und deutschen Sprachbaum. Grundsätzlich ist es natürlich sehr sinnvoll, regelmäßig neue Inhalte zu veröffentlichen, das gilt für Besucher gleichermaßen wie für Suchmaschinen.

Da beiden Sprachversionen in unterschiedlichen Verzeichnissen liegen (deutsch im Wurzelverzeichnis, englisch in einem Unterverzeichnis /en) ergeben sich für nahezu identische Seiten also zwei unterschiedliche URL’s, damit also doppelten Content. Suchmaschinen haben nun das Problem, dass sie nicht wissen, welche Version der Seite sie nun in ihrer Trefferliste anzeigen sollen. Eine Lösung bieten nun die sogenannten kanonischen URL’s (canonical url) an. Mit diesem Meta-Tag, dass in den Header der jeweiligen Seite eingetragen wird, kann ich der Suchmaschinen nun mitteilen, welche Version der Seite sie bevorzugt verwenden soll:
<link rel="canonical" href="http://www.beispiel.xyz/dateiname-der-richtigen-seite.html"/>

Soweit so gut, denn bei meinem Kunden wurden tatsächlich diese kanonische URL’s verwendet. Das Problem ist nun, dass der angegebene Link in diesem Meta-Tag vom verwendeten Content Management System (CMS typo3) automatisiert befüllt wird, und zwar mit der jeweiligen URL der aktuellen Seite. Und damit wird der Sinn einer solchen kanonischen URL einfach ausgehebelt: man teilt der Suchmaschine mit, dass jeweils beide Versionen einer Seite wichtig sind. Wie jetzt? Wir bzw. die Suchmaschine sind also wieder genauso schlau wie vorher.

Wie werden kanonische URL’s nun korrekt verwendet?

In meinem oben beschriebenen Fall gibt es zwei Versionen einer Seite, wobei eine von beiden von Suchmaschinen berücksichtiget werden soll. Sinnvollerweise sollte dies die englischsprachige Nachricht im englischen Sprachbaum sein und die deutsche Version im deutschen Teil der Webseite. So verweisen wir in der englischsprachigen Nachricht des deutschsprachigen Baums auf die korrekte Datei im englischen Sprachbaum:

<link rel="canonical" href="http://www.beispiel.xyz/en/news.html"/>

Soweit ich den Beitrag zum gleichen Thema auf der Support-Seite Googles richtig verstanden habe, braucht die eigentliche Seite, die von der Suchmaschinen berücksichtigt werden soll, keinen eigenen Eintrag. Kanonische URL’s funktionieren übrigens nur für Dateien innerhalb einer Domain. Domain-übergreifend lässt sich das Problem des doppelten Contents so nicht lösen.

Eine weitere Variante für die Lösung des beschriebenen Problems wäre zum Beispiel auch, das Auslesen der doppelten, überflüssigen Datei durch Suchmaschinen per Metatag zu unterbinden:
<meta name="robots" content="noindex">

Wo taucht die Problematik noch auf:

Auf dieses Thema stoßen wir überall dort, wo mehrere Zugangswege zu einer Seite mit Informationen angebotenen werden. So können einzelne Artikel eines Blogs über Tags, Kategorien und Archivseiten erreichabr sein oder einzelene Detailseiten von Produkten werden über unterschiedliche Produktkategorien angezeigt. Viele Systeme wie WordPress oder Magento bieten Lösungen für diese Problematik an, notfalls in Form von Plugins oder Extensions. Aber der Teufel steckt leider im Detail und eine fehlerhafte Konfiguration verhindert das angestrebte Ziel.

Weitere Informationen

Lesetipps zum Thema Suchmaschinenoptimierung, SEO (Affiliate-Links):

Kommentar absenden

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *