Technische Tipps zum Duplicate Content
Mit Sicherheit haben Sie Duplicate Content auf Ihrer Webseite, Druckversionen verschiedener Seiten und einiges mehr, von dem Sie vielleicht gar nichts wissen, da Duplicate Content ohne Ihr Wissen von dem verwendeten CMS oder auch von Tracking-Systemen generiert werden kann. Sie haben auch davon gehört, dass Duplicate Content unter allen Umständen zu vermeiden ist, um eine Abstrafung durch Google zu vermeiden. Aber ist dem wirklich so? Ist die Panik gerechtfertigt?Was ist Duplicate Content?
Duplicate Content (doppelter Inhalt) liegt dann vor, wenn der gleiche oder auffällig ähnlicher Inhalt auf verschiedenen Webseiten, der gleichen oder einer anderen Domain zur Verfügung steht. Oder in anderen Worten, wenn der gleiche Content über verschiedene URLs zu erreichen ist. Google unterscheidet sehr wohl zwischen Duplicate Content, der nicht böswillig generiert wird und Content, der generiert wird, um das Ranking zu manipulieren. Hierzu gehört auch der sogenannte “Spun-Content”, Texte, die oft maschinell paraphrasiert wurden, um den Eindruck von einzigartigem Content zu erwecken. In der Konsole-Hilfe gibt Google Beispiele für nicht böswillig duplizierten Content:- Diskussionsforen, die sowohl reguläre als auch gekürzte, auf mobile Endgeräte ausgerichtete, Seiten erzeugen
- Lagerartikel, die über mehrere eindeutige URLs angezeigt bzw. referenziert werden
- Druckversionen von Webseiten
- Ihre Webseite lässt sich mit verschiedenen URLs aufrufen und erscheint den Crawlern als gleicher Content auf verschiedenen URLs, wie beispielsweise
- IhreSeite.com
- com
- http://IhreSeite.com
- http://IhreSeite.com/
- https://www.IhreSeite.com
- https://IhreSeite.com
- Sie verwenden eine sichere HTTPS Webseite, können aber per Redirect auch über HTTP erreicht werden
- Sie haben Ihre URL geändert, aber eine Neuindexierung ist noch nicht erfolgt
- Sie tracken das Besucherverhalten und eine Session ID wird in der URL abgespeichert
- ein CMS kann für Kommentare eine Seitennummerierung einführen
- Ihr Content wurde kopiert und auf einer anderen Webseite ohne Quellenangabe veröffentlicht