Doppelter Inhalt (duplicate Content)

Doppelter Inhalt, oder auch duplicate content genannt, kann zu einem großen Problem für das Ranking der eigenen Seite führen.

Wie kann doppelter Inhalt entstehen?


Mittels eines kleinen Beispiels soll die Entstehung von doppelten Inhalten verdeutlicht werden. Lässt sich der Inhalt der Startseite mit mehreren URL-Varianten aufrufen, und sind alle diese URL-Varianten bei den Suchmaschinen im Index zu finden, dann handelt es sich um doppelten Inhalt.
Die URL-Varianten nachfolgend am Beispiel der Domain Konzept-Welt.de erläutert:
  • http://www.konzept-welt.de
  • http://konzept-welt.de
  • http://www.konzept-welt.de/index.html
  • http://Konzept-welt.de/index.html

Theoretisch verweisen alle 4 URL-Varianten auf die gleiche Seite, die index.html. Dieses Problem kann z.B. durch den Einsatz einer .htaccess-Datei mit den folgenden Befehlszeilen abgestellt werden:
RewriteCond %{HTTP_HOST} !^www\.konzept-welt\.de$ RewriteRule ^(.*)$ http://www.konzept-welt.de/$1 [L,R=301]

Mit diesem Code werden alle 4 verschiedenen URL´s auf eine URL gebündelt (umgeleitet), in diesem Fall auf www.konzept-welt.de. Die anderen 3 Varianten werden damit abgestellt. (Weitere Informationen rund um das Thema 301er-Weiterleutung kann unter 301redirect.de nachgelesen werden.)

Wo tritt doppelter Inhalt überall auf?


Dies kann überall da passieren, wo der Webmaster auf fertige Scripte wie CMS, Blog, Forum, … setzt. Vor allem bei Blogs können durch die Archive sehr schnell doppelte Inhalte entstehen.
Daher ist es ratsam, sich im Vorfeld des Einsatzes eines neuen Scriptes über die Generierung von doppelten Inhalten, bezogen auf dieses Produkt, zu informieren. Zu fast allen Scripten gibt es dann auch eine Lösung.

Eigene Texte prüfen


Wenn bestehende Projekte eine gewisse Größe erreichen oder mehrere Autoren gleichzeitig Texte veröffentlichen, dann kann es passieren, dass gleiche Themen mehrfach eingestellt werden. Um dies zu umgehen sollte vor der Veröffentlichung neuer Texte geprüft werden, ob bereits ähnliche veröffentlichte Artikel zu finden sind.
Vor allem bei Webseiten, die News automatisch von externen Quellen beziehen und diese ungeprüft veröffentlichen, bestehen diese Risiken (Ein prominentes Beispiel ist Yahoo!, wo immer wieder gleiche Nachrichten mehrfach veröffentlicht werden).

Webnapping


Vor allem im Zeitalter von “Web 2.0” sind Webnapping-Elemente stark im Kommen. Fast jede Webseite bietet eine Möglichkeit an, dass die neuen Inhalte auch auf anderen Webseiten kostenlos eingebunden und damit veröffentlicht werden. Wer dies nutzt sollte dabei beachten, dass diese Inhalte mehrfach im Web zu finden sind und dadurch doppelter Content entstehen kann. Die Suchmaschine Google will dem vorbeugen, indem der Zeitpunkt der Veröffentlichung eines Textes zusätzlich gespeichert werden soll. Wird später der gleiche Text noch einmal auf einer anderen Webseite gefunden, dann werden die Zeitstempel miteinander verglichen und die Webseite, die den Text zuerst veröffentlicht hat, ist der Urheber. Die anderen doppelten Texte werden dann nicht als doppelter Inhalt angesehen, jedoch auch nicht gewertet und ggf. nicht indiziert.

Theoretisch können auch RSS-Feeds in den Bereich des doppelten Contents fallen, wenn diese auf anderen Webseiten vollständig veröffentlicht werden. Doch hierfür gibt es auch Alternativen in Form von Kurzbeschreibungen oder komplett anderer Texte für RSS-Feeds. (Hier könnte auch der oben beschriebene Zeitstempel greifen).

Fazit: Doppelte Inhalte sollte auf jeden Fall vermieden werden. Denn wenn Texte in der gleichen oder minimal veränderten Form mehrmals im Internet zu finden sind, stellen dies Kopien dar und könnten auch als SPAM gewertet werden.


Aktueller Tipp

Anzeigen