Auf der SES gab es eine Session zum Thema Duplicate Content, moderiert von Chris Sherman. Die Sprecher waren Mikkel deMib Svendsen, Shari Thurow, Adam Lasnik (Google), Tim Converse (Yahoo) and Jon Glick (Become.com).

Darüber haben toprankblog.com, blogs.webpronews.com und webpronews.com berichtet.

Was ist Duplicate Content und wie kann er entstehen?
Unter Duplicate Content, also doppeltem Inhalt, versteht man Inhalt, der unter mehr als einer URL erreichbar ist. Das kann der Fall sein, wenn a) verschiedene dynamische URLs auf den gleichen Inhalt zeigen oder b) mehrere Domains auf eine Seite verweisen.

Ein Beispiel für a)
domain.de/index.php?id=2?p=16?sid=123456
domain.de/index.php?id=2?p=16?sid=123457 (usw)

Beispiel für b)
Domain1.de, domain2.de und domain3.de zeigen alle auf die gleiche Seite.
Domain1.de/seite1.html
Domain2.de/seite1.html
Domain3.de/seite1.html

Warum ist Duplicate Content schlecht ?
Suchmaschinen mögen keine doppelten (oder mehrfachen) Inhalte, da sie den Index unnötig aufblähen und vernünftige Suchresultate erschweren.

In Fällen von DC wird meist nur die als am wichtigsten annerkannte Seite indiziert. Dabei spielen Alter, Autorität und Backlinks eine entscheidende Rolle.

Was kann man gegen DC tun?
Bei doppeltem Inhalt durch mehrere Domains reicht es einen 301 Redirect von allen sekundären Domains auf die Hauptdomain einzusetzen.
Bei Duplicate Content durch dynamische URLs sollte man sich zuerst die Richtlinien zu dynamischen URLs zu Gemüte führen und sie entweder berücksichtigen oder versuchen die URLs mittels Mod Rewrite umzuschreiben.

Falls man einige (oder alle) Seiten seiner Website auch in einer druckbaren Version anbietet, sollte man diese Print-Versionen per Robots.txt und Meta-Tag vom Indizierungsprozess ausschließen.

Ein weiteres Problem ist die Übergabe von Style-Informationen per URL, also zum Beuspiel domain.de/index.php?dokument=10?style=1 [2,3]
In diesem Fall würde man immer den Text von Dokument 10 sehen, egal ob man die Seite mit Style 1, 2, oder 3 betrachtet. Solche Informationen sollten daher immer per Cookie gespeichert werden.

Verwandte Beiträge

  • Anzeichen dafür, dass eine Website Müll ist
  • Der Supplemental Index Ratio Rechner
  • Claim Your Content - Wie Google Copyrightverletzungen bei YouTube verhindert
  • Die optimale Artikellänge
  • Content: Weniger ist mehr?


  • One Response to “Duplicate Content”  

    1. 1 Der Supplemental Index Ratio Rechner

    Leave a Reply