Serendipity Blog: Duplicate Content vermeiden Sa, Feb 27. 2010

Im Blog werden neben den einzelnen Beiträgen ganze Scharen von weiteren Seiten erzeugt, die ein Problem für Besucher und Suchmaschinen sein können. Duplicate Content Seiten sind ein Problem im Blog Serendipity. So gibt es eine ganze Reihe von Archiv-Seiten, Seiten mit Zeitstempeln, getaggte Seiten und Kategorie-Seiten. Die Frage ist: welche Seiten sind für den Besucher relevant genug, um auch in dem Suchindex einer Suchmaschine zu stehen?

Bei genauerer Betrachtung sind es für mich 3 Seitentypen, die wichtig sind:

einzelne Blogbeiträge
die Blog Startseite
die Kategorieseiten

Damit eine Suchmaschine auch in die Tiefen des Blogs gelangen kann, gibt es nur wenige Möglichkeiten für den Webmaster, dies zuzulassen. Duplicate Content kann vermieden werden in dem man Seiten vor dem Indexieren einer Suchmaschine sperrt. Das Sperren mittels robots.txt wäre der falsche Weg, da dadurch die Seiten gar nicht berücksichtigt werden und Links darin nicht gefolgt werden. Erst duch das Setzen einer Metaangabe [1] auf jeder einzelnen Seite lässt sich filigran steuern, welche Seiten vom Spider gefolgt werden und welche auch in den Index dürfen:

Folgende Kombinationen sind sinnvoll:

Für Seiten, die in den Index sollen:
<meta name="robots" content="index,follow" />
Für Seiten, die nicht in den Index sollen, aber deren Links weiterverfolgt werden sollen:
<meta name="robots" content="noindex,follow,noarchive" />

Diese Metaangaben gehören wie üblich in den <head>-Abschnitt einer Website.

Im Idealfall wird in Serendipity die index.tpl-Template Datei erweitert, um Duplicate Content zu vermeiden:

{if ($view == "entry" || $view == 'start' || $view == 'categories')} <meta name="robots" content="index,follow" /> {else} <meta name="robots" content="noindex,follow,noarchive" /> {/if}

Es wird dabei der $view abgefragt. Es handelt sich hierbei um eine Smarty-Variable [1], die auch weitere Werte annehmen kann. Das heißt, wenn man auch andere Seiten zulassen möchte, kann man dies in der if-Bedingung entsprechend erweitern.

$view [string - available for 1.0-beta3 and above]
Indicates the current "view" on the frontend. One of: "archives, entry, feed, admin, archive, plugin, categories, authors, search, css, start, 404"
Scope: *.tpl

Nach dem Hochladen des neuen Templates sollte sich das Duplicate Content Problem in Serendipity gelöst haben. Sicher ist noch etwas Zeit nötig, damit die Suchmaschine den Index neu aufgebaut hat. Da kann durchaus schon mal ein halbes bis ein ganzes Jahr ins Land gehen.

Durch Techniken in den Webmaster-Tools der Suchmaschinen lassen sich weitere Vorgänge steuern, z.B. welche Seiten aus dem Index zu entfernen sind. Dadurch können solche Vorgänge noch gezielter und schneller Erfolg haben.

[1] Meta-Angaben Noindex, Nofollow

[2] Smarty-Variablen in Serendipity

Bookmarks:

Delicious Facebook Google Yahoo Mr. Wong Linkarena Digg

Geschrieben von Chris Gurk in Webdesign Kommentare: (3) Trackbacks: (0)

< Magento: Exception printing is disabled by default for security reasons | HowTo: Installation der Gallery2 >

Trackbacks

Trackback-URL für diesen Eintrag

Keine Trackbacks

Kommentare

Ansicht der Kommentare: (Linear | Verschachtelt)

#1 - Beispiel-Name schrieb:
13.04.2010 16:12 -

das mit dem duplicate content ist in der tat immer ein problem. deshalb freue ich mich, dass ich dieses howto gefunden habe. werde es gleich in die praxis umsetzen. vielen dank.

#2 - Hannes schrieb:
15.11.2010 13:52 -

Super Beitrag! Das doppelter Content nicht gut, ist ja bekannt, aber das man so gezielt etwas dagegen tun kann ist mir neu. Ich werds proieren! Danke!

#3 - AusweisApp schrieb:
18.11.2010 21:46 -

Vielen Dank! Das ist genau das, was ich gesucht habe. Wenn ich auf die Seite vor 3 Stunden gestoßen wäre, hätte ich drei Stunden meines Lebens gewonnen =)

Kommentar schreiben

Name
E-Mail
Homepage
Antwort zu
Kommentar	Die angegebene E-Mail-Adresse wird nicht dargestellt, sondern nur für eventuelle Benachrichtigungen verwendet. Um maschinelle und automatische Übertragung von Spamkommentaren zu verhindern, bitte die Zeichenfolge im dargestellten Bild in der Eingabemaske eintragen. Nur wenn die Zeichenfolge richtig eingegeben wurde, kann der Kommentar angenommen werden. Bitte beachten Sie, dass Ihr Browser Cookies unterstützen muss, um dieses Verfahren anzuwenden. Hier die Zeichenfolge der Spamschutz-Grafik eintragen:
	Daten merken? Bei Aktualisierung dieser Kommentare benachrichtigen
Kommentare werden erst nach redaktioneller Prüfung freigeschaltet!