Sitemap pflegen


Die Sitemap-Datei

Eine Sitemap-Datei ist eine XML-Datei, die die URLs der Dokumente einer Website aufführt, die von Suchmaschinen indiziert werden sollen. Die Anweisung

Sitemap: http://kleider.herbaer.de/sitemap.xml

in der Datei robots.txt nennt Suchmaschinen die URL der Sitemap.

Das Format einer Sitemap ist definiert bei http://www.sitemaps.org. Zu jeder URL können das Datum der letzten Änderung, eine Änderungshäufigkeit und eine Priorität angegeben werden. Darüber hinaus können XML-Elemente anderer Namensräume weitere Daten definieren. Google definiert XML-Namensräume für ergänzende Angaben zu Quellcode-Dateien (http://www.google.com/support/webmasters/bin/answer.py?answer=75225) und zu Bildern (http://www.google.com/support/webmasters/bin/answer.py?answer=178636)

Die Datei submit zeigt die URLs, unter denen eine Sitemap bei Suchmaschinen angemeldet werden kann.

Darstellung der Sitemap

Ich zeige hier als Beispiel drei XSLT-Transformationen, die die Sitemap als XHTML-Dokument zeigen. Die in der Website tatsächlich benutzte Transformation ist zusammen mit der Darstellung der Website beschrieben.

sitemap_ht.xslt (Text)

Eine einfache Darstellung.

sitemap_ht_all.xslt (Text)

Eine umfangreichere Darstellung.

sitemap_ht_ni.xslt (Text)

Darstellung ohne Verweise auf Bilder. Sie benutzt tabsort.js (Quelltext) zur Sortierung von Tabellenzeilen.

Verweise auf Bilder

Eine Sitemap mit Verweisen auf Bilder wird leicht unübersichtlich. Deshalb pflege ich eine Sitemap-Datei ohne Bildverweise. Nachdem die Verweise auf die neue(n) Bildergeschichte(n) in die Komponenten der Website eingefügt sind, kann ich die Einträge zu den aktualisierten Komponenten in der Sitemap ohne die Bildverweise im Texteditor aktualisieren und die neuen Bildergeschichten mit der Transformation sitemap_add_story.xslt (Text) einfügen. Bei größeren Änderungen kann ich mit dem Perl-Programm mksitemap.pl (Quelltext) die Sitemap (ohne Bildverweise) neu erstellen.

Auf welche Bilder soll ein Bildergeschichten-Eintrag in der Sitemap verweisen? Zu jeder Bildergeschichte gibt es eine Bildbewertungsdatei (imgindex.rng). Die Bilder mit der "besten" Bewertung bilden einen Querschnitt durch die Bildergeschichte. Auf diese Bilder soll die Sitemap verweisen. Die Transformation imgindex_ht.xslt (Text) stellt eine Bildbewertungsdatei als XHTML dar. Die Darstellung bindet die Dateien table.css und tabsort.js (Quelltext) ein.

Bildbewertungsdateien werden mit dem Programm imgindex.pl (Quelltext) erstellt und können dann im Texteditor bearbeitet werden.

Die Transformation imgix_montage.xslt (Text) erzeugt aus einer Bildbewertungsdatei einen Befehl, der eine Vorschaubildmontage für die Sitemap erzeugt. Diese dient in der Darstellung der Sitemap als Hintergrund.

Die Transformation sitemap_add_images.xslt (Text) fügt die Verweise auf die Bilder zur Sitemap hinzu.

Die "lokale" Website

Auf meinem Rechner läuft ein Server, der die Website "spiegelt". Der "lokalen" Webserver hat eine andere Basis-URL. Der lokale Server und der "WWw-Server" brauchen verschiedene Sitemaps. Die Transformation sitemap_add_images.xslt (Text) kann auch eine Basis-URL einsetzen. Auf meinem lokalen Rechner liegen zwei Dateien sitemap_web.xml und sitemap_local.xml. sitemap.xml ist normalerweise ein symbolischer Verweis auf sitemap_local.xml. Bevor ich die Sitemap auf den Webserver lade, setze ich den symbolischen Verweis sitemap.xml auf sitemap_web.xml.