Sitemaps – Optimalisatie in Google’s hulpprogramma voor webmasters

Banner Sitemap in Google's hulpprogramma voor webmasters

Hoewel Sitemaps vaak automatisch door zoekmachines worden gevondenis het toch een goed idea om deze toe te voegen in Google's hulpprogramma voor webmasters.

Sitemaps zijn bestanden waarmee de webmaster (de beheerder van de website of eigenaar) gemakkelijk zoekmachines kan informeren over welke pagina’s er op de web site staat. In haar simpelste vorm is een sitemap een xml bestand met een lijst van URL’s en additionele meta data. Dit is iets anders dan een HTML sitemap waarbij een web site een web pagina heeft met alle web pagina’s en is meer bedoeld voor bezoekers zodat ze gemakkelijk door de web site kunnen navigeren. Bekijk mijn vorige artikel over Sitemaps om een beter idee te krijgen. Sitemaps kunnen worden toegevoegt in Google’s hulpprogramma voor webmasters (hierna: GWT) maar het ook mogelijk om op de web site zelf zoekmachines te informeren via de robots.txt en/of Sitemapindex.

screenshot-sitemaps

Sitemap toevoegen in GWT

Sitemaps toevoegen is vrij makkelijk. Onder “Optimalisatie” en de tab “Sitemaps” is rechts bovenaan een makkelijke manier om een Sitemap toe te voegen. Een Sitemap hoeft niet in de root te zijn, maar dit is wel gebruikelijk. Echter als de webmaster bijvoorbeeld twee programma’s heeft, een content management systeem welke is geïnstalleerd in de root en een blog systeem welke is geïnstalleerd onder een sub-folder zoals /blog/, dan is het vrij aannemelijk dat beide systemen op verschillende locaties een Sitemap aanmaken. Dit is geen probleem voor Google en beide kunnen worden toegevoegd. Echter, in ons voorbeeld, de URL’s in de Sitemap example.com/blog/sitemap.xml kunnen alleen URL’s zijn die in de /blog/ sub-folder zijn. Als we ons voorbeeld uitbreiden met een Sitemap in de /forum/ sub-folder, example.com/forum/sitemap.xml, dan mogen er geen URL’s van example.com/blog/ in de Sitemap van example.com/forum/sitemap.xml. Met andere woorden, de URL’s in example.com/forum/sitemap.xml mogen alleen beginnen met example.com/forum/.

Site map toevoegen in GWT

Sitemaps toevoegen voor meerdere web sites

Het is mogelijk om Sitemaps van meerdere web site op één locatie te hosten. Hiervoor is het wel verplicht om voor alle web sites geverifieerd te zijn. Door de verificatie geeft de webmaster aan dat ze eigenaar is van de verschillende web sites en daardoor is het mogelijk om één Sitemap te hebben voor meerdere web site. Bijvoorbeeld de Sitemap example.com/sitemap.xml kan URL’s bevatten van de web site example.org als de webmaster beide heeft geverifieerd op de zelfde Google account. Maar het is ook mogelijk om aparte sitemaps te hosten op één locatie. Bijvoorbeeld de Sitemap van example.com is op example.com/sitemap.xml en de Sitemap van example.org is op example.com/org-sitemap.xml. Wederom dient de webmaster beide web sites te hebben geverifieerd op het zelfde Google account.

Zoals met vrijwel alles in GWT geldt dit alleen voor Google Search en andere zoekmachines hebben geen toegang tot deze informatie. Ook is het toevoegen van URL’s van verschillende domeinen in de zelfde Sitemap niet volgens de Sitemap.org protocol. Daarom raadt ik dit niet aan. In plaats daarvan lijkt het mij beter om gebruik te maken van de robots.txt om zoekmachines te informeren dat de Sitemap ergens anders is gehost. Die manier is het wel in overeenstemming met de Sitemap protocol.

Sitemapindex

Hoewel er meerdere web sites via één Sitemap kunnen worden toegevoegd zijn Sitemaps gelimiteerd tot 50.000 URL’s per Sitemap en de grote mag niet groter zijn dan 10 MB. Omdat deze limiet bestaat heeft sitemaps.org Sitemapsindex ontwikkeld. Net zoals een “gewone” Sitemap kunnen Sitemapindex via de zelfde manier worden toegevoegd aan GWT. Het mooie van deze manier is dat ook alle Sitemaps die in de Sitemapindex is wordt gevonden door Googlebot.

Robots.txt en Sitemap

De beste manier om een Sitemap toe te voegen is via de robots.txt omdat deze niet alleen voor Google geldt maar ook voor andere zoekmachines. Deze manier is een “open standaard”. Dat wil zeggen, de verschillende zoekmachines, zoals Google en Bing, ondersteunen deze manier. De open standaard wordt door sitemaps.org onderhouden. Door gebruik te maken van open standaarden is de webmaster niet afhankelijk van één zoekmachine zoals door het gebruik van GWT.

In de robots.txt is het vrij gemakkelijk om zoekmachines te informeren over waar de Sitemap is en deze kan ook ergens anders worden gehost. Namelijk door de volgende lijn toe te voegen aan de robots.txt:

Sitemap: http://www.example.com/sitemap.xml

Waar example.com uw domeinnaam is. Dit is een vrij gemakkelijke manier en deze kan ook naar een Sitemapindex linken.

Bekijk ook mijn andere artikelen over “Optimalisatie” in GWT:

URL’s verwijderen – HTML-verbeteringen – Contentzoekwoorden – Gestructureerde gegevens – Gegevens markeren

Geef een reactie

Uw e-mail adres wordt niet gepubliceerd.

*
*

De volgende HTML tags en attributen kunnen worden gebruikt: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>