Gestructureerde gegevens – Optimalisatie in Google’s hulpprogramma voor webmasters

banner gestructureerde data

Een prachtige manier om de kracht van de semantische web te zien is in Google's webmaster tools onder gestructureerde gegevens. Met schema.org is mooi.

Gestructureerde gegevens zijn gegevens die naar voren komen doordat de webmaster (de eigenaar of beheerder van de web site) een speciale mark-up gebruikt. Het is daarom onderdeel van semantisch web. Dat wil zeggen, een web die betekenis heeft voor computer programma’s. Het gaat hier om data die door computer gelezen en begrepen kunnen worden. Deze data is niet voor mensen of bezoekers bedoeld en daarom zijn deze (vaak) ook niet zichtbaar in de browser. De mark-ups worden vaak rich-snippets genoemd omdat ze op een rijke manier naar voren komen in de zoekresultaten  In Google’s hulpprogramma voor webmasters (hierna: GWT) geef Google de webmaster informatie over welke mark-ups ze heeft gevonden. Google ondersteund drie mark-up:

  • schema.org (deze wordt aangeraden en ik zal alleen hiernaar kijken in dit artikel)
  • microformats
  • microdata
  • RDFa

Semantische web

De rede waarom semantische web en de bijbehorende mark-up van belang kan zijn is omdat gestructureerde data die in een database staan informatie bevat die vaak op de web pagina verloren gaan. Bijvoorbeeld een ecommerce web site hebben een database waarbij per product de prijs en een beschrijving staat vermeldt. In de database staat dit mooi en gestructureerd in een kolom. Echter wanneer deze informatie op een web pagina wordt gezet dat kan wordt deze informatie verspreidt over de gehele web pagina en doordat crawlers (computer programma’s die een web pagina bezoeken) alleen de gehele web pagina zien en niet de individuele informatie wordt het moeilijk om deze gestructureerde data (prijs en beschrijving, bijvoorbeeld) uit de web pagina te filteren. Als deze informatie per web pagina wel verkrijgbaar is dan kunnen programma’s deze met elkaar vergelijken en deze in een gestructureerde manier naar voren brengen voor hun bezoekers. Kortom door de hoeveelheid informatie en doordat de verschillende informatie bronnen door elkaar staan wordt het ingewikkeld voor programma’s om een goed beeld te krijgen van de web pagina. Of, in andere woorden, door de structuur naar voren te brengen kunnen computer programma’s, zoals zoekmachines, beter de informatie begrijpen en deze beter presenteren aan de bezoekers van de web site, of zoekmachine.

Wat zijn rich-snippets?

Al deze mark-ups zijn over het algemeen niet te zien voor de bezoekers hoewel sommige browsers deze mark-up wel kunnen gebruiken om additionele informatie te geven. Google gebruikt deze mark-ups met name om extra informatie te geven in haar zoekresultaten. Deze worden rich-snippets genoemd. Immers doordat Google de informatie op de web pagina beter begrijpt kan ze meer gedetailleerde informatie doorgeven in haar zoekresultaten. Een snippet is wat wordt weergegeven in een zoekresutlaat. Het voorbeeld hieronder is een recept voor een vegetarische pizza zonder kaas zoals die naar voren kan komen op een zoekmachine van Google. De web pagina gebruikt hier schema.org en verschillende mark-up waarbij http://schema.org/Recipe het belangrijkste is:

Verschillende rich-snippet mark-ups en hoe ze in de zoekresultaat naar voren komen

Het duidelijk te zien dat deze zoekresultaat veel aantrekkelijker is dan een “normale” snippet waarbij de titel en de beschrijving (bekijk mijn artikel over HTML-verbeteringen om een idee te krijgen over de “normale” snippet). Hierdoor kan de CTR (click-trough-ratio) veel hoger liggen. Omdat in dit voorbeeld een recept wordt weergegeven is het ook meer waarschijnlijk dat door de mark-up deze web pagina op speciale zoekmachine van Google terecht komt, namelijk Google Recipes (helaas niet actief voor de lokale zoekmachine google.nl). Kortom door gebruik te maken van rich-snippets kan de webmaster meer verkeer genereren vanuit Google’s zoekmachine. Maar wat nog belangrijker is dat het verkeer vanuit Google naar alle waarschijnlijkheid bezoekers zijn die echt geïnteresseerde zijn in de content op de web pagina. Met andere woorden, de kwaliteit van het verkeer ligt over het algemeen hoger bij rich-snippets. Of het maakt niet veel uit of een web pagina in de zoekresultaten is als niemand erop klikt.

Waarom schema.org?

Nu we weten waarom mark-ups en de afgeleide rich-snippets van belang kunnen zijn voor een webmaster rijst de vraagt waarom schema.org als een mark-up en niet de andere. Schema.org is in vergelijking met de andere mark-up een nieuwkomer en bouwt verder op de microdata. Waarom schema.org preferent is over de andere mark-ups is omdat alle grote spelers deze ondersteunen en gezamenlijk tot overeenstemming zijn gekomen over hoe de mark-up hoort te zijn. Bing, Google, Yahoo, Yandex (Russische zoekmachine) allemaal ondersteunen dit. Maar verschillende zoekmachines hoeven niet elke mark-up van schema.org te ondersteunen. Aan de andere kant, Google heeft, bijvoorbeeld, al tijdens de lancering op 2 juni 2011 van schema.org gezegd dat de mark-up die nu niet wordt ondersteunt in de rich-snippets in de toekomst wel ondersteund kunnen worden.

Daarnaast bevat schema.org alle onderdelen die de grote zoekmachines ondersteunen en meer voor toekomstige rich-snippets. De onderdelen die ze support zijn onder andere deze populaire mark-ups:

Maar schema.org ondersteund veel meer. Bekijk hier de volledige lijst. Kortom doordat alle grote spelers dit ondersteunen en omdat de mark-up zeer uitgebreid is heeft schema.org de voorkeur boven andere mark-ups.

Rick snippets en GWT

In GWT geeft Google de informatie over welke mark-ups ze heeft gevonden op de web site weer per mark-up. Zo worden recensies en recepten apart weergegeven en de bron die gebruikt wordt voor de mark-up, bijvoorbeeld schema.org of microformats.org:

screenshot GWT en rich-snippets in gestructuurde gegevens

 

Wanneer de webmaster op de data-type klikt dan men zien waar de mark-up aanwezig is in web site. Dat wil zeggen, de mark-up wordt weergegeven per web pagina of URL van bron, hoeveel keer de mark-up op de web pagina voorkomt of items, bijvoorbeeld met betrekking tot recensies is het mogelijk dat er meerdere recensies aanwezig zijn, de omschrijving en tot slot laatst gedetecteerd:

Screenshot van gestructureerde data in GWT per snippet

 

Als de webmaster klikt op de individuele URL dan kan men zien welke data met betrekking tot deze mark-up er aanwezig is op de web pagina. Dit is een pop-up met een link naar Google’s rich snippet tool of Structured Data Testing Tool (zoals deze nu heet). Deze tool is geen onderdeel van GWT in de zin dat ze aanwezig na de log in en na de validatie proces. Dat wil zeggen, deze tool is openbaar en men kan elke web pagina testen (ook web pagina’s buiten het domein om van de webmaster) om te kijken of er rich-snippets aanwezig zijn.

Gestructuurde data in GWT en individuele URL

Tot slot,

Zoals al gehint is er veel en veel meer te vertellen over rich-snippets en hoe die worden weergegeven in GWT. Echter daarvoor is dit artikel veel te kort en dit is alleen bedoeld als een introductie tot rich-snippets waardoor de webmaster deze functie in GWT beter begrijpt. Met andere woorden, dit artikel is met name bedoeld om te laten zien hoe krachtig een rich-snippet kan zijn en om interesse op te roepen voor het semantische web en hoe een webmaster dit kan bevorderen.  Als je vragen hebt over een specifieke mark-up stel gerust een vraag hieronder als een commentaar.

Bekijk ook mijn andere artikelen over “Optimalisatie” in GWT:

Sitemaps – URL’s verwijderen – HTML-verbeteringen – Contentzoekwoorden – Gegevens Markeren

Geef een reactie

Uw e-mail adres wordt niet gepubliceerd.

*
*

De volgende HTML tags en attributen kunnen worden gebruikt: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>