Wat is PageRank?

Banner voor PageRank

PageRank is wat Google groot heeft gemaakt en om zoekmachine optimalisatie te begrijpen is een introductie in PR nodig. Maar tegenwoordig is Google meer dan PR.

Op het internet linken verschillende web pagina’s naar elkaar om zo de lezer te verwijzen naar een andere web pagina. Met andere woorden, doordat er gelinkt wordt in een web pagina naar een andere web pagina geeft de webmaster aan dat die andere web pagina van belang is voor deze web pagina. Of een link naar een web pagina zegt iets over de web pagina. Met andere woorden, links bevatten informatie. Zoekmachines gebruiken links om te bepalen hoe populair een bepaalde web pagina is. Bijvoorbeeld als een web pagina A tien links heeft en een andere, web pagina B, slechts twee en beide web pagina’s behandelen de zelfde content, of onderwerp waarbij de sleutelwoorden het zelfde zijn dan zal web pagina A hoger in de lijst staan dan B.

Maar zo simpel is het niet. Namelijk niet elke link is gelijk. Laten we eerst kijken naar hoe zoekmachines links behandelen waarnaar we kijken PageRank. PageRank is ontwikkeld op Stanford door de founders van Google in 1998. Het is ook de basis die Google gebruikte in die tijd, echter, de PageRank die Google tegenwoordig gebruikt is vele malen complexer en hoe deze exact in elkaar zit is niet bekend. Maar het origineel geeft zeker een aantal aanwijzingen over hoe zoekmachines aankijken tegen links. Ook zijn er een aantal belangrijke updates geweest. Daarom zal ik ook kijken naar wat men “PageRank sculting” noemt.

PageRank de werkelijke waarde van een web pagina?

Zoals hierboven al gehint is PageRank een manier om de waarde van een web pagina te bepalen relatief op links. De gehele links wordt ook wel link graph genoemd. Deze link graph kan worden uitgebuit. En in het originele document van 1998 wordt hier al aandacht aan besteedt en in het document wordt met toename de home pagina van Yahoo genoemd omdat deze web pagina ontzettend veel links heeft. Maar Google gebruikt tegenwoordig veel betere manieren om het uitbuiten van de link graph te detecteren. Ze gaan zelf zo ver dat als dit niet automatisch via algoritmische programma’s kan worden gevonden dat ze manuele actie kunnen ondernemen. Iedereen kan Google hiervan op de hoogte brengen door een spam report te versturen. Deze manuele actie wordt daadwerkelijk uitgevoerd door een medewerker van Google en het kan betekenen dat een web site niet meer voorkomt in de zoekresultaten. De web site beheerder (hierna: webmaster) dient op dat moment de manipulatieve links (in dit geval) te verwijderen en aan Google vragen voor een heroverweging om de manuele penalty te verwijderen.

Natuurlijk is het aantal links een belangrijke parameter om te bepalen hoe belangrijk een bepaalde web pagina is maar een web pagina die veel links naar zich heeft en linkt naar een andere web pagina is een meer belangrijkere link dan web pagina die naar deze web pagina linkt met minder links. Bijvoorbeeld een web pagina A heeft tien links en web pagina B heeft twee links en beide linken naar web pagina C. Omdat web pagina A tien links heeft een web pagina B maar twee links is de waarde van link waarde van web pagina A naar web pagina C vijf keer meer waard dan de link van web pagina B naar web pagina C. Nu is dit een vrij simpele voorstelling maar als dit proces vergroten over de gehele internet dan zien een web van allerlei links waar sommige web pagina’s in het centrum liggen van de web. Denk hier bijvoorbeeld aan een belangrijk artikel over een bepaald onderwerp die overal op de wereld wordt ontvangen als zeer goed en mensen schrijven aanvullende artikelen hierover en linken terug naar het originele artikel. Op dat moment is dit originele artikel het centrum van de on-line discussie en is daardoor meer waardevol voor dat onderwerp dan een artikel die het originele artikel uitgelegd. Met andere woorden, op die manier ontstaat er een web over een bepaald onderwerp (of query). Natuurlijk hebben verschillende onderwerpen verschillende raakvlakken en het is niet ongewoon dat zo’n web zich uitbreidt naar andere webs.

PageRank probeert dit web te kwantificeren door er een numerieke waarde aan te geven (van 0 tot 1). Waarbij het centrum van een web de hoogste waarde heeft en de buitenste web pagina’s de laagste waarde. Deze waarde is relatief omdat het afhankelijk is van welke web pagina’s er linken en hoeveel. Daarnaast wordt deze waarde verder verdeeld naar andere web pagina’s waarnaar de web pagina linkt. Immers zonder een herverdeling van deze waarde kan er nooit een web ontstaan. Een schema kan als volgt zijn:

Schema PageRankEchter als een aantal web pagina’s in een serie naar elkaar linken dan ontstaat er een oneindige loop waarbij de PageRank oneindig door loopt. In het originele publicatie wordt dit probleem omschreven als “rank sinks”. Daarom wordt er een automatische een afname in de formule geïntroduceerd waardoor de PageRank steeds met een beetje afneemt. Doordat links als een soort van “aanbeveling” wordt gezien en daaraan een bepaalde waarde aan wordt toegekend kan dit gebruikt worden om kwaliteit van een bepaalde web pagina te bepalen.

En daaruit volgt dat zoekresultaten beter geordend kunnen worden, van hoge kwaliteit naar lage kwaliteit web pagina’s. Met andere woorden, PageRank is een manier om te kijken of een web pagina tegen over een andere web pagina van een hogere kwaliteit is. En dit ook wat Google nastreeft in haar zoekresultaten. Namelijk het aanbieden van kwalitatief hoge zoekresultaten. In nog andere woorden, PageRank is een methode om het internet te ordenen op basis van hoge kwaliteit.

PageRank Sculpting: Als voorbeeld om PageRank uit te leggen

Omdat een hoge positie in de zoekresultaten zeer waardevol is, hebben webmasters technieken toegepast die niet in het belang zijn van Google. Immers door deze technieken kon het voorkomen dat een mindere kwalitatieve web pagina toch een hogere positie kreeg. Er zijn verschillende technieken die webmasters kunnen gebruiken en de meeste vallen buiten de richtlijnen van Google. Dat wil zeggen, Google heeft richtlijnen opgesteld en als een web site zich niet aan deze richtlijnen houdt dan kan er een manuele actie worden ondernomen. Zo kan een web site lager worden gezet in de zoekresultaten lijst of kan de web site helemaal van de zoekmachine worden verwijderd. Maar niet alle acties vallen buiten de richtlijnen maar Google heeft wel kenbaar gemaakt dat ze deze acties niet waarderen en in het geval van PageRank sculpting heeft Google een algoritmische update uitgevoerd om deze activiteiten bijna geheel waardeloos te maken.

Nofollow

Om PageRank sculpting te begrijpen moeten we eerst kijken naar nofollow. Nofollow kan op twee manieren worden geïmplementeerd:

  • Via een meta tag: De meta tag bevindt zich in the head gedeelte van de html code op een web pagina. Door deze meta tag worden alle links nofollow. Een voorbeeld is
    <meta name="robots" content="nofollow" />
  • Via een rel attribuut in een achor element: Hierbij is het mogelijk om individuele links te nofollow-en. Een voorbeeld van een nofollow rel attribuut in de html code is
    <a href="admin.php" rel="nofollow">Naar de admin pagina</a>

Als Googlebot (de crawler van Google) de nofollow ziet dan zal ze de link niet volgen, maar ook zal de link niet voorkomen in de “link graph”. We hierboven gekeken naar hoe link een web van web pagina’s maakt en in het centrum zijn de meest belangrijkste web pagina’s. Dit web welke naar voren komt door middel van links wordt ook wel de “link graph” genoemd. Met andere woorden, als Googlebot de nofollow tegen komt dan verwijderd deze die link van de web. Om een web pagina te kwantificeren zoals in PageRank is het nodig dat de link wordt toegevoegd aan de link graph. Omdat de link niet wordt toegevoegd geeft deze link ook geen PageRank door. In het kort, een nofollow link stopt de PageRank. Dus de herverdeling naar deze link vindt niet plaats.

Nu terug naar PageRank Sculpting

Omdat er geen herverdeling plaats vindt naar links met een nofollow wordt de waarde alleen verdeeld aan links die geen nofollow hebben (deze links worden ook wel dofollow links genoemd). Dus de waarde die wordt overgedragen wordt alleen aan links doorgegeven die geen nofollow attribuut hebben. Als we dit in de schema bekijken dan volgt:

Schema PageRank met nofollowDoordat een link nofollow is wordt de PageRank van de bovenste web pagina groter ten koste van de onderste web pagina. Webmasters en met name SEO’s gebruikten deze techniek binnen een domein om een bepaalde web pagina extra PageRank te geven. Bijvoorbeeld een bepaald product werd gepromoot en deze moest hoger in de zoekresultaten komen. Op dat moment gebruikten ze nofollow om zoveel mogelijk de PageRank naar een bepaalde web pagina te dirigeren. Dit wordt PageRank sculpting genoemd. Hoewel in de originele PageRank van 1998 al een afname of rank sink was heeft Google ergens begin 2008 of eind 2007 de PageRank zo up-ge-date dat dit dirigeren van PageRank niet meer voordelig is. Met andere woorden, de schema zoals hierboven is niet meer geldig. Hoe deze update van de PageRank precies in elkaar zit weten we helaas niet. Maar het is veilig om te stellen dat tegenwoordig PageRank sculpting vrij onzinnig is.

Tot slot,

Hoewel PageRank sculpting tegenwoordig niet meer voor komt of slechts sporadisch wordt gebruikt door webmasters die niet alles bijhouden heb ik dit toch toegevoegd aan dit artikel omdat het een mooie manier is om uit te leggen hoe PageRank werkt en hoe in het verleden webmasters en SEO’s met PageRank omgingen. Daarom is PageRank sculpting meer een voorbeeld en zeker niet iets waar een webmaster zich mee bezig hoeft te houden. Tot slot, met name het gedeelte over nofollow is vrij oppervlakkig en er is veel meer te vertellen over nofollow maar voor dit artikel is PageRank de kern vandaar dat ik slecht een introductie hier heb beschreven.

Geef een reactie

Uw e-mail adres wordt niet gepubliceerd.

*
*

De volgende HTML tags en attributen kunnen worden gebruikt: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>