« Friendsters Jonathan Abrams om sociala nätverkssystem | Main | mobillog.nu »

mars 17, 2004

Google PageRank Report

Google PageRank Report är en service jag letat efter länge. Här kan man se vilken PageRank en sida har, utan att behöva köra speciella webbläsare med speciella toolbars.

Än så länge har jag inte hittat några konstigheter.

Via Google Blogoscoped.

Uppdatering
Via samma källa hittades en Usenettråd som besvarar en del av tekniken bakom programmet.

Det har gjorts en del efterforskningar hur man räknar ut den checksumma (parametern ch) som krävs, men ingen algoritm har publicerats vad jag kan se.

Posted by hakank at mars 17, 2004 05:27 EM Posted to Sökmotorer

Comments

Ursäkta en humanist, men vad är pagerank? Har jag någon nytta av det?

Posted by: Chadie at mars 18, 2004 01:04 EM

PageRank är namnet på den algoritm som google använder för att lista ut i vilken ordning sökresultaten ska visas.

Den exakta metoden för att räkna ut vilken ordning som sidorna i sökresultatet kommer är okänt, men den bakomliggande principen finns publicerad.Några referenser om detta finns på
http://www.hakank.org/webblogg/archives/000103.html


Här är en kort och lite förenklad förklaring.

Förutom att google försöker att avgöra hur relevant en webbsida är med avseende på sökorden, används en parameter kallad PageRank-värde som - enkelt uttryckt - mäter hur populär en sajt är. Det är alltså detta värde man får reda på via den sajt jag bloggade om.

Tanken är att om två sidor är lika relevanta med avseende på sökorden kommer en populär sida (som har högre PageRank) att visas före en mindre populär sida (har lägre PageRank).

Det är ett tal mellan 1 och 10, där 10 indikerar störst popularitet och 1 minst (0 är för de sidor som inte har fått något PageRank-värde ännnu). För närvarande har hakank.blogg PageRank-värdet 5 liksom Chadie NU och ett antal andra svenska bloggar, tesugen.com har 6, Dagens Nyheter har 8, Aftonbladet 7 etc.

Denna popularitet ("prestige" som det kallas i annan litteratur) räknas ut genom att studera hur många som länkar till en sida och vilken popularitet dessa sajer har. Ju fler populära sidor som länkar till sajt desto populärare anses den vara. (Denna cirkulära definition förklaras mer i dokumenten som nämns ovan:)

En intressant sak är att bloggar tenderar att komma högt på googles sökresultatsidor eftersom de innehåller ofta länkar till varandra, t.ex. i bloggrullar och kommentarer.

Det är också på grund av denna popularitetsberäkning som vi får så mycket spam på våra bloggar: spammarna försöker att höja sin google-popularitet genom att lägga in länkar till sin sajt från så andra sajter som möjligt.

PageRank-metoden har med rätta kritiserats, men trots detta är google mitt förstaval av sökmotor, eventuellt kompletterad med andra såsom yahoo och alltheweb.


Nyttan med att veta sitt eller andras PageRank-värde är nog störst för dem som försöker att optimera sin sajt för att komma så högt som möjligt på google (s.k. Search Enginge Optimization), inklusive spammare.

Själv tycker jag att det är skoj att veta detta värde för att förstå hur google fungerar. Och är man statistikknarkare så är man...

För övrigt är jag i grunden också en humanist. :-)


P.S. Jag upptäckte nyss ett exempel på märklig sökrankning. Googla på "engelska nyheter" (utan fnuttar). Just nu är det underbloggad som kommer först av 116000 sidor...

Posted by: Håkan Kjellerstrand at mars 18, 2004 02:16 EM

Jag kollade ett tiotal svenska bloggar och alla hade värdet 5/10. Vad betyder det?

Posted by: Bengt O. at mars 20, 2004 02:16 EM

Bengt:

Det betyder egentligen inte så mycket mer än att de har ungefär av samma PageRank-popularitet.

Talen är på en logaritmisk skala så att det finns väldigt många sajter som har PageRank 1, lite färre som har värdet 2, och mycket få som har det maximala värde 10 (t.ex. google själv). 5 ligger där någonstans mitt emellan, men exakt hur många sajter som finns inom respektive intervall är osäkert.

PageRank säger alltså ingenting om innehåller eller bloggarnas kvalitet, utan är en summering av hur många sajter/sidor som länkar till dem och hur populära dessa i sin tur är.

Eventuellt skulle man kunna säga att anledningen till att de har samma värde är att de bara länkar till varandra. Men då tror jag för det första att man övertolkar värdena, och för det andra är det inte sant.


Man bör notera att vissa bloggar, t.ex. Mymarkup.net, Tesugen.com och Enkelriktat, just nu har 6 i PageRank.

(Jag har inte kollat samtliga inom bloggosfären, men sådant är ganska enkelt att automatisera. När tid gives. Vore det intressant?)

Posted by: Håkan Kjellerstrand at mars 20, 2004 04:51 EM