« Fraktaler i Shakespeares texter | Main | Fredagsfyran - Tema fredagsfyran »

augusti 20, 2004

'intressant blogg' - En liten studie i sökstabilisering Typ B

Inspirerad av 'Interesting blog' - we're number one? (Captology Notebook) gjordes motsvarande svenska sökning:

intressant blogg


I skrivande stund kommer innevarande blogg först, följd av Nätkreatur och Klocklös i tiden. Om man däremot citerar sökningen, dvs

"intressant blogg"

kommer Nätkreatur först, tätt följd av Klocklös i tiden och sedan hakank.blogg.

Några begreppsligheter
Den engelskspråkiga sökningen (interesting blog) är stabil i betydelsen att samma sajt kommer först oavsett om man citerar sökningen eller inte. Den svenska sökvarianten är däremot instabil.

Undertiteln på denna blogganteckning - en liten studie i sökstabilisering typ B - kommer sig av det experiment som ni just nu bevittnar, nämligen att försöka få hakank.blogg som första resultat på de båda typerna av sökningarna, både med och utan citattecken. Ett lyckat sådant försök kallas härmed för sökstabilisering. Eftersom det finns två varianter av sökstabilisering blir det typ A och typ B:
* Typ A: då den sajt som var på första platsen för citatsökningsversionen även blir först på sökning utan citattecken
* Typ B: då den sajt som var på första platsen för sökningar utan citattecken även kommer först på en sökning med citattecken.

Resultat
Jaha, nu är det bara att vänta några dagar tills google spindlar denna anteckning - vilket torde ske på söndag eller måndag (dvs 22 eller 23 augisti) - så kan vi se om det blivit något skillnad, dvs om det blivit någon sökstabiliseringen typ B.

Kommentarer
Egentligen borde man kalla det engelska sökresultatet för 1-stabilt eftersom det endast är förstaplatsen som är samma. Skulle de fyra första sökresultaten vara i exakt samma ordning är det 4-stabilt etc.

Däremot ger båda de engelska sökningarna samma första fyra sajter fast i olika ordningar, precis som för den svenska varianten (som har samma tre i topp-klustret). Att det är samma N bloggar som ligger först ger någon indikation på sökstabiliteten, men den exakta formeln för detta lämnas antingen som en övning åt läsaren eller till en regnig söndag.

Endast sökning på intressant ger naturligtvis intressant.se i topp. Sökresultatet är naturligtvis samma oavsett om man citerar sökningen eller inte.


Här är för övrigt ett citat från den ovan refererade blogganteckningen:
Since Google is so incredibility popular [...] [Google] has influenced many decisions about how to use language on the web.

Posted by hakank at augusti 20, 2004 10:44 EM Posted to Blogging | Sökmotorer

Comments

Resultatet innebär iofs inte att Klocklös skulle vara särskilt intressant, bara att jag skriver om intressanta bloggar. Vilket iofs väl innebär att Klocklös är intressant? Hmm, vilket filosofiskt dilemma.

Posted by: Mats Andersson at augusti 21, 2004 12:28 FM

Tack Mats, det är ett intressant spörsmål du tar upp.

I analogi med din fråga kan man fråga: om man söker på "grön disktrasa" och din sajt kommer först i resultatet, skulle det innebära att sajten var en grön disktrasa?

Jag ser f.ö. problemet snarare som en paradox än som ett dilemma. Problemet har en strukturlikhet med Russells paradox eller närmare bestämt Grelling-Nelsons paradox: Det finns ord som har den egenskapen den beskriver, t.ex. "kort", "tvåstavig". Kalla denna typ av ord för "autologiska". Andra ord har inte den egenskap de beskriver, t.ex. "lång", "enstavig", "blå". Vi kallar dessa ord för "heterologiska". Fundera nu på om ordet "heterologisk" är heterologisk eller inte. Se lite mer här: http://en.wikipedia.org/wiki/Grelling-Nelson_paradox . Dessa och liknande paradoxer diskuteras naturligtvis utförligt i "Gödel Escher Bach".


En helt annan sak: Det skulle också kunna vara så att alla förekomster av "intressant blogg" på din blogg alltid har ett "inte" framför (t.ex. "är inte en intressant blogg"), vilket i och för sig skulle kunna vara intressant att läsa om.


Men kärnan i din fråga kvarstår: vad säger sökningarna egentligen om världen?

För vissa typer av sökningar, t.ex. personnamn och produkter är det väl rätt enkelt. Vi försöker få information om dessa saker: vad skrivs om X (där X kan vara välkänt redan, såsom vid självgoogling).

För andra typer av sökningar är man mer intresserad av _användningen_ av en fras, t.ex. om en sådan fras finns eller inte eller hur vanlig den är. Svårigheten kommer om vi drar några djupare filosofiska växlar på detta. En sökning på "grön disktrasa" ger just nu exakt 0 (noll) träffar, men det säger naturligtvis ingenting om det finns sådana i den riktiga världen. (Liksom en sökning på mitt mors namn inte säger något om hon finns eller inte. Hon finns. Hej, mor!)


Några truismer:
* Att som finns finns inte på nätet, och allt som finns på nätet finns inte i verkliga livet.
* Bara för att en något kommer högt upp på ett sökresultat betyder inte att det är bättre eller ens bra.
* Bara för att en sökning på X ger fler googleträffar än en sökning på Y betyder inte att X är bättre än Y.

Se även "Google som bevis": http://www.hakank.org/webblogg/archives/000685.html .

Posted by: Håkan Kjellerstrand at augusti 21, 2004 07:18 FM

"Since Google is so incredibility popular [...] [Google] has influenced many decisions about how to use language on the web."

Intressant. Min första tanke var att det är lite hemskt att man tar hänsyn till Googles ranking när man gör innehåll. Naturligtvis borde det man vill säga vara det enda viktiga. Men efter viss reflektion kom jag att tänka på att jag faktiskt själv gjort något liknande. Nämligen valt att absolut inte använda vissa ord för att jag inte vill att sökningar på dem ska leda till mig. Det är ganska roligt att titta i loggarna och se var det är för sökord som har gjort att någon hittat till ens webbplats.

Posted by: Lars Olofsson at augusti 21, 2004 03:52 EM

Et tu, Lars. :)

Visst bör själva texten vara det viktiga och valet av ord endast bero på vad som är bäst rent språkligt eller kommunikativt.

Om man tycker det är roligt att få besökare till sin sajt kan det nog göras mer eller mindre medvetet någon form av sökoptimering för få bättre placering i sökresultaten, och om man dessutom är en statistikknarkare blir det kanske lite mer av den varan än vad som är nödvändigt.

(Naturligtvis finns det undantag. Det finns skribenter som inte bryr sig överhuvudtaget om placeringen på sökmotorerna. Och det ett ytterst litet antal sökfraser för vilka jag överhuvudtaget bryr mig om sökplaceringen, och ett ännu mindre antal där jag försöker att påverka.)

Din typ av "sökmotorminimering" - eller vad nu motsatsen till "optimering" heter - är synnerligen godartad.

Personligen ser jag denna medvetenhet om sökmotorer som nödvändig, eftersom det är ett offentligt samtal vi håller på med, och som sparas "för all framtid" (eller "till servern går ner") och är lätt tillgängligt för alla och envar.


Det är alltså inte så konstigt om vårt _webbspråk_ påverkas av sökmotorernas existens. En annan fråga är om vårt _vardagsspråk_ har påverkats av detta, förutom i den trivala meningen att vi får nya begrepp såsom "googla" etc. Har du börjat sökoptimera diskussionerna vid fikabordet?

Posted by: Håkan Kjellerstrand at augusti 22, 2004 07:56 FM