« februari 2005 | Main | april 2005 »

mars 31, 2005

Aprilpyssel

Aprilpyssel. Frågan är helt enkelt: Vad står där. Och varför?

Ledtråd 1 (2005-04-02): Det är inget aprilskämt.

Ledtråd 2 (2005-04-03): Detta är samma text förändrad med samma metod.

Ledtråd 3 (2005-04-04): Liksom detta.

Ledtråd 4 (2005-04-05): Program för att skapa (i princip) unika varianter, alla omformulerande samma text.
Kanske hjälper följande genom sin blotta närvaro, varvaro och hurvaro, kanske inte:

Finns det något som är beständigt?
Något som alltid ändras?
Är det det beständiga som är relevant eller
det som alltid förändras?
Är det hela handen som pekar,
eller pekfingret som gör själva peket och de
andra fingrarna håller endast med
genom sina ekon av pekfingrets monolog?

Ledtråd 5 (2005-04-06): Det finns ett annat program som gör det mycket enklare att komma på metoden. Programmet finns någonstans här på sajten. Ledtråd för placering och namn på detta program: klassidentifikation. Not: I programnamnet utnyttjas endast ett ondtyckligt urval av tecknen a-z, A-Z, "_" (understrykningstecknet), "." (punkten) samt de 9 vanligaste siffrorna.

Prosaisk dagsvers (dagsmynt?), som som vanligt möjligen hjälper eller inte:

Gör det enkelt och det rätta
Gör det inte så svårt.
Tänk på att hjärnan mätta
Så går det fint i denna sport.

Vägen till målet framför dig ligger
Tänk på alfabetets hide and seek:
en bokstav kan vara en annan lik
Så lossar du gåtans trigger.


Ledtråd 6 (2005-04-07): Tänk på att "klass" kan betyda olika saker (lånat från Svensk synonymordbok)

1 grupp, avdelning, kategori, fack, slag, sort, typ, rang, släkte; hög standard, standard, kvalitet, stil, nivå, grad, ordning, division
2 skolklass, årskurs
3 samhällsklass, socialgrupp, stånd, skikt, kast
4 servicekategori

En av ovanstående betydelsenyanser ger korrekt association. Kvar är då att fundera på vad "identifikation" kan beteckna i sammanhanget. Och hur dessa två ska kombineras.

För övrigt kan upplysas om att texten som laboreras med är på engelska språket men är inte från någon av Shakespeare mindre kända lätta förväxlingskomedier eller någon av dennes mindre lätta kända förväxlingskomedier.

Det görs härmed en stark rekommendation att bearbeta texterna med datorstöd eller motsvarande elektronisk utrustning (radio hjälper tyvärr inte så mycket), vilket möjliggör jämförelser i det stora och det lilla.


Ledtråd 7 (2005-04-08): Idag tar vi rast från klassidentifikationsproblemet och ägnar oss helt åt huvudgåtan.

Dagens primära ledtråd kan vara viktig om man hittar rätt nål att träda den på: Det rekommenderas att man gör en gemensam och samtidig analys av c:a 10 olika omkodningar av texten.

Igår undrade hakke (se kommentarerna i denna anteckning) om siffersumma var relevant. Jag skulle vilja uttrycka det så här: Nej, siffersummor är inte en nyckel till problemet, snarare tvärtom.

Så dagens sista ledtråd: Klartexten av denna omvandling motsvarar hela eller en central del av algoritmen eller koden för att göra omvandlingen, och är - eller inte - exakt samma kod som används för att generera denna specifika omvandling, som i sig är samma kod - eller inte - som använts för att generera den första omvandlingstexten, ehuru det är - naturligtvis - samma omvandlingsmetod som hela tiden används.

Exakt(a) beskrivningsprogramspråk/programspråk som används är alltså tillsvidare förborgad(e) som i en liten men blågrön ask som gömdes i den nedre byrålådans innersta under ett häftigt, populärt och välbesökt åskväder och som sedan fick dåliga recensioner vari det även anklages för att ha snott fler än fyra taker från en tidigare ledande men nu mindre offentlig molnkonstellation.

Man skulle nu möjligen börja kunna dra vissa slutsatsen om huvudtextens beskaffenhet.


Ledtråd 8 (2005-04-12): Efter en liten paus i letrådandet återkommer här några ändar:
* färgen i texten har ingen betydelise
* inte heller färgkodningen

De var bara några av de förvillelser som skapades enkom för att skapa förvillelser. Fler väderstreck på felstegskartan är att vänta.

"Klass" i klassidentifikationsledtråden är skolklass. Mer konkret: det var beteckningen på den klass jag gick i vid cirka 12 års ålder, på Husieskolan i Malmö (lilla baracken om minnet inte sviker helt nu). Det kan ha varit det sista året som vi gick i skolan på lördagarna (slöjd, inget annat).

Ledtråd 9 (2005-04-28): Sista ledtråden




(Skrivet dagen före 1:a april:)
För övrigt kommer jag inte att skriva något aprilskämt i morgon. (Min tidzon är den svenska modifierad för sommartid, precis som väntat.)

Posted by hakank at 08:19 EM Posted to Diverse | Comments (6)

mars 28, 2005

Economist om collaborative filtering (rekommendationssystem)

Economistartikeln United we find (10 Mars 2005) innehåller en introduktion av collaborative filtering och beskriver även mer modern forskning inom området.

For many people, technology now plays an increasing role in making such choices and navigating through large numbers of alternatives. But while this might sound like a job for an internet search engine, keyword-based search engines (such as Google) have a fundamental constraint: they can only help you find something if you already have an idea of what it is. Two people's idea of “good music” may differ substantially, but Google would return the same results to both of them. To find things you might like, but are not already familiar with, requires a different technology, known as “collaborative filtering”.

This increasingly pervasive technology looks for patterns in people's likes and dislikes, and uses those patterns to help people find things they did not know they were looking for. Computer scientists term this task, in a welcome respite from jargon, “find good things”. Collaborative filtering also has the power to do the converse, “keep bad things away”, for instance by filtering unsolicited commercial e-mail messages, or spam.

Artikeln förklarar sedan kortfattat skillnaden mellan de två teknikerna "user-user" och "item-item", liksom hur TiVo räknar ut sina rekommendationer som är annorlunda jämfört med Amazons serverkalkyler.


De mer intressanta sakerna kommer sedan: hur man kan göra rekommendationssystem säkra för intrång i den personliga integriteten och säkra för manipulering.

* John Canny och hans förslag till rekommendationer baserade på krypterade (anonyma) preferenser.
* Mike O'Mahoney gjorde tillsammans med Neil Hurley, Nicholas Kushmerick och Guénolé Silvestre en analys av sådana systems robusthet: Collaborative Recommendation: A Robustness Analysis
* Nolan Miller har skissat på en lösning av manipulationer genom en probabilistisk analys av ovanliga händelser i systemet.
* Jonathan Herlocker som spekulerar i om det finns en gräns i hur bra rekommendationer kan göras med collaborative filtering-tekniker: Dr Herlocker speculates that this might be evidence for a fundamental limit to the accuracy of recommendation systems based on collaborative filtering. There is no point in making suggestions any more finely tuned than the variations in an individual's own opinions. Dr Herlocker may well be correct, or the technology may just have further to go.


Artikeln avslutas med en hyllning till collaborative filtering jämfört med traditionella sökmotorer och använder den allt mer vanliga crowd vs. solitary-metaforen (cf. artikelns rubrik: "United we find"). Även om jag i stort sett håller med i hyllningen så tycker jag nog att författaren tar lite väl lätt på skillnanden i förutsättningar mellan de två olika metoderna att hitta information: För att kunna få bra rekommendationer i ett rekommendationssystem krävs ett stort förarbete att berätta om sina preferenser för systemet, antingen det är frågan om att betygssätta filmer/skivor/böcker, ha köpt dem via systemet eller klickat runt i sajten ordentligt. När/om det blir möjligt att kunna spara och förflytta gjorda preferenser mellan olika rekommendationssystem blir skillnaden naturligtvis mindre.

But the value of collaborative filtering has, in any case, already been established. It helps people find things they might otherwise miss, and helps online retailers increase sales through cross-selling. Where the user of a search engine is on a solitary quest, the user of a collaborative-filtering system is part of a crowd. Search, and you search alone; ramble from one recommendation to another, and you may feel a curious kinship with the like-minded individuals whose opinions influence your own—and who are, in turn, influenced by your opinions.


Se även
Lite om rekommendationssystem (recommender systems, collaborative filtering)

Posted by hakank at 08:03 FM Posted to Rekommendationssystem | Comments (4)

mars 24, 2005

Joke-e-oke: Karaokee för skämt

Wired News: Now You, Too, Can Be a Comedian skriver om en karaokee-inspirerad fluga. I stället för att att sjunga till en jukebox ställer man sig upp och drar skämt till en jokebox.

Detta passar f.ö. mig bättre är att sjunga (som jag inte heller kan): ska jag göra bort mig inför IRL-publik så vore det så här. Nästa steg är väl att man kan spela Romeo mot en virtuell Julia (fast sådant kanske redan finns?).

Några klipp från artikeln:

Karaoke is soooooo 1990s. For those who'd rather make people laugh at their punch lines than cringe at their high notes, the new wave in participatory entertainment is Joke-e-oke.

The premise behind Joke-e-oke is that, at some level, everyone wants to be a comedian. It's a form of entertainment software that allows people, momentarily, to realize this ambition while emulating the classic comedy routines of their favorite comedians.

The idea for Joke-e-oke is simple. It's basically karaoke with stand-up comedy material. Many dream of the chance to be a comedian with killer material in front of a laughing crowd. With Joke-e-oke, people are able to live out their comedy fantasy of being their favorite comedian onstage, choosing from a list of stand-up comedy icons to perform. A built in laugh track is added, timed perfectly to accent punch lines.
...
How does Joke-e-oke compare to doing real stand-up comedy?

"Normal stand-up is about playing off the audience and crowd's energy. It's rawer. This is a funny riff off of karaoke. It's a smart-ass goof. A conceptual art piece," [local comedian Mike] Spiegelman said, adding, "I think it's more fun to do the material in your own voice. Makes it more personal and accessible to the crowd. That said, some people nail the source's cadence."

Posted by hakank at 08:40 EM Posted to Humor

Jag ger mig: Du har rätt Åsk, AdLand är en blogg

Det är numera sällan jag (officiellt) går in i definitionsdiskussioner om vad en blogg är och inte. (Det är dock en av de stående men mycket snabbt övergående punkterna på de skånska bloggaremiddagarnas hittills mycket korta och fasta agenda: servetten och vad-är-en-blogg.)

Den enda skälet till varför det numera vore vettigt med bloggdefinitioner är för att förklara för de som bara hört uttrycket surra runt, och då är det inte heller frågan om att sätta upp en strikt definition med nödvändiga och tillräckliga villkor utan för att ge exempel på vad man kan göra med en blogg, varför det är så mycket surr kring bloggar nu. Etc.

Åsk Wäppling och jag haft lite diskussioner om begreppet som nu bör komma upp till ytan, främst eftersom jag härmed officiellt erkänner att jag har haft fel. Åsk - för de som inte känner till henne - skriver om reklam på AdLand och mer personnära på ascii log (dock fortfarande RSS-lös, hint-hint).

Under den senaste skånska bloggaremiddagen diskuterade vi bland annat varför AdLand inte har setts som en blogg av media och andra. Åsk menade att det berodde på att den handlade om reklam. Min åsikt var emellerid att Adland finns i det lite luddiga gränslandet till att vara ett forum, liksom jag ansåg att slashdot också är (ja, jag vet att slashdot anses vara en av protobloggarna).

Som gemensamt namn för "saker" liknande Adland och slashdot brukar man använda det lite svävande begreppet "gruppblogg", men denna attributisering har jag också haft problem med. Gränsen mellan "forum" och "blogg" är naturligtvis flytande, men jag har nog ansett att en blogg har en relativt fast uppsättning av ett fåtal identifierbara avsändare, även om de är fullständigt anonyma/pseudonyma eller opersonliga. I system som slashdot kan vem som helst publicera (möjligen efter registrering) vilket gör det svårare (för mig i alla fall) att säga saker som att "saken X är Y:s blogg" eller "saken P är A, B och C:s gruppblogg". En sak som komplicerar detta ytterligare är att vissa personer/pseudonymer bli - enligt en online-sociologisk nödvändighet - mer kända än andra. Men bara för att R och S skriver de flesta inläggen känns det inte korrekt att säga att det är R:s och S:s blogg, möjligen säger man att R och S dominerar sajten, eller kanske till och med att R:s och tagit över den. (Sålunda var mina språkliga intuitioner.)

Några saker har nu krånglat till det för att upprätthålla mina åsikter, speciellt när det gäller Åsk och AdLand.

AdLand är Åsks sajt och hon skriver väldigt många av inläggen där. Man kan därför utan att darra på rösten det minsta säga att det är Åsks (grupp)blogg.

Nästa sak, som meddelandes mig nyligen och är den egentliga upprinnelsen till denna bloggantecknings vardande, är att AdLand har utsetts till en av "Best Business Blogs: Advertising" av Fast Company. Se
Best Business Blogs: Advertising för detaljerna. Och säger Best Company att AdLand är en (grupp)blogg så är den det.

Jag ger mig, Åsk. Du har rätt och jag har fel. AdLand är en blogg. Intressant är möjligen att jag hela tiden sett dig som en bloggare.

Grattis, förresten!

Posted by hakank at 07:17 EM Posted to Blogging | Comments (13)

mars 23, 2005

Förslag till nytt ord: SMSter

Förslag till nytt ord att införliva i det svenska språket: SMSter.

Så här skulle det kunna se ut i Nationalencyklopedin:


SMSter: (från "SMS" och "semester", uttalas "ess-em-ess-ter", nykonstruktion 2005-03-22) för att beteckna då en arbetatagare under sin ledighet kommunicerar med sina arbetskamrater kring arbetsrelaterade spörsmål via mobiltelefoners SMS-tjänst, e-post eller andra elektroniska hjälpmedel.

Begreppet är en förtätning (ihopslagning) av de två orden SMS ("Short Message Service", korta meddelanden som skickas via t.ex. mobiltelefon) och semester (lagstadgad ledighet från arbetet).

En korrekt användning av ordet kräver inte att arbetstagaren är ledig på just semester, utan det kan även vara frågan om sådan kommunikation under helger (då många tjänstemän är utan arbetsplikt), flextid (flexibel arbetstid) eller annan typ av ledighet eller bortavaro från arbetet då arbetstagaren är utan arbetsplikt.

Uttalsförtätningen sker på följande sätt:
"SMS" uttalas ess-em-ess
"semester" utalas sem-esster
varvid de två termerna slås ihop till
ess-em-esster



Jämför med tidigare nykonstruktioner:
sammansvärmning
hängmattematik/hängmatte

Posted by hakank at 07:12 FM Posted to Diverse | Comments (4)

mars 22, 2005

"Värd" till aprils månads skånska bloggaremiddag sökes

Eftersom vi tidigare har sagt att "värdskapet" (*) för den skånska bloggaremiddagen bör cirkulera sökes härmed efter en "värd" för april måndags skånska bloggaremiddag.

Vi kan börja med fördelarna kring "värdskapet":

* du får själv bestämma tid och plats (dock inom vissa ramar, se nedan)

* det kommer en massa besökare till din blogg, kanske till och med helt nya bekantskaper.

* det skapas mängder av länkar till din blogg, vilket är bra för google-ranken och den allmänna självkänslan (i valfri ordning).

* det är en stor och bejublad ära.

Om du är vill ta på dig värdskapet så kommentera detta inlägg. Först till kvarn får mala först. Värdskapet flyttas då omedelbart över.


Den formella delen av "värdskapet" innebär ungefär följande:

* bestämma dag och tid för middagen. Någon gång i första delen av april är lämpligt. Notera att det inte är nödvändigt att det är söndag klockan 13.00, och det kanske till och med är bra om det inte är då. Vi skulle ju kunna tänka oss på kvällen någon gång mitt i veckan.

* bestämma plats. Och som vi sagt flera gånger är det bra om det är i Malmö eller Lund eftersom de flesta i Skåne bor här.

När du bestämt dig för dessa rums/tidskoordinater:

* publicera det på din blogg. Kanske ska det också publiceras i blogglivs bloggaremiddagsavdelning.

* uppdatera en lista över de som anmält sitt intresse, med länkar till bloggarens blogg.

* om det är väldigt få som kan komma på den föreslagna tid/platsen: föreslå/fundera ut/diskutera fram en ny tid

* när det är dags: boka bord på restaurangen

* efter bloggaremiddagen: skriv gärna någon form av summering. Du kommer dock inte vara ensam om att göra summeringarn.

* se till att "värden" för maj månad utses.

* i summeringen av förra middagen förslog Åsa att vi borde ha någon form av fasta punkter som inledde middagen, dvs lite mer strukturerade punkter som vi gemensamt diskuterar. Se Åsas förslag och efterföljande diskussion (sök efter 'Posted by: Åsa at mars 14, 2005 05:55 EM'). Detta är alltså något som synkas av dig. Ambitionsgrad och sådant bestämmer du naturligtvis själv.


Oj, det blir ju en del när man skriver ner det så här. :-)


(*) Snart kommer jag att ta bort fnuttarna kring "värd" och "värdskap" eftersom begreppen kommer att vara vedertaget implicit fnuttade.

Posted by hakank at 10:37 EM Posted to Blogging | Comments (3)

Magenta #3 2005: Om Markovkedjor och andra språkutvidgande tekniker

Magenta är ett "Medietekniskt magasin i syfte att belysa området medieteknik. Produktion och formgivning görs i sin helhet av studenter vid Linköpings Universitet". (Från Om Magenta)

Nummer 3, årgång 2 (dvs 2005) har flera intressanta artiklar, bl.a. När orden inte räcker till som handlar om Markovkedjor för att skapa nya ord eller fullständiga meningar (med eller utan någon mening i övrigt). Några av mina program nämns som exempel på denna teknik. (Se min sida "useless programs" för några andra exempel.)

En intressant fråga som tyvärr inte diskuteras så mycket är copyrightaspekten: Här kommer vi in på en annan intressant aspekt som togs upp i artikeln om Björn Crona i förra numret av Magenta. När har materialet ändrats så mycket att upphovsrätten för det ursprungliga inte längre gäller?.


Några relevanta tidigare Magentaartiklar
Framtidens hitmaskin som beskriver Thomas Björkvalds och Erik Svenssons ex-jobb Semi-automatic Music Creation using the Continuous Wavelet Transform and Markov Chains (PDF) om att automatiskt generera musik utifrån tidigare musikstycken.
Björn Crona - Pärlplattekungen där Björn Crona intervjuas som skapat ett system för att tillverkar mönster för pärlplattor (och som nämndes av David i början av året).

Se även
avdelningen Nyheter
RSS-flödet till Magenta finns här.

Aha, den David Pettersson som nämns på Kontakta oss är ju vår Månhus beta-David. (Och saker och ting såsom findings i webbserverloggarna faller nu på sin plats.)

Posted by hakank at 07:16 FM Posted to Språk | Comments (4)

mars 21, 2005

"Malte Laurids Brigges anteckningar" en outsiderblogg?

Fick senaste nyhetsbrevet (#117) från Bakhåll. Där står det att nästa paket innehåller (min emfas) Rainer Maria Rilkes legendariska outsiderblogg: Malte Laurids Brigges anteckningar i nyöversättning av Erik Ågren.. Texten finns också att läsa på bokens sida. Lite längre ned förklaras (?) lite mer: Vad Rilke ville skriva var en "fiktiv självbiografi", han ville berätta om sig själv, hur han innerst inne upplevde livet, utan att behöva hålla sig till triviala yttre sanningar.


Fråga på detta: Är "outsiderblogg" ett vedertaget uttryck i kulturkretsar? Samtliga google, yahoo, msn samt altavista exakt 0 (noll) sökresultat på den svenska söktermen. Har inte heller hittat begreppet i samma betydelse på utländska (= engelska), men där kan jag haft en dålig sökdag.

(Som svar på nyfikna frågor: Nej, jag har inte läst Rilkes bok tidigare.)

Posted by hakank at 06:36 EM Posted to Böcker

mars 20, 2005

Word of Mouth samt en ovidkommande gåta

Som N/ (**) på Researcher skrev häromdagen i Consumer marketing: Aldrig förut har så mycket data funnits när det gäller mun-till-mun-marknadsföring/word of mouth..

Mitt intresse för Word of Mouth-fenomenet är egentligen inte så mycket marknadssmässiga utan mer den sociala aspekten av fenomenet som t.ex. beskrivs i Malcolm Gladwells The Tipping Point, och diskussioner kring sociala nätverk etc. (Boken finns att köpa på Bokus. Se även min recension .)

Kanske ännu mer är det dataanalyssidan av fenomenet som fascinerar: hur mycket av omdömena, tyckandena och länkarna som finns i bloggar, mailinglistor och andra onlineforum skulle man kunna använda för att kunna göra automatiska Word of Mouth-rekommenderare (om nu inte detta begrepp är en oxymoron)?). Det blir då en utökning av de mer traditionella rekommendationssystem, men mer om det till en annan gång. (En av de mest kända skrifterna inom detta områdena kring detta heter f.ö. Social Information Filtering: Algorithms for Automating "Word of Mouth, skriven av Upendra Shardanand and Pattie Maes.)


Via Proven Ways to Get New Customers (tagline: "Ideas and Analysis from an Executive Recruiter who speaks with dozens of America's top Marketing VP's every week.") hittades ett ställe som verkar ha mycket matnyttigt inom word of mouth-området: Word of Mouth Marketing Association (WOMMA).

Här är några av de - för mig - mer intressanta sidorna.
* Womma Library med flera intressanta boktips och artiklar.
* En sammanfattning av olika WoM-tekniker beskrivs i Word of Mouth 101 (PDF).
* Womma har också en blogg: Womnibus. Namnet definieras på följande sätt: (Def: n: a collection of knowledge about word of mouth marketing; from 'word-of-mouth omnibus') Your central resource for learning about word of mouth marketing.
Länkar till olika RSS-flödena finns här.


Not:
Åsk på Adland skriver en hel del om word of mouth-marknadsföring liksom DurnikBlog ("Nyheter, åsikter och idéer om Permission Marketing & Word of Mouth - och annat intressant i marknadsföring").


Ett ganska ovidkommande sidospår eller "N:s mystiska symboler"
** Sagda Åsk berättade häromdagen att N:s kommentarssignatur är ett "N" följt av ett "|"-tecken (pipe-tecken) och inte ett "J" (ji) som jag tidigare trott. Däremot berättade Åsk inte varför detta tecken används, och jag blev naturligtvis nyfiken.

Kanske ska det tolkas som "N talar" eller något liknande, dvs som i de kommandon man ger via kommandorader för att skicka data (filtrera) mellan olika program, vilket ju är en fin symbol för att kommunicera med sina läsare.

Men mysteriet är mer mystiskt än så: "N|" används som signatur i kommentarerna, men en annan symbol: "N/" används som signatur i själva blogganteckningen. Själv använder jag "/hakank/" som markering på bl.a. mina matpaket för att signalera ägandeskapet (och som kommer från loggan för ett företag inom webbutvecklingsbranschen som skapades kring 1996, där "/" naturligtvis ska associera till webbens URL:ar), men varför ett "/"?

Hmm, kan det vara början på ASCII-snurran, dvs tecknen "|", "/", "-", "\", som avses? Det kanske finns ett "N-" och "N\" någonstans som jag inte hittat...

Posted by hakank at 07:37 EM Posted to Social Network Analysis/Complex Networks | Comments (7)

mars 15, 2005

Jordan Ellenberg: Does Gödel Matter? - The romantic's favorite mathematician didn't prove what you think he did

Jordan Ellenberg: Does Gödel Matter? - The romantic's favorite mathematician didn't prove what you think he did. är en recension av Rebecca Goldsteins bok Incompleteness: The Proof and Paradox of Kurt Godel.

In his recent New York Times review of Incompleteness, Edward Rothstein wrote that it's "difficult to overstate the impact of Gödel's theorem." But actually, it's easy to overstate it: Goldstein does it when she likens the impact of Gödel's incompleteness theorem to that of relativity and quantum mechanics and calls him "the most famous mathematician that you have most likely never heard of." But what's most startling about Gödel's theorem, given its conceptual importance, is not how much it's changed mathematics, but how little. No theoretical physicist could start a career today without a thorough understanding of Einstein's and Heisenberg's contributions. But most pure mathematicians can easily go through life with only a vague acquaintance with Gödel's work.

Posted by hakank at 05:46 EM Posted to Matematik | Comments (8)

NPR-intervju med Donald Knuth

NPR : Donald Knuth, Founding Artist of Computer Science

Posted by hakank at 05:23 EM Posted to Systemutveckling

mars 14, 2005

John Allen Paulos om Oulipo: Google Made Surreal

John Allen Paulos: Google Made Surreal:

I thought of Oulipo recently while visiting a Web site listing the Top 10 queries posed to Google for the week ending Feb. 21, 2005. (http://www.google.com/press/zeitgeist.html) In lower case, these queries were: 1. nascar, 2. hunter s thompson, 3. sandra dee, 4. constantine, 5. westminster dog show, 6. numa numa, 7. jeff gannon, 8. daytona 500, 9. us weekly and 10. american idol. The Oulipian constraint I considered was a weekly "news summary" incorporating all 10 of the queries.


Se även en tidigare anteckningar
OuLiPo
Matematikspalter

Posted by hakank at 09:00 EM Posted to Språk

"Kort" sammanfattning av den skånska bloggaremiddagen 13 mars 2005

Deltagare denna gång:

Martin 'brother' Bagge (Utsikt från en etta i Ronneby)
Håkan 'hakank' Kjellerstrand (hakank.blogg)
Erik Starck (Framtidstanken)
Simon Winter (Infontology)
Åsk 'dabitch' Wäppling (adland)
Åsa (Åsas anteckningar)

Tid Från 14.00 (två första tappra) - 21.40 (tre sista tappra).

Stockholmsbloggarena hade samtidigt sin middag som beskrivs av bl.a. Annica Tiger här där det finns bilder på Malmö- och Stockholmsbloggarena. Den skånska och enda bilden fotograferad av Åsk.

I Malmö avhandlades ungefär följande (ordningen är inte i kronologisk sådan utan i någon annan). Samtliga deltagare får gärna komplettera eller korrigera uppgifterna.

* Mailinglistor, moderering av mailinglistor och varför det är bra för alla parter att nykomlingar lurkar en stund innan de börjar vara aktiva (svar: det är för att man ska får en känsla för stil, ton och vanliga frågor samt att eveentuellt FAQ oftast nämns då). Undantag är då man blir speciellt inbjuden till listan (lycko dem). Flame wars kan vara skoj, i alla fall de kreativa.

* Vad som gör att en del tycker att vissa typer av gruppbloggar såsom slashdot inte är "riktiga" bloggar medan andra gruppbloggar såsom Boing Boing och Crooked Timber är det. (De sistnamnda - kom jag på - har en fast namngiven staff medan t.ex. slashdot har en mer flexibel medlemsstaff. Not: Detta är en personlig reflexion av rapportören och skulle troligen inte vara förenligt med en vedertagen definition av "blogg" skulle en sådan finnas.]

* Olika typer av cravings under graviditeter. En fråga som snart dyker upp är hur en havande vet att murbruk är gott eller välgörande.

* Det där portal-projektet Telias drog igång från typ 2001 som inte vad så väldigt lyckat. (Och namnet har fallit ur minnet precis.)

* Korzybski, Bateson, Hayakawa och hur språket påverkar tanken och det sociala livet. De två förstnämnda är inspirationskällor till NLP (Neuro Linguistic Programming) som diskuterades kortfattat. Subliminal påverkan, Vance Packards Hidden Persuaders och det berömda Coca Cola och popcorn-experimentet som sedemera visade sig vara fusk, hoax och fuffens. Se t.ex. New Urban Legends.

I samband med detta pratades om hur vilseledning (misdirection) används av magiker, reklambranschen och martial arts. Vilseledning, lurendrejeri förutsätter att man förstår själva finten. (Och det var därför en av deltagarna var en rätt lyckad fotbollsback: denne förstod helt enkelt inte fintarna som de duktiga motspelarna försökte med.) Brian Wilson Key och dennes konspirationsteoretiska böcker nämndes, framförallt den där scenen ur Exorcisten där Blair vrider huvudet runt-runt-runt, där det - enligt Key - finns subliminala klipp på dödskallar och subliminala ljud av dödsskrikt från grisar. (Hakank hade mardrömmar om denna scen, de övriga verkade ha haft mardrömmar om en helt annan scen.)

* Intressant.se, nyligen.se och "Var är du?", samt eventuellt fusk på dessa listor och varför sådant är både futilt och meningslöst. Internetworlds bloggomröstning och vem som kommer att få flest röster. En kreativ diskussion uppstod här.

* Zoombie-filmer, romantiska zoombie-filmer, och eventuellt romantiska zombie-komedier. Ett tips på en möjlig representant ur den sistnämnda kategorin är "Dawn of the living dead"(?).

* Vuxna katter är laktosintolerande, men det är inte kattungar. Därför är det ingen höjdade att sälja mjölk till de vuxna.

* Det hade på söndagen oberoende upptäckts att Observer nu bevakar ännu fler svenska bloggar, t.ex. Researcher och hakank.blogg (ni får faktiskt lita på sammanfattaren här)

* Vilka (amerikanska) A-liste-bloggare som läses/bevakas och varför de räknas som A-liste-bloggar: Kottke, Boing-Boing, Joi-Ito var några av dem. Varför de räknas som A-liste-bloggar: För att andra räknar dem som A-liste-bloggar.

* När man fick/skrev sitt första SMS. Åsk vann med hästlängder. Hakank förlorade med flera hästsvansar.

* 20q.net och att det troligen är vettigt att det är ett artificiellt neuralt nätverk så att användarna inte behöver straffas för att de svarar "maybe" i stället för "sometimes".

* Med den moderna tekniken går det att diagnostisera och bota sjukdomar betydligt bättre än förr, men även att "förbättra" genom olika typer av ingrepp eller "förlängningar". Är detta odelad bra? Är det odelat dåligt? Troligen inte.

Diskussionen kom även in på begreppet "sjukdom" men där hörde inte er rapportör hela diskussionen. (Det lyckades dock få in det Wittgensteinska familjelikhet, men så här i efterhand blir det inte riktigt klart. Simon? Erik?)

* Att ironi är oftast obegriplig tråkig eller bara konstig. Då är det bättre med sarkasm. Bengt O Karlsson som oftast begriplig, icke-tråkig och okonstlad mästare på detta. Några exempel på dennes mästerskap nämndes. Begreppet "den proto-ironiska generationen" introducerades mer publikt.

* När man fick sitt elektroniska namn/handle/nick. Hakank vann här med girafflängder, troligen mest i kraft av sin ålder. Skulle alla vara lika gamla skulle nog någon av ungdomarna vinna även här (speciellt eftersom hakank var cirka 25 när han ordentligt började med datorer). dabitch och brother gjorde långa utläggningar om sina, båda kopplade till dataspel, vilket under normala förhållanden ge stilpoäng.

* Vikten eller i alla fall medvetenheten av att hålla isär bloggandet och arbetet. Det är viktigt att hålla i minnet sin "blogg-persona", dvs den bild man vill visa (och bjuda på) i sin blogg. En del gamla webb-synder kom fram efter några koppar kaffe/te.

* Minnen man haft som väldigt liten och hur man kan verifiera att det verkligen är riktiga minnen och inte minnen av någon som berättat något om den tiden.

* Dataspel, där rapportörens ögon (och öron) likt Kalle Anka var helt blanka med ett kors i.

* Mosaik har tyvärr inte alkoholfri öl. Finns det alkoholfritt vin?

* Risken att blogga att man åker iväg (ett återkommande ämne). Det uppstod tanken att brottslingarna börjat blogga för att synka denna typ av information, men detta lades snart till handlingarna.

* Det berättades om ett telefonnummer en matematiker hade som i och för sin hade en del skoj egenskaper (palindrom) men hade en fascinerande faktorisering. Nej, telefonnumret hade glömts bort, däremot inte faktoriseringen. (Efter hemkomst försöktes det faktoriera egna telefonnumer, men inget var så magiskt som det refererade.)

* Det diskuterades inte online-poker eller någon annan poker för den delen.

* Bra aprilskämt såväl äldre som moderna. Vissa kreativa idéer framkom även här.

* Det försöktes kommunicera med Stockholmsmötet, men det gick inte så bra. Vi hade inget trådlöst nätverk; det testades.

* Att Jonas Söderström och Gustav Holmberg hittar på nya och skojiga ord.

* En hel del som troligen är belagda med tystnadsplikt.

* Vad en usuability-expert gör när denne usuability-expertar. Mycket intressant. Det kom här fram att analysfasen i ett utvecklingsprojekt är den skojigaste, tyckte i alla fall de flesta av de deltagande utvecklarna. För en del av dessa var det just möjligheten att få arbeta med språkligheter, definitioner av begrepp som var en av de största lockande faktorerna.

* En hel del skvaller från reklambranschen, en fascinerande värld.

* (Hakank pratade en stund med Bo-Göran, en kollega från 80-talet. De kände först inte igen varandra, men hakank blev igenkänd på rösten. Det pratades bloggar och både nya och gamla arbeten. Bo-Göran visste naturligtvis vad en blogg är. Hej, Bo-Göran.

Under detta samtal pågick de viktiga och djupa diskussionerna vid bloggarebordet, som någon annan får referera.)

* Husgudar är som tomtar: De finns där men syns inte så mycket (esse non videre?). hakank och Simon har en hel del gemensamma hustomtar, vilket de för övrigt visste sedan tidigare.

* Copyrightdiskussioner. Blogg till papper. Vad är det egentligen man copyrightar i musik, hur nära får ett musikaliskt verk vara utan att bryta mot lagen. Flera exempel gavs. Hur man bäst länkar till en bild.

* Creative Commons gör sig troligen en björntjänst genom att vara otydlig.

* Melodifestivalen. En låt vann, de andra vann inte.

* "Feminism": själva ordet har i mycket förlorat sin betydelse eftersom det numera verkar innehålla allting. Begreppet det representerar är naturligtvis fortfarade viktigt.

* Nästa bloggaremiddag föreslås läggas någon dag kring första söndagen i april. Någon annan än hakank torde ta hand om "värdskapet" då. Vidare information meddelas å blogg-svärmen.

Posted by hakank at 07:45 FM Posted to Blogging | Comments (29)

mars 13, 2005

Liten påminnelse om dagens bloggaremiddag: Klockan 14.00 Restaurang Mosaik , Stortorget Malmö

Bara en påminnelse om dagens bloggaremiddag: Skånsk bloggaremiddag: söndagen 13 mars, Plats: Mosaik, Stortoget, Malmö, klockan 14.00.

Posted by hakank at 08:28 FM Posted to Blogging | Comments (6)

mars 12, 2005

"Stjärnor över änglar" - Analys av eventuella språkliga samband mellan låttitlar och deras placering i Melodifestivalen år 1959 - 2004

Introduktion till undersökningen

I söndags skrev Håkan 'hakke' Karlsson (i Med andra ord) om antal ord i titlar i lördagens melodifestival (vars deltävlingar jag inte har sett).

Detta inspirerade till följande frågeställningar (som även antyddes i kommentaren till Hakkes blogganteckning):
* Finns det något samband mellan längden på en låttitel och dess placering i en melodifestival?
* Finns det något samband mellan medellängden av titelorden och dess placering i en melodifestival?
* Finns det överhuvudtaget något samband mellan titlar och något annat?

Kort summering: Nej, det finns inga sådana samband. Med ett undantag: den genomsnittliga längden på orden har blivit något kortare med åren.

Rubriken "Stjärnor över änglar" får sin förklaring i någon av nedanstående avsnitt. Läs vidare.


Introduktion av data
Efter lite letande på nätet hittades det låttitlar och deras placeringar i Melodifestivalen för åren 1959 till 2004; alla mellanliggande år har dock inte varit behäftade med melodifestivaler.

Som vanligt tog pre-processingen av datan mest tid, filtrera informationen på ett sätt som gör att det gick att bearbeta med analysprogram, i detta fall - och som vanligt - det fria systemet R.

Lite översiktlig information om datan:
* 406 låttitlar i 43 melodifestivaler har studerats
* Det var 1305 unika ord
* Det finns ett flertal varianter för poängberäkning, t.ex. med 10 låtar där endast 5 fått en placering, en variant (1959) där samma artist (Ingvar Wixell) sjöng alla låtar etc etc. Jag har dock försökt att normalisera placeringarna till poäng, se "Ordpoäng" nedan.


Konkordanstabeller
Förutom ren statistisk analys (eller snarare data snooping) som ju inte gav så mycket, gjordes även lite andra analyser, t.ex. konkordanstabeller över antal förekomst av orden i titlarna.

Här är de vanligaste orden samt antalet antal låttitlar som har innehåller detta ord. Notera att även om ett ord finns flera gånger i en låttitel räknas det bara en gång (dubletter räknas alltså inte dubbelt, se även nedan).


ord: antal
en: 44
jag: 37
du: 35
mig: 30
är: 28
dig: 27
i: 24
det: 23
och: 20
som: 18
om: 16
min: 14
på: 13
sång: 12
här: 11
vår: 9
kärlek: 8
till: 8
se: 8
för: 7
mitt: 7
med: 7
bara: 7
igen: 7
vän: 7
vill: 6
gång: 6
av: 6
har: 6
finns: 6
kommer: 6
nu: 6
när: 6
din: 6
ska: 5
dina: 5
var: 5
hand: 5
inte: 5
vals: 5
vi: 5
kärleken: 5
ett: 5
dröm: 5
värld: 5
liv: 5
stjärna: 4
över: 4
änglar: 4
ger: 4
alla: 4
ha: 4
världen: 4
så: 4
natten: 4
livet: 4
ser: 4
att: 4
hos: 4
gör: 4
allt: 3
eld: 3
annan: 3
spela: 3
stanna: 3

Vilket nog skulle kunna bli en bra - måhända existentiell - sångtext:

En jag, du mig.
Är dig i det och som om min.
På sång här vår kärlek till,
se för mitt, med bara igen: vän.

Vill gång av.
Har? Finns?
Kommer nu när din ska;
dina var hand.
Inte vals, vi.

Kärleken ett,
dröm, värld, liv
Stjärna över änglar,
ger alla ha.

Världen så natten livet.
Ser att hos gör allt, eld annan spela.
Stanna!

(Jag tycker speciellt om "stjärna över änglar". googleförekomst: 0.)


"Ordpoäng"
Så till en lista över genomsnittlig "ordpoäng", dvs hur många poäng har ett ord fått under åren.

Två kommentarer:

Poäng är här uträknat som: antal låtar i tävlingen - placering + 1

Det innebär att låt på första platsen av 6 låtar får 6 poäng (6 - 1 + 1 = 6), andra platsen vid en tävling av 10 låtar får 9 poäng (10 - 2 + 1 = 9) etc. För tävlingar med utslagningar har de utslagna låtarna fått tillräkna sig 1 poäng.

Den andra kommentaren är att ord som endast förekommit en gång i en sång titel är borttagna, annars skulle ord som "satellit", "cocacola" och "bugg" (vilka är ord som endast förekommit en gång i en vinnande låt) komma först och det vill vi ju inte.


ord: genomsnittlig poäng, antal poäng, antal ord
dag: 10.00, 30, 3
your: 9.50, 19, 2
let: 9.50, 19, 2
dé: 9.00, 18, 2
vackraste: 9.00, 18, 2
é: 9.00, 18, 2
love: 8.50, 17, 2
bang: 8.50, 17, 2
stad: 8.00, 16, 2
hallå: 8.00, 16, 2
havet: 8.00, 16, 2
härliga: 8.00, 16, 2
över: 7.75, 31, 4
vindarna: 7.67, 23, 3
fångad: 7.50, 15, 2
varje: 7.50, 15, 2
vilken: 7.00, 14, 2
älskar: 7.00, 14, 2
härlig: 7.00, 14, 2
vem: 7.00, 14, 2
sången: 7.00, 14, 2
dansa: 7.00, 21, 3
april: 7.00, 14, 2
hela: 6.50, 13, 2
is: 6.50, 13, 2
hej: 6.50, 13, 2


Ordmultiplicitet
Påverkas placeringen av förekomsten av dubbletter i titeln? Möjligen finns det en liten fördel med dubletter: ord som förekommer fler än en gång i en låttitel har en genomsnittliga poäng på 4.57 medan enkelord har genomsnittligt 4.39 poäng. Om det är ett samband så är det svagt.


Finns det något samband, då?
Så var det där med de ursprungliga frågeställningarna om sambanden mellan låttitelns ord och låtens placeringen. Det fanns ingen. Inte heller finns något av följande samband (eller så hittade jag dem inte):
* antal ord i låttiteln
* medelantalet ord i låttiteln
* antal tecken i låttiteln
* huruvida det finns dublettord i titeln eller inte (men se ovan)

Förändring av medellängden av ord över åren
Det finns dock en liten förändring av medellängden på orden över åren. För hela perioden (1959-2004) har medellängden minskat från cirka 5.5 bokstäver per ord till cirka 4 bokstäver per ord (detta inkluderat siffror och talspråksvarianter som "de'" i stället för "det"), och det kanske säger en del om vår kultur i allmänhet, även om jag inte tror att melodifestivalen någonsin har varit en kulturens högborg. (En mer seriös fråga: har medelantalet tecken per ord i normal text minskad i samma omfattning över åren? )

Bilden visar denna utvecklingen av medellängden per ord, där den räta linjen är regressionslinjen.


R-kod för analysen
Här är lite R-kod för att skapa bild och analysen av medellängden per år. Kontentan är att för varje år minskar ordens medellängd med cirka 0.02 tecken. Det låga värdet på Adjusted R-squared (0.27) påvisar att det är lågt förklaringsvärde; p-värdet är < 0.001.



# läs in data över årems genomsnittliga längd
> melodi.year <- read.table("melodi_year.dat", sep=",", header=T)

# gör en linjär analys
> summary(lm(aver_letters_per_words~year, data=melodi.year))

Call:
lm(formula = aver_letters_per_words ~ year, data = melodi.year)

Residuals:
Min 1Q Median 3Q Max
-0.98296 -0.30508 -0.03489 0.22848 0.85569

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 45.220494 9.720366 4.652 3.41e-05 ***
year -0.020288 0.004903 -4.138 0.00017 ***
---
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

Residual standard error: 0.4278 on 41 degrees of freedom
Multiple R-Squared: 0.2946, Adjusted R-squared: 0.2773
F-statistic: 17.12 on 1 and 41 DF, p-value: 0.0001699

# plotta
> plot(aver_letters_per_words~year, data=melodi.year)

# visa regressionslinjen
> abline(lm(aver_letters_per_words~year, data=melodi.year))


För att testa modellen görs slutligen en prediktion för år 2005: den genomsnittliga ordlängden blir enligt modellen 3.84 tecken per ord.


# prediktion för år 2005
> round(predict(lm(aver_letters_per_words~c(year-1960), data=melodi.year),data.frame(year=2005)),2)
[1] 3.84

Det korrekta medelvärdet är 4.07, och med skillnaden på 4.07 - 3.84 = 0.23 är det lite väl mycket fel för att modellen ska accepteras som en god approximation (vilket vi nog visste ändå).


Slutord
Det finns mängder av annan analys man skulle kunna göra:
* hur är orden fördelade över åren? T.ex. är titelordet "en" vanligare nu än på 60-talet? Kom sångtitlar med "sång" bättre än på 90-talet än på 80-talet?

* man kan även ta med aristens kön i kombination med ord, t.ex. har titelordet "kärlek" sjungen av en man (eller flera män) bättre placering är då den besjunges av en kvinna (eller flera kvinnor) eller av en blandad grupp (man/män + kvinna/kvinnor)?

* påverkar låttitlarnas (och framförallt vinnarens) språkliga sammansättning nästa års låttitlar? Det skulle här vara möjligt att göra tidsserieanalyser. En mycket preliminär analys visar att det möjligen finns ett sådant samband (autokorrelation), och det förvånande är att påverkan verkar vara något större två år senare än det omedelbart efterföljande året.

En bild där punkterna sammanbundna med linjer visar möjliga ansatser kring tidsserieanalyser, t.ex. att studera de där dipparna i slutet av 1960-, 1980- samt 1990-talet vilka omedelbart föregicks av ett rätt högt medelvärde.

* finns det motsvarande samband/icke-samband mellan t.ex. filmtitlarna och hur bra det gått för filmerna.

Ja, det finns mycket att analysera. Men troligen visar sådana analyser inte speciellt mycket mer samband än de föreliggande analyserna mer än möjligen en allmän förändring av språkbruket över åren.

Melodifestivalerna är ju trots allt inte en tävling i låttitlarnas språkligheter utan i mycket annat, t.ex. artist, dennes/deras utstrålning, kläder (eller avsaknaden av dem); möjligen är musiken och själva texten också avgörande för hur bra en låt blir placerad.

Posted by hakank at 11:47 FM Posted to Statistik/data-analys | Comments (12)

mars 06, 2005

På nya äventyr

Not: Detta är för ovanlighetens skull en personlig anteckning, där målgruppen är främst bekanta och andra nyfikna som är intresserade av mina externa trajektorier. Företagens namn nämns inte i denna anteckning av sökmotorskäl, även om informationen så småningom kommer att finnas annorstädes på sajten. Därför kommer namngivningar av företag i eventuella kommentarer att anonymiseras. I personliga mail berättar jag gärna mer.


Från
I fredags var sista dagen på det jobb jag haft sedan maj förra året. Jag tackar härmed följande trevliga gäng (order by rumsordning) för den gångna tiden: Martin, Markus, Thomas, Anette, Jerker, Eva, Eva, Sten, Christin samt Jan-Erik. Det har varit både nyttigt och skoj att lära mig er verksamhet så ingående; och mycket nyttigt att tränga in i de speciella krav som ni arbetar under. Stort tack för att ni tagit mig under era vingar (och för pajboken). Ett speciellt tack till Markus som introducerade mig till företaget.


Till
Den kommande veckan börjar jag som systemutvecklare på ett svenskt e-handelsföretag som arbetar med något som jag har betydligt mer kunskap om (och i ärlighetens namn brinner mer för) än vad det förra företaget arbetade med.

En av mina drömmar och önskor kring systemutveckling är att arbeta med system som jag personligen kan använda (och då oftast faktiskt använder). Detta är ett sådant.

Posted by hakank at 11:19 FM Posted to Personligt | Comments (11)

mars 03, 2005

Musik "operated by nature"

Jag fick ett mail angående Inf@Vis: Visualising Music med en fråga om jag visste någon som gör musikinstrument "operated by nature". (Frågan är inte riktigt kopplat till anteckningen, den som mailade sökte på music blogg och råkade komma hit. Troligen är "blogg" ett stavfel.)

Om man märker ord så är väl alla musikinstrument "operated by nature", t.ex luft som swischar eller strängar som svänger på ett visst sätt. Men frågan avser såvitt jag förstår snarare musikinstrument som skapar musik utan direkt mänsklig inblandning (förutom möjligen att ha konstruerat maskinen). Elförstärkt eller datorgenererad musik räknar jag inte till denna kategori.

Jag kan tänka mig feta orgelpipor som står ute på en blåsig hed och ljudar allt efter vinden fångas i piporna, eller en harpa några meter till vänster på samma hed precis bredvid en buske (eller under ett vattenfall). Kanske den där klädnypan på ett cykelhjul är ett embryo till vacker musik?

Dock känner jag inte till några specifika installationer. Är det någon som vet mer om detta?

Posted by hakank at 07:57 FM Posted to Diverse vetenskap | Comments (2)

mars 02, 2005

Internetworlds bloggomröstning: En halvtidsanalys

Så här ungefär i halvtid av Internetworlds Bästa-bloggen-omröstning, (och som skrevs om i Internetworld: "Rösta fram Sveriges bästa blogg") passar det kanske bra med en liten analys av besökarbeteendena, dvs hur besökarna från omröstningssidan betett sig,

Först några summerande tal för besöken mellan första dagen 17 februari till och med cirka klockan 18 idag (2 mars):
* Det har klickats 255 gånger från omröstningssidan till hakank.blogg.
* Det som har besökt via omröstningssidan har besökt totalt 556 sidor, vilket ger ett medelvärde på 2.1 sidor per besök.
* Totalt gjordes det 99 extra besök, vilket utgör en "effektivitet" på cirka 18%: extra besök/totalt antal = 88/556 ~ 0.18.

Tabellen nedan visar antal sidor som besöktes på bloggen efter omröstningsklicket, samt antalet besökare som klickade så många extra sidor:


Antal extra sidorAntal besökare med detta beteende
0217
118
29
36
42
101
121
151

Dvs av de 255 besökare gjorde 217 inget extraklickande alls. Visst är det deprimerande. Det var 18 stycken som klickade vidare 1 gång, 9 som klickade på ytterligare 2 sidor osv. Jag hade nästan hoppats att de skulle rota omkring ordentligt på bloggen. Skoj att det i alla fall var ett par tre stycken som rockade loss lite mer i alla fall.


Not: En del av besöken var proxies (dvs att flera besökare använder samma IP-adress) som gör att värdena är lite missvisande, men det är sånt man får leva med. Åtminstone två av loss-rockarna är inte proxies, däremot misstänker jag att de själva är bloggare.

Slutsats?
Frågan är vilken slutsats man ska dra om detta. En slutsats kan vara att besökarna tyckte att det var så (o)intressant att det gick att göra en vettig bedömning om innehållet, vilket måhända är sant. En annan slutsats, i samma anda, är att det troligen inte är så mycket som lockar en besökare att "rota runt". Man skulle kunna tänka sig att skriva lite mer publikfriande saker nu när det kan komma fint besök, men jag tror inte riktigt på sådant. Då är det bättre att skriva på som vanligt.

En annan förklaring kan ju vara att besökarna redan besökt bloggen tidigare och ville bara kolla så att det var den blogg som de trodde. Men det är en alldeles för otrolig förklaring.

Helt enkelt är det precis så här vi beter oss igemen, hittar vi inte direkt intressant så går vi snabbt därifrån.

Notera att besöksbeteendet på en blogg beror också en hel del på vilka anteckningar som råkar vara överst vid ett besök. Det har jag dock inte kalibrerat in i beräkningarna.


En mer detaljerad analys
Så kommer en mer detaljerad analys av beteendet som har en något annan beräkning än ovanstående, men slutsatsen är samma som ovanstående: Det är väldigt många som endast kollar på första sidan och vänder i dörren.

I dessa värden har inkluderats besöken från hela februari, dvs även sådana som gjorts innan omröstningen (dvs från 1:e februari till den 17:e). Detta för att få en mer fullständig bild av besökandet.

Först en tabell på antal sidor man varit inne på hakank.blogg (kolumnen "Hits"), inkluderat sådana som besökts före första klicket från omröstningssidan (t.ex. via sökmotorer etc). Kolumnen "First" anger vilket besök i ordningen som var besöket från omröstningssidan. "Count" är så många besökare som haft detta beteende.

Det innebär alltså (för första raden) att det varit 193 besökare som besökt en (1) sida ("Hits"), och detta besök var det direkt efter klicket från omröstningssidan. Två rader ner ser vi att det varit 11 stycken som fortsatte att klicka på en sida på bloggen. Någonstans bland de sista raderna ser vi att någon varit inne på bloggen 80 gånger tidigare, den 81:e gången via omröstningssidan, och klickade vidare några sidor. Denna sistnämnda är en proxy men det tar jag ingen som helst hänsyn till.

Den sista kolumnen "Rate" är ett sätt att mäta "effektiviteten" i omröstningsklicket, och som räknas enligt formeln:

(antalet besökta sidor - när första besöket gjordes)/ (antalet besökta sidor)

Exempel: Om en besökare besökt bloggen 3 gånger och den tredje gången var via omröstningssidan räknas "effektiviteten" enligt samma princip som ovanstående: (3-3)/3 = 0/3 = 0. En besökare som besökt bloggen 4 gången och det via omröstningssidan var på första besöket blir det (4-1)/4 = 3/4 = 0.75.

FirstHitsCountRate
111930.00
22130.00
12110.50
1350.67
5540.00
1430.75
4430.00
2330.33
5720.29
7720.00
3320.00
3420.25
5610.17
4510.20
818510.05
81010.20
31510.80
3510.40
21710.88
1510.80
132310.43
71010.30
161910.16
2510.60

Till slut kommer en summering av ovanstående tabell, där rate är sorteringsordningen och Count anger hur många som hade en viss rate (besökseffektivitet).

RateCount
0.881
0.80 2
0.75 3
0.67 5
0.60 1
0.50 11
0.43 1
0.40 1
0.33 3
0.30 1
0.29 2
0.25 2
0.20 2
0.17 1
0.16 1
0.05 1
0.00 217

Som sagt, man kan dra samma slutsats som för första tabellen. Skillnaden är att de två sista tabellerna visas de olika beteendena mer detaljerat.


Allra-sist-kommentar
För den som nu oroar sig att jag suttit och handräknat de uppkomna värdena: Oroen er icke! Ovanstående är resultatet av dels ett generellt program (nyligen optimerat och med en massa bells 'n whistles) för att studera webbserverloggen, dels ett mer specialdesignat program för att göra ovanstående uträkningar.

Posted by hakank at 10:17 EM Posted to Blogging | Statistik/data-analys | Comments (4)