« september 2003 | Main | november 2003 »

oktober 31, 2003

Hängmatematik

Två förslag till svenska ord för "recreational mathematics": hängmatematik
alternativt hängmatte.

Mer om hängmatematik finns i Rekreationell matematik ocn annat tankegodis och Matematikspalter. Se även googles kategori Science > Math > Recreations.

En relativt ny favoritsida är Other Maths av Jon Perry.

Posted by hakank at 08:24 EM Posted to Matematik | Comments (3)

Keeping Found Things Found on the Web

I Keeping Found Things Found on the Web av William Jones, Harry Bruce och Susan Dumais, studeras olika metoder som används för hantera information från webben.

Numera använder jag huvudsakligen dessa metoder:
* bokmärka i webbläsaren, i kategoristruktur
* skriva om det på bloggen så att jag hittar det via google eller bloggens sökmotor etc
* ladda ner ("dunka ner") informationen lokalt på hårddisken, kategoriserat
* i det senare fallet brukar jag för respektive katalog (kategori) även skriva mina findings etc i en speciel fil. Till viss del har denna metod ersatts av blogganteckningarna.

Det finns en tabell (Table 1.) som kan vara värt att studera vidare eftersom den innehåller ett antal intressanta parametrar.

Abstract

This paper describes the results of an observational study into the methods people use to manage web information for re-use. People observed in our study used a diversity of methods and associated tools. For example, several participants emailed web addresses (URLs) along with comments to themselves and to others. Other methods observed included printing out web pages, saving web pages to the hard drive, pasting the address for a web page into a document and pasting the address into a personal web site. Ironically, two web browser tools that have been explicitly developed to help users track web information – the bookmarking tool and the history list – were not widely used by participants in this study. A functional analysis helps to explain the observed diversity of methods. Methods vary widely in the functions they provide. For example, a web address pasted into a self-addressed email can provide an important reminding function together with a context of relevance: The email arrives in an inbox which is checked at regular intervals and the email can include a few lines of text that explain the URL’s relevance and the actions to be taken. On the other hand, for most users in the study, the bookmarking tool (“Favorites” or “Bookmarks” depending on the browser) provided neither a reminding function nor a context of relevance. The functional analysis can help to assess the likely success of various tools, current and proposed.

Keywords

Information retrieval, personal information management, human-computer interaction, World Wide Web use.


Via Mathemagenic.

Posted by hakank at 06:27 EM Posted to

The Technology of the Year: Social Network Applications

Tidningen Business 2.0 har korat "Social Network Applications" till "The Technology of the Year".

Endast första stycket är tillgänglig för icke-prenumeranter. Artikeln i dess helhet kan dock läsas i denna PDF-fil från ett av de företag som omnämns i artikeln, Spoke Software. Andra applikationer som nämns är Visible Path, Friendster och LinkedIn.

Call them social network applications computer programs that analyze networks of people, their contacts, and even their ideas. The programs do everything from helping salespeople generate leads to ferreting out connections among criminals to matching people in sprawling corporations with other folks in-house who are working on similar projects. Social networking applies the power of the network to one of the most fundamental problems in all of business: finding the person who has the critical information you need, right when you need it. That s why Business 2.0 has selected social networks as our Technology of the Year for 2003.


Relaterad information finns i kategorin Social Network Analysis/Complex Networks.

Posted by hakank at 05:44 EM Posted to Social Network Analysis/Complex Networks

oktober 30, 2003

Senaste R News

R News är ett nyhetsbrev för systemet R som jag har skrivit om/i några gånger här på bloggen. (Senast var det i De svenska myntens talsystem.)

Det senaste (PDF) numret innehåller bland annat följande:

Posted by hakank at 09:41 FM Posted to Statistik/data-analys

oktober 29, 2003

Fler grafiska relationsvisare

I Författarkopplingar och andra kulturrekommenderare skrevs om gnod som visar grafer över närhetsrelationer mellan olika författare, artister etc.

TouchGraph har skapat liknande system:
google browser
Amazon browser.

Applikationerna kräva Java.

En jag upptäckte för en stund sedan för bloggar var på BlogStreet, nämligen BlogStree Visual Neightborhood, som också använder TouchGraph. Exemplet visar grannarna till hakank.blogg. Det finns även en BlogStreet Profile med icke-grafisk information om grannar och sådant.

Det kan ta en liten stund för sidorna att komma upp.

Posted by hakank at 10:17 EM Posted to Social Network Analysis/Complex Networks | Comments (4)

Inspirerande böcker för right-wings

I Right-Of-Center Bloggers Select The Books That Have Had The Biggest Impact On Their Thinking listas böcker som right-wing-bloggare anser vara de som påverkat mest.

Så här förklarar man undersökningen:
Right Wing News emailed more than 150 right-of-center bloggers and asked them to send us a list of the books they considered to have had "The Biggest Impact On Their Thinking". Representatives from the following 53 blogs responded...
...
All bloggers were allowed to make anywhere from 1-20 selections. Rank was determined simply by the number of votes received. I think you'll find that more than a few surprises made this incredibly diffuse list.

Av de listade böckerna tillhör nedanstående 6 mina favoriter, och har på olika sätt påverkat mitt tänkande. I och för sig inte så mycket mitt politiska tänkande men i alla fall.

Douglas Adams: The Hitchhiker's Guide to the Galaxy
George Orwell: Animal Farm
Robert Heinlein: The Moon is a Harsh Mistress
J. R. R. Tolkien: The Lord of the Rings Trilogy
Sun Tzu: The Art of War
George Orwell: 1984


Några kommentarer:
* Man kan notera att (förutom Sun Tzu) är samtliga av mina favoriter romaner. Få av de övriga böckerna har jag ens läst.

* Det skulle vara nyttigt med en jämförelse med favoriterna för hela befolkningen, eftersom vissa av dem är troligen favoriter "över gränsen".

* Varför Douglas Adams?

* Är jag i riskzonen?

Uppdatering
Jag glömde bort att länka till kommentarerna till artikeln.

Posted by hakank at 08:51 EM Posted to Böcker

Författarkopplingar och andra kulturrekommenderare

Gnooks är en rekommenderare där man skriver ett författarnamn och sedan visas de "närmsta" författarna i en graf. Det ser ut att vara rätt vettiga kopplingar.

Några exempel Umberto Eco, Borges. Klickar man på ett författarnamn i grafen blir detta det nya centrat.

Huvudsidan finns på www.gnod.net, där det även är finns rekommenderare för filmer och musik. Det finns något även för webben, men det tyckte jag inte riktigt verkade vara så kul, möjligen beroende på att jag inte matat systemet med tillräckligt mycket data.

För musikrekommendationen ska man skriva en till tre favoriter. Jag testade med Jaco Pastorius. Svaret blev Mike Stern. Inte helt fel.

(Via Mathemagenic.)

Posted by hakank at 01:12 EM Posted to | Comments (1)

Extremvärdesanalys av webbesök

Extremvärdesanalys (extreme value analysis) är en fascinerande statistisk metod där man, med hjälp tidigare värden, kan estimera förväntat maximalt värde i framtiden. T.ex. kan man estimera maximal vattennivå i en flod, och kan då anpassa resurser (skydd) efter detta värde.

Ett förklarande exempel med nyttan av extremvärdesanalys finns i On Extremes and Crashes (PDF) av Alexander J. McNeil. Se även nedan för andra referenser.

Analys
Här görs två extremvärdesanalyser (i R) av antal besök per dag på min sajt (www.hakank.org). Båda analyserna har som startdatum 2003-06-18, dagen jag började blogga.

Nyttan att göra en extremvärdesanalys på min sajt är kanske inte så stor eftersom det är är så få besök. För mig är det snarare att stilla nyfikenheten. Däremot kan det vara viktigt för mer välbesökta sajter för att anpassa antal servers etc.


Datafiler
Datafilerna finns här: blogg_tid_sep30.dat samt blogg_tid_oct28.dat. De tre fälten i filerna är månad, dag, antal besök. Endast det tredje värdet används nedan.


30 september-analysen
Först den analys som gjordes för en knapp månad sedan, som använder data från 2003-06-18 till och med 2003-09-30. Vi ser sedan hur väl analysen slog ut.

Paketet evir kan laddas ner här. Se även referenserna nedan.
> library(evir)
# ta bara med tredje kolumnen, dvs besöken
> web.hits.sep30<-read.table("blogg_tid_sep30.dat",h=T,sep=" ")[,3]
Nu använder vi evirs funktioner gev samt rlevel.gev för att estimera extremvärdet. Parametern 100 i rlevel.gev anger hur många dagar framåt man vill studera.
> web.hits.sep30.gev<-gev(web.hits.sep30)
> rlevel.gev(web.hits.sep30.gev,100)
[1] 1367.577 1578.583 2071.990
De tre värden som rlevel.gev returneras är:
- den lägre 5%-gränsen i konfidensintervallet (1367.577)
- det förväntade maximumvärdet (1578.583)
- den högre 95%-gränsen i konfidensintervallet (2071.990)

Så, de närmsta 100 dagarna efter 30 september kunde jag som max förvänta mig 1578 besök. Det fanns 5% sannolikhet att det skulle bli fler än 2072 besök eller färre än 1368 besök per dag.

Låt oss nu även studera de kommande 30 dagarna (dvs oktober). Vi kan då kan kontrollera hur bra förutsägelsen var. En sådan 30-dags-analys ger:
> rlevel.gev(web.hits.sep30.gev,30)
[1] 1192.267 1326.222 1586.469
dvs förväntat max-värde för de 30 närmsta dagarna är (var) 1326 träffar, med konfidensintervallen 1192 respektive 1586 besök.

Facit
Vilket maxvärde blev det då under oktober (så långt vi nu kommit i månaden)? Vi läser in datafilen och ser vilket maxvärdet det blev:
> web.hits.oct28<-read.table("blogg_tid_oct28.dat",h=T,sep=" ")[,3]
> max(web.hits.oct28)
[1] 2051
Det blev 2051 träffar, vilket var rätt oväntat. Och skoj för mig!

Vi kan nu även studera de kumulerade max-värdena (till och med 28 oktober), dvs de som efterhand blir max-värden. Detta görs med funktionen cummax. Man ser här hur länge ett visst värde varit max-värde, tills ett nytt sådant kommer.
> cummax(web.hits.oct28)
 [1] 674 739 739 739 739 739 739 739 739 739 739 739 739 739 739
 [16] 739 739 739 739 739 739 739 739 813 813 813 813 813 813 813
 [31] 813 813 813 813 813 813 813 956 956 956 956 956 956 956 956
 [46] 956 956 956 956 991 991 991 991 991 991 991 991 991 991 991
 [61] 991 991 1107 1107 1107 1107 1107 1107 1107 1107 1107 1107 1107 1107 1107
 [76] 1107 1107 1107 1107 1107 1107 1107 1107 1107 1520 1520 1520 1520 1520 1520
 [91] 1520 1520 1676 1676 1676 1676 1676 1676 1676 1676 1676 1676 1676 1676 1676
[106] 1676 1676 1676 1676 1676 1710 1710 1710 1710 1710 1710 1710 1710 1710 1710
[121] 1710 1710 1710 1710 1710 1710 2051 2051 2051 2051 2051 2051 2051
För att enbart lista de uppkomna max-värden används unique:
> unique(cummax(web.hits.oct28))
 [1] 674 739 813 956 991 1107 1520 1676 1710 2051

28 oktober-analysen
Här är den (nyss gjorda) analysen som nu inkluderar de besök som gjorts till och med 28 oktober (fortfarande från 2003-06-18).
> web.hits.oct28.gev <- gev(web.hits.oct28)
Vi testar först med 30 dagar:
> rlevel.gev(web.hits.oct28.gev,30)
[1] 1572.685 1804.349 2244.556
Dvs, den närmsta månaden kan jag förvänta mig max 1804 besök. Det finns dock 5% chans (risk, möjlighet) att det blir över 2245 besök. Med 100 dagar:
> rlevel.gev(web.hits.oct28.gev,100)
[1] 1886.486 2295.388 2823.097
Låt oss avsluta med estimeringen av max-värdet under det kommande året (365 dagar).
> rlevel.gev(web.hits.oct28.gev,365)
[1] 2185.355 2880.037 4725.287
Oj!


Plot
Här är en plot på antal besök per dag, från 18 juni till 28 oktober. Inget fancy men man ser tendenserna tydligt.
> plot(web.hits.oct28,type="l")Att läsa och ladda ner
Här är ett urval av det material om extremvärdesanalys jag stött på.

Introduktioner: It's a record
The extreme value fallacy On Extremes and Crashes (PDF)

Mer teoretisk är Statistical Methods for Extreme Values (PS) av Stuart Coles och Jonathan Tawn.

Några som skrivit om ämnet:
Alec Stephenson
Stuart Coles
Alexander J. McNeil

Coles har även skrivit boken An Introduction to Statistical Modeling of Extreme Values som jag skulle vilja lägga rabarber på, men den är rätt dyr ($79.95).

Det finns några R-paket att ladda ner. Se Software for Extreme Value Theory (Stephensons sajt). Där finns bland annat paketet evir som jag använde i analyserna.

Posted by hakank at 11:12 FM Posted to

oktober 28, 2003

George Lakoff om det politiska språket

I Framing the issues: UC Berkeley professor George Lakoff tells how conservatives use language to dominate politics intervjuas George Lakoff (of Metaphors we live by-fame) om bland annat det politiska språket.

In a long conversation over coffee at the Free Speech Movement Café, he told the NewsCenter's Bonnie Azab Powell why the Democrats "just don't get it," why Schwarzenegger won the recall election, and why conservatives will continue to define the issues up for debate for the foreseeable future.

Posted by hakank at 10:51 EM Posted to Diverse

Tillit och anseende i ekonomiska transaktioner

Experimental games for the design of reputation management systems (PDF) av Claudia Keser.

Abstract
Trust between people engaging in economic transactions affects the economic growth of their community. Reputation management systems, such as the Feedback Forum of eBay Inc., can increase the trust level of the participants. We show in this paper that experimental economics can be used in a controlled laboratory environment to measure trust and trust enhancement. Specifically, we present an experimental study that quantifies the increase in trust produced by two versions of a reputation management system. We also discuss some emerging issues in the design of reputation management systems.

(Via www.smartmobs.com.)

Posted by hakank at 08:27 EM Posted to Agentbaserad modellering

De svenska myntens talsystem

I Svaret är ungefär 41 - Mynten igen, alltså berättas om en (idealiserad) fördelning av mynten man får tillbaka vid köp.

Här är ett annat sätt att se fördelningen av antalet 10-or, 5-or, 1-kronor samt 50-öringar. Detta sätt utgår från kombinatoriken snarare än simulering.

Man kan se myntens möjliga fördelning som ett eget lustigt talsystem ("de svenska myntens talsystem"), där vi har följande möjliga grundvärden
 10, 5, 1, 0.5
Jämför med 1, 10, 100, 1000, etc i det decimala talsystemet eller 1, 2, 4, 8, 16 etc i det binära.

I detta mynt-system räknar man lite annorlunda än vanliga talsystem eftersom man här, i en viss (idealiserad) pengar-tillbaka-situation, endast kan få tillbaka ingen (0) eller en (1) 10-krona, 5-kronor respektive 50-öring, medan man kan få tillbaka ingen (0) eller upp till fyra (4) 1-kronor.

Enklast att se detta är att göra en tabell över hur mynten fördelas sig över de 40 möjliga värdena (från 0 till 19.50 i steg om 50-öre).

Kolummnerna är
Pengar-tillbaka-värdet, antal 10-kr, antal 5-kr, antal 1-kr, antal 50-öre
> cbind((0:39)/2, t(sapply((0:39)/2, function(x) return.change(x))))
   [,1] [,2] [,3] [,4] [,5]
 [1,] 0.0  0  0  0  0
 [2,] 0.5  0  0  0  1
 [3,] 1.0  0  0  1  0
 [4,] 1.5  0  0  1  1
 [5,] 2.0  0  0  2  0
 [6,] 2.5  0  0  2  1
 [7,] 3.0  0  0  3  0
 [8,] 3.5  0  0  3  1
 [9,] 4.0  0  0  4  0
[10,] 4.5  0  0  4  1
[11,] 5.0  0  1  0  0
[12,] 5.5  0  1  0  1
[13,] 6.0  0  1  1  0
[14,] 6.5  0  1  1  1
[15,] 7.0  0  1  2  0
[16,] 7.5  0  1  2  1
[17,] 8.0  0  1  3  0
[18,] 8.5  0  1  3  1
[19,] 9.0  0  1  4  0
[20,] 9.5  0  1  4  1
[21,] 10.0  1  0  0  0
[22,] 10.5  1  0  0  1
[23,] 11.0  1  0  1  0
[24,] 11.5  1  0  1  1
[25,] 12.0  1  0  2  0
[26,] 12.5  1  0  2  1
[27,] 13.0  1  0  3  0
[28,] 13.5  1  0  3  1
[29,] 14.0  1  0  4  0
[30,] 14.5  1  0  4  1
[31,] 15.0  1  1  0  0
[32,] 15.5  1  1  0  1
[33,] 16.0  1  1  1  0
[34,] 16.5  1  1  1  1
[35,] 17.0  1  1  2  0
[36,] 17.5  1  1  2  1
[37,] 18.0  1  1  3  0
[38,] 18.5  1  1  3  1
[39,] 19.0  1  1  4  0
[40,] 19.5  1  1  4  1
En summering av kolumnerna ger:
> apply(t(sapply((0:39)/2, function(x) return.change(x))),2,sum)
[1] 20 20 80 20
Av de 40 olika möjliga fallen, finns det 20 sätt (20/40 = 1/2) att få tillbaka respektive en 10-krona, en 5-krona samt en 50-öring, men 80 sätt (80/40 = 2) att få tillbaka åtminstone en 1-krona. Här har vi alltså den fördelning som tidigare simulerats fram:
  c(1/2, 1/2, 2, 1/2)
Om vi normaliserar så att summan blir 1 erhåller man motsvarande sannolikheter att få tillbaka ett speciellt mynt.
> xx<-c(1/2,1/2,2,1/2)
> xx/sum(xx)
[1] 0.1428571 0.1428571 0.5714286 0.1428571

Antal mynt
Hur många mynt kan vi förvänta oss att få tillbaka? Vi lägger till en sjätte e kolumn med antal mynt som motsvarar en viss summa. Kolumnerna är
Pengar-tillbaka-värdet, antal 10-kr, antal 5-kr, antal 1-kr, antal 50-öre, antal mynt
> xx<-t(sapply((0:39)/2, function(x) return.change(x)))
> cbind((0:39)/2,xx,apply(xx,1,sum))
   [,1] [,2] [,3] [,4] [,5] [,6]
 [1,] 0.0  0  0  0  0  0
 [2,] 0.5  0  0  0  1  1
 [3,] 1.0  0  0  1  0  1
 [4,] 1.5  0  0  1  1  2
 [5,] 2.0  0  0  2  0  2
 [6,] 2.5  0  0  2  1  3
 [7,] 3.0  0  0  3  0  3
 [8,] 3.5  0  0  3  1  4
 [9,] 4.0  0  0  4  0  4
[10,] 4.5  0  0  4  1  5
[11,] 5.0  0  1  0  0  1
[12,] 5.5  0  1  0  1  2
[13,] 6.0  0  1  1  0  2
[14,] 6.5  0  1  1  1  3
[15,] 7.0  0  1  2  0  3
[16,] 7.5  0  1  2  1  4
[17,] 8.0  0  1  3  0  4
[18,] 8.5  0  1  3  1  5
[19,] 9.0  0  1  4  0  5
[20,] 9.5  0  1  4  1  6
[21,] 10.0  1  0  0  0  1
[22,] 10.5  1  0  0  1  2
[23,] 11.0  1  0  1  0  2
[24,] 11.5  1  0  1  1  3
[25,] 12.0  1  0  2  0  3
[26,] 12.5  1  0  2  1  4
[27,] 13.0  1  0  3  0  4
[28,] 13.5  1  0  3  1  5
[29,] 14.0  1  0  4  0  5
[30,] 14.5  1  0  4  1  6
[31,] 15.0  1  1  0  0  2
[32,] 15.5  1  1  0  1  3
[33,] 16.0  1  1  1  0  3
[34,] 16.5  1  1  1  1  4
[35,] 17.0  1  1  2  0  4
[36,] 17.5  1  1  2  1  5
[37,] 18.0  1  1  3  0  5
[38,] 18.5  1  1  3  1  6
[39,] 19.0  1  1  4  0  6
[40,] 19.5  1  1  4  1  7
Medelvärdet av antal mynt är
> mean(apply(xx,1,sum))
[1] 3.5
I genomsnitt får vi alltså tillbaka 3.5 mynt tillbaka.

Och så här fördelas frekvensen av antal mynt.
> table(apply(xx,1,sum))

0 1 2 3 4 5 6 7 
1 4 7 8 8 7 4 1 
Dvs det finns 8 möjligheter att få tillbaka 3 mynt, 1 möjlighet att få inga eller 7 mynt osv.


Generaliseringar
Jag kan tyvärr inte garantera att detta var den sista anteckningen om mynts fördelning, eftersom det finns ett antal generaliseringar som kan göras.

Posted by hakank at 01:12 EM Posted to Diverse | Matematik | Comments (3)

Skrivande som påverkan

I boken Influence, Science and Practice av Robert B. Cialdini kan man läsa följande (4:utgåvan, sid 71) om skrivandets makt. Kapitlet heter "Commitments and Consistency".

... Some door-to-door sales companies use the magic of written commitments to battle the "cooling-off" laws that exists in many states. The laws are designed to allow customers a few days after agreeeing to purchase an item to cancel the and receice a full refund.
...
The companies have since learned a beautifully simple trick that cuts the number of such cancellations drastically. They merely have the customer, rather than the salesperson, fill out the sales agreement. According to the sales-training program of a prominent encyclopedia company, that personal commitment alone has proved to be "a very important psychologicaly aid in preventing customers from backing out of their contracts." ... [These] organisations have found that something special happens when people put their commitments on paper: They live up to what they have written down.

Detta är bara ett exempel av många hur man påverkas av att skriva något. Tidigare i kapitlet berättas om hur man i kinesiska fångläger har utnyttjat en liknande teknik för att påverka fångarna till att samarbeta. Fångarna fick t.ex. skriva ned texter om Kina i positiva ordalag; något positivt om Kina kunde de flesta komma på. Bara det faktum att skriva ner en positiv sak om Kina (t.ex. att kommunismen har vissa fördelar i Kina) gör att man påverkar sin självbild: att man inte är absolut emot kommunismen eller Kina. Tagen så detta första lilla steg krävdes det inte så mycket mer övertalning att få fångarna att ta nästa steg, etc.

En intressant sak är att även om en fånge vägrade att skriva ner egna positiva åsikter utan bara kopierade en text med sådana åsikter ("det kan ju inte vara så farligt att kopiera en text") påverkades fången på samma sätt.

I kapitlet står även att andras bild av oss påverkas mycket mer av det vi skriver än det vi säger. Skrivandets makt är tydligen stor.

Kommet så långt kom jag att tänka på skrivande i allmänhet och bloggning i synnerhet. Vad är det egentligen som händer när man skriver en text i sin blogg (eller hemsida)? Hur påverkas man (och ens självbild) av de åsikter man "råkar" skriva eller de ämnen man skriver om?

Troligen finns inga direkta svar på dessa frågor i boken, men boken kan vara en spångbräda för vidare tankar. Nu har jag i alla fall skrivit ner lite tankar och frågor, vilket torde komitta mig starkare till problemet.

Första gången jag stötte på denna intressanta bok var när jag läste Niklas Johanssons (på Enkelriktat kommentarer om den. Se t.ex. här, här och här.


Se även Influence at Work.

Posted by hakank at 12:24 EM Posted to Blogging

Svaret är ungefär 41 - Mynten igen, alltså

Frågan som ger svaret ~41 är lite komplicerad, men den förklaras här nedan.

I Myntfördelningen - en gåta mindre (under Uppdatering) fick vi fram medelvärdet av antal mynt man får tillbaka vid ett köp: I en pengar-tillbaka-situation får man tilbaka, genomsnittligt, 0.5 stycken 10-kronor, 0.5 stycken 5-kronor, 2 stycken 1-kronor samt 0.5 50-öringar. Skrivet i den vanliga fördelningsordningen (10-or, 5-or, 1 kr, 50 öre)
 (1/2, 1/2, 2,1/2)
Vi vet också att 1 kilo svenska mynt är värda cirka 400 SEK (se Nya rön om mynt-estimering, Håkans viktformel för mynt)

Vi försöker nu få en enkel matematisk formel för att räkna ut totalsumman av värdet samt hur mynten fördelar sig. Problemet kan lösas t..ex. med hjälp av ett symboliskt matematikprogram (obs! här har R inte använts):
> solve(x*10/2 + x*5/2 + x*1*2 + x*0.5/2 = 400);
                   41.02564103
Dvs svaret är ungefär 41.

Denna konstant, 41.02564103, använder vi sedan för att räkna ut fördelningen samt totalsumman (som ska bli 400 annars har vi gjort fel).

Per kilo får vi alltså följande antal mynt (något avrundat).
> 41.02564103 * (1/2,1/2, 2,1/2); 
    (20.513, 20.513, 82.051, 20.513)
Värdet av mynten (något avrundat):
> 41.02564103 * (10*1/2,5*1/2,1*2,0.5*1/2);
                (205.123, 102.564, 82.051, 10.256)
Summan av dessa tal blir ~ 400 SEK. Så det stämmer alltså.

Tittar vi på 10 kilo mynt multiplicerar vi helt enkel med 10 och får antalet mynt:
> 10 * 41.02564103 * (1/2,1/2,2,1/2);
                (205.128, 205.128, 820.513, 205.128)
Och värdet:
> 10 * 41.02564103 * (10*1/2,5*1/2,1*2,0.5*1/2);
                (2051.283,1025.641, 820.513, 102.564)
Kontroll: Summan blir cirka 4000SEK.

Nu fick vi tag i fördelningen: ~ (205, 205, 820, 205)

Vilket ska jämföras med den empiriska fördelningen:
(171, 265, 849, 202)

Exempel
Låt oss nu avsluta med ett fiktivt exempel. Tänk om vi vore i den lyckliga belägenheten att vi har 23 kilo mynt. Hur mycket är detta värt och hur många olika mynt har vi?

> 23 * 41.02564103 * (10*1/2,5*1/2,1*2,0.5*1/2);       
         4717.948718, 2358.974359, 1887.179487, 235.8974359
> 4717.948718+2358.974359+1887.179487+235.8974359;
                   9200.000000
Det är alltså värt 9200 SEK och fördelningen av mynten (antal) är, avrundat till heltal (472, 472, 1887, 472) .

Posted by hakank at 12:54 FM Posted to Diverse | Matematik | Comments (1)

oktober 27, 2003

"En bloggnybörjares funderingar"

När jag letade efter en helt annan text hittade jag nedanstående funderingar om bloggning, skrivet kring 23 juni 2003, dvs efter en knapp veckas bloggande.

Även om den gångna tiden givit mig mer erfarenhet av bloggning, både praktiskt och teoretiskt, är det inte stor skillnad mot mina åsikter/tankar idag. Och jag är nästan lika frågande idag hur blogg egentligen ska definieras.

Man kan sålunda se dokumentet som En bloggnybörjares funderingar.


Efter en knapp vecka med en egen webblogg har jag börjat bli intresserad av "teoretisk bloggologi", dvs studiet av fenomenet webblogg (blogging etc), och läser därför lite (slumpmässigt) om vad som konstituerar en webblogg. Går det att få fram nödvändiga och tillräckliga villkor? Går det att, eller bör man, redan nu bestämma begreppet för att sedan försöka att få in alla nya utvecklar i teorin med skohorn, enbart för att ens teori ska vara korrekt. Teorier om begrepp i förändring måste också vara dynamiska!


Personliga förväntningar
En första sak som slår mig är att begreppet "webblogg" inte är väldefinierat redan! Jag har hört begreppet ett bra tag och trodde att detta var en stabil företeelse. Trots allt har företeelsen webbloggar funnits i flera år, men först den senaste tiden (år) verkar det ha samlats communitites. Jag antar att detta har att göra med den tekniska utvecklingen: att verktyg har blivit tillräckligt bra, medvetenheten hos bloggare som grupp har blivit starkare och antalet bloggare har nått någon magiskt gräns.

Man kan nu fråga sig om värdet att försöka fånga begreppet "webblogg". Varför är det intressant? För mig personligen är det en utmaning eftersom det verkar inte finnas någon riktig definition än, alltså kan det, om inte annat, vara skoj att göra en egen analys.


A priori-teori
Innan jag börjar läsa mer strukturerat tänkte jag göra en apriori-teori om detta, så att jag inte blir alldeles för påverkad av vad andra skriver.

En a priori-teori om detta är att begreppet hela tiden utvecklas beroende på vilken grupp som tar till sig bloggeriet. T.ex. torde ett begrepp förändras om företeelsen det betecknar blir så intressant att det forskas kring, eller om det går att kapitaliseras. Efterhand företeelsen utvecklas torde det ske begreppsförskjutningar och det kommer att skapas starka diskussioner mellan pionjärer och andra om att begreppet egentligen betyder si eller så. Detta är min förutsägelse.


Spridning (a priori)
En annan a priori-teori om ett begrepps spridning och utveckling är att det följer ungefär följande bana. Jag använder X som begrepp för att göra det lite mer formellt.

1) några enstaka personer börjar med något som i efterhand kan sägas vara X, helt oberoende av andra och man använder olika tekniker men det finns någon form av familjelikhet mellan de olika användarna (t.ex. dagböcker eller personliga kommentarer i HTML på webben).

I denna tidiga utveckling har begreppet troligen ännu inte något namn. I fallet med webblogg kallar man det t.ex. för dagbok, dagliga reflexioner, journal etc.

Detta är uppfinnarfasen (innovators).

* Några av dessa tidiga enstaka uppfinnare upptäcker att de har samma intresse och - av olika skäl - vill verka i en grupp. Det är inte alls självklart hur man vill utgöra en grupp. T.ex. om personerna är konkurrenter vill de kanske inte ens låtsas om varandra. Men om de i gruppen ingående personerna är av rätt virke vill de träffas och inspirera varandra.

Därför bildas kollektiv (communities) av olika sorter och på olika tekniska plan. Detta kollektiv behöver inte vara speciellt koherent, vilken typ av sammanhållning beror mycket på vad X är.

* Någon börjar skapa speciella verktyg för att stödja kollektivet. Troligen är detta ett fritt program som någon av de ingående har utvecklat, eller möjligen någon kompis till dessa.

Notera att vi fortfarande är i uppfinnarfasen.

* Genom dessa verktyg når X en större krets men spridningen av information sker fortfarande informellt och ostrukturerat.

Med största sannolikhet finns det nu flera olika webbplatser för X.


* På något sätt blir företeelsen mer känd och kanske nu får ett klatchigt namn. Detta offentlighetsgörande kan ske t.ex. genom:
- medveten marknadsföring av begreppet av kollektivet
- tidning, radio, TV eller annan media beskriver X
- någon börjar oroa sig och publikt anklaga X för att vara samhällsfarligt
- någon aktienoterar ett företag som har X som grund
- en känd/inflytelserik person skriver mycket om X
- det görs en film om X
- någon börjar kanske nu forska i X och dess utveckling och försöker hitta gemensamma nämnare, kanske till och med gör en formell analys

Troligen börjar man ha X-konferenser och kanske startar någon tidning.

Detta gör att en större del av mänskligheten blir utsatt för att det finns något som heter X.

[Om X är ett naturligt led i en redan existerande utveckling, t.ex. en ny teknik att analysera data, går ovanstående fort eftersom det redan finns medier att förmedla information, webbplatser, mailinglistor etc. Jag tänker även på begrepp som Semantic Web som skapades för många år sedan, men ännu inte fått den stora genomslagskraft den borde haft. Några skäl är att både teknik och teori inte är fullt utvecklade för att ge Sematic Web det stora lyft det förtjänar.
]

[En annan kommentar: Denna analys bygger på att X lyckas. Se mer i "The Tipping Point"!]

* Vad händer om någon skriver "The Ultimate Guide to X"?
Cf Semantic Web. Begreppet definieras tidigt och kommittéas, dvs utvecklingen blir en formell företeelse enligt strika regler. Det behöver inte vara en dålig sak, tvärtom!

* Sedan kommer de som har hört X nämnas ett tag men kanske inte tyckt det var tillräckligt intressant för att ägna det mer än en tanke. Men efter ett tags funderande och olika slumpheter beslutar sig för att testa det, kanske efter förslag eller påtryckning från någon i kollektivet.

Och så är det igång!

-----
En sak jag tycker verkar vara viktiga med en webblogg är

* den temporära strukturen

Dvs att det finns en tidslighet som skiljer sig från vanliga webbsidor. Denna tidslighet gör att man kan följa en persons eller företeelses utveckling. Vad skiljer detta sig från en webbtidning såsom Aftonbladet, Sydsvenskan, Svenska Dagbladet? Här finns ju också denna temporära struktur. Det kan ju inte vara så enkelt att man i en blogg listar alla artiklar i en rad efter varandra medan man inte gör detta i en webbtidning! Eftersom de allra flesta bloggar kategorierar sina artiklar så är det ännu mindre skillnad.

Två saker kan sägas skilja en webbtidning från en blogg:
- en webblogg skrivs normalt av endast en person eller ett mycket fåtal personer
- målgruppen är lika mycket (?) författaren själv som andra

Men å andra sidan är de allra största bloggarna (t.ex. Udell) mer eller mindre proffs-skribenter vars blogg inte skiljer sig speciellt mycket från deras (eller liknande) kolumner i syndikerade kommersiella tidningar.

(Min intuition är att det egentligen inte finns någon meningsfull definition
på en blogg. Och ärligt talat så bryr jag mig inte om det. Den aktuella
analysen är mer för att undersöka andras analyser.)


Vad är en (web)blogg?
De senaste dagarna har jag läst olika förklaring till vad en webblogg är och speciellt vad som utgör de viktigaste skillnader mot andra former av webbplatser. Man bör notera att jag tidigare inte brytt mig så mycket att analysera detta begrepp så det troligen en del newbie-tankar här.

Från The structure and linguistic analysis of blogs av Stephanie Nilsson. (2003-10-27: Dokumentet var OH-bilder från ett seminarium Stephanie höll i somras. Tyvärr är den gamla länken invalid.)


* A blog is a form of personal publishing on the web.
* Form, form, form
It is a series of hyperlinked texts that are date-stamped in reverse
chronological order.
* Blogs are interactive.
* Blogs are social
* Blogs are NOT a homepage

"Homepages are places where you put pictures of your family and your cats.
It's a place to distribute information to a close circle of family and friends.
Weblogs ... are designed for an audience... they are an interactive extension
of who you are" Cameron Barrett of CamWorld, http://www.camworld.com/".

Min intuition om det sistnämnda är annorlunda, speciellt eftersom jag utnyttjat min sajt (hemsida) sedan jag skapade den (1995) just för att ge information till "vem-som-helst", möjligen en begränad krets som har samma (begränsade) intressen som jag själv, men definitivt inte primärt till mina existerande IRL-vänner. Den är även interaktiv eftersom jag skapad en massa interaktiva program (CGI, applets etc). Jag har - förutom en lite kortfattad presention - väldigt lite personlig information om mig själv.

Till detta kan läggas att det verkar det som om begreppet hemsida används av väldigt många för att beteckna andra saker än det som sägs i definitionen t.ex. pratar man om "ett företags hemsida" eller "gå till vår hemsida för att hitta mer om ...", vilket alltså går emot ovanstående definition. Visst, man kan definiera begreppet homepage att vara som i det ovanstående citatet, men då förvirrar det i alla fall mig.

Detta är en måhända en liten invändning sett mot de övriga kriterierna som enkelt kan sammanfattas med ungefär följande (det ska inte ses som en definition): "sociala" sidor med personlig publicering av artiklar i omvänd kronologisk ordning vilka jag tror rätt väl täcker in begreppet blogg.

Speciellt intressant är iakttagelsen att en blogg är både monolog och dialog!

Problem med bloggar
Ett problem med bloggar som jag upptäckt nu när jag letar efter information om "bloggens essens" är att det kan vara svårt att hitta relevant information, speciellt när man - som jag - kommer in rätt sent i utvecklingen av bloggarna. Nästan allt som skrivs om bloggning verkar vara skrivet just i en webblogg för bloggare som vet hur man navigerar i en blogg, vilket inte gör det lättare.

Väldigt mycket har troligen skrivits redan, men det är svårt att hitta det bästa utan att gå igenom åratal av artiklar som är blandade med artiklar av mindre intresse. Ibland har man hjälp av kategoriseringen, med en fullt utvecklad blogg har ofta en massa inlägg som gör att det är ett härke att försöka reda upp essensen.

Man ser då tydligare fördelen med "standardsajter" med en ofta välstrukturerad uppdelning i ämnen etc. Och - vilket nog är det viktigaste - en sida förändras genom att den ändras när ny information kommer till, inte bara att information läggs till kronologiskt.

Det jag skulle vilja ha är en syntes av bloggens kronologi och sociala interaktion som initierar, formulerar och samlar information ett ämne ("problem" etc) och som sedan sammanfattas, redigeras och presenteras i en välstrukturerad och välredigerad webbsajtform.

Det finns dimensioner där denna lösning är helt irrelevant, t.ex. den rent sociala dimensionen av bloggeriet, dvs att skrivande, läsande och kommenterande är mer en social företeelse än informationslämnande/-införskaffande, och vilket nog inte skiljer sig avsevärt från en mailinglista eller nyhetsgroup. Men för de inlägg där man försöker att ge eller få information kan ovanstående kanske vara en lösning.

Hur man ska lösa det rent tekniskt är en helt annan fråga. Och för övrigt är det säkert någon som funderat på detta redan och skapat ett alldeles fantastiskt verktyg. Det är bara det att det har drunknat i ett hav av andra artiklar på någon blogg någonstans.

Trots ovanstående drapa är jag fascinerad av bloggeriet och kommer att fortsätta att skriva som om inget hade hänt. Världen går inte under bara för att man inte kan definiera ett begrepp!

--

En stor fördel med bloggande är att det går att skriva en kort artikel som inte har något egentligt samband med övrig information på en sida. Skulle man göra samma sak på en icke-blogg-sajt skulle det blir alldeles förskräckligt rörigt och man skulle nog till slut komma fram till en lösning (både tekniskt och presentationsmässigt) som påminner om en webblogg. En annan fördel är att det - förhoppningsvis - finns en viss läsekrets som i alla fall är nyfiken på vad man skriver.

--

Av en ren slump stötte jag på följande. Jag har ingen aning om artikeln är representativ, speciellt bra eller kanske utgör ett extremt inlägg i en existerande debatt. Men någonstans måste man ju börja....

Dave Winer: What makes a weblog a weblog? (23 maj, 2003)

Början i artikeln verkar lovande. Här försöker författaren definiera (eller i alla fall förklara) vad som utgör en webblogg. En av rubrikerna är:

The unedited voice of a person
..., they are writing about their own experience. And if there's editing it hasn't interfered with the style of the writing. The personalities of the writers come through. That is the essential element of weblog writing, and almost all the other elements can be missing, and the rules can be violated, imho, as long as the voice of a person comes through, it's a weblog. (min markering).

Avsaknad av påverkan:
Weblogs are unique in that only a weblog gives you a publication where your ideas can stand alone without interference. It gives the public writer a kind of relaxation not available in other forms.

Detta - att skriva oredigerat, utan påverkan och om sin egen erfarenhet - verkar alltså vara nödvändiga och tillräckliga villkor för att utgöra en webblogg. Men, jag förstår faktiskt inte på vilket sätt detta skiljer sig från en personlig hemsida som handlar om personliga intressen, eller personliga kolumner i kommersiella magasin, där (antar jag i alla fall) redigeringen är minimal om inte obefintlig.

Som exempel tas en sida från BBC om kriget i Irak Reporters' log: Final thoughts.

Slutsatsen: So, I think the BBC page is a weblog.


Now on to the technical features and a definition only a mathematician could love.

A weblog is a hierarchy of text, images, media objects and data, arranged chronologically, that can be viewed in an HTML browser.

Så det som skiljer en webblogg från vanliga webb-sidor är den kronologiska uppräkningen? Men vad skiljer då detta från en webbtidning? Ah, då har vi den oredigerade personliga texten, vilket faktiskt inte står i ovanstående definition. OK, må så vara.

Sedan följer en uppräkning om vad en webblogg mer teknisk oftast består av, t.ex. (se originalartikel för vad de olika sakerna betyder):


Det finns ofta en infrastruktur:

Men det känns nu som om författaren vill definiera en webblogg som det eller de verktyg som används för att skapa en webblogg! Vilket iofs verkar vara korrekt, men den inledande analysen (oredigerad personlig webbsida) kommer nu helt i skymundan och man får inte reda på vilken relation dessa båda dimensioner har till varandra.


Några kommentarer om ovanstående essä finns i:
Glenn Harlan Reynolds: The Good, The Bad, and the Blogly

Denna artikel diskuterar vad en god webblogg är. Det finns några få kriterier (1) a personal voice; and (2) rapid response times. Där response time är en frågan om redigerings-loopen snarare än hur ofta bloggaren skriver och svarar på kommentarer.

Vad som är än viktigare är länkarna, som ju är ett effektivt sätt att förmedla en fullständig artikel. Den främsta poängen med detta är att det möjliggör källkritik: The link isn't a guarantee of accuracy, of course - the source you're linking to can always be wrong - but it does let the readers evaluate the source themselves.

Personligen anser jag att länkar till en artikel - till skillnad från att endast kopiera innehållet i en artikel - också har den stora fördelen att man kan nästan alltid hittar mer intressanta saker på den refererade sajten. Detta är inget nytt med webben: de allra flesta har säkert råkat ut för den fascinerande men något frusterande upplevelsen att upptäcka att man tillbringat flera timmar att utröna en sajts övriga sidor i stället för att fokusera på det man först kom dit för.

Övriga saker som kan utgöra en god artikel är inte speciella för just webbloggar, utan är sådan som gör bra artiklar i vilket medium som helst: bra språk, unik information, unik synvinkel etc.

Posted by hakank at 07:23 EM Posted to Blogging | Comments (1)

Bra bloggtips

47 key tips from the World's best BLOGGERS.

Bloggers have lost jobs, friends, and even spouses over things they revealed in their journals. Bloggers have to make the conscious decision from the start that what they write today may come back to haunt them tomorrow, and be OK with that choice. That’s the warning from one of the best veteran bloggers. They share their tips and experiences.


Via Emerging Communications.

Posted by hakank at 06:06 EM Posted to Blogging | Comments (2)

Myntfördelningen - en gåta mindre

I Nya rön om mynt-estimering skrevs bland annat om hur mina växelmynt fördelades empiriskt:
MyntAntalVärde(SEK)
10kr1711710
5kr2651325
1 kr849849
50 öre202101

En liten fråga ställdes om vad denna fördelning beror på. Speciellt noterades att det fanns så många 1-kronor jämfört med övriga myntslag. För att citera: Studiet av myntfördelning måste alltså anses vara ett senare forskningsprojekt..

Sedan är nu!

Vi gör en simulering av olika värden av pengar tillbaka vid ett köp, från 0 till 19.50 SEK. Anledningen till att större värden än 19.50 inte tas med är att vi antar att de i så fall returneras i sedlar, dvs 20-kronors sedlar etc (som, tyvärr, inte är studieobjekt för tillfället).

Följande förutsättningar görs:
- Kassören har tillräckligt med mynt för att kunna göra en "optimal" växel, dvs med så få mynt som möjligt.
- Vi antar att alla olika växelvärden är lika sannolika, dvs det är lika stor chans att få tillbaka 19.50 som 2.00.
- All betalning görs endast med sedlar och vi använder alltså aldrig några mynt för betalning (ny!)

Logiken i simuleringen är följande:

För varje pengar-tillbaka-situation:
1. Simulera pengar-tillbaka-värde, från 0.0 .. 19.50 SEK.
Dessa kan endast vara jämna kronor eller 50-öringar.

2. Från detta värde undersök hur många 10-, 5-, 1-kronor, samt 50-öringar vi får (vid en optimal växel).

Om man simulerar flera olika sådana pengar-tillbaka-körningar, får vi även en summa av det totala värdet av växelmynten.

Här är R-koden som simulerar detta. (Systemet R finns som vanligt på www.r-project.org.)

Generering av växel (0 - 19.50)
> (0:39)/2
 [1] 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0
[16] 7.5 8.0 8.5 9.0 9.5 10.0 10.5 11.0 11.5 12.0 12.5 13.0 13.5 14.0 14.5
[31] 15.0 15.5 16.0 16.5 17.0 17.5 18.0 18.5 19.0 19.5


Funktionen return.change returnerar hur många 10-, 5-, 1-kronor resp 50-öringar som krävs för en "optimal växling", dvs med målet att det ska bli så få mynt som möjligt. Funktionen returnerar:
antal 10-kronor,5-kronor,1-kronor,50-öringar

return.change <- function(money=19.50) {
  coins <- c(10, 5, 1, 0.5)
  dist <- c(0,0,0,0)
  for (i in 1:4) {
   if (money > 0) {
    while (money >= coins[i]) {
     dist[i] <- dist[i] + 1
     money <- money - coins[i]
    } 
   }
  }
  dist
}
# return.change()
Funktionen change.simulate gör själva simuleringen, med parametern n som är antalet pengar-tillbaka-situationer.

Returvärdet är:
dist : antal 10-kronor,5-kronor,1-kronor,50-öringar
dist.sum : totalsumman

Här kan vi alltså både jämföra med fördelningen av antalet myntslag och den empiriska totalsumman (som var 3985 SEK).

change.simulate <- function(n=10) {
  dist <- c(0,0,0,0)
  for (i in 1:n) {
   ss <- sample( (0:39)/2, 1, replace=T)
   dist <- dist + return.change(ss)
  }
  coins <- c(10, 5, 1, 0.5)
  # total value of money
  dist.sum <- sum(dist * coins)
  list(dist=dist, dist.sum=dist.sum)
}
# change.simulate(100)

Så körs vi!

Ett mål är att komma så nära den empiriska fördelningen och totalsumman som möjligt, dvs
 dist:   171 265 849 202
 dist.sum: 3985
Några exempelkörningar.

Först kör vi med 100 växlingar:
> change.simulate(100)
$dist
[1] 49 39 180 53

$dist.sum
[1] 891.5
Sedan med 1000 körningar:
> change.simulate(1000)
$dist
[1] 494 514 2017 495

$dist.sum
[1] 9774.5
500 körningar. Vi börjar närma oss.
> change.simulate(500)
$dist
[1] 260 249 953 248

$dist.sum
[1] 4922
Följande är ganska likt den fördelning som jag faktiskt fick. Cirka 800 1-kronor, samt övriga kring 200 stycken.
$dist
[1] 179 215 852 208

$dist.sum
[1] 3821
Låt oss nu se om medelvärdet av totalsumman för 100 sådana körningar motsvarar det empiriska 3985.
> mean(replicate(100, change.simulate(400)$dist.sum) )
[1] 3932.04

Medelvärdet 3932 får nog anses vara tillräckligt bra.

Varför n=400?
Hur ska vi nu förklara värdet n=400? Det är alltså antal pengar-tillbaka-situationer som görs i simuleringen. Om vi nu gör en liten efterkonstruktion så innebär det att under de cirka 2 år som jag sparat växelmynten, har jag fått växelpengar ungefär varannan dag. Faktiskt inte helt orealistiskt.

Detta skulle t.ex. innebära att under ett års sparande (med n=200) skulle det blir följande fördelning och totalsumma:
> change.simulate(200)     
$dist
[1] 109 106 383 105

$dist.sum
[1] 2055.5

Återstoden
Det krävs naturligtvis mer empirisk data för att testa modellen, så nästa undersökning kan göras ungefär oktober 2005. Eftersom simuleringen verkar visa på en rätt realistisk modell, återstår att göra en mer formell analys av fenomenet. Vi får se när detta sker...

Koppling till vikt/volym: Naturligtvis borde de respektive myntsorterna ha vägts, men så gjordes inte. Sådant är dock ganska enkelt att göra närhest vid behov.

Uppdatering
Det skulle nog även vara bra med en medelvärdeskörning för själva fördelningen med n=400, och inte bara på totalsumman.:
> ss <- apply(replicate(100,change.simulate(400)$dist),1,mean)
> ss
[1] 199.69 202.17 802.75 199.31

> sum(ss*c(10,5,1,.5))
[1] 3910.155
Dvs cirka 800 1-kronor, och cirka 200 övriga mynt-sorter.

En medelvärdeskörning för n=1, dvs ett enda pengar-tillbaka-tillfälle är enligt följande, där vi kan köra 10000 sådana simuleringar eftersom det inte tar så lång tid:
> ss <- apply(replicate(10000,change.simulate(1)$dist),1,mean)
> ss
[1] 0.4961 0.5022 2.0037 0.5012

> sum(ss*c(10,5,1,.5))
[1] 9.7263

Dvs i medelvärde cirka 2 stycken 1-kronor, och respektive 0.5 övriga myntsorter. Medelvärdet för totalsumman är cirka 9.73 SEK.

Egentligen skulle vi ju bara behövs ha dessa värden, resten kan man projicera fram. Låt oss gå baklänges:

Vi har 849 stycken 1 kronor, vilket n-värde får vi och hur ser den övriga fördelningen ut. Eftersom vi vet att vi får igenom snitt 2 1-kronor per pengar-tillbala-situation blir n = 849/2 = 424.5 ~ 425.

De övriga mynten ska fördela sig med 1/4 av antalet 1-kronor, vilket innebär: 212.25 stycken 10-or, 5-or respektive 50-öringar.

Låt oss nu testa detta mot simuleringen
> ss<-apply(replicate(100,change.simulate(425)$dist),1,mean)
> ss
[1] 214.18 212.06 853.00 211.35
> sum(ss*c(10,5,1,.5))
[1] 4160.775
Tja, det är en bra utgångspunkt i alla fall.

Posted by hakank at 04:36 EM Posted to Diverse | Comments (2)

Dynnet newsletter

Dynnet är ett nyhetsbrev (yahoo-group) som kommer en gång i veckan (måndagar).

Programförklaring:
The aim of this group is to exchange ideas, papers and news about the modelling of the evolution and the dynamics of networks (social, Web and so on)

Det senaste numret pekar (också) på flera skoj papers.

Exploring Complex Graphs by Random Walks, Bosiljka Tadic

Theory of Aces: Fame by chance or merit?, M.V. Simkin, V.P. Roychowdhury

Determination of the Topology of a Directed Network, Darin Goldstein

Endogenous Versus Exogenous Shocks in Complex Networks: an Empirical Test, D. Sornette, T. Gilbert, A. Helmstetter, Y. Ageon

Complexity and hierarchical game of life, Ivan Gotz, Isaak Rubinstein, Eugene Tsvetkov, Boris Zaltzman

Random walks on hierarchical scale-free networks, Jae Dong Noh, Heiko Rieger

Spatial Small Worlds: New Geographic Patterns for an Information Economy, Sean P. Gorman, Rajendra Kulkarni.

Posted by hakank at 01:54 EM Posted to Komplexitet/emergens

Intressanta papers från senaste Complexity Digest

Den senaste Complexity Digest pekar till flera intressanta (allmänt tillgängliga) papers/artiklar:

Pattern Excitation-Based Processing: The Music of The Brain av Lev Koyrakh
Hierarchical Organization In Complex Networks av Erzsebet Ravasz, Albert-Laszlo Barabasi
How to search a social network av Lada A. Adamic, Eytan Adar
Analysis of Norms Game in networked societies av Pawel Sobkowicz
2003 World Rock Paper Scissors Championship
Complex Systems In Biomedicine (PDF) av S. Wuchty, E. Ravasz & A.-L. Barabási
Self-organized Model for Modular Complex Networks : Division and Independence av D.-H. Kim, G. J. Rodgers, B. Kahng, D. Kim
Scale-Free And Hierarchical Structures In Complex Networks (PDF) av A.-L. Barabási, Z. Dezs, E. Ravasz, S.-H. Yook & Z. Oltvai

Posted by hakank at 01:12 EM Posted to Komplexitet/emergens | Social Network Analysis/Complex Networks

Nya rön om mynt-estimering

I Hur mycket väger pengar? och Hur mycket väger pengar? - Nu även med lite granularitetsforskning diskuterades hur mycket 10 kilo svenska mynt är värda. Det efterfrågades någon form av approximeringsmetod för att avgöra sådana problem.

Den formel som främst användes (den s.k. Marcus volymformel ) innebär följande approximation:

1 liter SEK-mynt = 1850 SEK

Notera att det är myntens volym som mätes.

Eftersom den förevarande undersökningen mätte cirka 2.5 liter mynt gav det ett estimatcirka 4600 SEK

Resultat
Nu är pengarna räknade. De fördelade sig på följande sätt:

MyntAntalVärde(SEK)
10kr1711710
5kr2651325
1 kr849849
50 öre202101

Summan blir alltså:

1710 + 1325SEK + 849 + 101 = 3985 SEK

Jämfört med Marcus volymformel slår det på 4600 - 3985 = 615 SEK, vilket trots allt kan anses som relativt bra.

Marcus-Håkan volymformel
Det känns dock tvunget att justera för den uppkomna avvikelsen. Här lanseras alltså den nya Marcus-Håkan volymformel för mynt som innebär en avvägning av de två uppkomna mätvärdena, dvs

1 liter SEK mynt =
(Marcus-värdet + Håkan-värdet)/2 =
(1850SEK + 1594SEK) / 2 =
1722SEK

Vilket sedan avrundas till 1720SEK.

Den nya Marcus-Håkan volymformel för approximering av svenska mynt från volym, är sålunda:
1 liter SEK-mynt = 1720 SEK

Håkans viktformeln för svenska mynt
Här lanseras även Håkans viktformel för svenska mynt (via 10 kg mynt = 3985 SEK ~ 4000 SEK):

1 kg mynt = 400 SEK

Myntens fördelning
Man kan även fundera på varför det är så många 1 kronor (849 stycken) jämfört med övriga mynt (cirka 200 stycken vardera).

Tid och resurser medger för närvarande inte en fullständig analys av detta fenomen. Det kan dock med viss (möjligen stor) sannolikhet antas att fördelningen beror på värden av de existerande sedlarna som även returneras tillsammans med mynten vid en köpprocedur.

Speciellt 20-kronorssedeln måste anses vara viktig för den uppkomna mynt-fördelningen. Detta eftersom just 20 SEK är det minsta värdet för svenska sedlar, vilket är gränsvärdet för penga-tillbaka-returer som kan hanteras i sedlar. Resterande pengar-tillbaka-värden måste alltså returneras i mynt (vilket för oss till den uppkomna myntfördelningen).

Studiet av myntfördelning måste alltså anses vara ett senare forskningsprojekt.

Posted by hakank at 11:13 FM Posted to Diverse | Matematik

Organisationer i kris

Santa Fe-papret The Organization of Responsiveness: Innovation and Recovery in the Trading Rooms of Lower Manhattan (PDF) av Daniel Beunza och David Stark studerar hur organisationer arbetar i krissituationer och vad som kännetecknar effektiva och robusta organisationer.

Från introduktionen:
In this essay we examine a trading room that was damages in the Septemner 11th attack on the Worlds Trade Center (WTC). The trading room, part of a major international investment bank was located in the World Financial Center directly adjacent to the WTC. On the evening of September 11th, the management team of the trading room regrouped in an emergency facility in New Jersey and estimated that it would take 3 weeks to 3 month to resume operations. Yet only 6 days later, when equity markets re-opened on September 17th, they we trading again. What king of organization made such recovery possible? What did the crisis reveal about the social practices and the technological tools of trading? And what re the implications of the organizational bases of innovation and responsiveness for the broader recovery of Lower Manhattan?

Abstract
What is the organizational basis of responsiveness under conditions of crisis? In this essay we examine a trading room that was damaged in the September 11th attack on the World Trade Center (WTC). What did the crisis reveal about the social practices and the technological tools of trading? Drawing on ethnographic field research prior to September 11th, we show how the heterarchical (as opposed to hierarchical) organization of the trading room contributed to innovation on an ongoing basis. Drawing on our subsequent observations in the relocated trading room and focus group discussions with executives in other WTC financial firms, we show that similarly heterarchical features contributed to innovation in response to crisis. Under conditions of radical uncertainty, one cannot know in advance what resources one will need, or even know in advance what might be a resource. Laterally distributed intelligence and a tolerance of multiple registers of valuation and interaction provide generative structures of resourcefulness where the replicative redundancy of contingency planning confronts its limits. We conclude with a brief discussion of the implications of our findings on innovation, location, and responsiveness for the changing urban geography of finance and the redevelopment of Lower Manhattan.

Keywords:robustness, organizational theory, heterarchy, contingency planning, socio-technical networks

Posted by hakank at 08:18 FM Posted to Social Network Analysis/Complex Networks

oktober 26, 2003

Projektförslag: Nyttan med bloggar

INTRODUKTION
I sitt utförliga svar till Söndagstrean - om bloggningens utveckling i Sverige gjorde Mats Andersson mig uppmärksam på att för närvarande är min blogg den första svenska blogg som kommer upp vid en googlesökning på 'blogg'.

Söker man med 'Sök svenska sidor' (t.ex. via www.google.se) är hakank.blogg den första som kommer upp överhuvudtaget. (Naturligtvis har jag inte varit helt omedveten om detta, men Mats fick mig att se det i ett lite större sammanhang.)

Det är självklart kul, men det förpliktigar också: Om detta är den första kontakten man får med en blogg, borde det finnas en länk till en bra och systematisk introduktion av vad en blogg är, inte bara en massa exempel på vad som kan finnas på en blogg

Mats anteckning Vad är vitsen? senare idag om vitsen med bloggning är ett annat sätt att se detta. Jag instämmer i hans fråga: Någon som kan föra bloggarnas talan gentemot ickebloggarna bättre än jag? :)

Till detta kommer min egen tro att en orsak till att många inte känner till vad en blogg är, beror på "inte helt optimal" PR. Ett övergripande dokument som förklarar vad bloggar är och dess nytta, skrivet av drivna bloggare, kan vara en del i en "Detta är bloggning"-drajv.

Eventuellt finns alla svar på ovanstående och nedanstående frågor redan skrivna, i så fall önskas en referens som jag kan länka till.

Här nedan är ett förslag vad ett sådant dokument kan innehålla, med förslag till disposition etc. Kanske kan man klippa och klistra från redan skrivna texter som finns ute på bloggarna. En sådan text bör nog skrivas/sammanställas av en person/-er med stor kunskap om (den svenska) bloggvärlden.

Naturligtvis är jag tacksam för kommentarer, åsikter etc.


FÖRSLAG: BLOGG-INTRODUKTION

Härmed föreslås att det skrivs ett introduktionsdokument som förklarar vad bloggning är, varför det är bra och varför många flera skulle börja blogga.

Det vore att rekommendera att texten är på svenska. Om det finns en bra sådan text på annat språk är det kanske lämpligt att den översättes och anpassas till svenska förhållanden.

Det bästa är nog om ett sådant introduktionsdokument skrives så att alla bloggare som finner så lämpligt kan länka till det. Det bör alltså vara rätt allmänt hållet just för att så många som möjligt kan acceptera den som en bra (tillräckligt bra!) beskrivning av sin egen bloggtillvaro.


FÖRSLAG TILL DISPOSITION
En sådan introduktion borde innehålla åtminstone följande avsnitt:

- Vad är en blogg?, någon form av definition eller beskrivning
- Exempel på bra bloggar
- Vad är det för bra med att blogga? Hur kan bloggning göra en skillnad i världen? dvs frågan Vad är vitsen?.
- Hur kommer man igång med bloggning?

Här är en lite mer utförlig beskrivning av de olika delarna.

Vad är en blogg?
Det finns många olika definitioner av bloggar. T.ex. Steffanie Müllers Vad är en blogg? och Blogg-definition refererar till lite olika definitioner.

Det finns säkert flera definitioner/förklaringar.


Exempel på bra bloggar
Det är viktigt att förevisa bra, representativa bloggar. Gärna sådana som representerar olika typer av bloggar (vad "olika typer" än kan innebära). Det bästa är nog att ha både svenska och internationella bloggar

Kanske kan man hänvisa till Internetworlds (kommande) blogg-lista här?

Nyttan med bloggar och blogging
Det räcker inte att endast definiera begreppet blogg. Jag tror det är minst lika viktigt att ha en inspirerande text som försöker att förklara varför det är roligt/stimulerande/nyttigt/samhällsviktigt/etc med bloggar.

Det vore roligt om man även kunde koppla bloggning med mätbar nytta, t.ex. Sedan vi började blogga har vi blivit 300% mer effektivare (Känt Företag AB), Efter bara tre dagars bloggande växte min fan-mail med 200 procent (Känd-Olof Kändisson).

Det finns olika tänkbara målgrupper och som möjligen kräver lite olika typer av texter. Några tänkbara målgrupper:

- "hobbybloggaren" (vad nu än detta innebär)
- mindre eller större företag/organisationer, vinstdrivande eller inte
- representanter för massmedia, dvs journalister, chefredaktörer etc
- politiker
- icke-bloggare
- ...

Man kanske även ska dela upp frågan i olika två:
- vad är det för nytta att bloggar finns överhuvudtaget
Här är det alltså den mer allmänna samhällsnyttan, nöjesnyttan, etc som ska betonas.

- vad finns det för nytta konkret för en speciell målgrupp
Vad kan just jag/vi har för nytta av att börja blogga?

Det kanske ska tilläggas att avsikten inte är att skapa en lärd avhandling med fullständigt oanstastbara vetenskapliga bevis om effekten av bloggning, snarare en fingervisning eller vision.

Hur kommer man igång med bloggning?
Ett av de problem jag själv hade när jag började blogga var just: var börjar jag. Tack och lov hade jag god hjälp från erfarna bloggare, både privat och via kommentarer i bloggen (se t.ex. Min första dag med webblogg).

Det kan nog behövas en kortare introduktion i olika verktyg som kan användas, naturligtvis nämnande av weblogs.se etc.


ARBETSSÄTT
Jag vet inte vilket som är bästa sätt att skapa ett sådant här dokument. Några olika sätt:

- via en wiki
- via en projektblogg, där någon tar på sig att sammanställa förslag som kommer upp som sedan kommenteras (iterativt)
- man skriver sitt eget dokument och de som tycker det är bra länkar till det. Andra skriver ett eget dokument, ytterligare andra bryr sig kanske inte.

Det första förslaget (wiki) kan nog anses vara mest demokratiskt eftersom samtliga kan vara med. I den tredje varianten sker röstningen "med fötterna" vilket också det är en form av demokrati.


Problem att tänka på
Oavsett vem eller hur många som skriver ett sådant här dokument så kommer det kanske finnas de som känner sig förfördelade: Varför skulle just ditt/ert/deras beskrivning vara representativt för min blogg?

Jag har dock inget bra sätt att lösa detta på.

Posted by hakank at 07:48 EM Posted to Blogging | Comments (4)

Simulering av sand

Sand är ett intressant fenomen. Bland annat har sandens beteende, framförallt ras i sandhögar, används för att förklara emergent beteende s.k. power laws. Se t.ex. History found in a grain of sand eller Narrative Physics (om Per Bak), samt min anteckning för ett tag sedan som beskriver annan sandforskning Hur mycket väger pengar? - Nu även med lite granularitetsforskning.


Sand page finns ett antal olika simuleringar (Java applets) av hur sand beter sig i olika situationer, dock inte direkt kopplat till emergent beteende. Fascinerande.

Samma person har även skapat andra applets, t.ex. spel och simuleringar.

Posted by hakank at 01:44 EM Posted to Komplexitet/emergens

Har Amazon rättigheter till sin megasök i böcker?

Häromdagen skrevs den glädjande nyheten att Amazon visar innehållssökning för böckerna, se Full sökning i böckerna på Amazon.

Kanske Amazon inte har rättighet att göra detta. Det berättas att författare nu rekommenderas att ta bort sina länkar från Amazon i protest.

Se t.ex. Slashdot Amazon's Book Search Hits a Snag, samt The Importance Of Another NY Times v Tasini? Amazon's Book Search Hits a Snag.

Posted by hakank at 11:32 FM Posted to Böcker | Comments (11)

Söndagstrean - om bloggningens utveckling i Sverige

I Mera navelskådande skriver Bengt Karlsson om den diskussion som uppstått kring DN:s artikel Bloggrevolutionen är här. Se Bengts anteckning för referenser till dessa diskussioner.

I tack-och-adjö-anteckningen Post scriptum till "I dåligt sällskap" (som nu alltså är nedlagd) diskuterar Bengt den uteblivna utvecklingen av bloggningen i Sverige. Det är mycket intressanta frågor för mig som inte var med då (maj 2003).

Till detta kommer diskussionen kring Internetworlds kommande blogg-artikel om Sveriges bästa bloggar, t.ex. hos Mats Andersson och Erik Stattin (där Erik glädjande nog och inte lite förvånande nominerar mig. Tack Erik!).

Även om jag läst de tidigare diskussionerna var det anteckningen "Mera navelskådande", samt ett mailutbyte med Bengt, som fick mig att fundera mer på detta (dvs utvecklingen av den svenska bloggningen) än tidigare.

Jonas Söderström skriver optimistiskt i avslutningen på dagens DN missar huvudsaken ... Jag förutspår i alla fall att det massmediala genombrottet för webbloggar är nog nära nu. ... . Jag ignorerar här glatt hans disclaimer.

Något är tydligen på gång eftersom svenska tidningar faktiskt skriver en del om den svenska bloggningen.

Eftersom jag själv inte har några speciellt bra svar, kommer här ett par frågor som jag är uppriktigt nyfiken att få svar på:

Söndagstrean
Not: Fråga 1 och 2 överlappar varandra till viss del.
1. Hur ser din vision för bloggning i Sverige ut? Dvs på vilket sätt kommer bloggningen att utvecklas, hur kommer bloggar att användas etc? Du får även skissera hur vägen dit ser ut.

Om du vill behöver du inte isolera ditt svar till bloggning i Sverige, det får gärna vara en världsomspännande vision.

2. Givet att du hade alla tillräckliga resurser (finansiella och andra) till ditt förfogande, hur skulle du använda dem för att uppnå denna vision?

3. Har du sett några positiva tendenser - i så fall vilka - kring utvecklingen av den svenska bloggningen de senaste månaderna, t.ex. sedan i maj i år då bl.a. Bengt skrev sin avskedsanteckning.

"Utvecklingen" kan vara: antalet svenska bloggar/bloggare, kvaliteten på dessa, hur bloggarna påverkar världen utanför bloggosfären etc etc. Du har full frihet att själv definiera vad du menar med "utveckling".


Förhoppningsvis kommer svaren att vara utförliga, så du får gärna skriva dem på din egen blogg. Ge mig i så fall helst en kommentar eller TrackBack med URL:en.

Om intresse finns, gör jag gärna en sammanställning av svaren. (Även om svaren direkt eller indirekt kommer att finnas här på bloggen underlättar det troligen med en sådan sammanställning. Jämför med Peter Lindbergs föredömliga sammanställningsprojekt).

Posted by hakank at 09:36 FM Posted to Blogging | Comments (5)

oktober 25, 2003

Mobilt jam

En sån här skulle jag kunna tänka mig.

Cellphone software allows a musical jam:

After texting, photomessaging, and web surfing, the latest cellphone talent is set to be enabling people to "jam" together to improvise music, say software engineers in London, UK.

The idea is the brainchild of computer interactivity expert Nick Bryan-Kinns and his colleagues at Queen Mary College. They have developed software that let will groups of people phone into a mobile number and work together to improvise short, looping tunes.

The QMC team hope people will be able to engage with their friends in the same way jazz musicians appear to "mentally connect" when jamming.

Se Daisyphone - A Group Music Interaction Tool. Det finns lite mer info.


Testa själv! Dra med musen på lite olika ställen. Klickar man på någon av de yttersta ringarna går "musikpendeln" dit. Man ska även kunna spela tillsammans med andra, men det har jag inte fått att funka.

Not (sic!): Dessa applikationer kräver Java 1.4.1 .

Tänk på att i musiken är det tystnaden som är viktigast.

Posted by hakank at 09:52 FM Posted to Diverse | Comments (3)

oktober 24, 2003

Empirisk test: Funkar weblog.se för mig igen?

Yes! Är det sant, verkligen sant? Funkar weblogs.se äntligen för mig också? Sedan i augusti har jag nämligen inte kunna komma åt den svenska bloggosfärscentralen mer än indirekt (av för mig okända orsaker).

Jag kan nu komma åt sajten och det verkar som notifieringen funkar. Testar nu igen av empiriska och vetenskapliga skäl.

Detta är en mycket glädjande nyhet. Tack någon!

Uppdatering
Resultat av testet: affirmativt, det funkar.

(Så särskilt vetenskapligt var testet kanske inte, men empiriskt var det i alla fall.)

Drar en "Groundhog day"-suck av lättnad.

Posted by hakank at 08:00 EM Posted to Blogging | Comments (7)

Six Degrees of Separation -- The Movie

I dag (natten till lördag) på SVT1 klockan 00:45-02:35 visas filmen Six Degrees of Separation (under namnet "Ett oväntat besök") som bygger på John Guares teaterpjäs "Six Degrees of Separation" som innehåller det berömda begreppet "Six Degrees of Separation" som innebär att vi kan nå "alla människor på jorden" inom 6 steg (vän till en vän till en vän till ...). Som jag bara måste se, filmen alltså.

Mer om forskningsområdet som analyserar denna typ av fenomen finns att läsa i Social Network Analysis och Complex Networks - En liten introduktion samt i kategorin Social Network Analysis/Complex Networks

Posted by hakank at 07:23 EM Posted to Social Network Analysis/Complex Networks

Fredagsfyran: Bloggning

Veckans Fredagsfyra.


Veckans tema är bloggar.
Blogg används här i ordets vidaste bemärkelse.

1. När började du blogga?
18 juni 2003.

2. Varför började du blogga?
För att Gustav Holmberg tyckte det skulle vara intressant. :-)

Som jag antyder i Min första dag med webblogg hade jag i och för sig funderat lite på att blogga under våren 2003 men inte riktigt vetat hur jag skulle komma igång. Det är möjligt att det krävs hjälp från en erfaren bloggare som Gustav för att det ska gå enkelt.

Sedan 1995 när jag fick min hemsida (www.hakank.org eller under andra namn) har jag skrivit en del om det som numera skrivs på bloggen, t.ex. olika typer av projekt, stora som små. Eftersom det är meckigare att skapa HTML.-sidor och att manuellt hålla reda på en struktur för dem, är sådant HTML-ande inte lämpligt för att skriva mindre notiser. När jag upptäckte hur oerhört nimt Movable Type var blev jag fast efter bara några timmar.


3. Har ditt bloggande inneburit några fördelar?
Definitivt.

- har fått kontakt med flera mycket trevliga, intressanta och inte minst hjälpsamma personer

- har ett mer fokuserat ofokus på saker som kan vara roligt att blogga om. Vissa saker som jag tidigare bara tänkt skulle vara roligt att göra har jag gjort eftersom jag vet att någon kanske läser det.

- en stor fördel har varit att få tillgång till ett distributionssystem (t.ex. weblogs.se och senare BlogLines) för att notifiera nya skriverier, samt systematiskt få tillgång till vad andra skriver, t.ex. för omvärldsbevakning. Detta ser jag som en av de största vinsterna med bloggningen, dvs att ingå i en bloggosfär. Den svenska bloggosfären (definierad som de som hänger på weblogs.se) är hanterbar med sina cirka 300 personer/bloggar.

- tidigare har besöken till min sajt totalt dominerats av sökmotorsökningar men nu börjar det finnas de som tydligen dagligen läser vad som skrivs. Det är en stor uppmuntran.

- min google PageRank har gått upp. :-)

4. Har ditt bloggande inneburit några nackdelar?
Till viss del.

Det finns nu ett (inre) krav på att skriva, vilket i och för sig kanske inte är helt negativt. Både Gustav och Erik Tjernlund varnade mig (privat) för detta så jag gick in i det med öppna ögon.

Att blogga tar tid, både att själv skriva och att kolla vad andra skriver, men å andra sidan tar alla intressen tid.

Och så länge fördelarna uppväger nackdelarna så mycket som de gör nu, fortsätter jag blogga.

Posted by hakank at 01:13 EM Posted to Blogging

Omkategorisering

Puh! Nu har jag skapat nya kategorier och omkategoriserat många gamla anteckningar.

Som alltid är det svårt att välja vilka kategorier som ska vara med och var gränserna mellan dem ska dragas. Ledstjärnan har varit hur jag tänkt i mina olika "projekt" under tiden de växt fram, där bland annat sökorden å sökmotorer haft ett visst inflytande. Eftersom sådana projekt hela tiden lever, omdefinieras eller ses i annat ljus med nya erfarenheter är det säkert dags att omkategorisera igen om några månader.

Nyheterna är:
- Agentbaserad modellering
- Komplexitet/emergens
- Kognitiva illusioner
- Sammanträffanden
- Skepticism, parapsykologi etc

Se även Kategorierna och Borges.

Posted by hakank at 12:11 EM Posted to Blogging

Storleksbedömningar

I Science Daily-artikeln Shape Of Beverage Glass Influences How Much People Pour And Drink skrivs om våra svårighet att bedöma hur mycket vätska vi häller i ett glas.

Your eyes play tricks. And your brain makes it worse. Both teenagers
and adults misjudge how much they pour into glasses. They will pour more into short wide glasses than into tall slender glasses, but perceive the opposite to be true. The delusion of shape even influences experienced bartenders, though to a lesser degree, a researcher at the University of Illinois at Urbana-Champaign has found.

How shape can alter a person's notion of size has been widely investigated. For instance, triangles are generally perceived to be larger than squares, and horizontal shapes are seen as smaller than vertical objects of identical volume.

Yet research examining the effects of shape on how people determine how much they consume is limited, said Brian Wansink, a professor of marketing and nutritional science at Illinois. To understand the process better, Wansink examined how shape influences teenagers, adults and bartenders who pour beverages into empty glasses.
...
There are various policy implications in these findings, according to Wansink. The tricks of the eye and brain could play havoc with dieters seeking to monitor and better control food and beverage consumption.

Lite mer om relevansen för vikthållningen (från Ten Tips for Staying Lean, avsnitt 2: " Shrink your servings", min markering):

When people were served larger portions of lasagna, they ate more than when they were given smaller portions and allowed to get up for more,” says Tufts's McCrory. That's what happened in single-meal studies done decades ago. More recent studies show that when people are given larger amounts of “hedonistic” foods like M&Ms, they eat more than people who are given smaller amounts. “When we gave people big buckets of popcorn—the ones you have to hold with two hands—at a movie theater, they ate 40 to 50 percent more popcorn than people who got smaller buckets,” says Brian Wansink, director of the Food and Brand Research Lab at the University of Illinois at Urbana-Champaign. The only exception: Women on a date ate the same amount of popcorn, regardless of bucket size, he notes. When they were on their own or with friends, though, watch out..
...

Posted by hakank at 08:40 FM Posted to Kognitiva illusioner

oktober 23, 2003

Sista Chance News

Sista Chance News? Ja, det är tyvärr rätt. Efter 12 års trogen tjänst diskontinueras denna underbara skrift. Det är tråkigt eftersom det alltid fanns några guldklimpar som var lärorika och underhållande.

I stället publicerar man Current chance news articles, där det nog inte kommer att vara lika bearbetade artiklar som i Chance News. Borde tipsa dem om att göra det till en blogg, med RSS-flöde (-förs) och allt.

Det sista numret finns som HTML eller PDF.

Glöm inte att man kan söka i äldre artiklar nederst på första sidan.

Posted by hakank at 08:42 EM Posted to Statistik/data-analys

Full sökning i böckerna på Amazon

Erik skriver den underbara nyheten att man nu kan söka bland innehållet i Amazons böcker. Man måste dock gå bok för bok för att se den exakta texten.

Ett exempel: Sök på blog.

Mer info finns på Search inside the Book, samt FAQ:n.

Här nedan är några av mina findings.


Ett krav är att tydligen att man ska vara registrerad Amazon-användare. Från FAQ:n:
Why do I need to sign in or register as an Amazon.com customer to view pages?

We developed Search Inside the Book to help customers find the perfect book to buy. It's also very important that we protect the copyrighted material of publishers and authors who have agreed to participate in this feature. By monitoring the feature's use, we're able to provide both the customer and the copyright holder with a positive experience. If you are a recognized, registered customer, you should not have to sign in to view pages. If you are not, we require that you to sign in or set up an account with us before viewing pages.


Trots min upprymdhet kan jag inte undanhålla min fasa att det nu kan bli svårare att hitta rätt bok med den vanliga (icke-avancerade) sökningen, eftersom det blir väldigt många sökresultat. T.ex. på en så enkel sökning som diaconis, som - om jag inte missminner mig - tidigare gav 6 träffar (se nedan), men ger i skrivande stund ger 124. Eftersom jag klarar av att använda google och andra sökmotorer, så ska det nog inte bli några problem med viss justering av sökbeteendet.

En sökning på "data mining" visar fortfarande de mest relevanta böckerna först så jag kan ropar varg för tidigt.

En liten konstig sak var att ibland kommer den gamla typen av sökning upp, dvs utan sökning i böckerna. Aha, om jag går via följande sökning (som görs som en smart-search i min webbläsare): data mining och sedan söker på diaconis kommer den gamla sökningen (dvs 6 resultat).

End Of Report.

I natt kan jag sova gott!


Uppdatering
Det är inte så säkert att Amazon har rättigheter att göra denna typ av sökning. Se Har Amazon rättigheter till sin megasök i böcker?.

Posted by hakank at 07:54 EM Posted to Böcker

oktober 22, 2003

Didaktiska teknikromaner

I New York Times-artikeln Art and Science Meet With Novel Results skrivs om didaktiska teknikromaner, en kul genre. Några exempel från artikeln (har inte läst någon av dem):

João Magueijo: Faster Than the Speed of Light: The Story of a Scientific Speculation
Alan P. Lightman Einstein's Dreams
Christos H. Papadimitriou: Turing (A Novel about Computation). Han har även skrivit Computational Complexity en stor fet teoretisk bok om (datalogisk) komplexitetsteori
Dan Lloyd: Radiant Cool: A Novel Theory of Consciousness (kommer ut december 2003)

Michael Crichtons Prey: A Novel tillhör också teknikromansgenren. Läs t.ex. min recension av boken.

Se även Amazon-kategorin didactic fiction som även innehåller annat än rena teknikromaner.

Posted by hakank at 08:45 EM Posted to Böcker

Ming the Mechanic

En rätt ny blogg-favorit är Ming the Mechanic skriven av Flemming Allan Funch.

Han har skrivit intressanta saker om bland annat kreativitet Perceptual Creativity Tricks (om bland annat de Bono), hur vi uppfattar världen: Manufacturing Reality.

Posted by hakank at 07:48 EM Posted to Blogging

Memory Morphing (minnesförvrängning)

I Selling you a new past berättas om "memory morphing" (minnesförvrängning) som är ett otäckt knep att lura oss att i efterhand tycka bra om produkter vi egentligen tyckte illa om. (Länken via kottke.org remaindered links.)


Is your memory playing tricks on you, or did you find shopping at your
over-priced supermarket last week a wonderful experience? Did you have a great time on that lacklustre package holiday a couple of years ago? And are you quite sure whether you enjoyed that cold, tasteless meal the other day?

Advertisers have found a new way to mess with your mind.

A group of US marketing researchers claim that brand owners can make their customers believe they had a better experience of a product or service than they really did by bombarding them with positive messages after the event. Advocates of the technique, known as "memory morphing", claim it can be used to improve customers' perceptions of products and encourage them to repeat their purchases and recommend brands to friends.

Sedan kommer en blänkare för en bok skriven av Jerry Zaltman: How Customers Think: Essential Insights into the Mind of the Market, som skriver om tekniken. (Jag har inte läst denna bok.)

Zaltman's extraordinary claims are based on experiments carried out by memory researchers in the US, most notably the work carried out by Elizabeth Loftus, a former professor of psychology at the University of Washington. She singled out a campaign by Disney - "Remember the magic" - which, she claimed, was used to invoke real or imaginary childhood memories in consumers.

Några av Loftus artiklar: Creating False Memories (Scientific American 1997). Aha, det var ju Loftus som skrev de där artiklarna om falska minnen i Skeptical Inquirer: Who Abused Jane Doe? och Creating False Memories.


I en bok som jag bläddrade i för en stund sedan beskrivs liknande tekniker och fenomen: The Seven Sins of Memory (med underrubriken "How the Mind Forgets and Remebers"), skriven av Daniel Schacter.Loftus finns med på några sidor.

Uppdatering
Jonas skriver också om "Selling you a new past"-artikeln.

Posted by hakank at 07:30 EM Posted to Diverse | Comments (1)

Flash blogging

Om "Flash blogging", dvs Flash Mobs på bloggar, skrivs i Flash blogging hits the net.

Detta diskuterades i den svenska bloggosfären för några månader sedan, men jag vet inte riktigt var.

(Via Reflective Reality: Online version of flashmobing is flashblogging....)

Posted by hakank at 01:26 EM Posted to Blogging

"Hörselhicka"

I artikeln Professor studies 'playlist from hell' pratas om "hörselhicka", dvs när vi repetitativt, envetet och opåkallat får en låt i huvudet som går om och om igen, utan att vi kan göra något åt det.

Ordet "earworms" används i artikeln för att beteckna fenomenet. Finns det något vedertaget svenskt ord för det? "Öronmask" låter helt fel, "slagdänga" betyder något annat. Kanske "örondänga"? Min nuvarande favorit är "hörselhicka". (Fenomenet kan liknas med när man "smakar om" mat man ätit för mycket av, så "öron-rap" vore månne bättre. Men kanske ändå inte, det låter inte speciellt bra.)

Under min tid som musiker (mestadels jazz och funk) var detta fenomen mycket vanligt. Det kunde vara låtar som vi spelade eller andra låtar, och det var alltid lite pinsamt när det var "mindre bra" musik (ja, jag var en musiksnobb).

Numera är det sällan musik, utan ord som ger mig hörselhicka. Det är antingen mer ovanliga ord (t.ex. "opåkallat") eller helt nya begrepp/namn som jag stött på (Diaconis var ett sådant). Jag har sett denna "ordhicka" som ett sätt för mig att bearbeta ordet, som ett sätt att träna hjärnan för lättare åtkomst när det är påkallat. Eller kanske helt enkelt för att smaka på det eftersom det är så gott. Jag kanske ska vara tacksam att det sällan är programkod som hickas.

Å andra sidan, kommer det en riktigt bra slagdänga som Robyns "O Baby" ...


Se även Songs Stick in Everyone's Head.

Posted by hakank at 11:21 FM Posted to Diverse

oktober 21, 2003

Blogtimes

Tack vare Emmanuel på em-brof lyckades jag identifiera Blogtimes som visar bloggningstiderna. Det är betydligt snyggare än det som visas i Bloggningstider.

Blogtimes visar i version 1.0 statistik endast för en månad (default innevarande), men eftersom jag vill visa statistiken för hela bloggningstiden gjorde jag två mycket specifika hack i programmet. Förändringarna finns här (textfil, diff-format).

Resultatet kan ses överst på förstasidan av hakank.blogg. Vit färg indikerar aktivitet, svart inaktivitet.

Installationsnot:
Blogtimes kräver Perl-modulen GD (välj det paket som bara heter "GD"), som i sin tur kräver gd graphics library.

Posted by hakank at 09:54 FM Posted to Blogging | Comments (2)

Att hålla reda på busstider

Enligt Text messages aim to cut bus delays kommer vissa bussbolag i London att skicka textmeddelanden till chaufförerna att snabba på eller att ta det lite lugnare i trafiken. Detta för att undvika "klustringar" av bussarna.

Jag vet inte om det är så bra om chaufförerna nu också ska fibbla med sin mobil för att läsa hur fort de ska köra. Kanske jag har missat något...

(Via SmartMobs.)

Posted by hakank at 12:42 FM Posted to Diverse

Bloggningstider

Kollade precis tiderna när jag bloggar, dvs klockslaget för publiceringen av anteckningarna. Själva skrivandet torde ju ske något före detta klockslag. :-)

Samtliga inlägg
Först kollades samtliga inlägg som skrivits på bloggen, dvs förutom mina huvudanteckningar även andras och mina egna kommentarer. Det var 423 sådana inlägg. Här inkluderas några stycken av mina icke publicerade anteckningar.

Så här ser det ut sorterat på hur frekvent en timme är för publikation. Först klockslaget, sedan antal inlägg.
09: 46
23: 37
20: 31
21: 28
10: 28
00: 25
22: 23
14: 23
19: 23
15: 21
11: 20
12: 20
18: 18
13: 16
17: 14
08: 14
16: 12
01: 9
02: 6
03: 4
07: 4
06: 1
04: 0
05: 0

Ett histogram över detta:
00: .........................
01: .........
02: ......
03: ....
04: 
05: 
06: .
07: ....
08: ..............
09: ..............................................
10: ............................
11: ....................
12: ....................
13: ................
14: .......................
15: .....................
16: ............
17: ..............
18: ..................
19: .......................
20: ...............................
21: ............................
22: .......................
23: .....................................

Egna anteckningar
Sedan kollade jag mina egna huvudanteckningar, utan mina eller någon annans kommentarer. Det blev 246 (inberäknat de icke publicerade anteckningarna).
09: 37
10: 23
23: 21
19: 19
21: 17
11: 14
15: 13
22: 12
08: 12
20: 12
14: 11
13: 10
00: 10
01: 7
12: 5
17: 4
18: 4
03: 4
16: 4
07: 4
02: 3
04: 0
05: 0
06: 0

Histogram
00: ..........
01: .......
02: ...
03: ....
04: 
05: 
06: 
07: ....
08: ............
09: .....................................
10: .......................
11: ..............
12: .....
13: ..........
14: ...........
15: .............
16: ....
17: ....
18: ....
19: ...................
20: ............
21: .................
22: ............
23: .....................
Några slutsatser kan dragas.
Det sker mycket lite på bloggen mellan 4 och 7 på morgonen. Själva rytmen antyder att det är i princip en tidszon (vilket inte är speciellt förvånande). Jag skriver mest anteckningar på morgen före och kring 9-snåret, samt lite ojämt fördelat över kvällen. På eftermiddagarna är det mindre aktivit med huvudanteckningarna, men lite mer aktivt med kommenteringen.

En möjlig utveckling vore att jämföra tiderna med längden på anteckningarna/kommentarerna.

Posted by hakank at 12:21 FM Posted to Blogging | Comments (3)

oktober 20, 2003

Kapitelrecension: Richard Dawkins 'Unweaving the Rainbow' (Unweaving the uncanny)

I Vår besatthet att hitta mönster i tillvaron berättade jag om ett boktips jag fått på min fråga (som finns i Brights-initiativet och Dan Larhammar) om var Richard Dawkins skrivit om mönstersökandet som evolutionär mekanism.

Nu har jag läst det kapitel som rekommenderades, nämligen kapitel 7 'Unweaving the uncanny' i Richard Dawkins bok Unweaving the Rainbow: Science, Delusion and the Appetite for Wonder, sid 145-179. Det kändes fristående så jag tror inte det gör så mycket att läsa det isolerat. Vi får se när jag läser resten.


Precis som utlovats handlar kapitlet om sammanträffanden (coincidences). I slutet av kapitlet diskuteras en del om den evolutionära mekanismen bakom fenomenet. Det görs även en beskrivning av Skinners duv-experiment som visar att skrock-beteenden inte endast görs av människor (se nedan). Dock domineras kapitlet av olika typer av sammanträffanden och hur lätt det är för oss att se dem.

Det är en roligt kapitel med flera exempel som visar vår intuition om sammanträffanden, och Dawkins skriver mestadels kritisk om vår tro på det övernaturliga.

T.ex. berättas om en TV-kändis med en (påstått) parapsykologisk förmåga att kunna stoppa eller starta klockor. Här tänkte jag naturligtvis på Uri Geller som var med i svensk TV 1974 och "orsakade Geller-epidemi i Sverige" (citat från NE); Geller nämns dock inte. Dawkins skriver utförligt hur man i princip räknar ut sannolikheterna för att sådana klock-händelser ska hända rent slumpmässigt av helt naturliga orsaker.

Han inför begreppet PETWHAC, dvs "Population of Events That Would Have Appeared Coincidental" (ungefär "Samlingen Av Händelser Som Skulle Uppfattas Som Sammanträffanden", SAHSSUSS, en kanske inte lika catchy akronym). Detta begrepp är menat att betona att det finns väldigt många händelser som, för en person under en viss situation eller tidsperiod, skulle uppfattas som "märkliga sammanträffanden" och att den händelse som verkligen hände egentligen inte var så märklig (osannolikt) som vi trodde.

Dawkins betonar dock den psykologiska mekanismen att det är svårt att inte känna något om man själv blir "utsatt" för sådana sammanträffanden, t.ex. om vi själva drömmer om en gammal klasskamrat som man inte sett på många år och stöter på denne dagen efter. Då kan det vara bra att tänka på PETWHAC.

Naturligtvis tas även födelsedagsproblemet upp. Trots att det är inte helt enkla matematiska problem som diskuteras lyckas Dawkins att göra det mycket överskådligt. Så förvänta inte en matematisk stringent genomgång av problemen.
(För mer om en mer matematisk genomgång av födelsedagsproblemet, se t.ex. referernserna i Sammanträffanden - anteckningar vid läsning av Diaconis och Mosteller 'Methods for Studying Coincidences'.)

En stor fördel är att kapitlet beskriver hypotesprövningar och förklarar översiktligt de vetenskapliga metoderna för att undersöka om samband finns: Det är viktigt att man före utfallet förklarar vad som ska hända, och inte bara räknar de händelser där man i efterhand ser sammanträffanden, liksom att ta med alla de händelser som inte inträffar, t.ex. de gånger jag drömt om personer utan att jag därefter träffar dem dagen efter. En av orsakerna till att vi får denna känsla av övernaturlighet är att vi har stor tendens att endast komma ihåg de händelser som "sticker ut", dvs som verifierar vår teori om att det är något övernaturligt som händer.

Dawkins beskriver B.F. Skinners experiment med duvor i en Skinner Box. Detta experiment visade att duvorna tenderar att uppvisa märkliga beteenden om de matas av orsaker som inte är kopplat till att duvan petar på matningsspaken. Eftersom duvan ändå får mat skapar den en "teori" kring vad som orsakade matandet, och upprepar detta om och om igen.

Detta visar hur benägna vi (såväl duvor som människor och andra djur) är att försöka förklara orsak och verkan, och att i situationer där sådant inte kan göras, ibland uppvisar märkliga beteenden eller skapar märkliga teorier. Exempel på detta är spelare som har olika rutiner för att frammana tur.

Skinners paper 'Superstition' in the pigeon finns online och kan läsas, men Dawkins beskrivning är mycket roligare. Troligen finns det en hel del kritik av Skinners experiment och slutsatser, men några sådana har jag inte läst. (Och just nu passar detta utmärkt eftersom Skinners slutsatser är ett stöd för mina egna teorier :-) )

Dawkins gör även en intressant koppling mellan olika typer av fel som kan uppkomma i hypotesprövningar och olika typer av "personligheter": de som tenderar att se mönster där sådana egentligen inte finns (övertolkning), och de som tenderar att missa mönster där sådana finns ("undertolkning"). Liksom i hypotesprövningar gäller det att få en bra jämvikt mellan de båda, men helt fri från dessa skevheter går inte att vara. Här beskrivs även hur olika djur kan "drivas" av evolutionen att betona det ena eller andra "personlighetstypen", men detta är, vad jag förstå, spekulationer.


Summering: Kapitlet är kort, 35 sidor, och Dawkins får med mycket matnyttigt om sammanträffanden på ett lättsamt och underhållande sätt. Det blev inte som jag hoppats om de evolutionära mekanismerna. Rekommenderas i alla fall!

Posted by hakank at 09:22 EM Posted to Böcker | Sammanträffanden | Skepticism, parapsykologi etc | Comments (2)

Recension: Massimo Piattelli-Palmarini 'Inevitable Illusions'

Boken Inevitable Illusions : How Mistakes of Reason Rule Our Minds av Massimo Piattelli-Palmarini är en mycket fascinerande bok om hur lätt vi har för att göra misstag när vi ska göra bedömningar under osäkerhet (t.ex. icke-fullständig information). Boken handlar alltså om våra kognitiva illusioner. Jag skrev lite om boken i Tankeillusioner och tankemisstag innan jag läst den.


Boken börjar rätt långsamt med att diskutera analogin mellan de kognitiva illusionerna och de optiska illusionerna. De jämförs även med Freuds begrepp om det undermedvetna. Piattelli-Palmarini kallar mekanismen som orsakar de kogntivia illusionerna för "det kognitiva undermedvetna" och försöker göra lite kopplingar mellan de båda begreppen. Tyvärr lyckas det inte speciellt bra, och "det kognitiva undermedvetna" nämns i stort sett inte mer än i inledningskapitlet.


I de efterföljande kapitlen bättrar sig författaren och går igenom många av de olika typer av kognitiva illusioner vi alla drabbas av, detta inklusive experter såsom matematiker, statistiker och andra som arbetar med bedömningar under osäkerhet, t.ex. börsmäklare.

Detta "galna" tänkande innebär inte att vi alltid tänker fel (för det gör vi inte), snarare att vi i vissa typer av bedömningssituationer har en tendens att göra vissa systematiska felbedömningar.

Många kognitiva illusioner som tas upp är kring bedömningar som bygger på vår matematiskt/statistisk intuition, t.ex. att göra ett snabbt överslag om produkten av en handfull tal eller att avgöra vilka varor som som är mest prisvärda , eller som beror på att vi saknar vissa "grundläggande" statistiska förmågor (där användande av den s.k. Bayes regel skulle hjälpa).

Det har gjorts flera vetenskapliga försök där försökspersonerna fått läsa en beskrivning av en person och ska sedan bedöma vilket yrke (av några olika alternativ) som verkar vara mest troligt. Det visar sig att vi ytterst sällan tar hänsyn till hur vanligt (sannolikt) yrket är när vi gör sådana bedömningar. I stället gör vi bedömningen helt utifrån informationen som finns i den beskrivande texten, trots att den kanske inte innehåller någon relevant information alls. Undantaget är om yrket är extremt ovanligt, t.ex. kung, statsminister eller påve. Då gör vi oftast korrekta bedömningar.

I boken finns en hel del övningar man själv kan (och bör!) göra, t.ex.
Monty Hall-problemet och det snarlika Fångens dilemma (inte att förväxla med det spelteoretiska problemet "Fångarnas dilemma"). Några av dessa övningarna hade jag läst om tidigare så jag var varnad, men i vissa andra föll jag direkt i den kogntivia illusionens garn.

Man ska dock inte se detta som en bok i matematik utan snarare som hjälp att vara medveten om, och träna upp, sin "vardagsmatematiska" intuition

Den största delen av texten är mycket lätt att följa och det flyter lätt och enkelt. I några enstaka kapitel är det mera rörigt. I det viktiga Bayes-kapitel saknas, tråkigt nog, en strikt pedagogisk uppbyggnad.

En sätt att skydda sig mot en del av illusionerna är att lära sig mer om statistik/sannolikhetsteori. Författaren diskuterar detta tyvärr endast i förbigående, vilket jag ser som en stor brist.

En illusion som jag själv är intresserad av är sammanträffande-illusionen, dvs att vi har en enastående förmåga att hitta mönster fastän inga sådana finns (se t.ex. Sammanträffanden - anteckningar vid läsning av Diaconis och Mosteller 'Methods for Studying Coincidences'). Tyvärr behandlas även detta för lite i boken.

En intressant sak i boken är när den behandlar en konkurrerande teori om de kognitiva illusionerna, nämligen av Gerd Gigerenzer (och dennes kolleger).

Gigerenzer är en "evolutionistisk psykolog" som, enligt Piatelli-Palmarini, hävdar att det egentligen inte finns några kogntivia illusioner! Den forskning som gjorts (t.ex. av Kahneman, Tversky och andra) har använt speciellt konstruerade experiment som inte visar hur vi egentligen fungerar. Gigerenzers argument är tydligen att vår hjärna har evolutionärt utvecklats på ett optimalt sätt, och begår därför inga fel. Jag har dock inte läst tillräckligt mycket om Gigerenzer för att kunna göra en egen bedömning vad som han säger.

Det är i slutet på det avslutande kapitlet som Gigenrenzer raljeras, men det blir för många dråpslag för att man ska ta det som ett allvarligt inslag i en akademisk diskussion. Synd med en sådan avslutning på en i övrigt utmärkt bok.

Det finns en omfångsrik referenslista ordnad efter de ämnen som diskuteras i boken. Tyvärr är det ingen riktig notapparat så referenslistan blir svår att följa, en vanlig företeelse i populärvetenskapliga böcker. (Se Min favoritnotapparat hur jag skulle vilja ha det, även i populärvetenskapliga böcker.)

En summering av boken: "Inevitable Illusions" är både nyttig och underhållande att läsa och ger många exempel på hur vi kan tänka galet emellanåt. Den rekommenderas till dem som är intresserade av hur hjärnan fungerar, och emallnåt inte fungerar. Den som är intresserad av optiska illusioner får troligen rätt mycket ut av denna bok. Förhoppningsvis gör boken att läsaren blir mer känslig för situationer där sådana illusioner kan uppkomma, och kan vara på sin vakt.

Läs gärna boken med ett block i handen för att skriva ner egna bedömningar i de olika exemplen som beskrivs.

Boken kan också ses som en bra introduktion till mer tekniskt inriktad litteratur i ämnet, t.ex. Kahneman, Slovic och Tverskys Judgement under Uncertainty: Heuristics and Biases.

Se även andra litteraturtips i mina tidigare anteckningar:

En annan bok som i viss mån behandlar samma kognitiva illusioner som "Inevitable Illusions" är How We Know What Isn't So: The Fallibility of Human Reason in Everyday Life av Thomas Gilovich, vilken naturligtvis också rekommenderas.

Posted by hakank at 03:33 EM Posted to Böcker | Kognitiva illusioner

Recension: Michael Crichton 'Prey'

För ett antal veckor sedan läste jag klart Michael Crichtons Prey. Av lite olika anledningar har det tagit ett tag innan denna recension skrivits.

Min tidigare erfarenhet av Crichton är blandad. Jag blev besviken på Jurassic Park eftersom det mest var jakt och suspense, vilket jag inte tycker är så skoj. Det lilla som handlar om kaosteorin var heller inte så upplyftande. I och för sig är boken rätt välskriven för genren (om man nu tycker om sådant). Andra böcker som jag läste för en massa år sedan, såsom Andromeda Strain och The Terminal Man ingav mig ungefär samma känsla

Så det var med rätt låga förväntningar jag började läsa Prey. Fast kanske ändå inte, eftersom anledningen till att jag började med boken var att boken har fyra sidor litteraturreferenser i ämnena nanoteknologi och agent-baserad modellering/swarm intelligens, varav det sistnämnda är mycket spännande. (Se nedan för lite blogganteckningar om detta.)

Min fråga när jag började läsa var då: Vad kan han skriva om svärmintelligens, månne? Eftersom Crichton är en teknikkritisk nisse (vilket jag uppskattar mycket) antog jag att det skulle bli elände och biljakter, hur han nu skulle få ihop detta.

Tack och lov visade det sig Prey vara en riktigt sidvändare! Vad var det då i boken som gjorde detta möjligt?

Främst var det två skäl. Först: Till skillnad från t.ex. Jurassic Park är den mycket mer personligt skriven. Den är skriven i jag-form och Crichton ger mer karaktärsdrag hos huvudpersonerna; kanske inte så mycket, men tillräckligt för att det ska bli intressant.

Det andra skälet är att han skriver mycket om agentbaserad modellering/svärmintelligens. Boken skulle faktiskt kunna vara en introduktion till detta ämne; man kan se den som en väldigt lång populärvetenskaplig tidningsartikel om agentbaserad modellering (och nanoteknologi), interfolierad med lite action.

De förklaringar Crichton skriver om de ämnen jag känner till, är ungefär lika bra som andra populariseringar jag läst. Visst förenklar och överdriver han en del, men det är inget som jag stördes av i alla fall. Man kan i och för sig fråga sig hur rimligt det är att en person som är mitt inne en kritisk situation börjar skriva ett par sidor om teoron eller tekniken bakom problemet. Det störde mig dock inte speciellt mycket.

Nå, hur var actionscenerna då? De var faktiskt inte alls så dumma, och föredömligt få. Naturligtvis är det den senare delen av boken som har dessa scener. Med Yuen Woo-Ping som actioninstruktör skulle det kunna bli en underbar film. (Yuen Woo-Ping är kampscensregissören till bland annat "Crouching Tiger, Hidden Dragon", "Matrix", "Tai Chi Master" etc. F.ö. är han kampsceninstruktör till cirka 7 av mina 10 favorit-kungfu-filmer, de tre nämnda inkluderade.) Det krävs möjligen lite kreativ rewriting, som att alla huvudpersoner är Kung-Fu-mästare, men det vore ett billigt pris att betala.


Ett slutomdöme
Boken finns numera på listan över böcker jag tänker läsa om nästa år, om inte
tidigare. För mig är det ett mycket högt betyg.


På denna reading list finns Prey med tillsammans med en massa av mina övriga favoritböcker i detta och näraliggande ämnen.

Förutom "Fragile Dominion" har jag samtliga böcker, fast Wolframs ANKOS har jag ännu inte börjat läsa ordentligt.

Information om workshopen som har denna trevliga litteraturlista finns på New Mexico Adventures in Modeling 2003-2004 Workshop. De använder ett av de system jag själv gärna använder, nämligen StarLogo.

Vidare läsning
Om ovanstående, inklusive böckerna i listan ovan, har jag skrivit ungefär här:


Uppdatering
Marcus på Commemoro skickade precis en TrackBack med sin recension av Prey.

Marcus borde fått en cred eftersom det var hans recension som gjorde att jag beslöt mig för att skriva min. Det får han därför nu: Cred till Marcus!

Posted by hakank at 12:44 EM Posted to Agentbaserad modellering | Artificiell intelligens | Böcker | Komplexitet/emergens | Comments (1)

oktober 18, 2003

internetworld-fråga: "Vad bloggar du om?"

internetworld finns sedan 15 oktober "Frågan: Vad bloggar du om?" (uppe till höger).

Här är en tabell över svarsalternativen, procent samt antal personer. Detta grundat på de 2255 som hittills svarat.

ÄmneProcentAntal
Mig själv1.9%43
Nyheter0.7%16
Ämnen som intresserar mig2.4%54
Jag bloggar inte31.3%706
Vad är blogga? 63.8%1439


Frågor på detta
Stämmer detta med intuitionen om fördelningarna dels mellan bloggarnas inriktning, dels förhållandet mellan bloggare/icke-bloggare samt andelen som inte vet vad "blogga" är?

Sedan kan man ju alltid diskutera de olika alternativen. Om jag skriver om mig själv är det troligen det som intresserar mig. Likaså skriver jag nyheter om mig själv. Vilket alternativ ska jag då välja. Förutsätt att jag bloggar. :-)

Uppdatering
Slutställningen (20 oktober, klockan 12:30) blev nedanstående med 2780 röstande, vilket är en ökning med 525 jämfört med förra mätningen. Inom parentes anges antal samt förändring jämfört med föregånde mätning (dessa värden räknas från procenten så de är ungefärliga).
Mig själv: 1.9% (53, +10)
Nyheter: 0.7% (19, +4)
Ämnen som intresserar mig: 2.6% (72, +18) 
Jag bloggar inte: 31.1% (865, +159)
Vad är blogga?: 63.8% (1774, +335)
Det blev ingen jordskredsförändring. Cirka 5.2 % av de som röstade bloggar själv.

Och glöm inte: Resultatet visar endast åsikter hos de besökare på IDG.se som valt att svara på undersökningen, och kan därför inte anses vara representativt för allmänheten eller Internetanvändare i stort.

Posted by hakank at 11:24 EM Posted to Blogging | Comments (3)

Vilken SF-författare är du?

Via Thorvald på Förvetet fick jag nys om det trevliga testet Which Science Fiction Writer Are You?.

Själv blev jag Hal Clement: (Harry C. Stubbs) A quiet and underrated master of "hard science" fiction who, among other things, foresaw integrated circuits back in the 1940s. Som jag inte läst.

De författarna i testet jag hittills mest läst är snarare (i viss oordning) Isaac Asimov, Arthur C. Clarke, Frank Herbert, Ursula K. LeGuin, Stanislav Lem, Philip K. Dick, William Gibson samt Robert A. Heinlein.

Nu tyckte jag det var så skoj att jag kollade lite mer på koden (skrivet i JavaScript) och hackade ihop ett litet träd som visar vilka författare som motsvarar vilka svar.

Gör testet själv innan du kikar!

Posted by hakank at 07:51 EM Posted to Böcker | Comments (2)

oktober 16, 2003

Michael Shermer om Brights

Michael Shermer skriver en lång artikel om Brights-rörelsen och reaktionen på den: The Big “Bright” Brouhaha - An Empirical Study on an Emerging Skeptical Movement. Från Skeptic.com.

Se även Brights-initiativet och Dan Larhammar.

Posted by hakank at 01:20 FM Posted to Skepticism, parapsykologi etc

oktober 15, 2003

Simulering av sammanträffanden - I

När jag häromdagen läste Persi Diaconis och Frederick Mostellers underbara paper "Methods for Studying Coincidences" skrev jag lite R-kod för att testa vissa avsnitt. Några exempel publicerades i blogganteckningen Sammanträffanden - anteckningar vid läsning av Diaconis och Mosteller 'Methods for Studying Coincidences'.

Dock skrev jag då ingen simulering av hur sammanträffanden slumpmässigt kan uppstå, vilket nu åtgärdas i Simulering av sammanträffanden - I .

Varning: dokumentet kan upplevas som tekniskt av känsliga personer.:-)

Mer om R, systemet som använts, finns på www.r-project.org.

Posted by hakank at 10:10 EM Posted to Sammanträffanden | Statistik/data-analys

Design och magi

Tog har en intressant jämförelse mellan magiker och design. Dölj det komplexa för användaren.

Från Web wizards weave their magic:

Former Apple veteran Bruce "Tog" Tognazzini argues that the secrets of successful websites are the same as those of successful magicians.

Now with the usability consultancy firm, the Nielsen Norman Group, Tog has been looking at how people interact with their computers and the net.

He has found a surprising number of similarities between magic and web design.

"Both are based on illusion and misdirection, making us believe something which is not real and doesn't actually exist," he says.
...
Much of it revolves around simulation and dissimulation. Magicians do this all the time, making someone believe something which is not actually happening.
...
"Keep it useful, keep it swift and then add showmanship," Tog advises any would-be web wizards.

Posted by hakank at 03:23 EM Posted to Systemutveckling | Comments (1)

oktober 13, 2003

Vår besatthet att hitta mönster i tillvaron

I går frågade jag (i Brights-initiativet och Dan Larhammar) om var Richard Dawkins skrivit om följande (citat från Larhammar):

Som Richard Dawkins har sagt är människan besatt att hitta mönster i tillvaron. Det har säkert varit en oerhört viktig evolutionär mekanism, men ibland slår det över och vi försöker hitta mönster där det inte finns några.

Det jag speciellt undrade var Dawkins skrivit om mönstersökandet som evolutionär mekanism.

Ett tips jag fått var boken
Unweaving the Rainbow: Science, Delusion and the Appetite for Wonder som verkar vara mycket spännande.

En lite längre recension görs i Finding Awe, Reverence, and Wonder in Science (från Skeptical Inquirer).
Från artikeln:
Seeking to understand how we are so strongly impressed by coincidences, Dawkins turns to his Darwinian roots. Like all other creatures, humans must behave as intuitive statisticians. We need to steer between false positive and false negative errors according to which offer the greater penalty in a given situation. Furthermore, our willingness to be impressed by uncanny coincidence was influenced by the smaller population size of our ancestors and the relative sameness of their everyday experience, leading us to expect a very modest level of coincidence. Yet today we are immersed in a giant global media culture and our access to stories of all kind is multiplied many times compared with that of our small-village ancestors. This means, says Dawkins, that the number of opportunities for coincidence is greater for each one of us than it would have been for our ancestors, and consequently greater than our brains are calibrated to assess. Theoretically, we can learn to recalibrate ourselves, but that is "revealingly difficult even for sophisticated scientists and mathematicians."

Tack för tipset! Fler tips om den evolutionära mekanismen kring mönstersökandet emottages tacksamt. Det får även vara referenser till andra än Dawkins.

Posted by hakank at 10:04 FM Posted to Sammanträffanden

oktober 12, 2003

Brights-initiativet och Dan Larhammar

I dagens Godmorgon, världen (cirka 13 minuter inne i programmets första timme; djuplänk , en veckas giltighet) berättas om The Bright-rörelsen/uppropet/initiativet.

Jag läste om, och fascinerades av, Brights-initiativet i mitten på juni i år, men har inte skrivit om det tidigare. Därför skrivs lite nu.

En bright är (citat från sajten):
A Bright is a person who has a naturalistic worldview
A Bright's worldview is free of supernatural and mystical elements.
The ethics and actions of a Bright are based on a naturalistic worldview.

Röreslsen i sig beskrivs på följande sätt:
Currently the naturalistic worldview is insufficiently expressed within most cultures. The purpose of this movement is to form an Internet constituency of individuals having social and political recognition and power. There is a great diversity of persons who have a naturalistic worldview. Under this broad umbrella, as Brights, these people can gain social and political influence in a society infused with supernaturalism.

1. Promote the civic understanding and acknowledgment of the naturalistic worldview, which is free of supernatural and mystical elements.
2. Gain public recognition that: persons who hold such a worldview can bring principled actions to bear on matters of civic importance.
3. Educate society toward accepting the full and equitable civic participation of all such individuals.

Många bra artiklar finns på sajten, under rubriken Selected Essays on the Brights lite längre ned.

Edge finns två artiklar av Richard Dawkins (inofficiell sajt) och Daniel Dennett samlade.


I programmet intervjuas Dan Larhammar, professor i molekylär cellbiologi. Han säger bland annat (ungefär) följande om vår tro på övernaturliga krafter:

Den underliggande mekanismen [bakom vår tro på övernaturliga krafter] tycks framför allt vara att vi hela tiden söker mönster och samband i tillvaron. Det är det som har varit den evolutionära drivmekanismen för detta. Men det innebär ibland att vi drar förhastade slutsatser. Så fort vi ser två företeelser som ser ut att korrelera så tror vi att det det finns ett orsakssamband mellan dem. ... Som Richard Dawkins har sagt är människan besatt att hitta mönster i tillvaron. Det har säkert varit en oerhört viktig evolutionär mekanism, men ibland slår det över och vi försöker hitta mönster där det inte finns några.

Jag försöker nu spåra mer exakt var Dawkins (eller någon annan för den delen) sagt eller skrivit om denna evolutionära mekanism. Någon?


Dan Larhammars sajt är väl värd att kika vidare på. Jag stötte på den tidigare i veckan och tänke skriva lite om den. Vilket sammanträffande! :-)

Där finns det flera bra artiklar om pseudovetenskap, evolution vs. creatiomism, neurobiologin bakom religiösa upplevelser (neuroteologi) samt många bra litteraturreferenser i dessa ämnen. Hans artiklar i folkvett finns även här.

Roliga länkar, med koppling bland annat till optiska illusioner, finns på Links to educational and/or entertaining web sites. Några skoj (=intressanta) är Change Blindness samt Synvillan. Läs först instruktionerna, följ dem sedan.

Posted by hakank at 10:43 FM Posted to Sammanträffanden | Skepticism, parapsykologi etc

oktober 09, 2003

Movable Type: automatisk intern TrackBack (framåtreferenser i efterhand)

Funderade lite på problemet att bloggen är en "bakåtriktad" graf, dvs att man har bakåtreferenser till tidigare anteckningar (som man skapar själv med <a href="...">) men det är sällan jag ser eller själv skapar framåtreferenser.

Eftersom jag gärna refererar till tidigare anteckningar skulle jag nu gärna vilja ha en automatisk funktion i Movable Type som TrackBackar alla interna bakåtreferenser som görs.

I Movable Type finns ju funktionen auto-detect som, och nu citerar jag från sidan Weblog Config, Preferences (min emfas):
If you turn on auto-discovery, when you write a new post, any external links will be extracted and the appropriate sites automatically sent TrackBack pings.

Finns det någon färdig funktion, hack etc för att fixa så att Movable Type även gör en auto-discovery på interna länkar? Av underhållsskäl vill jag helst inte gå in och joxa i koden.

Det är naturligtvis möjligt att gå till den gamla anteckningen som refereras, kolla in TrackBack-id och sedan skriva in det i URL-to-ping-fältet för den aktuella anteckningen, men det är lite för meckigt (och jag är en lat människa). Jag trodde det skulle funka genom att skriva URL-en för den gamla anteckningens HTML-sida, men det verkar inte funka, eller så är det väldigt långsamt.


Problemet är naturligtvis samma för webben generellt: om någon gör en länk till en min sajt så finns det inget riktigt bra sätt att få reda på detta; förutom manuella bevakningar via t.ex. google eller ännu hellre automatiska sådana via t.ex. google-alert, och för bloggar tjänster såsom technorati etc, samt naturligtvis att statistikknarka sina webbserverloggar.
Jag är skyldig i samtliga fall. :-)

Posted by hakank at 11:51 EM Posted to Blogging | Comments (4)

Stephen Wolfram i "Senate Subcommittee on Science, Space, and Technology"

Stephen Wolfram har pratat för "Senate Subcommittee on Science, Space, and Technology" om sin bok A New Kind of Science. En textversion av talet finns här (PDF-fil). Det refereras även till denna www.senate.gov-sida, men den kommer jag inte åt.

Fler transcripts finns här.

Posted by hakank at 09:41 EM Posted to Dynamiska system

DM Review-artikelserien om sociala/komplexa nätverk är nu komplett

Som jag skrev i DM Review-artikel om sociala/komplexa nätverk har DMReview en artikelserie i tre delar om analys av sociala/kompexa nätverk. Samtliga delar är nu publicerade:

The Link is the Thing, Part 1

The Link is the Thing, Part 2

The Link is the Thing, Part 3

Se även Expanded References.


Några andra intressanta artiklar från senaste numret är:
Finding the Needle in the Haystack: Using Data Visualization to Spot Patterns and Anomalies in Business Data

Data Mining and Modeling: The Bayesian Debate.

Posted by hakank at 09:11 EM Posted to Statistik/data-analys

Hur mycket väger pengar? - Nu även med lite granularitetsforskning

I min förra anteckning Hur mycket väger pengar? frågade jag om värdet på 10 kilo ihopsamlande svenska mynt. Efter några intressanta och inspirerande kommentarer försöker jag här konkretisera mina egna tankar. Tack Marcus och Bengt!

Mätande av SEK-mynt i liter
Marcus skrev 2 liter SEK-mynt motsvarar 3700 SEK.

Jag mätte mina mynt till cirka 2.5 liter, så det blir cirka SEK 4600 enligt formeln:

1 liter SEK-mynt = 1850 SEK

Så det besvarar kanske min fråga, dvs 10 kilo SEK-mynt är värda cirka 4600 SEK.

Bengt skrev två saker:
Det första var att 15 kilo (SEK?) blev 2.200 €. Han gjorde sedan ett antagande att 1 liter SEK-mynt = 1 kilo SEK-mynt.
Dock verkar det som om hans antagande

1 liter SEK-mynt = 1 kilo SEK-mynt

behövas justeras lite. Mätt via en vanlig kroppsvåg vägde mina mynt till 10 kilo SEK-mynt. Dvs omvandlingsformeln blir snarare

2.5 liter SEK-mynt = 10 kilo SEK-mynt
dvs
1 liter SEK-mynt = 4 kilo SEK-mynt


Granularitetsforskning
Ett problem att räkna ut via litermått är att det troligen även beror på hur mynten har samlats, skakas eller blandats i den uppsamlande behållaren, vilket i sig kanske beror på fördelning, hur ofta man lägger i mynten etc.
(Mått via kilo är mer konstant vad gäller sådant.)

Vilket får mig att tänka på den "granularitets"-forskningen som jag läste lite om i Nature idag: Think outside the sandbox, skriven av Marc Buchanan, som handlar om forskning kring sands beteende.
One grain of sand is a solid. But a lot of grains together can behave like a solid or a liquid. By probing this dual personality, physicists hope to understand a host of real-world systems, says Mark Buchanan.

Heinrich Jaeger knows what it's like, literally and metaphorically, to watch the sand slipping through the hourglass.
...
A decade ago, Jaeger and his colleagues at the University of Chicago were busy studying what happened when they poured sand into a container and tapped the box repeatedly. They expected the grains to bed down fairly quickly — but, as the team eventually reported in 1995, the sand kept shifting into ever more compact configurations. "Granular systems look deceptively simple," says Jaeger. "But the closer we look, we find so many complexities."

Such puzzles show why granular materials hold a special fascination for physicists interested in the fundamental properties of matter. A pile of sand, flour or mustard seed can stand tall and fixed like a solid, defying the tug of gravity that would bring water sloshing to the floor. Yet sand pours through an hourglass as though it were a liquid.

En annan webbsida om denna forskning är skriven Nathan Bell. Se även program och bilder via projektfilerna (jag har ännu inte fått programmet att kompilera).

Där står det dock inte hur mynt beter sig...


Om "slumpmässig fördelning"
Bengt slog även rask ned på mitt slarviga användande av "slumpmässig fördelning".

Vad jag avsåg var att det inte var någon avsevärd skevhet i mina inköp, såsom att jag skulle använt alla en- och femkronor till parkeringsautomater, eller endast köper kvällstidningen kontant etc.

Snarare menade jag "slumpmässig enligt "växel-tillbaka-fördelningen", som väl i pratform kan beskrivas i stil med "växel fördelat enligt de summor som erhålles efter normala hushållsinköp utan några större avvikelser för en person motsvarande den avsedda demografiska och livsstilmässiga tillhörigheten".

Jag tror alltså det är en speciell fördelning av mynten som, bland annat, beror på följande faktorer:
- vad man köper och hur mycket, dvs mixen av varor. Även vilken typ av hushåll som köper borde vara en påverkande faktor.
- i vilken typ av affär man köper (lågpris, närbutik, specialpriser)
- hur ofta man köper
- hur ofta man betalar med kreditkort
- vilken summa man betalar med (vilket i sig beror på andra saker)
- etc.

Ingen som vill gå vidare med detta och eventuellt få Sveriges Riksbanks pris i ekonomisk vetenskap till Alfred Nobels minne år 2063? :-)

Posted by hakank at 08:48 EM Posted to Diverse | Matematik | Comments (4)

Hur mycket väger pengar?

Jag såg på nuisance value en referens till mycket en viss summa pengar motsvarar.

Det fick mig att tänka på följande: Om man har X (säg 10) kilo svenska mynt, ungefär hur mycket är de värda?

Det (10 kilo) råkar nämligen vara så mycket som jag har lagt undan efter jag fått tillbaka från olika butiker, låt oss säga under ett år. Det är alltså växel från "vanliga köp", dvs hushållsinköp såsom inköp av mat, tidningar etc.

Man kan alltså anta att det är slumpmässigt fördelat - vad det nu innebär här. Den intressanta frågan är just hur de olika mynten fördelas i normal handel under en viss tidsperiod.

Någon som känner till en fin formel för detta?

Posted by hakank at 03:01 EM Posted to Diverse | Matematik | Comments (3)

En vestenkalpig unsdernöking gjord .... - igen.

Äntligen har Mats Andersson (och hans bror) fått internationell cred för att vara tidigt ute (2 veckor innan det stora utbrottet) med Hur läser vi?.

Detta, och mycket mer, kan läsas i sammanställningen Aoccdrnig to a rscheearch at... skriven av Matt Davis.

Unlguailbch! är en tysk översiktsartikel med tonvikt på den tyska varianten, publicerad den 24 september.

Posted by hakank at 02:12 EM Posted to Diverse | Comments (2)

oktober 08, 2003

Analys av ekonomiska bubblor. Lomb-periodogram.

I Nature-artikeln Physicists predict Christmas crisis for UK housing market beskrivs en ny bubbla, nämligen i den brittiska fastighetsmarknaden.

"Mayhem may be in store" for the British property market, say scientists in California. They claim to see the "unmistakable signature of a strong unsustainable bubble" in UK house prices, which could burst around the end of this year.

There is no comparable danger in the US real-estate market, say Wei-Xing Zhou and Didier Sornette of the University of California, Los Angeles, despite fears among investors of a "bubble mentality".
...
Sornette believes that most market crashes arise from the internal dynamics of trade, rather than being a response to some external shock to the system. A crash, he suggests, is preceded by a period of very fast growth in economic indices, plus a series of wobbles or oscillations stretching over several years, which come increasingly close together.

Papret är 2000-2003 Real Estate Bubble in the UK but not in the USA av W.-X. Zhou och Didier Sornette.

Sournette har skrivit böckerna Why Stock Markets Crash: Critical Events in Complex Financial Systems och Critical Phenomena in Natural Sciences: Chaos, Fractals, Selforganization and Disorder: Concepts and Tools. Jag har läst ingendera. En intervju med honom finns här.

Lomb-periodogram
I papret visas bland annat Lomb-periodogram (google-sök). Det finns, upptäckte jag efter lite sökande, ett R-paket för att visa sådana: paketet nlt, (non)linear time series analysis, som finns här. Han som skapat paketet är Ottar Nordal Bjørnstad. Se även hans publikationer. Bjørnstad forskar dock inte i ekonomiska bubblor utan i dynamiska biologiska system.

Posted by hakank at 09:43 FM Posted to Dynamiska system

oktober 07, 2003

Självorganisation och data mining/data analys, samt stigmergy

Här är två intressanta artiklar som kombinerar självorganisation och data mining. Jag har ännu bara bläddrat igenom dem. Sist finns lite länkar om stigmergi (stigmergy).


Båda artiklarna är skriva av Vitorino Ramos och Ajith Abraham.


Web Usage Mining Using Artificial Ant Colony Clustering and Genetic Programming.

Paper.

Abstract
The rapid e-commerce growth has made both business community and customers face a new situation. Due to intense competition on one hand and the customer's option to choose from several alternatives business community has realized the necessity of intelligent marketing strategies and relationship management. Web usage mining attempts to discover useful knowledge from the secondary data obtained from the interactions of the users with the Web. Web usage mining has become very critical for effective Web site management, creating adaptive Web sites, business and support services, personalization, network traffic flow analysis and so on. The study of ant colonies behavior and their self-organizing capabilities is of interest to knowledge retrieval/management and decision support systems sciences, because it provides models of distributed adaptive organization, which are useful to solve difficult optimization, classification, and distributed control problems, among others. In this paper, we propose an ant clustering algorithm to discover Web usage patterns (data clusters) and a linear genetic programming approach to analyze the visitor trends. Empirical results clearly shows that ant colony clustering performs well when compared to a self-organizing map (for clustering Web usage patterns) even though the performance accuracy is not that efficient when comparared to evolutionary-fuzzy clustering (i-miner) approach.

KEYWORDS: Web Usage Mining, Ant Systems, Stigmergy, Data-Mining, Linear Genetic Programming.


Swarms on Continuous Data

Paper

Abstract
While being it extremely important, many Exploratory Data Analysis (EDA) systems have the inhability to perform classification and visualization in a continuous basis or to self-organize new data-items into the older ones (evenmore into new labels if necessary), which can be crucial in KDD - Knowledge Discovery, Retrieval and Data Mining Systems (interactive and online forms of Web Applications are just one example). This disadvantge is also present in more recent approaches using Self-Organizing Maps. On the present work, and exploiting past sucesses in recently proposed Stigmergic Ant Systems a robust online classifier is presented, which produces class decisions on a continuous stream data, allowing for continuous mappings. Results show that increasingly better results are achieved, as demonstraded by other authors in different areas.

KEYWORDS: Ant Systems, Stigmergy, Data-Mining, Exploratory Data Analysis, Image Retrieval, Continuous Classification.


En liten aside
Stigmergi är ett intressant begrepp.

På sidan 23 i Self-Organization in Biological Systems (Amazon-länk) står det:

In situations where many individuals contribute to a collective effort, such a colony of termites building a nest, stimuli provided by the emerging structure itself can be a rich source of information for the individual.
...
In other words, information from the local environment and work-in-progress can guide further activity. As a structure such a termite mound develops, the state of the building continually provide new information for the builders.

In the study of social insects, the term stigmergy (...) has been used
to describe such recursive building activity.

Begreppet stigmergy skapades av P-P Grassé. I boken är det dock endast franska artiklar som refereras.

Man kan läsa mer t.ex. på följande sidor:
Stigmergy and the World-Wide Web
www.stigmergicsystems.com
Stigmergy, Self-Organization, and Sorting in Collective Robotics (PDF)
Swarm Intelligence - varför myror är intressanta av Robert Johansson och Mia Living.

Se även Forskning och Framsteg: Temanummer om självorganisation och dess referenser.

Posted by hakank at 11:15 EM Posted to Komplexitet/emergens | Machine learning/data mining

Historiska dokument i datavetenskap

Den som är intresserad av historiska dokument i datavetenskap bör kika på Historic Documents in Computer Science .

Samt Al Kossow's manual collection som innehåller en massa manualer för äldre system/språk/etc. Det finns en liten innehållsförteckning över dokumenten.


Via Lambda the Ultimate.

Posted by hakank at 10:41 EM Posted to Diverse

First Monday

Senaste First Monday har kommit.

Innehållsförteckning:

Factors of regional/national success in information society developments: Information society strategies for candidate countries
by Marc Bogdanowicz, Jean-Claude Burgelman, Clara Centeno, Elisaveta Gourova, and Gérard Carat

Copyright and authors
by John Ewing

Democratizing software: Open source, the hacker ethic, and beyond
by Brent K. Jesiek

Where am I and who are 'we'?: Self-representation and the intersection of gender and ethnicity on the Web
by Linda Leung

Using the Internet to enable developing country universities to meet the challenges of globalization through collaborative virtual programmes
by Derek W. Keats, Maria Beebe, and Gunnar Kullenberg

Studying special collections and the Web: An analysis of practice
by Lorriane Normore

Victims of cyberstalking: An exploratory study of harassment perpetrated via the Internet
by Paul Bocij

Posted by hakank at 09:37 FM Posted to Diverse

oktober 06, 2003

Google Frequent Searchers - nu då?!

I NYTimes-artikeln Frequent Search Engine Users, Google Is Watching and Counting berättas om en ny liten sak som google lagt till: Google Frequent Searchers. Tydligen är det funktionen jag skrev om för en månad sedan. Notera att den hjälpsida på google.com som refereras i anteckningen inte fungerar längre.

Enligt artikeln är det för tillfället bara ett fåtal utvalda som får ta del av funktionen .


The Web search service Google has quietly started placing a counter on its home page for a small number of its most frequent users.

Most Google users do not have it, but a select few now have a no-frills counter that with each search clicks higher, noting "You have done 479 searches," or whatever the actual number.

For the curious, an explanatory page linked to the counter reveals that this is a test, or limited-sample experiment of a new search counting feature.

Posted by hakank at 08:07 FM Posted to Sökmotorer

oktober 05, 2003

Sammanträffanden - anteckningar vid läsning av Diaconis och Mosteller 'Methods for Studying Coincidences'

[Om denna anteckning är svårläst på huvudsidan, försök då att läsa det som separat anteckning här]

Detta är en liten anteckning med anledning av papret Methods for Studying Coincidences av Persi Diaconis och Frederick Mosteller som jag lyckades få tag i tack vare en snäll person. Tack!

Studiet av coincidences (sammanträffanden) är relaterat till kognitiva illusioner som jag (egentligen) håller på att kolla in. Vi har dålig intuition om sammanträffanden, vilket födelsedagsproblemet visar: Födelsedagsproblemet säger att det krävs 23 personer för att det ska vara 50% chans att två av personerna i denna grupp har samma födelsedag. Förvånande? En vanlig intuition är att det krävs många fler personer.
Se nedan för refererenser om detta mycket berömda problem.

Här nedan går jag igenom ett av de intressantaste avsnitten i Diaconis och Mostellers paper, avsnittet "7.1 General-Purpose Models: Birthday Problems" (sid 857ff).

Mestadels består denna anteckning av citat från papret och en del R-kod. Statistik/data analys-paketet R finns att ladda ner på www.r-project.org.

I övrigt finns det andra mycket intressanta diskussioner i artikeln, t.ex.

The Standard Birthday Problem
Detta är standardversionen av födelsedagsproblemet.

Problem 1: The Standard Birthday Problem. Suppose N balls are dropped at random into c categories, N <= c. The chance of no match (no more than one ball) in any of the categories is

prod(1-i/c, i=1..N-1) (Expression 7.1)

... If c is large and N i small compared to c**(2/3), the following approximation is useful. The chance of no match is approximately

exp(-N**2/2*c) (Expression 7.2)

This follows easily from Expression (7.1), using the approximation

log_e(1-i/c) ~ -i/c

To have probability about p of least one match, equate (7.2) to 1-p and solve for N. This gives the approximations
N ~ 1.2 * sqrt(c) (Expression 7.3)
for a 50% chance of match and
N ~ 2.5 * sqrt(c)
for a 95% chance of match.
[...]

Thus, if c=365, N=22.9 or 23 for a 50% chance and about 48 for a 95% chance.


I R skriver man:
> 1.2 * sqrt(365)
[1] 22.92597

> 2.5 * sqrt(365)
[1] 47.76243
Many Types of Categories
Följande problem är mycket intressant. Här räknar man (approximativt) ut hur stor sannolikheten är för att det finns sammanträffande där det finns flera attribut. I standardversionen av födelsedagsproblemet är det ju endast ett attribut (samma födelsedag). Här generaliseras alltså detta.

Problem 2: Many Types of Categories.
...
Suppose that a group of people meet and get to know each other. Various types of coincidences can occur. These include same birthday; same job; attended same school (in same years); born or grew up in same country, state or city; same first (last) name; spouses' (or parents') first names the same; and same hobby. What is the chance of a coincidence of some sort?
....
If the numbers of [independent] categories in the sets are c1, c2,...ck, we can compute the chance of no match in any of the categories and subtract from 1 as before. If k different sets of categories are being considered, the number of people needed to have an even chance of a match in some set is about

N ~ 1.2 * sqrt(1/ (1/c1 + 1/c2 + ... 1/ck)

The expression under the square root is the harmonic mean of the ci divided by k. If alla ci equal c, the number of people needed becomes 1.2*(c/k)^1/2 so that multiple categories allow coincidences with fewer people as would be expected. For a 95% chance of at least one match, the multiplier 1.2 is increased to 2.5 as in Expression 7.4.
...
As an illustration, consider three categories: c1 = 365 birthdays; c2= 1000 lottery tickets; c3 = 500 same theater tickets on different nights. It takes 16 people to have an even chance of a match here.


I R:

För en 50-50-chans för en match kräver alltså 16 personer:
> 1.2 * sqrt(1/sum(1/c(365,1000,500))); round(.Last.value)
[1] 15.83929
[1] 16
Och för 95% chans till en match krävs 33 personer:
> 2.5 * sqrt(1/sum(1/c(365,1000,500))); round(.Last.value)
[1] 32.99852
[1] 33
Multiple Events
Här studeras en match för k antal personer som ska ha samma attribut (t.ex. samma födelsedag).

Problem 3. Multiple Events. With many people in a group it becomes likelu to have triple matches or more. What is the least number of people required to ensure that the probabilit exceeds 1/2 that k or more of them have the same birthday? McKinney (1966) found, for k=3, that 88 people are required. For k=4, we require 187.
....
The number of people required to have the probability of p of k or more in the same category is approximately [...]
N*E**(-N/(c*k)) / (1 - N/(c*(k+1)))^(1/k) =
( c**(k-1) * k! * log_e(1/(1-p)) )**(1/k) (Expression 7.5]

....
[Example:]
A friend reports that she, her husband, and their daughter were all born on the 16th. Take c = 30 (as days in a month), k = 3, and p = 1/2. Formula (7.5) gives N ~ 18. Thus, among birthdays of 18 people, a triple match in day of the month has about a 50-50 chance.


R-kod:
Först lite förklaringar:
log är logaritmen med basen E.
Funktionen factorial() finns i paketet gregmisc och är definierad som
factorial <- function(x) { gamma( 1 + x)}

Det kan även skrivas som prod(1:k), dvs
> c=30; k=3; p=1/2; (c**(k-1) * prod(1:k) * log(1/(1-p)) )**(1/k)
[1] 15.52648
men om man vill arbeta med vektorer, t.ex. testa för olika värden av k (t.ex. 1:10), blir det problem att ha ytterligare en vektor i prod(1:k)

> c=30; k=3; p=1/2; (c**(k-1) * factorial(k) * log(1/(1-p)) )**(1/k)
[1] 15.52648
Trist! Jag förväntade mig värdet (ungefär) 18 här.
Jag pushar ovanstående diskussion och kollar in detta problem lite mer.

Funktionen qbirthday finns som standard i R som är följande (via hjälpen, ?qbirthday):
Computes approximate answers to a generalised ``birthday paradox'' problem. `pbirthday' computes the probability of a coincidence and `qbirthday' computes the number of observations needed to have a specified probability of coincidence.

Man refererar explicit och endast till Diaconis och Mostellers paper.
Är det fel i papret?
Med min formel får jag princip samma som följande:
> qbirthday(prob=0.5, classes=30, coincident=3)
[1] 16
Jag jämför här min formel med qbirthday för olika k-värden, och avrundar sålunda till heltal.
> c=30; k=1:10; p=1/2; round((c**(k-1) * factorial(k) * log(1/(1-p)) )**(1/k))
 [1] 1 6 16 26 37 48 59 71 82 93

> c=30; k=1:10; p=1/2; sapply(k, function(i) qbirthday(prob=p, classes=c, coincident=i)) 
[1] 1 6 16 26 37 48 59 71 82 93
De ser ut att vara identiska! Jag vet tyvärr inte varför våra värden skiljer sig mot papret.

Tyvärr hittade jag även följande problem: För stora värden av k (t.ex. 1000) är min formel dålig eftersom den ger Inf (infinity) i factorial(). Även om man i stället använder prod(1:k) blir det Inf. Efter lite undersökningar visar det sig att max-värdet för k är 170. Så qbirthday är att föredra i sådana fall.
> c=30; k=1000; p=1/2; round((c**(k-1) * factorial(k) * log(1/(1-p)) )**(1/k))
[1] Inf
medan qbirthday inte har några problem med stora värden för k (t.ex. 1000):
> c=30; k=1000; p=1/2; sapply(k, function(i) qbirthday(prob=p, classes=c, coincident=i)) 
[1] 11043
OK. Nu vet vi det.!

Så, tillbaka till huvudspåret.
För en simulering av födelsedagsproblemet med k = 3 resp. 4 får vi följande approximationer (jämför med svaren 88 resp 187 som nämns ovan). Vi jämför också med qbirthday för att kolla.
> c=365; k=3; p=1/2; (c**(k-1) * factorial(k) * log(1/(1-p)) )**(1/k)
[1] 82.13359

> qbirthday(prob=0.5, classes=365, coincident=3)
[1] 82

> c=365; k=4; p=1/2; (c**(k-1) * factorial(k) * log(1/(1-p)) )**(1/k)
[1] 168.6471

> qbirthday(prob=0.5, classes=365, coincident=4)
[1] 169
Dvs det krävs (approximativt enligt "vår" metod) 83 personer för att, med 50% chans, tre eller flera personer ska ha samma födelsedagar.

Almost Birthdays
Detta är vad författarna även kallar för multiple endpoints, dvs att två saker nästan matchar. Tillåter vi sådana nästan-matchningar (och ofta görs det utan någon uttrycklig gräns för var "nästan" slutar) blir sannolikheten hög för en träff.

Problem 4: Almost Birthdays.
...
How many people are needed to make it even odds that two have a birthday within a day.
...
A neat approximation for the minimum number of people required to get a 50-50 chance that two have a match within k, when c categories are considered [...] is approximately

N ~ 1.2 * sqrt(c/(2*k + 1) (Expression 7.6)

When c = 365 and k = 1, this approximation gives about 13 people (actually 13.2).


I R:
> 1.2 * sqrt(365/(2*1 + 1))
[1] 13.23631
Om vi kollar denna approximering från 0 dagar till 20 får vi följande:
> sapply(0:10, function(i) round(1.2 * sqrt(365/(i*1 + 1)),1))
 [1] 22.9 16.2 13.2 11.5 10.3 9.4 8.7 8.1 7.6 7.2 6.9
dvs det krävs ungefär 7 personer för att det ska vara 50% chans att två personer fyller år inom 10 dagars räckvidd.

Jag antar nu (men det står inte uttryckligen i papret) att detta gäller samma som tidigare, dvs vi multiplicerar med 2.5 för att få 95% chans till en match. Vi får då:
> sapply(0:10, function(i) round(2.5 * sqrt(365/(i*1 + 1)),1))
 [1] 47.8 33.8 27.6 23.9 21.4 19.5 18.1 16.9 15.9 15.1 14.4
dvs med 15 personer är vi tämligen säkra (95%) att det finns två födelsedagar inom 10 dagars räckvidd.

The Law of Truly Large Numbers Slutligen avslutas med följande tänkvärda (och möjligen i efterhand självklara) citat:

The Law of Truly Large Numbers.
Succinctly put, the law of truly large numbers states: With a large enough sample, any outrageous thing is likely to happen. The point is that truly rare events, say events that occur only once in a million [as the mathematician Littlewoood (1953) required for an event to be surprising] are bound to be plentiful in a population of 250 million people. If a coincidence occurs to one person in a million each day, then we expect 250 occurences a day and close to 100000 such occurences a year.

Going from year to a lifetime and from the population of the United States to that of the world (5 billion at this writing), we can be absolutely sure that we will see incredibly remarkable events. When such events occur, they are often noted and recorded. If they happen to us or someone we know, it is hard to escape that spooly feeling.


Se även följande om födelsedagsproblemet
Birthday Problem
Coincident Birthdays
Coincidence
The Skeptic's Dictionary: law of truly large numbers (coincidences)

Relevanta tidigare blogganteckningar (och referenser):
Tankeillusioner och tankemisstag
Chance News (och sajt)
Att förutsäga framtiden i efterhand - hindsight bias/creeping determinism (läs även kommentarerna).


Uppdatering
Mer om simulering av sammanträffanden finns i Simulering av sammanträffanden - I.

Posted by hakank at 09:39 EM Posted to Sammanträffanden | Statistik/data-analys

oktober 04, 2003

Veckans fredagsfyra

En lite försenad fredagsfyra.

1. Vilken skiva tror du att du lyssnat mest på?
Endera Jaco Pastorius "Word of Mouth", Weather Report "Heavy Weather", Eberhard Weber "Later That Evening" eller Miles Davis "Sketches of Spain".

2. Vilken bok läser du gärna om?
Här är några stycken som jag läser om (nästan) varje år:
Isaac Asimov: 'Stiftelsetrilogin', 'Hari Seldon och Stiftelsen', 'Preludium till Stiftelsen'
Jorge Luis Borges: Främst "Biblioteket i Babel"
Frank Herbert: "Dune"
Milan Kundera: "Varats olidliga lätthet" (kanske inte varje år)
Mario Puzo: "Gudfadern"
Clayton Rawson: Rubbet
Robert Heinlein: Bland annat "AB Magi" (Magic Inc), "Revolt mot jorden" ("Moon is a hash mistress")
Mary Stewart: Merlin-trilogin
Ursula LeGuin: Övärlden-trilogin

Tidigare var även "Sagan om ringen" med på listan, men jag har inte läst den på 15-20 år.

3. Vilken film skulle du se på bio flera gånger?
En av de få filmer jag sett om på bio är Ettore Scolas "Familjen", men då gjorde jag det dagen efter första besöket.

Numera går jag sällan på bio. Vad gäller VHS och DVD ser jag gärna om ett flertal filmer. Ett litet urval:
"Tai Chi Master", "Shaolin Soccer", "Pride and Prejudice" (BBC:s TV-version), "Groundhog Day".


4. Vilken maträtt kan du äta hela veckan?
Egentligen ingen. Jag skulle bli trött på att äta kinesmat varje dag (även om den är från Kin Long).

Skulle jag vara tvungen att välja en enda maträtt skulle det nog bli sillamackor. :-)

Posted by hakank at 11:58 FM Posted to Diverse

Bloglines: en bra informationssamlare

För ett antal timmar sedan såg jag en ny RSS/RDF-bott i en av mina webserverloggar. Det var botten till Bloglines som jag inte testat innan.

Rask gick jag dit och lade in en massa informations-flöden (eller vad nu RSS-feed kommer att heta på svenska).

Info om Bloglines:

Bloglines is a free service that makes it easy to keep up with your favorite blogs and newsfeeds. With Bloglines, you can subscribe to the RSS feeds of your favorite blogs, and Bloglines will monitor updates to those sites. You can read the latest entries easily within Bloglines.

Unlike other aggregators which require you to download and install software, Bloglines runs on our servers and requires no installation. Because your Bloglines account is accessible through a web browser, you can access your account from any Internet-connected machine. See the overview for more information.

Jag har testat lite andra informationssamlare (syndikeringsprogram) under Linux, men Bloglines är det första som funkar någorlunda bra. Tyst och mjukt är det också, om ni förstår vad jag menar.

Det är bra att det finns mängder av fördefinierade flöden som det bara är att prenumerera på: Topplista, Nya Bloggar och "Recommended feeds". Det är dock lite irriterande att mina prenumerationer inte syns på dessa listor som tydligen är statiska HTML-sidor (uppdateras en gång om dagen, troligen eftersom man vill skona databashanteraren).

Det finns även möjlighet att publicera sina prenumerationer på sin blogg, detta har jag ännu inte gjort.

Lite roligt är också att Botlines RSS/RDF-bott anger hur många prenumeranter det finns:

http://www.bloglines.com; 3 subscribers

Tack till den (ännu) okände person som gjorde mig uppmärksam på Bloglines genom att börja prenumerera på hakank.blogg!

Jag letar dock fortfarande (se kommentarerna) efter mer intelligenta verktyg för att välja vilka flöden som jag ska bevaka.

Posted by hakank at 11:06 FM Posted to Blogging | Comments (2)

oktober 03, 2003

Efterlysning: Diaconis coincidence-papers

Detta är en upprepning av min efterlysning av några papers som jag försöker få tag på:

Jag letar efter följande riktigt citerade Diaconis-artiklar. Finns de (publikt) elektroniskt tillgängliga någonstans?

Persi Diaconis: "Statistical Problems in ESP Research." Science (July 14, 1978), 201(4351):131-136
Tydligen finns detta paper på JStor men tyvärr har jag inte åtkomst.

Persi Diaconis och Frederick Mosteller: "Methods for studying coincidences", Jour. Amer. Statist. Ann., vol. 84, 853-861 (1989).
Uppdatering: Detta mycket intressanta paper har jag nu fått.


Den urspungliga efterlysningen finns i kommentarerna till Att förutsäga framtiden i efterhand - hindsight bias/creeping determinism.

Posted by hakank at 01:14 EM Posted to Diverse | Comments (2)

SAOL på nätet

Upptäckte precis att SAOL (Svenska Akademiens Ordlista) finns på nätet, gratis året ut. Kräver enkel registrering.

Från Om SAOL: Nätversionen motsvarar den senaste (12:e) upplagan av den tryckta boken som utkom 1998.

I inställningarna finns valet "Använd fonetik", men kräver "Explorer 4.0 eller senare". Trist att det inte funkar under Netscape/Mozilla-derivaten.

Liten not: Applikationen kräver att webbläsaren tillåter popups. (Jag tillåter normalt inte detta.)

Posted by hakank at 09:34 FM Posted to Diverse | Comments (3)

oktober 02, 2003

MonsterMedia - monstrosity in the face of weblogs

Thomas N. Burg: MonsterMedia - monstrosity in the face of weblogs.

Abstract:

My paper is trying to setup the grounds for researching the newly established blogosphere and the media culture in general in terms of cultural practices vis a vis the new phenomenon. Martijntje Smits theory on how society reacts on new technologies forms the basis of the research on weblogs. Her „pragmatic monster-ethics" outline social and cultural reaction in view of the emergence of new technologies. My paper elaborates on weblogs, the blogosphere and its practice of linking as new technologies and techniques of content creation that challenge our established public media space.
On the grounds of this outline the discourse within the blogosphere as well outside of it will be researched.


Utdrag (fotnotsmarkeringar borttagna):

The initial basis is provided by the dissertation "Exorcising monsters: the cultural domestication of new technologies" by Martijntje Smits and respectively an essay based upon her assumptions.

The focal point of the dissertation is based upon the notion of Monster– that is upon the thesis that a Monster unifies two incompatible sides within itself (e.g. human parts and inorganic and/or animalistic ones) – with investigating cultural norms and types of behavior in the light of ‘monstrous’ challenges. The monster is provided its characteristics due to the fact that our collective cultural categories that allow for an understanding of the world in the first place, do not permit classification. This implies that Monsters will continue to exist forever or at least up until our civilization is based on cultural categories.

In this essay the attempt is undertaken to utilize Smits’ thesis with the phenomenon of the weblog, that of Blogopshere and respectively of linking/networking of content. The question, however is: Are weblogs, the Blogosphere or respectively Monster links and if that is the case, which cultural categories do they surpass?

Posted by hakank at 07:09 EM Posted to Blogging

oktober 01, 2003

Varför klustrar sig bussar?

I Nature-artikeln There's chaos on the buses diskuteras problemet att bussar tenderar att klustra sig.


You wait half an hour for an airport shuttle bus, then two show up at once. It's not bad planning, it's chaos, says Japanese researcher Takashi Nagatani of Shizuoka University.

The unpredictability of shuttle-bus services may be inherent in the shuttling process, calculates Nagatani. He demonstrates that the average number of passengers aboard a bus and the distance between vehicles can fluctuate unpredictably, resulting in a less efficient system. Chaos emerges even in a very simple set up of two buses picking up regularly arriving passengers and taking them at constant speed to one destination.

Papret som refereras är Fluctuation of riding passengers induced by chaotic motions of shuttle buses. av Takashi Nagatani. Har dock inte hittat det på en publik sajt.

Se även artikelns "related stories" samt blogganteckningarna Simulering av "Vågen", trafikfenomen och Crowd Dynamics och Agent-baserad modellering - simuleringar av emergenta fenomen.

Posted by hakank at 11:53 EM Posted to Dynamiska system

Radioprogrammet Tendens: Det paranormala

Dagens Tendens handlar om "Det paranormala".
....Nu har universitetet i Lund utlyst en professur i psykologi, med inriktningen parapsykologi och hypnologi. Tendens träffar både sökande till tjänsten, forskare inom telepati och andra som upplevt saker de inte kan förklara..

Djuplänk här (RealPlayer). Man ska även kunna ladda ner RAM-filen (men funkar inte just nu). Själva programmet börjar cirka två minut in i filen.

Bland annat intervjuas Jan Dahlkvist som har gjort en del parapsykologiska experiment. Han har tillsammans med Joakim Westerlund en lång och intressant artikel Parapsykologin och dess kritiker - ris och ros i senaste numret av folkvett. Den hålls just på att läsas.

Även Olof Rydén, professor i psykologi på Lunds universitet, intervjuas.

Posted by hakank at 10:54 EM Posted to Skepticism, parapsykologi etc | Comments (2)

Projektförslag: Social nätverksanalys av den svenska bloggosfären

Nedanstående text är från introduktionen tilll Projektförslag: Social nätverksanalys av den svenska bloggosfären.

Ända sedan jag började blogga för några månader sedan har jag tänkt att göra en social nätverksanalys (Social Network Analysis, SNA) av den svenska bloggosfären, dvs analysera bloggarna utifrån sociala begrepp som centralitet, influens, auktoritet, "mäklarroller" etc. Det började som en liten övning inom SNA, men sedan har jag tyckt det är uppriktigt intressant och troligen skulle tillföra något viktigt till forskningen om bloggarna.

Ett sådant projekt är stort och kräver mycket mer tid än vad jag har inom överskådlig framtid. Ett alternativ är att någon (t.ex. en snäll mecenat) betalar mig så att jag kan göra undersökningen själv. Fler mecentater, tack! :)


Häromdagen beslöt jag mig för att, i stället för att själv göra en sådan undersökning, göra en övergripande beskrivning av projektet och se om någon annan/andra är intresserad av det. Projektet kommer att kräva en hel del programmerande, tid och tålamod, samt kunskaper om SNA-metoderna.

Möjligen kan det vara lämpligt för någon som ska skriva en akademisk uppsats.

Vad jag förstår finns ingen sådan undersökning gjord för svenska bloggare, och jag känner inte heller till någon motsvarande för någon annan typ av bloggsamhälle. Det senare bör dock undersökas.

Markering:
Jag kommer alltså inte själv kunna lägga ner speciellt mycket tid på projektet, möjligen vara till hjälp och rådgivare i den inledande analysfasen med tips och åsikter samt i själva dataanalysen, om sådan hjälp är önskvärd. Naturligtvis kommer jag gärna även med glada tillrop. Men programmering, projektledning/-drivande, synkning etc kommer jag inte ha tid till.


Min förhoppning är att (om det nu inte träder fram någon mecenat) någon säger: Jättebra förslag, det gör jag gärna som en del i min forskning eller hobbyprojekt, och sedan snabbt övertar utvecklings-, synk- och projektledaransvaret.

Jag redogör inte för de specifika SNA-begreppen. För en mycket kort översikt och litteraturtips om SNA, se min Social Network Analysis och Complex Networks - En liten introduktion.

Notera att denna sida innehåller information om både Social Network Analysis (ett ämne tillhörande "matematisk sociologi") och analys av komplexa nätverk (en mer gränsövergridande teknik, ursprungligen uppfunnen av personer med främst bakgrund inom fysiken). T.ex. tillhör begreppet "power law" (som jag skrivit en del om) traditionellt området komplexa nätverk och inte SNA, liksom böckerna skrivna av Barabasi, Duncan Watts samt Buchanan. Det är alltså två olika analysmetoder och båda är mycket intressanta.

Det föreslagna projektet bör dock koncentrera sig på SNA.


Här är alltså projektförslaget: Projektförslag: Social nätverksanalys av den svenska bloggosfären.

Posted by hakank at 10:16 EM Posted to Blogging | Social Network Analysis/Complex Networks | Comments (3)

KDnuggets-undersökning: Hur känt är RSS?

KDnuggets redovisas om deras senaste webbundersökning angående hur känt/använt RSS är. Undersökningen var helt frivillig att deltaga i och därför inte helt tillförlitlig.

Målgruppen för sajten är arbetare/forskare/intresserade inom data mining och machine learning. Man kan nog anta att besökarna har rätt hög teknikkännedom.

Av de 122 som valt att vara med i undersökningen fördelar sig svaren på följande sätt (antal personer inom parentes):

Never heard of it (98): 80%
Heard of it, but never used it (12): 10%
Occasional user of RSS (3): 2%
Active user of RSS (9): 7%

En kort redaktionell sammanfattning finns här.

Så 80% har aldrig hört talas om RSS. Ska jag vara förvånad?


Se även andra nyheter.

Posted by hakank at 09:37 FM Posted to Blogging | Comments (4)

Cyberkulturella studier

Resource Center for Cyberculture Studies (RSSS):

The Resource Center for Cyberculture Studies is an online, not-for-profit organization whose purpose is to research, teach, support, and create diverse and dynamic elements of cyberculture.

Har bland annat ett stort antal bokrecensioner i ämnet.

Posted by hakank at 07:55 FM Posted to Diverse