« Optiskt kamouflage | Main | Framsticks, ALife simulator »
augusti 04, 2003
Matematiska och statistiska "självklarheter"
Thomas Schellings bok Micromotives and Macrobehavior handlar om hur beteende på individnivå kan påverka en grupps beteende, vilket i sin tur påverkar individen, vilket i sin tur.... Han ger många exempel på sådana fenomen såsom trafikköer, hur man väljer en plats i en föreläsningslokal, skickar julkort till varandra, hur man grupperar sig på fester etc.
En av de saker Schelling är mest känd för (han har även skrivit betydande verk inom spelteorin) är sin analys av segregering: om samtliga inom en befolkning kan acceptera ett blandat grannskap men kräver att det åtminstone finns minst 30% av grannar av "samma slag", så tenderar det att bli en rätt kraftig segregering. Det är alltså makrobeteende (segregering) som uppstår ur mikromotiv (minst 30% grannar av samma slag). Segregering inom bostadsorter, och grupperingar på fester är några exempel på detta.
Kapitel 2 ('The inescapable mathematics of musical chairs') handlar om vissa grundläggande "självklara" sanningar om aggregerade värden, dvs värden för en hel grupp (medelvärden etc) som man kanske inte så ofta tänker på eller inser vidden av. Schelling listar upp en rad sådana sanningar, t.ex. att det alltid finns någon som är först respektive sist när vi sorterar personer enligt något specifikt kriterium, t.ex. längd, betyg på ett prov eller inkomst. Han drar en hel del slutsatser, t.ex. vad man ska tänka på när man planerar trafikljus eller skidliftar.
[Mer om mikromotiv/makrobeteende och hur de kan simuleras kommer, som tidigare utlovats, inom en framtid.]
När jag läste detta kapitel om matematiska/statistiska "självklarheter" kom jag att tänka på några bra artiklar jag läste för ett tag sedan. De handlar om olika typer av feltänk som är mycket lätta att göra och som vi rätt ofta gör. Artiklarna kan förhoppningsvis öka känsligheten att detektera sådana feltänk.
Of birthdays and clusters. I data över en tillräckligt stor grupp finns det alltid någon typ av kluster att hitta, om man letar tillräckligt länge. Vi har en tendens att övertolka dessa kluster och dess betydelser.
One of the concepts that gets the media excited and brings a glow of expectation to the eyes of compensation lawyers is the cluster. Every time there is a disease outbreak, cluster-watching comes back into vogue, as is now happening in the UK during the foot and mouth epidemic.
The extreme value fallacy förklarar lite om en viss typ av elakartad 'data snooping' som övertolkar att det alltid finns någon som har högst eller lägst värde. Artikeln ger också en kort introduktion i den fascinerande statistiska tekniken extremvärdesanalys.
A very common example is the birth month fallacy, which recurs in the media several times a year. It usually takes the form of a headline such as People born in July are more likely to get toe-nail cancer or more fancifully Cancerians are more likely to get toe-nail cancer. What the 'researchers' have done is look at the statistics for each of the twelve months, pick out the biggest, and then marvel that it seems large compared with what you would expect for a random month.
Birth daze gör en något mer matematisk genomgång av ovanstående.
It's a record!: Rekord kan, per definition, endast förbättras. Artikeln diskuterar lite om konsekvenserna av detta enkla faktum.
(Det var bland annat ovanstående artiklar som fick mig att intressera mig för just ämnet extremvärdesanalys för ett bra tag sedan.)
Sajten där dessa artiklar finns, Number Watch, är en ständig källa till intressant, ibland provokativ, läsning. Programförklaring: This site is devoted to the monitoring of the misleading numbers that rain down on us via the media. Whether they are generated by Single Issue Fanatics (SIFs), politicians, bureaucrats, quasi-scientists (junk, pseudo- or just bad), such numbers swamp the media, generating unnecessary alarm and panic. ... .
Frequently Asked Questions ger en bra översikt över saker som behandlas.
Posted by hakank at augusti 4, 2003 09:17 FM Posted to Dynamiska system | Statistik/data-analys
Comments
En journalistkollega räddade ett nyhetstorrt sommarjobb i glesbygd med frågan "ökat eller minskat?".
All statistik -- inbrott, badvänlighet, fortkörning, etc -- kunde jämföras med förra årets siffror. Sedan var rubriken klar, "X ökar" eller "X minskar".
Posted by: Jan Tångring at augusti 4, 2003 06:10 EM
Effektivt!
Jag hoppas att det bara var rubriken som var så kärv och att brödtexten var lite mer utförlig.
Möjligen något opåkallat, och utan några antydningar, kommer jag att tänka på klassikern 'How to Lie With Statistics' av Darrell Huff som visar hur man på olika sätt kan presentera data. (Amazon: http://www.amazon.com/exec/obidos/tg/detail/-/0393310728/002-7038832-5859256?vi=glance).
Posted by: Håkan Kjellerstrand at augusti 4, 2003 07:06 EM