« februari 2004 | Main | april 2004 »

mars 31, 2004

Ze Frank: Smallworld

ze frank's video-satir om sociala nätverkssystem: smallworld.

Not: Har av tekniska orsaker inte kunnat se den själv, men läggs här för EZ Ref.

Via danah boyd. Tack Simon Winter för (privat) påminnelse.

Posted by hakank at 07:19 EM Posted to Social Network Analysis/Complex Networks

Reality Mining

Technology Review-artikeln "Reality Mining" the Organization berättar om nya tekniker för att undersöka hur organisationer fungerar (fetstil tillagd):

Who are the experts within your organization? Who has the most decision-making influence? Recently, managers have started mining data from e-mail, Web pages, and other digital media for clues that will help answer such questions. That’s a start, but it misses the real action: studies of office interactions indicate that as much as 80 percent of work time is spent in spoken conversation, and that critical pieces of information are transmitted by word of mouth in a serendipitous fashion. Fortunately, the data infrastructure for mining real-world interactions is already in place. Most working professionals already carry microphones (cell phones), and many also carry PDAs with ample computational horsepower. This foundation of mobile communications and processing power will support an exciting new suite of business applications: reality mining.

The MIT Media Lab’s Human Design research group is demonstrating that commonplace wearable technology can be used to characterize the face-to-face interactions of employees—and to map out a company’s de facto organization chart. This capability can be an extraordinary resource for team formation and knowledge management.

Se även:
MIT-sajten Reality Mining
Reality Mining: Organizational Intelligence
ShortCuts: Creating Small Worlds

Posted by hakank at 06:37 EM Posted to Social Network Analysis/Complex Networks

Newsmap

Newsmap är ett nyhetsvisualiseringssystem som använder sig av Treemaps-tekniken.

Se vidare
Peter Merholtz (peterme.com): All the pretty colors...

Via peterme.com.

Posted by hakank at 11:02 FM Posted to Statistik/data-analys | Comments (2)

Flash mob Computing

New Scientist: Flash mob to attempt supercomputing feat:

On Saturday 3 April, over 1000 laptop owners will converge on the university gym in an attempt to build a "flash mob" supercomputer. The project's organisers hope that FlashMob will run fast enough to beat supercomputers in the list of the world's top 500 supercomputers.
...
Because nothing like FlashMob has ever been attempted, it is not clear how the project will fare.

Se vidare
FlashMobComputing.org
Jack Dongarra

Posted by hakank at 10:46 FM Posted to Diverse

mars 30, 2004

Steven Strogatz: The physics of crowds

I Nature-artikeln The physics of crowds recenserar Steven Strogatz Philip Ball's bok "Critical Mass: How One Thing Leads to Another", som uppmärksammades för ett tag sedan.

Recensionen avslutas med en jämförelse med Cladwells "The Tipping Point" (som också skrivits om tidigare):

Speaking of which, the title Critical Mass: How One Thing Leads to Another struck me as uncannily (or perhaps intentionally?) close to the title of Malcolm Gladwell's recent bestseller, The Tipping Point: How Little Things Can Make a Big Difference. Both books deal with collective phenomena in society, or what Gladwell calls social epidemics, but the resemblance ends there. Gladwell's book is fluffy and full of entertaining anecdotes, but is often unconvincing. Ball's is substantial, impeccably researched and generally more persuasive. For anyone who would like to learn about the intellectual ferment at the surprising junction of physics and social science, Critical Mass is the place to start.


Uppdatering
För att komma åt artikeln räcker att man gör en kostnadsfri registrering.

Uppdatering 2
Det har inkommit rapporter om problem trots registrering. En annan länk att testa är denna.

Kommer du inte åt artikeln kan du kontaka mig så bör vi kunna lösa det på något sätt.

Posted by hakank at 02:27 EM Posted to Komplexitet/emergens

mars 29, 2004

Statistisk data snooping - att leta efter sammanträffanden

Denna anteckning beskriver och ger lite exempel på data snooping - "datasnokning". Efter en inledande begreppsutredning beskrivs ett par tekniska papers, varefter det blir mer lite mer lättsmält material, inklusive ett program att själv leka med.

Data snooping vs annat
"Data snooping" används för att beteckna olika typer av företeelser. Det finns en betydelse som refererar till en form av dataintrång där någon otillbörligt försöker att få reda på andra användares data; det är verkligen inte denna betydelse som avses här.

En något subtilare betydelseskillnad är till data mining. Data mining är explorativ ("datagrävande") till sin natur, men har metoder anpassade för att avgöra om t.ex. ett beslutsträd eller artificiellt neuralt nätverk verkar att ge lovande resultat.
Data snooping är - å andra sidan - den mer tvivelaktiga metoden att först leta reda på intressanta samband i en datamängd för att t.ex. sedan skriva en vetenskaplig rapport med "statistiska förtecken" som om denna inledande grävning inte gjorts. Problemet med data snooping är att detta letande gör att de traditionella statistiska analyserna, t.ex. signifikansvärde, inte längre gäller.


Super Bowl
Patric Burns Permuting Super Bowl Theory (PDF) analyserar den populära teorin att det finns en koppling mellan utgången av den amerikanska högtiden Super Bowl (amerikansk fotboll, alltså) och börsen.
Abstract:
The quality of stock market predictions based on the winner of the Super Bowl is examined using permutation tests. These tests are very easy to perform in modern computing environments like the R language. One key point that comes to light is that the success rate of a prediction is not a good measure of its usefulness. Statistically signi cant success in prediction does not automatically lead to economically profitable strategies.

R for the Super Bowl finns R-kod (R som i www.r-project.org) för att själv köra exemplen.

Ovanstående paper refererar till två mycket tekniska papers skrivna av bl.a.
Halbert White:

Halbert White: A reality check for data snooping (PDF, ~6Mb)
R. Sullivan, A. Timmermann, and H. White: Data Snooping, Technical Trading Rule Performance, and the Bootstrap (PDF, ~6Mb)

(Av sanningivrande skäl bör noteras att dessa två papers endast har bläddrats i.)


Fler skrifter
Timothy Falcon Crack A Classic Case of "Data Snooping" for Classroom Discussion (PDF)
Abstract:
Data snooping (mistaking spurious statistical relationships for genuine ones) is an important and dangerous by-product of financial analysis. However, data snooping is a difficult concept to explain to students of financial economics because, by its very nature, it is difficult to illustrate by example (a strong statistical relationship between complex financial variables is difficult to refute). To overcome this pedagogical difficulty, I present an example of data snooping where one variable is non-financial: I show that near both new moon and full moon, stock market volatility is higher and stock market returns are lower than away from the new or full moon. The simple and off-beat nature of this example enables substantial classroom discussion.


David Jensen Data Snooping, Dredging and Fishing: The Dark Side of Data Mining, SIGKDD 1999.
Beskriver en paneldiskussion hållen 1999 om data snooping-liknande problem inom data mining. I sista avsnittet föreslås några lösningar på dessa problem.


Mer lättillgängliga skrifter
Så kommer vi till några mer lättillgängliga skrifter.


Bibelkoden
I David Jensens paper nämns som ett exempel på data snooping den teknik som används i bibelkoden (Bible codes) för att "hitta" dolda religiösa "budskap" i Bibeln. Denna teknik kan dock användas för att "hitta" vad som helst i vilken skrift som helst, t.ex. Tolstoys Krig och Fred, Moby Dick eller Microsofts licensöverenskommelse.

För mer i detta ämne se Scientific Refutation of the Bible Codes skriven bl.a. av Brendan McKay samt Skeptical Inquirer-artikeln Hidden Messages and The Bible Code. Sajten Are there Mathematical Miracles in the Qur'an or the Bible? har en omfångsrik samling av liknande forskningar.

Man kan också notera (som tidigare gjorts) att ordet hakank finns i π (pi).


666 och programmet Devil's word
I David A. Gershaw: Is It Just a Coincidence? står bland annat:

Another example [of using coincidences to prove a point] is using any combination of the number "666" to indicate that someone is the Beast of Revelation. Some said that our ex-president, Ronald Wilson Reagan, was the Beast. Why? Each of his names has six letters, therefore "666". However, if you look long enough, you can probably find some arrangement of 666 with almost anyone.

1996 skrev Matthew Hunt och Masto Christopher i Usenet-gruppen comp.lang.perl två Perl-program (antichrist.pl) som gör just detta. Källkoden samt några exempel finns här . Programmet tar ASCII-värdet av en sträng och söker efter en kombination av additioner och subtraktioner över dessa tal för att få fram talet 666, vilket lyckas för många strängar. Många ord har flera kombinationer som uppfyller villkoret, men programmet visar endast den första.

Det finns en nyskriven och webbanpassad version av programmet: Devil's word. För tillfället finns en stygg maxgräns på 20 tecken, som eventuellt senare kommer att justeras.

Exempel på en sådan körning på namnet håkan kjellerstrand:

Checking 'håkan kjellerstrand'....

Character ASCII value
h 104
å 229
k 107
a 97
n 110
32
k 107
j 106
e 101
l 108
l 108
e 101
r 114
s 115
t 116
r 114
a 97
n 110
d 100


+104+229+107+97+110-32+107-106+101+108-108+101-114-115-116-114+97+110+100 = 666

Coincidence? I think not!

Se även
Of birthdays and clusters och The extreme value fallacy från Number Watch som båda behandlar olika typer av data snooping. Dessa samt några andra artiklar kommenteras i blogganteckningen Matematiska och statistiska "självklarheter".


Uppdatering
En uppdaterad version av programmet beskrivs i Uppdatering: Devils' word (sammanträffanden i ord).

Posted by hakank at 10:32 FM Posted to Sammanträffanden | Statistik/data-analys | Comments (2)

Infontology: Uppdaterad programförklaring

Infontology har en Uppdaterad programföklaring som täcker många spännande områden. Läs den!

Posted by hakank at 09:11 FM Posted to Blogging

mars 28, 2004

Google PageRank Prediction

Google PageRank Prediction är ett webbaserat program för att estimera vilken PageRank en sida kommer att få vid nästa gång värdet uppdateras.

För hakank.blogg blir resultatet en liten nedgång:
Results: Your current Google PageRank is 5. Based on our calculations, we predict your future PageRank after the next Google update will be 5, a decrease of 3.74%.

Via Google Blogoscoped.

Posted by hakank at 04:06 EM Posted to Sökmotorer | Comments (4)

mars 25, 2004

David Lusseau, Mark Newman: Identifying the role that individual animals play in their social network

David Lusseau, M.E.J. Newman
Identifying the role that individual animals play in their social network

Abstract:

Techniques recently developed for the analysis of human social networks are applied to the social network of bottlenose dolphins living in Doubtful Sound, New Zealand. We identify communities and subcommunities within the dolphin population and present evidence that sex- and age-related homophily play a role in the formation of clusters of preferred companionship. We also identify brokers who act as links between subcommunities and who appear to be crucial to the social cohesion of the population as a whole. The network is found to be similar to human social networks in some respects but different in some others such as the level of assortative mixing by degree within the population. This difference elucidates some of the means by which the network formed and evolves.


Se även
Study: Dolphins Make Excellent Networkers
Newmans publikationer
samt Swingens lilla värld, och delfinens.

Posted by hakank at 08:43 EM Posted to Social Network Analysis/Complex Networks

mars 23, 2004

Cranks och crackpots

Av olika skäl tycker jag att vissa typer av cranks (crackpots) inom vetenskaperna är fascinerande. Troligen har denna fascination att göra med de personer som fanns, och fortfarande finns, på olika Usenetgrupper som följts noga vid olika tidpunkter, t.ex. sci.math, sci.physics, och sci.skeptic. En av mina riktigt stora Usenet-"favoriter" var Archimedes Plutonium som frekventerade de flesta Usenetgrupper under '90-talet. Varning: det finns risk att man blir beroende av detta läsande.

(Språkligt not: Själv används mestadels det engelska ordet crank för att beskriva dessa personer. De svenska orden knäppgök, galenpanna, tokskalle, udda person eller original känns inte lika bra. Varmpanna, av osäkert etymologiskt ursprung, syftar enligt min språkkänsla enbart på de med synnerligen stark religiös övertygelse. google ger för övrigt endast en träff just nu.)


Anledningen till denna anteckning var att jag häromdagen läste en sak som fick mig att tänka på John Baez The Crackpot Index som innehåller kriterier hur man kan avgöra om en person/teori är cranky. Den lämpar sig främst för personer/teorier inom fysiken, men där finns flera allmängiltiga indikatorer.

Man startar med -5 poäng och ger sedan olika pluspoäng för varje kriterium som stämmer överens. Ju högre poäng desto större chans är det för crankyness ("knäppgökighet"?).

Några exempel:

1 point for every statement that is widely agreed on to be false.
5 points for each mention of "Einstien", "Hawkins" or "Feynmann".
10 points for pointing out that you have gone to school, as if this were evidence of sanity.
10 points for offering prize money to anyone who proves and/or finds any flaws in your theory.
10 points for claiming that your work is on the cutting edge of a "paradigm shift".
20 points for emailing me and complaining about the crackpot index, e.g. saying that it "suppresses original thinkers" or saying that I misspelled "Einstein" in item 8.
30 points for claiming that your theories were developed by an extraterrestrial civilization (without good evidence).
40 points for claiming that the "scientific establishment" is engaged in a "conspiracy" to prevent your work from gaining its well-deserved fame, or suchlike.
50 points for claiming you have a revolutionary theory but giving no concrete testable predictions.

För säkerhets skull bör sägas att ovanstående inte är helt humorbefriat.

(Besök gärna författarens sajt länkad ovan. Där finns många intressanta saker inom matematik, fysik och annat. Baez är inte en crank.)


En av de bästa sajterna i ämnet är Crank Dot Net. Där finns inte bara länkar och korta kommentarer till cranks inom matematik och fysik utan även inom datavetenskap, evolution och konspirationsteori.

För många (cirka 10) år sedan läste jag en fascinerande bok som berättar om många matematiska cranks: Mathematical Cranks skriven av Dudley Underwood. Likande böcker finns på Crank Dot Net:s boksida.

Posted by hakank at 01:25 EM Posted to Diverse | Comments (2)

Bengt O. Karlssons google-utmaning

Bengt O. Karlsson - När jag ändå har ordet ... (en av mina favoritbloggar/-e) - skrev i går Blogjam i vårtid bland annat följande (länkar som i originalet):


Till er som förgooglade er och hamnade på När jag ändå har ordet...när ni sökte efter:
...
Politikers brutna löften - Vi lade märkte till att Du bara fick 14 träffar (!) hos Google vilket tydligt visar att G. inte är det allvetande orakel som ett par av våra favorit- bloggare vill göra gällande.
...


En sådan utmaning var svår att motstå.

Låt oss nu följa den debatt som därefter fördes i kommentan till anteckningen. Det stod alltså mellan å ena sidan google-skeptikerna/-kritikerna (representerad av Bengt O. Karlsson, kallad Bengt nedan) och å andra sidan den mer sökmotoroptimistiska falangen (här representerad av undertecknad, nedan kallad hakank alt. Håkan). Man skulle kunna notera att funna stavfel ändrats, smärre stilistika effekter lagts till samt en och annan ytterligare redigering gjorts.


hakank:
OK, jag tar härmed upp googlehandsken som så drastiskt slängdes i ansiktet.

En något mer avancerad sökning ger fler resultat: 2840.

(politiker OR politikers) (löften OR lovar OR lovat) (bryter OR brutna OR "håller inte") -Robinson

[Not: i originalkommentarer fanns här en "väldans lång URL", nämligen denna]

Ingen har väl sagt att det är enkelt att söka i google? :-)
...


Bengt:
Håkan: (OBS ej ironi OBS) Det var verkligen imponerande. Jag testade faktiskt Din ekvation och den fungerade precis som Du sa. Var lär man sig sådant? Mest bry i huvudet fick jag dock av termen "-Robinson". Längre ner står det sedan "+ - Robinson". Så långt min enkla matematik räcker till blir slutresultatet "-Robinson". Hur påverkar h/h politikernas brutna löften?


hakank
Bengt: Ehuru din matematik är oantastlig i princip, bygger den på en förblandning som jag tyvärr ensam är orsak till. Mottag en djup ursäkt.

Den första raden är själva sökfrasen.

Termen - Robinson betyder att man inte vill att strängen "Robinson" ska vara med i sökresultatet. Om man inte har med denna term kommer som första resultat en Aftonbladets-artikel om TV-programmet Robinson, vilket ansågs vara olämpligt i sammanhanget.

Den andra - rackarns långa - raden är URL-en till sökningen, där man av tekniska skäl ha i sökfrasen ersatt tecknet " " (mellanslag) med ett "+" (plus)-tecken.

Så: ersätt varje "+" på den andra raden med ett mellanslag och man finner att matematiken på de bägge raderna, tagna var för sig, är inte bara korrekt, inte bara sann, utan även intuitiv.

Likt en flitig skolelev klarar google för övrigt av enklare matematik. Sök t.ex. på "2+2" (utan citattecken).

En summering av de olika operatorerna som kan användas finns på
http://www.geocities.com/googlepubsupgenfaq/#searchoperators

För kalkylatorn se vidare:
http://www.google.com/help/calculator.html


Eventuella efterspel i denna gästkramande historia kommer möjligen att kommenteras vidare i denna anteckning.

Posted by hakank at 12:05 EM Posted to Sökmotorer

wingedpig.com: grundarens av Bloglines blogg

Jeremy Zawodny skriver att han också har gått över till Bloglines.

Där länkas till bloggen som Mark Fletcher, grundaren av Bloglines, har skrivit sedan 2001: wingedpig.com. Inte helt förvånande skrivs mycket om detta trevliga program.

En summering av Fletchers göranden före Bloglines:

In 1997, Mark started ONElist, a free Internet email list service. To that point, email lists had been difficult to set up and administer. Through ONElist, Mark set out to make email lists available to even novice users. As CEO, Mark raised money from CMGI and Bertelsmann Ventures in 1998. The service was the category leader from the beginning and in November 1999, ONElist acquired eGroups, its main competition. Yahoo acquired the resulting company, renamed eGroups, in June 2000. At acquisition, eGroups served twenty million active users, one million email lists, and sent out over two billion email messages a month, making it one of the largest services on the Internet. Mark served as CEO of ONElist from inception until October 1999 and was CTO until the acquisition by Yahoo.


Se även tidigare anteckningar Bloglines samt Bloglines: en bra informationssamlare där det skrivs andra positiva erfarenheter av programmet.

Posted by hakank at 10:49 FM Posted to Blogging

"I'm Blogging This"

Mathemagenic: "I'm Blogging This" A closer look at why people blog

Länkar bland annat till "I'm Blogging This" (ps-fil) av Bonnie Nardi, Diane Schiano, Michelle Gumbrecht och Luke Swartz

Posted by hakank at 09:03 FM Posted to Blogging

mars 22, 2004

Bibliomining - data mining for libraries

Detta låter onekligen spännande. Är detta månne något för de svenska biblioteken, eller de kanske redan använder tekniken?

Bibliomining - Data mining for libraries. Termen bibliomining förklaras på följande sätt:

The basic definition is "data mining for libraries."

For years, bibliometrics has been used to track patterns in authorship, citation, etc. Today, there are many more tools available for discovering similar patterns in complex datasets from data mining and statistics. In addition, tools from management science such as Online Analytical Processing (OLAP) can be used to explore the data for patterns.

Therefore, a more complex definition is:
Bibliomining is the combination of data mining, bibliometrics, statistics, and reporting tools used to extract patterns of behavior-based artifacts from library systems.

FAQ:n förklarar - uppenbarligen på förekommen anledning - att det inte är frågan om att hitta individuella låntagare (etc) utan generella mönster.

The goal is _not_ to get to the individual patron level. Instead, the goal is to look for patterns of behavior of either large groups of patrons, staff, or both to help the library managers make better management decisions.

It may be that it's useful to look at the broad demographic groups that a patron is in (like age range), but it would be unethical (and in many cases, impossible or illegal) to look at the individual patron level without the permission of the patron.

Posted by hakank at 11:53 FM Posted to Machine learning/data mining

Ny Technorati-beta

En ny beta-release av Technorati har kommit. Nyheterna presenteras i Sifry's Alerts: New Technorati beta launches.

BookTalk nämns som nyhet (det har funnits en liknande tjänst tidigare). Andra tjänster finns i vänstermenyn, under rubriken Services.

Här är cosmos för hakank.blogg.


(Via apophenia.)

Posted by hakank at 11:36 FM Posted to Blogging

mars 21, 2004

Fylogenetiska träd

I veckans Vetenskapsradion (cirka 21:46 minuter in i programmet) har Per Helgesson en krönika om likheter mellan biologisk evolution och språklig evolution, och den nytta forskare inom de olika fälten kan ha av varandra.

Tack Peter Lindberg för påminnelse och pek till programmet. Peter skrev tidigare idag Using Evolutionary Ideas in Linguistics som troligen var inspirerad av samma program.

Både i programmet och i Peters anteckning nämns forskaren Russell Gray som analyserat de indoeuropeiska språkens utveckling och byggt upp släktschema för dessa språk.

Lite mer om Russell Gray finns här:
Russell Current Research Projects
Publications.
På sidan Russell Gray's Data finns datafiler från Russell Gray och Quentin Atkinson Language-tree divergence times support the Anatolian theory of Indo-European origins (PDF).


Fylogenetiska träd
De släktschema, evolutionära träd, som Gray använt kallas för fylogenetiska träd (phylogenetic trees). Jag kikade lite på dessa för några år sedan och samlade en del referenser varav några presenteras nedan.


Bakgrund till intresset
För en liten bakgrund: Intresset triggades troligen av en analys av kedjebrev (Charles Bennett, Ming Li, Bin Ma: Linking Chain Home Page) och som senare skrevs om i Kedjebrevsanalys. Det gjorde mig f.ö. även intresserad av det vidare området computational biology.

Till detta kom en gammal fascination av metriker för att mäta avstånd i datamängder. Se t.ex. Lord of the Strings som beskriver ett försök att mäta vilket naturligt språk som är närmast Tolkiens uppfunna språk.


Sajter och dokument
Här är några av de sajter och texter som då hittades. Den som har tips på nyare och bättre introduktionstexter i detta ämne får gärna höra av sig.

Phylogeny and Reconstructing Phylogenetic Trees med en Java Applet samt kod.

Phylogeny (PDF), från kursen Introduction to Computational Molecular Biology and Genomics.

Susan Holmes Phylogenesis - An overview (ps-fil). Holmes har nämnts tidigare i andra sammanhang, se t.ex. Diaconis om myntsingling, Redan de gamla grekerna höll på med kombinatorik samt Brian Arthur: Lock-in och El Farol.

The Tree of Life Web Project A collaborative Internet project containing information about phylogeny and biodiversity.


Icke-biologiska tillämpningar
Egentligen är jag inte så intresserad av ren biologisk data utan analys av annan data, t.ex. texter såsom kedjebrev och andra artefakter som snarare tillhör memetiken.

Phylogenetic methods for evolutionary economics

New methods of editing, exploring, and reading The Canterbury Tales

Länkar till fler icke-biologiska skrifter som använder liknande metoder finns på Phylogenetics Everywhere


Program
Det finns naturligtvis en mängd program för att analysera och simulera sådana träd. Några som har tittats på:

Statistiksystemet R har paket för manipulation av sådana träd. Se paketlistan (obs stor fil!) och sök på "phylogenetic".

PHYLIP, PHYLogeny Inference Package med dess dokumentation och exempel.


Slutnot
Dessa fylogenetiska träd har länge legat i bakhuvudet och inte en gång utan flera gånger de senaste månaderna har de dykt upp, t.ex. att försöka skapa träd för att visa hur olika nyheter på webben/bloggarna utvecklas (jämför med Hur nyheter sprids på Internet), eller visa "släktskapen" mellan de svenska bloggarna genom att titta på länkar och vilka nyheter som citeras mellan dem.

Posted by hakank at 09:15 EM Posted to Memetik | Statistik/data-analys | Comments (4)

mars 19, 2004

Formel för klackhöjd

I avdelningen vardagsfysik/-matematik kan vi i “Sex and the City stars stay upright because h = Q.[12+(3s/8)]” say scientists läsa allt om hur hög en skoklack kan vara utan att man snubblar eller lider. Det framgår inte med all önskvärd tydlighet om detta endast gäller kvinnoskor eller om formeln även är tillämpbar på mansskor, ehuru anspelningar, val av måttenheter samt exempel tyder på det förra.

As Sex and the City's Carrie finally wanders off the UK's television screens, physicists at the Institute of Physics (London, UK) have devised a formula that high-heel fans can use to work out just how high they can go. Based on your shoe size, the formula tells you the maximum height of heel you can wear without toppling over or suffering agonies.

h = Q•(12+3s /8)

h is the maximum height of the heel (in cm)
Q is a sociological factor and has a value between 0 and 1 (see below to work this out)
S is the shoe size (UK ladies sizes). This factor makes sure that the base of support is just good enough for an experienced and sober, high-heel wearer not to fall over.

Den exakta formeln för den sociologiska komponenten Q är något mer komplicerad men finns att läsa i artikeln. Parametrarna för Q är bland annat antal års vana att gå i högklackade skor, kostnad för skorna, antal månader sedan liknande skor var moderna samt mängd alkohol som planeras intagas under perioden skorna ska bäras.

Se även andra pressreleaser från Institute of Physics.


Via Eureka Alert, där artikeln Scientists calculate how high heels can go visar formlerna något annorlunda än i ovanstående.

Posted by hakank at 09:10 EM Posted to Diverse

Multi-agent technology samt lite om ontologier och annat

Artikeln Multi-agent technology: removing the 'artificial' from AI beskriver en av de grenar som bygger system kring agenter (se nedan för en begreppslig not).


AI technologies have been around for years, but they don't always work as well as we'd like. Anyone who has used speech-recognition technologies in a business context will know that the result can be, at best, laughable. And, should your voice be changed by something like a cold, the whole thing falls apart.

But technology has advanced since AI was first developed. Magenta Technology is one company that is developing a new type of technology that uses multi-agent systems to make informed decisions based on the resources that are available. Agents are small software programs that communicate with each other, acting behaviorally to interact and respond, matching available resources to demand.


Det förklaras kort även om relationen mellan dessa Multi-Agent System och ontologier.


These agents are able to perform in this way owing to their ability to communicate with a database based on ontology. Based on principles first described by Aristotle, ontology is that part of metaphysics that deals with the nature and essence of being or existence. In the context of multi-agent systems, ontology is a computer-readable description of knowledge about the resources in an enterprise's network. It relates attributes to different classes of objects, such as available business resources, projects, customer orders or plans, to enable knowledge of available resources to be built up in ontology. The software agents become intelligent because they can make use of the knowledge contained in ontology to use in the process of negotiation and decision-making.
...
At present, most work being done in the world of multi-agent technology is focused on logistics applications, but it also holds promise for the development of predictive systems in the financial services market as well as in the development of next-generation intelligent computer games. In an era where all companies are looking to increase their visibility into the workings of their supply and value chains, multi-agent technology holds enormous promise for making intelligent business decisions in real time in complex environments.

Via Agents Portal.


Notera att det finns en viss koppling mellan sådana "agenter" man talar om i denna Multi Agent Technology och agenter t.ex. i agentbaserad modellering som tidigare skrivits om här, men de bör inte förväxlas. En skillnad är att man i de senare inte inte talar så mycket om ontologier. Begreppet "agent" används för att beteckna många olika med snarlika saker (som nog alla har en familjelikhet för att prata Wittgensteinska).


Se även
Magenta Technology (uppdaterad länk)
UMBC AgentWeb
Ontology Development 101: A Guide to Creating Your First Ontology
John F Sowa: Ontology och Agent.
Recension: Michael Crichton 'Prey'.


En liten sidestep
Jag hittade även en sajt om och med Bishop John Wilkins An Essay Toward a Real Character and a Philosophical Language som bl. a. Umberto Eco kommenterat (se sidan för länkar). Jorge Luis Borges kritiserade boken i sin The Analytical Language of John Wilkins, och som det står på sajten: apparently done without having read it.

Se även Kategorierna och Borges.

Posted by hakank at 10:02 FM Posted to Diverse

Lord Of The Strings

I de två artiklarna Lord Of The Strings Part 1 och Lord Of The Strings Part 2 görs en analys av vilket naturligt språk som är närmast Tolkiens uppfunna språk. Databasfrågor och programkod medföljer artiklarna.


As a developer, I was thinking about an algorithmic approach to the problem. My idea was to write a program that takes each Tolkien word in turn and finds which real language has the word which is most similar. By inspecting the number of times each language is chosen, we should be able to decide which language was Tolkien’s biggest influence. Of course I would need to look on the Web to find lists of Tolkien words, as well as word lists for other languages, but I assumed that wouldn’t be a problem. My own string similarity metric could be used for the word-by-word comparison, and is a good choice because it acknowledges similarity for a common substring of any size, and is robust to differences in string size. Of course this would be a comparison of lexical similarity, as my string similarity algorithm makes only lexical comparisons. It is still possible that the inspiration for the grammar and the lexical structure of Tolkien’s languages came from entirely different sources.
...
Conclusions

When I started this investigation, I had no idea what the result would be. I just clung firmly onto the belief that my string similarity metric, together with a simple algorithm to iterate over the set of possible word pair comparisons, would provide an interesting result. In fact, the results are very satisfying. I found that English had a profound effect on Tolkien's invented languages, with perhaps further influences from Hungarian and Spanish. This is satisfying because it is entirely reasonable (at least the part about English!), though not exactly what I expected after reading about the (apparently unfounded) claims for the influences of Finnish. It is also satisfying because it increases my confidence in the string similarity method. And as developers, we like to have confidence in our methods.

Se även samme författares (Simon White) Matching Strings and Algorithms.


(Tack Ulf!)

Posted by hakank at 01:13 FM Posted to Statistik/data-analys

mars 18, 2004

mobillog.nu

mobillog.nu är en ny sajt för att lägga upp sina mobiltelefonbilder. Syftet är:

Mobilblog.nu är tänkt att vara en dagbok på Internet för de bilder du tar med din mobiltelefonkamera. Ett sätt att spara de bilder som annars lätt bara kastas bort.

Se vidare Så funkar det för instruktioner och annat.

P.S. Det är några kompisar till mig som gjort sajten.

Posted by hakank at 02:36 EM Posted to Sajter | Comments (1)

mars 17, 2004

Google PageRank Report

Google PageRank Report är en service jag letat efter länge. Här kan man se vilken PageRank en sida har, utan att behöva köra speciella webbläsare med speciella toolbars.

Än så länge har jag inte hittat några konstigheter.

Via Google Blogoscoped.

Uppdatering
Via samma källa hittades en Usenettråd som besvarar en del av tekniken bakom programmet.

Det har gjorts en del efterforskningar hur man räknar ut den checksumma (parametern ch) som krävs, men ingen algoritm har publicerats vad jag kan se.

Posted by hakank at 05:27 EM Posted to Sökmotorer | Comments (4)

Friendsters Jonathan Abrams om sociala nätverkssystem

Ett långt utdrag från Jonathan Abrams (Friendster) keynote-tal på SXSW Interactive finns i What the Heck Is Social Networking?.

Läs även danah boyds ::cringe:: Jonathan Abrams did not invent social networks.

Posted by hakank at 12:10 EM Posted to Social Network Analysis/Complex Networks

mars 16, 2004

Engelska nyheter i skrift och tal: Voice of America

Häromdagen efterfrågades en engelskspråkig nyhetssajt där man har samma nyhet både i tal och skrift, t.ex. transkribering av ett radioinslag.

Det slog mig plötsligt att jag så sent som den 9 mars länkade till en sådan sajt i DN om Tai Chi, nämligen Voice of America VOANews.com.. Alla artiklar har inte ljud (endast de med en pil högtalare till höger) men det är säkerligen tillräckligt många för ändamålet.

Tack alla som via olika kanaler givit förslag.

Posted by hakank at 08:07 EM Posted to Sajter

mars 15, 2004

Blogg: Lundi Pundi

Lundi Pundi är en ganska ny blogg (första anteckningen 24 februari). Taglinen för bloggen är A physics undergrad's view on matters at hand. Johan Hermansson presenterar sina intressen på följande sätt:

Among all the wonderful things in the world I truly find science (physics, math, cs, biology, ...), books (and some moving picture once in a while), martial arts, music (classical, ambient, psytrance, goa, techno), photography, art (Escher, Dali), philosophy, politics and tea (chai!) intriguing.

Det ska bli spännande att läsa om alla dessa saker.


Den senaste anteckningen var The longitude and the future of physics som bland annat rekommenderar en av mina gamla favoritböcker.

Knowledge should be -- or actually, it is -- valuable on its own.

Oh well, won't continue now, was just something I found interesting and striking... Though I will recommend you the wonderful collection called The World of Mathematics, editored by James Newman. In Sweden we also have a nice translation called Sigma. In a couple of volumes you'll find lots of great and easy reading by some top scientists through out history. They're cheap as well.

(Amazonlänk till den engelska utgåvan: The World of Mathematics.)


I Ohly and E-Type being Fame skrivs bland annat om var Lars Ohly finns i den politiska kompassen. Webbsidan som refereras till är Lars Ohly (v) gör www.politicalcompass.org's test!. I somras tog några bloggare detta politiska test; se vidare Politisk kompass.

Uppdatering
Två korrigeringar: En av länkarna fixades så den går direkt till anteckningen och inte till månadssammanställningen. Sedan glömde jag ju nämna att det var Chadie som först tipsade mig om Lundi Pundi.

Detta redigerande innebär att Johan nu får lite TrackBack-dubletter. Sorry.

Posted by hakank at 07:05 EM Posted to Blogging | Comments (1)

Stanley Milgram

Råkade precis stöta på boken The Man Who Shocked the World: The Life and Legacy of Stanley Milgram av Thomas A. Blass.

Se även
The Stanley Milgram Website (av Thomas Blass)
Stanley Milgram Links.

Posted by hakank at 06:00 EM Posted to Social Network Analysis/Complex Networks

Mikael Pawlo: Våga vägra Orkut

Mikael Pawlo skriver i Ny Teknik-artikeln Våga vägra Orkut

Jag tycker inte om det. Värdet på ett nätverk ökar ofta om man är beredd att dela med sig av det. Men det är skillnad på att dela med sig av ett vissa, väldefinierade affärsrelationer till en viss given person och krets och med ett visst syfte och att lägga upp hela sin adressbok med stora personprofiler och fotografier på nätet.

Helt plötsligt blir vi transparenta som människor. Det känns en smula ointressant. Det känns en smula olämpligt. Vad är egentligen värdet med att all information om en människa skall finnas tillgänglig med några enkla knapptryckningar? Varför skall mina vänner och affärsbekanta registreras för var och en på Orkut?
...
Nätverk fungerar bäst så länge man respekterar dessas integritet och sin egen. Är det inte så att vi behöver en privat sfär och att denna kanske i första hand består av våra vänner? Blottningskulturen på Internet har gått för långt.

Posted by hakank at 05:39 EM Posted to Social Network Analysis/Complex Networks | Comments (1)

Bokus första vinst

Som rapporterats tidigare gick Bokus med vinst 2003, ungefär en miljon.

Dagens Handel skriver i artikeln Bokus första vinst även om en förändring i kundsammansättningen:

I början var det mest män i en viss ålder, så kallade early adopters, säger [Anders] Ringnér. - Nu är det fler kvinnor och äldre. Traditionella bokköpare. Vi jobbar på att sajten ska bli bättre och ge en riktig bokhandelskänsla.

Via nyhetsbrevet Shop@ där Henrik Torstensson är redaktör.
Se t.ex. det aktuella nyhetsbrevet.

Posted by hakank at 11:40 FM Posted to Böcker

Infontology

Om ni inte har insett det så pingar inte Infontology sina anteckningar till weblogs.se, utan man får manuellt (eller annorledes) bevaka nyheterna där.

T.ex. kom det nyss en intressant betraktelse i "Felet med Gud är att det inte går att ladda ner honom." och häromdagen skrevs Informationsöverflöd och demokrati.

Posted by hakank at 10:08 FM Posted to Blogging

Deep Web

Salon-artikeln In search of the deep Web handlar om Deep Web, dvs den del av webben som sökmotorerna av olika skäl inte kommer åt.

The next generation of Web search engines will do more than give you a longer list of search results. They will disrupt the information economy.
...
Those of us who place our faith in the Googlebot may be surprised to learn that the big search engines crawl less than 1 percent of the known Web. Beneath the surface layer of company sites, blogs and porn lies another, hidden Web. The "deep Web" is the great lode of databases, flight schedules, library catalogs, classified ads, patent filings, genetic research data and another 90-odd terabytes of data that never find their way onto a typical search results page.
...
As new search spiders penetrate the thickets of corporate databases, government documents and scholarly research databanks, they will not only help users retrieve better search results but also siphon transactions away from the organizations that traditionally mediate access to that data. As organizations commingle more of their data with the deep Web search engines, they are entering into a complex bargain, one they may not fully understand.

I artikeln står inte så mycket om begreppet Deep Web, så här är några länkar för vidare läsning.

Undersökningen som refereras till gjordes 2001. Det vit-papper som då skrevs
är Deep Web White Paper (PDF).

InternetBrus.com skrev tidigt (15 apr 2001) en svensk summering om "den osynliga webben" i Chris Sherman, Gary Price: The Invisible Web.

En senare sammanfattning finns i The Deep Web".

För den som gillar sådant, finns det även en typisk slashdot-diskussion med anledning av Salonartikeln.


(Inspiration från Simon Winter på Infontology.)

Posted by hakank at 09:57 FM Posted to Sökmotorer

Hur nyheter sprids på Internet

Stephen VanDyke How News Travels on the Internet har gjort en analys av - och den fina bilden nedan - hur den internationella bloggosfärens nyheter (eller memer) sprids, samt har exempel på de olika sajterna/bloggarna i denna spridning. De olika spridningstyperna är:

* Dark Matter
* MetaNews
* Greater Blogosphere
* Lesser Blogosphere
* Blog Indexing
* Traditional “Big” Online Media
* Offline Media

Det skulle vara intressant att se en liknande analys över den skandinaviska bloggosfären. Flera av källorna skulle säkert vara de samma (såsom Slashdot, BoingBoing, Google News etc), men det finns ju även geniun nyhetsbevakning här både vad gäller inhemsk respektive internationella nyheter. Any takers?



Se även
Wired Warning: Blogs Can Be Infectious
Wired: The Blogfather's Hit List, intervju med Glenn Reynolds (Instapundit) där han nämner "Dark Matter"
danah boyd: gossip & news spread in blogs
Network-Centric Advocacy: Blogs | Gossip | Advocacy.

Posted by hakank at 09:32 FM Posted to Blogging | Memetik

mars 14, 2004

Engelska nyheter i skrift och tal

Följande fråga spordes mig av en nära anförvant.

Är det någon som känner till någon bra engelskspråkig nyhetssajt som har samma nyheter både i skrift och tal? Dvs som Ekot fast på engelska; amerikansk eller brittisk variant spelar ingen roll.

Uppdatering
En sådan har hittats. Se Engelska nyheter i skrift och tal: Voice of America.

Posted by hakank at 01:35 EM Posted to Diverse | Comments (2)

Fler sociala nätverkskurser -- Eller: När fel kan bli intressant

Den väldigt nya bloggen Random digressions from a man with big hair har hittills endast tre anteckningar, samtliga om sociala nätverk och relaterade ämnen.

Normalt skulle jag endast lägga in bloggen i Bloglines för vidare bevakning, men dess tagline How to get an A in 208B gjorde mig lite nyfiken. Vad är "208B" för någon kurs?

Den första googleförekomsten är SOCIOL 208B LEC 1: Social Network Methods som verkar skoj. Full med länkar och datamängder. Se även föreläsarens Rick Grannis hemsida.

Nu tror jag inte att det var denna kurs som bloggen refererar till. Troligen är det i stället INFOSYS 208B: Analysis of Information Organizations, men den sidan har inte alls lika mycket intressant information.

Bloggaren heter David Schlossberg vars hemsida themeat.org kan bjuda på saker såsom Guide to Slacking. Citat: Slacking is the skill of making it seem like you're doing your job when you're not. I say "skill" and not "art" because this is something that you can train to do, not something that you're born with..


Uppdatering
Till slut hittades också en betydligt mer intressant kurssida: IS 208B Analysis of Information Organizations, där det även finns blogg assigments, vilka ovanstående är exe

Det finns en anhopning slika bloggar:

Sarah Ellinger, 208B Social networking like a MACHINE
Jeannie's Blog
sindikk.aeshin
Prickly Monkey Yuppie Foxy
my crazy social networking [we]blog
vmakam A blog for a class at Berkeley for Digital Social Networks
danah's 208B weblog
shelby Blog for Infosys 208B assignments and reading responses.
Musings of a Information Management Drama Queen
Not Quite a blog
brooke's 208 webrant
Shane Ahern IS 208B
CULTURAL.CA Reflections on culture from a Canadian-born Chinese studying in the United States
mspring
cdclph

Här är en lista på (vissa av) deltagarna i kursen.

Posted by hakank at 11:34 FM Posted to Social Network Analysis/Complex Networks | Comments (2)

Råd till unga forskare

William Tozier (Notional Slurry) skriver i A brief and hopefully helpful (but certainly cathartic) note to those submitting manuscripts for presentations at technical conferences on agent-based systems, evolutionary algorithms, complex systems or artificial life några råd kring forskning inom, ja, de nämnda områdena och troligen annan forskning.


Via Cosma Shalizi (Three-Toed Sloth), vars fantastiska Notebooks nu fått RSS-flöde.

Posted by hakank at 08:05 FM Posted to Diverse

mars 11, 2004

Hur använder ni weblogs.se:s bevakningar? - En rundfråga

Chadie och jag har en pågående e-fika där vi bland annat diskuterar weblogs.se:s mest bevakade bloggar ("20-i-topp-listan"). Listan har - med viss rätt - kritiserats för att den är för konservativ och det är svårt för nyare bloggar att komma in.

Själv tycker jag att listan är bra eftersom den ger möjlighet för nya bloggskrivare/-läsare att få en översikt över de bloggar som läses mest. Det är också ett bra sätt att få reda på om det är någon fantastisk blogg som man totalt missat.

Bevakningarna har ju den dubbla funktionen att både vara grund för själva bevakningen (via "Lista favoriter"), samt ett sätt att visa för världen att det är en favorit, dvs rösta in på 20-i-topp-listan.

En fråga som har inställt sig är hur många det egentligen är som aktivt använder weblogs.se:s bevakningar, liksom hur man faktiskt använder denna funktion. Är det som bevakning eller inröstning på 20-i-topplistan, både och, eller kanske något tredje sätt som inte nämnts?

Det finns flera som - liksom jag - kombinerar weblogs.se-bevakningar med bevakning via RSS-verktyg (t.ex. Bloglines). Alla svenska bloggar har tyvärr inte stöd för RSS, så de bevakas ju via weblogs.se. Men hur är det med de svenska bloggar som har RSS, bevakar ni även dem via weblogs.se?

För att summera: På vilket sätt använder ni weblogs.se:s bevakning, favoriter samt 20-i-topp-lista? Om ni även använder andra bevakningsverktyg, hur kombinerar ni dem? Ni får gärna besvara privat via mail om det passar bättre.


Mina egna svar på detta är:
Bloglines och weblogs.se är de två verktyg jag huvudsakligen använder för daglig omvärldsbevakning. För bevakning av de svenska bloggarna används främst weblogs.se eftersom den ger en sekundsnabb spegling av vilka bloggar som har uppdaterats. Bloglines pollar endast en gång i timmen, och så länge kan man ju inte vänta. :-)

Weblogs.se används också som ett sätt att rösta på mina favoritbloggar så även bloggar med RSS finns med. Jag är rätt snabb att lägga till svenska bloggar som jag tycker verkar intressanta. Däremot tar det betydligt längre tid att ta bort dem från listan.

Vad gäller 20-i-topp-listan går jag numera in där dagligen, till stor del för att kontrollera mina spådomar. (Version noll kom in på listan häromdagen.)

F.ö. används fortfarande programmet hakanks favoriter för själva bevakningen, främst för att det blir tydligare (rödmarkerat) vilka uppdateringar som gjorts. [Teknisk not: Programmet läser favorites.js-filen som väl oftast används för bloggrullarna. Skulle någon till äventyrs vara intresserad av detta program är det bara att säga till. Det finns både i Perl och PHP.]

Posted by hakank at 09:35 FM Posted to Blogging | Comments (8)

mars 10, 2004

Orkut DNS-problem

Till mina Orkut-vänner

Det verkar som om Orkut just nu har problem med DNS:en. Det funkar dock att komma in via IP-nummret direkt http://66.28.250.19/Home.aspx.

Det finns en liten diskussion om detta problem i samfälligheten Orkut Design.

Uppdatering
Sorry, mitt första förslag var inte riktigt korrekt och är nu ändrat till en variant som verkar funka bättre.


Uppdatering 2
Nu fungerar det igen som vanligt.

Posted by hakank at 12:56 EM Posted to Diverse

Norsk bloggare som (eventuellt) ska forska i bloggar

Mari på Maris blogg skriver att hon överväger (om jag nu tolkar "vurderar å" korrekt) att göra en masteroppgave om bloggar:

Vurderer å skrive om blogging og de sosiale aspektene omkring. Hvorfor blir man så "avhengig" og hva er motivasjonen for å blogge? Tror en intervju/spørreundersøkelse av et antall mer eller mindre aktive bloggere kan utgjøre et materiale for videre undersøkelser.

Mari presenterar sig själv på följande sätt: Jeg studerer medievitenskap på UIO [Seksjon for humanistisk informatik] og skriver om film, blogging, nyheter, kunst og ting jeg ellers tenker på!

Förhoppningsvis kommer det att bli mer framgent i kategorin Masteroppgave.

(Via Maris ping till min anteckning Mer forskning om bloggning.)

Posted by hakank at 09:23 FM Posted to Blogging

Dokument inom komplexa nätverk

Via den innehållsrika länksidan SPIDER (Social Psychology of Information Diffusion - Educational Resources) hittades kursen Networks, där det finns en rad intressanta dokument om komplexa nätverk, bl.a. några kapitel från Duncan Watts bok Six Degrees: The Science of a Connected Age. Watts bok är en av de bästa inom forskningen av komplexa nätverk. Se en kort recension av denna och andra liknande böcker på Social Network Analysis och Complex Networks - En liten introduktion.

Stanna även till ett slag på SPIDER-sidan. Där finns pekare till många andra läsvärda sajter.

Posted by hakank at 08:00 FM Posted to Social Network Analysis/Complex Networks

mars 09, 2004

DN om Tai Chi

Chadie pekade påpassligt på DN:s två artiklar om Tai Chi Chuan.

Tai chi bevisat bra för hälsan
Kinesisk folkgympa förbättrar hjärthälsa, balans och rörlighet hos äldre. Det visar en vetenskaplig analys av ett femtiotal studier om tai chi.

Tai chi är ett säkert och effektivt sätt att höja den fysiska prestationsnivån och förbättra koordinationsförmågan. Övningarna sänker blodtrycket, ökar syreupptagningsförmågan och ger bättre balans, styrka och rörlighet.

Det är några av de hälsovinster som redovisas i ett femtiotal olika studier om den traditionella kinesiska gymnastiken. En utvärdering av forskningsrapporterna publiceras i tisdagens nummer av medicintidskriften Archives of Internal Medicine.

"På tio minuter mår jag bättre"
En privatlärare i Kina lärde Annali Andersson tai chi. Träningen ser hon som en nyckel till sitt eget välmående.

Uppdatering
Fler artiklar om ovanstående (via Bloglines utmärkta bevakning).
The Herald: Chinese puzzle of why tai chi is good for you
news.telegraph: Tai chi exercise 'can help ill and elderly'
BBC News: Tai Chi 'improves body and mind'
VOANews.com: Boston Doctors Find Health Benefits of Chinese Martial Art Tai Chi (artikeln även i RealAudio)


Se även kategorin Tai Chi Chuan samt min sida med länkar och lite mer information.

Posted by hakank at 08:52 FM Posted to Tai Chi Chuan | Comments (1)

mars 07, 2004

Science Fiction som samhällskritik

Radioprogrammet OBS har sedan januari haft en serie "Science Fiction som samhällskritik". Till dags dato har det blivit 9 program. Några exempel (beskrivningarna från sajten):

1) Ett samtal med SF-kännaren John-Henri Holmberg, om en litteratur som ställer viktiga frågor om vår samtid och vår framtid.
...
5) Bo Lindblom har läst om Isaac Asimov och funnit intressanta samband till en visst terroristiskt nätverk.
6) Maria Nilsson undersöker könsstereotyperna.

Håller just nu på att lyssna igenom programmen.

Via Frippeville, via Fan span.

Posted by hakank at 07:01 FM Posted to Böcker | Comments (1)

mars 06, 2004

Myror i rusningstid

I Nature-artikeln Ants avoid traffic jams berättas om myrors lösning på trafikstockningar: knuffa undan andra myror på en annan väg.

When it comes to traffic congestion, ants prefer the no-nonsense approach - they barge others out of the way, forcing them to take an alternative route.
...
[P]roblems can arise when too many ants try to use the route, says Vincent Fourcassié of the Université Paul Sabatier in Toulouse, France. His team found that ants are surprisingly good at avoiding congestion, simply by shoving each other off the main highway and on to back streets.


Det finns praktisk nytta med dessa studier.


Similarly simple rules could be used to manage the flow of data through networks such as telephone systems, says Peter Bentley, a computer scientist at University College London. "Congestion is a big issue," he says. "You have to work out the best route for data."

Many scientists rely on the behaviour of ants or other natural systems to give them clues as to how to design computer systems that avoid overcrowded networks.


Trots detta ska vi vara snälla mot varandra i trafiken.


Papret som refereras är Audrey Dussutouri, Vincent Fourcassié, Dirk Helbing Jean-Lous Deneubourg: Optimal traffic organization in ants under crowded conditions. Tyvärr har ingen publikt tillgänglig källa hittats. Ett kort abstrakt finns här.


Se även t.ex. den tidigare blogganteckningen Simulering av "Vågen", trafikfenomen och Crowd Dynamics

samt följande hemsidor
Vincent Fourcassié (fransk text)
Dirk Helbing
Jean-Lous Deneubourg som är en av medförfattarna till den fascinerande boken Self-Organization in Biological Systems (Amazon-länk).
Peter Bentley, författare bland annat till (den ännu inte lästa) Digital Biology.

Posted by hakank at 12:31 EM Posted to Komplexitet/emergens

mars 05, 2004

Orkut - ett spel?

Mer Orkut- och topplistetrivia.

En connector i Orkut är de personer med lägst average path, dvs har
kortast väg till samtiliga av sina vänner i vän-nätverket. I går lyckades två svenskar, bland annat "vår egen" Gunnar R. Johansson på gunnar.net, ta sig in på listan över connectors. Samtidigt knuffades de tidigare mest kopplade personerna (t.ex. Joi Ito, Marc Cantor) ned av något mindre välkända personer. Troligen beror detta på att Orkut har ändrat sin algortitm för att räkna ut average path.

danah boyd skriver lite mer om detta i gaming Orkut connectors.

Är Orkut bara ett spel?

Tack Wille för påpekandet om svenskarnas intrång på listan.

Posted by hakank at 07:53 FM Posted to Social Network Analysis/Complex Networks

mars 04, 2004

Do you "google"?

I First Monday-artikeln Do you "google"? Understanding search engine use beyond the hype diskuterar Eszter Hargittai sökmotorer och några förvirringar kring dessa.

Abstract
Much anecdotal evidence suggests that Google is the most popular search engine. However, such claims are rarely backed up by data. The reasons for this are manifold, including the difficulty in measuring search engine popularity and the multiple ways in which the concept can be understood. Here, I discuss the sources of confusion related to search engine popularity. It is problematic to make unfounded assumptions about general users’ search engine choices because by doing so we exclude a large number of people from our discussions about systems development and our understanding of how the average user finds information online.


Se även
Författarens blogg: Eszter's Blog.

Brian Livingston Google Grumbles som kritiserar google för att ha förlorat relevans jämfört med andra sökmotorer.


Andra FirstMonday-artiklar denna månad. T.ex.
William Jones Finders, keepers? The present and future perfect in support of personal information management

Posted by hakank at 08:30 EM Posted to Sökmotorer

En spådom: The II

I Weblogs.se 20-i-topp-lista: En spådom spåddes vilken blogg som snart skulle komma in på swelogs.se:s mest bevakade bloggar.

Man kan notera att blog.hertze.com nu finns med på denna lista. Kul! Det är en intressant blogg.

Den aktuella spådomslistan är:
Version noll (12)
Life de Luxe (11)
När jag ändå har ordet..., (10)
I hastigt mod (10)
Annas blog (9)
Månhus Beta (9)

Siffrorna inom parentes är ett tal som antyder sannolikheten att komma in på listan. Det blev sex stycken p.g.a. de många delade platserna.

Posted by hakank at 10:18 FM Posted to Blogging

mars 03, 2004

Brottslighet och power laws

Naturartikeln Criminals follow laws of statistics (Philip Ball) handlar om forskning kring den statistiska fördelningen av antal brott som begås av en och samma person.


The best way to combat casual crime is not to search for persistent offenders but to deter people from committing their first crime.

So say researchers at the London-based company Volterra Consulting who have studied the statistics of criminal acts. "The single most important thing is to persuade people not to commit a crime in the first place," says Paul Ormerod of the Volterra team.


Angående den något självklara slutsatsen att man stoppar brottslighet (i det långa loppet) om man förhindrar det första brottet står det följande:


It might seem obvious that the way to cut crime is to stop people from doing it. But their recommendations contrast with some common approaches to crime prevention.

The practice of rooting out key individuals in crime networks might be effective in dealing with large-scale organized crime, says Ormerod, but it will probably not affect casual crime of the sort committed by bored or frustrated young men, which is by far the most prevalent type of criminality.


Forskarna trodde att de skulle hitta en normalfördelning i antal brott per person, men hittade i stället power laws, dvs att många personer begår inga eller få brott medan ett fåtal personer begår många brott.


Instead they found that that crime rates fell into a mathematical pattern called a power law, in which large deviations from average behaviour are more common. In both studies, most of the boys committed no crimes at all. In the Pittsburgh study, quite a few boys reported over 1,000 criminal acts during the study period, while the average number was just 90.

Physicists often find power-law statistics in systems with many interacting parts. This suggests that the young boys in the study are not responding randomly and independently to criminal opportunities that come their way. Instead they are probably influencing one another, presumably through strong peer pressure.


Papret som refereras är
William Cook, Paul Ormerod, Ellie Cooper: Scaling Behaviour in the Number of Criminal Acts Committed by Individuals

Abstract:
We find subtle deviations from power law behaviour in the number of crimes committed by individuals, analysing the two main criminology databases which track this behaviour, the Pittsburgh Young Offenders survey and the Cambridge UK Study in Delinquent Development. The description of the data when the number of boys committing or reporting zero crimes are excluded is different from that when they are included. The crucial step in the criminal progress of an individual appears to be committing the first act. Once this is done, the number of criminal acts committed by an individual can take place on all scales.


Se även
Volterra Consulting
Paul Ormerod som bland annat skrivit den trevliga boken Butterfly Economics : A New General Theory of Social and Economic Behavior. Ormerod nämndes f.ö. i Physics of Society som handlar om Philip Balls kommande bok.


Sist i Statistikknarkande: Antal webb-besökare och power law finns referenser till mer information om power laws.


Uppdatering
Sydsvenskan skriver också om detta i Kriminella helt åtskild grupp.

Posted by hakank at 12:57 EM Posted to Komplexitet/emergens | Comments (2)

mars 02, 2004

Wiki: Inriktat (Teman i skönlitteratur)

I Efterlysning: Sajt för teman i skönlitteratur efterfrågades en sajf för olika typer av teman i skönlitteratur.

Tills en sådan hittas har jag skapat en Wiki: Inriktat, med den engelska undertiteln Non Fiction Themes in Fiction Books, som är lite mjukare än det svenska "Facklitteraturtema i skönlitteratur". I och för sig låter "Sakprosetema i normalprosa" riktigt fint, ehuru något högtidligt.

Wikin installerades i går, och texterna har hittills varit skrivna av mig.

Hittills har diskussioner kring systemet förts i Orkut-samfälligheten Dubbelriktat.
(Man måste bli inbjuden för att bli Orkut-medlem. Om du känner mig, men ännu inte är medlem i Orkut får du gärna höra av dig. Min mailadress är hakank@bonetmail.com. Eller kontakta din närmsta Orkut-vän.)

En del av mina texter därifrån finns även på Wikin, tills vidare på sidan WikiTankar. På samma sida finns funderingar, frågor, och en och annan förklaring hur jag har tänkt mig systemet.

Ni får gärna lägga till och ändra sidor. Det finns alltså inte så mycket ännu, så det är bara att fylla på. Jag vet inte riktigt hur systemet kommer att bli eller organiseras och tänker inte vara någon strikt tankepolis. Förhoppningsvis kommer vi gemensamt upptäcka det (eller de) bästa arbetssättet efter hand.

Är du en van Wiki-skribent bör det inte vara några problem att komma igång direkt. Tips för något mindre Wiki-vana finns t.ex. på följande sidor:
Help for Beginners
HelpContents
Help on Editing.

Den sida som kallas för SandBox är en utmärkt plats för att lära sig redigera sidor.

Välkommen in till Inriktat!

Posted by hakank at 06:00 EM Posted to Böcker | Comments (2)

Bridging the Gap: A Genre Analysis of Weblogs

Bridging the Gap: A Genre Analysis of Weblogs.

Abstract
Weblogs (blogs) — frequently modified web pages in which dated entries are listed in reverse chronological sequence — are the latest genre of Internet communication to attain widespread popularity, yet their characteristics have not been systematically described. This paper presents the results of a content analysis of 203 randomly-selected weblogs, comparing the empirically observable features of the corpus with popular claims about the nature of weblogs, and finding them to differ in a number of respects. Notably, blog authors, journalists and scholars alike exaggerate the extent to which blogs are interlinked, interactive, and oriented towards external events, and under-estimate the importance of blogs as individualistic, intimate forms of self-expression. Based on the profile generated by the empirical analysis, we consider the likely antecedents of the blog genre, situate it with respect to the dominant forms of digital communication on the Internet today, and advance predictions about its long-term impacts.

Via Anjo Anjewierden via Mathemagenic.

Posted by hakank at 08:39 FM Posted to