« januari 2007 | Main | mars 2007 »

februari 22, 2007

Länkar 20070222

Notationssystem
Pasta and vinegar: How to write gestures and movements, om olika notionssystem för gester och rörelser.

nicolas novas förklaringar varför han bloggar om en speciell sak, dvs "Why do I blog this?", är eftersträvansvärda. Således: Det är fascinerande med notiationssystem för mundäna saker.


Reguljära uttryck
A Neighborhood of Infinity: Modular arithmetic with regular expressions sätter tänderna i följande problem:


Problem: Find a regular expression, compatible with GNU grep, that recognises strings of 1's and 0's that form the binary expansion of multiples of 7.


Ambigram
3-D Ambigram Generator
Se även About (om sajten, där "ambigram" förklaras.)

Och varför inte kolla in Scott Kim och dennes Inversions när vi ändå håller på.
Det verkar - apropå det - som om det finns en generation (eller två) utvecklare ("geekar") som inte läst (eller ens känner till) den fantastiska boken Gödel, Escher, Bach. Den gjorde bl.a. självreferenser till ett populärt salongsämne, men handlar även om allt annat. Mer om boken finns att läsa här.

Apropå regexpar: Lambda the Ultimate Regular Expression Matching Can Be Simple And Fast


Data mining och terrorism
Jeff Jonas: Effective Counter-Terrorism and the Limited Role of Predictive Data Mining


The key point of our paper is that the form of data mining which uses historical incident data to determine a pattern … then using this pattern to predict a future event is not helpful in the terrorism context because there isn’t enough historical data to derive a meaningful and statistically reliable pattern. Thus, we settled on the term "predictive data mining" to differentiate what we were characterizing as ineffective from many other effective uses.

Detta angående ett paper som Jonas och Jim Harper skrivit: Effective Counterterrorism and the Limited Role of Predictive Data Mining (PDF).

Via bl.a. Data Mining Research, som kommenterar med följande:


I think that we need to distinguish between the usefulness of data mining for terrorism (i.e. can we extract meaningful knowledge from data) and the possibility to use it in everyday life (i.e. is it effective, too expensive, not ethical?). In the paper, authors only argue that data mining for terrorism waste time and money. Although they have good arguments, they are not directly related to technical aspects of data mining.

Cf TheStar Thinking like the 'bad guys' the aim of university project (länk från ovan).


Change blindness
Wikipedia: Change blindness:

Change blindness is a phenomenon in visual perception where apparently large changes within a visual scene are undetected by the viewer. Typically for change blindness to occur, the change in the scene has to coincide with some visual disruption such as an eye movement or a brief obscuration of the observed scene or image.

Mixing Memory Coolest... Experiment... Ever berättar om ett berömt experiment kring detta.

Se även
Change Detection Database
The Need for Attention to See Change med andra exempel.

Posted by hakank at 08:48 EM Posted to Diverse vetenskap | Comments (1)

februari 19, 2007

Den som ändå bodde kring Uppsala: 1 mars pratar Persi Diaconis om matematik och trolleri

Den 1 mars 2007 är det Celsius-Linneföreläsning å Uppsala Universitet. Celsius-föreläsningen är Persi Diaconis som föreläser om Mathematics and magic tricks

bulletin.se-notisen Trollkonster och empatiska djur på årets Celsius-Linnéföreläsningar beskriver ner:


Celsiusföreläsningen hålls av Persi Diaconis, professor i statistik och matematik vid Stanford University. Diaconis har använt matematiken för att utveckla magiska trick, och är bland annat känd för att ha bevisat att en vanlig kortlek måste blandas sju gånger för att vara ordentligt blandad. Sättet på vilket magiska trick fungerar är minst lika fascinerande som tricken själva, menar han, och kommer att visa detta bland annat genom att demonstrera några trick.

Är det någon besökare som vill ta anteckningar och publikt (eller privat) delge dem?


(Det finns fler Linnéevenemang.)

Posted by hakank at 05:57 EM Posted to Husgudar | Matematik | Trolleri, magi etc | Comments (4)

februari 16, 2007

Ansikten: länkar 20070216

Det blev visst mest om ansikten idag.

New York Times: Faces, Faces Everywhere


Why do we see faces everywhere we look: in the Moon, in Rorschach inkblots, in the interference patterns on the surface of oil spills? Why are some Lay’s chips the spitting image of Fidel Castro, and why was a cinnamon bun with a striking likeness to Mother Teresa kept for years under glass in a coffee shop in Nashville, where it was nicknamed the Nun Bun?

...

Dr. Sinha of M.I.T. says that whether the hair-trigger response to faces is innate or learned, it represents a critical evolutionary adaptation, one that dwarfs side effects like seeing Beelzebub in a crumpled tissue.

Pawan Sinha

Mind Hacks: Faces, faces everywhere

The Face Clouds

Cognitive Daily: Why we see faces when they're not really there (with poll!)


Wikipedia: Apophenia: Apophenia is the experience of seeing patterns or connections in random or meaningless data.
Wikipedia: Pareidolia: Pareidolia [...] describes a psychological phenomenon involving a vague and random stimulus (often an image or sound) being mistakenly perceived as recognizable.


Mind Hacks: Beauty and the average girl, Average girls are hot

Seed Magazine: Beauty is in the processing time of the beholder: Prototypical faces are pleasing because they're easy for the brain to process.
Piotr Winkielman, Prototypes are attractive because they are easy on the mind (PDF)

Face Research

Figurer i moln


Här passar det utmärkt att länka till det trevliga Malmöföretaget Polar Rosesom specialicerat sig på ansiktsigenkänning.


The web is increasingly becoming visually oriented, progressing from text to photos and other rich media. Close to 10 million new photos are uploaded on a daily basis, a number which is doubling every eight to ten months.

Photos tell many stories, but unlike text, the context of a photo is hard to search for unless explicitly "translated" by a human being. The photo web of today is like the text web before Altavista, Inktomi, and Google.

Polar Rose makes photos searchable by analyzing their content and recognizing the people in them.

Polar Rose blog.

Posted by hakank at 06:25 EM Posted to Diverse vetenskap | Machine learning/data mining | Comments (2)

februari 11, 2007

Några länkar om dataanalys, data mining etc 20070211

Statistical Modeling, Causal Inference, and Social Science
The fallacy of the one-sided bet (for example, risk, God, torture, and lottery tickets)
Animated Social Network Visualization


Data Mining Research
Data mining application: terrorism, som även tipsar om en ny bok Data Mining and Predictive Analysis: Intelligence Gathering and Crime Analysis (ISBN: 075067796) skriven av Colleen McCue .


Geeking with Greg
Excellent data mining lecture notes tipsade för länge sedan om kursen CS345, Autumn 2006: Data Mining. Där finns en mängd presentationer av metoder.


Cognitive Daily
Is 17 the "most random" number?
Randomness wrap-up


Nyupptäckta bloggar i ämnet
Data Mining Research tipsade även om en ny blogg Crime Analysis and Data Mining: A meeting place for those interesting in analyzing or solving crimes using Predictive Analytics!, se presentationen.

Data Mining in MATLAB

Posted by hakank at 10:37 FM Posted to Machine learning/data mining | Statistik/data-analys

februari 04, 2007

Experimentellt tillägg i "Visa ordklasser": endast suffixgissning

En mailfråga som gäller något relaterat gjorde att programmet Visa ordklasser (presenterades i Svenska ordklasser samt gissning med hjälp av ordsuffix) nu har utökats med den experimentella funktionen Använd endast suffix för klassifikation, som försöker att klassificera ordklass helt utifrån ordens suffix, utifrån den lista som finns i suffixes1-4.txt.

Utan att ha gjort någon större undersökning kring funktionen kan berättas att det inte blir speciellt bra.

Frasen Sjön har sina källor ganska långt upp i norr och där är ett härligt land för en sjö testades. (För vidare bakgrund till frasen, se här.)

I standardläge (dvs klassifikationen görs endast med uppslag i ordlista) blir det följande resultat:

sjön<substantiv:bestämd form singularis> har<verb:presens> sina<pronomen|verb:infinitiv|verb:imperativ> källor<substantiv:obestämd form pluralis> ganska<adverb> långt<adjektiv:positiv neutrum|adverb> upp<adverb> i<preposition|adverb> norr<adverb> och<konjunktion> där<adverb> är<verb:presens> ett<räkneord> härligt<adjektiv:positiv neutrum> land<substantiv:obestämd form singularis|substantiv:obestämd form singularis|substantiv:obestämd form pluralis> för<verb:presens|verb:imperativ|substantiv:obestämd form singularis|preposition|konjunktion|adverb> en<räkneord|substantiv:obestämd form singularis|pronomen> sjö<substantiv:obestämd form singularis>


Med Använd endast suffix för klassifikation blir resultatet följande något nedslående. Alla möjliga varianter visas, sorterade efter antal förekomster i den ordlista som utgåtts ifrån. T.ex. klarar denna variant inte av att klassificera "sina". Ett framtida projekt vore att utöka antal tecken i suffixen. Samt naturligtvis även att göra en mer vetenskapsliknande undersökning hur bra denna metod är.


sjön<OKÄNT|n substantiv:bestämd form singularis(15411)|n substantiv:bestämd form pluralis(2767)|n substantiv:obestämd form singularis(1418)> har<OKÄNT|r substantiv:obestämd form pluralis(12206)|r verb:presens(5417)|r substantiv:obestämd form singularis(1339)|ar verb:presens(4446)|ar substantiv:obestämd form pluralis(4394)|r substantiv:obestämd form pluralis(12206)|r verb:presens(5417)|r substantiv:obestämd form singularis(1339)> sina<OKÄNT|na substantiv:bestämd form pluralis(13741)|a substantiv:bestämd form pluralis(13743)|a adjektiv:bestämd form(10374)|a adjektiv:pluralis(10335)|a verb:infinitiv(5005)|a verb:imperativ(4170)|a substantiv:obestämd form singularis(1648)> källor<OKÄNT|or substantiv:obestämd form pluralis(1641)|r substantiv:obestämd form pluralis(12206)|r verb:presens(5417)|r substantiv:obestämd form singularis(1339)> ganska<OKÄNT|ska adjektiv:bestämd form(2659)|ska adjektiv:pluralis(2659)|ka adjektiv:bestämd form(2751)|ka adjektiv:pluralis(2750)|a substantiv:bestämd form pluralis(13743)|a adjektiv:bestämd form(10374)|a adjektiv:pluralis(10335)|a verb:infinitiv(5005)|a verb:imperativ(4170)|a substantiv:obestämd form singularis(1648)> långt<OKÄNT|gt adjektiv:positiv neutrum(4337)|t adjektiv:positiv neutrum(10844)|t verb:supinum(5374)|t substantiv:bestämd form singularis(4404)|t substantiv:obestämd form singularis(2686)|t verb:perfekt particip, neutrum(1684)> upp<OKÄNT> i<OKÄNT> norr<OKÄNT|r substantiv:obestämd form pluralis(12206)|r verb:presens(5417)|r substantiv:obestämd form singularis(1339)> och<OKÄNT> där<OKÄNT|r substantiv:obestämd form pluralis(12206)|r verb:presens(5417)|r substantiv:obestämd form singularis(1339)|r substantiv:obestämd form pluralis(12206)|r verb:presens(5417)|r substantiv:obestämd form singularis(1339)> är<OKÄNT|r substantiv:obestämd form pluralis(12206)|r verb:presens(5417)|r substantiv:obestämd form singularis(1339)|r substantiv:obestämd form pluralis(12206)|r verb:presens(5417)|r substantiv:obestämd form singularis(1339)> ett<OKÄNT|t adjektiv:positiv neutrum(10844)|t verb:supinum(5374)|t substantiv:bestämd form singularis(4404)|t substantiv:obestämd form singularis(2686)|t verb:perfekt particip, neutrum(1684)|t adjektiv:positiv neutrum(10844)|t verb:supinum(5374)|t substantiv:bestämd form singularis(4404)|t substantiv:obestämd form singularis(2686)|t verb:perfekt particip, neutrum(1684)> härligt<OKÄNT|ligt adjektiv:positiv neutrum(1429)|igt adjektiv:positiv neutrum(4258)|gt adjektiv:positiv neutrum(4337)|t adjektiv:positiv neutrum(10844)|t verb:supinum(5374)|t substantiv:bestämd form singularis(4404)|t substantiv:obestämd form singularis(2686)|t verb:perfekt particip, neutrum(1684)> land<OKÄNT|d verb:perfekt particip, utrum(1400)> för<OKÄNT|r substantiv:obestämd form pluralis(12206)|r verb:presens(5417)|r substantiv:obestämd form singularis(1339)|r substantiv:obestämd form pluralis(12206)|r verb:presens(5417)|r substantiv:obestämd form singularis(1339)> en<OKÄNT|en substantiv:bestämd form singularis(12046)|en substantiv:bestämd form pluralis(2764)|n substantiv:bestämd form singularis(15411)|n substantiv:bestämd form pluralis(2767)|n substantiv:obestämd form singularis(1418)|en substantiv:bestämd form singularis(12046)|en substantiv:bestämd form pluralis(2764)|n substantiv:bestämd form singularis(15411)|n substantiv:bestämd form pluralis(2767)|n substantiv:obestämd form singularis(1418)> sjö<OKÄNT>


Posted by hakank at 06:52 EM Posted to Språk | Comments (3)

Ultimate Research Assistant (Web Edition)

Ultimate Research Assistant (Web Edition) är en trevlig (men tyvärr långsam) applikation för att sammanställa sökresultat på ett mer intelligent sätt än de sökmotorerna. Systemet listar ut fraser som anses vara signifikanta för sökordet och visar representativa sajter

Exempel: sökning på "blogg" ger följande nyckelord.

Av ovanstående fraser anses denna blogg vara representativ för flera: "att det", "jag har", "att jag", "om det", "det som", "om man", "som jag". Vilket kan få en att undra...

Vad gäller urvalet av fraser kan man möjligen anta att stackarn blivit förvirrad av innehållet av de 50 första sökresultaten av "blogg" på Yahoo!, eller så är det helt enkelt att - som det heter på julafton - att "Tony förstår inte språket så bra". Intressant nog finns "Climat Change" med, en het potatis i både inom och utanför bloggvärlden.

Sökningar på mer stringenta fackfraser såsom "text mining" (som råkar vara den teknik som Ultimate Research Assistant använder) och "Diaconis" (en husgud som ofta används för testning av sökverktyg) ger betydligt bättre resultat och känns användbart.

Man bör dock notera den brasklapp som står på sajten: It is an experimental proof-of-concept prototype, and should not be used for any official purposes.


Se vidare
Andy Hoskinson:
Creating the Ultimate Research Assistant där tekniken bakom verktyget förklaras.

Samme Hoskinson har även skapat verktyget Keyword Analysis Tool - Advanced Keyword and Keyphrase Extraction Technology for Content Analysis and Search Engine Optimization (SEO).

Wikipedia: Text mining

Tyvärr koms det här även att tänkas på 200 dagar som bl.a. visar förekomsterna av ord på hakank.blogg där ordet "jag" kom på fjärde plats, samt "jag" i bloggen där vidare språkanalyser genomfördes.


(Verktyget funnet via webbserverloggen.)

Posted by hakank at 05:46 EM Posted to Språk | Statistik/data-analys | Comments (4)

Smånotiser 20070204

Posted by hakank at 11:06 FM Posted to Diverse vetenskap

februari 02, 2007

Meddelanden från ledningen (nej, det är inte att jag tar bort kommenteringsmöjligheterna igen, utan andra saker)

Några saker om bloggfunktionerna här.

1) Jag har tagit bort möjligheten till "Subscribe to this Comment" eftersom det ändå inte funkade. Det var en gammal och härkesfull sak som jag helt glömt bort att komma ihåg att ta bort.

2) Under några dagar så fick jag inte mail om inkomna kommentarer , så kommentarer som skrevs häromdagen har inte upptäckts förrän för en stund sedan. Troligen har denna incident ett samband med punkt 1).

En ursäkt är på sin plats, nämligen just här: Ursäkta.

3) En gammal sak som också har fixats: Förhandsvisningen (preview) av kommentarerna visades i stort sett som en enda lång sträng. Nu är den bättre formaterad.

Posted by hakank at 09:18 EM Posted to Diverse

Wintermute: Ännu ett Bertil Pettersson/Lasse O'Månsson-fan

Tänkte bara nämna att signaturen "Wintermute", som rikligt klargjort sakernas tillstånd i Apanssons yrke: Originaltexten av Lasse O'Månsson och G Linderholm?, har bekänt blogg.

Wintermule skriver nämligen på Det kunde varit värre med taggraden en blogg om livet på det förvirrade 00-talet..


Mer om Petterson/O'Månsson finns i Mystisk gumma hade papper i mössan!.

Namnet Wintermute får sin förklaring i den (numeriskt) andra blogganteckningen Wintermute.

W. förklarar varför han bloggar i det börjar klarna (då bloggen troligen fick sitt namn) och avslöjar några personliga detaljer (ålder och kön finns här):


Nu börjar det klarna… Jag börjar förstå lite mer av varför jag har satt igång med det här bloggandet. En på sätt och vis ganska meningslös sysselsättning kan man ju tycka…

Saken är den att jag håller på och skriver en avhandling. Ska vara klar i höst. Det innebär en väldig massa strukturerat skrivande. Och en väldig massa strukturerat (nåja) tänkande. Men sen är det ju det där andra. Alla restprodukter som det genererar. Alla de där tankarna som inte passar in i avhandlingen. En del som befinner sig i gränstrakterna och så en massa annat som handlar om helt andra saker. Det verkar som att ju mer jag försöker koncentrera mig på avhandlingsskrivandet, desto större behov får jag att skriva om annat. Det är förstås därför jag håller på med det här. Det fungerar som en slags säkerhetsventil.


Det finns faktiskt annat som jag inte länkat till, men de får ni läsa själva.

Posted by hakank at 08:55 EM Posted to Blogging | Humor | Husgudar