hakank.blogg: Economist om collaborative filtering (rekommendationssystem)

« Joke-e-oke: Karaokee för skämt | Main | Aprilpyssel »

mars 28, 2005

Economist om collaborative filtering (rekommendationssystem)

Economistartikeln United we find (10 Mars 2005) innehåller en introduktion av collaborative filtering och beskriver även mer modern forskning inom området.

For many people, technology now plays an increasing role in making such choices and navigating through large numbers of alternatives. But while this might sound like a job for an internet search engine, keyword-based search engines (such as Google) have a fundamental constraint: they can only help you find something if you already have an idea of what it is. Two people's idea of “good music” may differ substantially, but Google would return the same results to both of them. To find things you might like, but are not already familiar with, requires a different technology, known as “collaborative filtering”.

This increasingly pervasive technology looks for patterns in people's likes and dislikes, and uses those patterns to help people find things they did not know they were looking for. Computer scientists term this task, in a welcome respite from jargon, “find good things”. Collaborative filtering also has the power to do the converse, “keep bad things away”, for instance by filtering unsolicited commercial e-mail messages, or spam.

Artikeln förklarar sedan kortfattat skillnaden mellan de två teknikerna "user-user" och "item-item", liksom hur TiVo räknar ut sina rekommendationer som är annorlunda jämfört med Amazons serverkalkyler.

De mer intressanta sakerna kommer sedan: hur man kan göra rekommendationssystem säkra för intrång i den personliga integriteten och säkra för manipulering.

* John Canny och hans förslag till rekommendationer baserade på krypterade (anonyma) preferenser.
* Mike O'Mahoney gjorde tillsammans med Neil Hurley, Nicholas Kushmerick och Guénolé Silvestre en analys av sådana systems robusthet: Collaborative Recommendation: A Robustness Analysis
* Nolan Miller har skissat på en lösning av manipulationer genom en probabilistisk analys av ovanliga händelser i systemet.
* Jonathan Herlocker som spekulerar i om det finns en gräns i hur bra rekommendationer kan göras med collaborative filtering-tekniker: Dr Herlocker speculates that this might be evidence for a fundamental limit to the accuracy of recommendation systems based on collaborative filtering. There is no point in making suggestions any more finely tuned than the variations in an individual's own opinions. Dr Herlocker may well be correct, or the technology may just have further to go.

Artikeln avslutas med en hyllning till collaborative filtering jämfört med traditionella sökmotorer och använder den allt mer vanliga crowd vs. solitary-metaforen (cf. artikelns rubrik: "United we find"). Även om jag i stort sett håller med i hyllningen så tycker jag nog att författaren tar lite väl lätt på skillnanden i förutsättningar mellan de två olika metoderna att hitta information: För att kunna få bra rekommendationer i ett rekommendationssystem krävs ett stort förarbete att berätta om sina preferenser för systemet, antingen det är frågan om att betygssätta filmer/skivor/böcker, ha köpt dem via systemet eller klickat runt i sajten ordentligt. När/om det blir möjligt att kunna spara och förflytta gjorda preferenser mellan olika rekommendationssystem blir skillnaden naturligtvis mindre.

But the value of collaborative filtering has, in any case, already been established. It helps people find things they might otherwise miss, and helps online retailers increase sales through cross-selling. Where the user of a search engine is on a solitary quest, the user of a collaborative-filtering system is part of a crowd. Search, and you search alone; ramble from one recommendation to another, and you may feel a curious kinship with the like-minded individuals whose opinions influence your own—and who are, in turn, influenced by your opinions.

Se även
Lite om rekommendationssystem (recommender systems, collaborative filtering)

Posted by hakank at mars 28, 2005 08:03 FM Posted to Rekommendationssystem

Comments

När konsumenter (sökare) även är producenter (bloggare) och sökmotorer använder sig av länkanalys så är även traditionella sökmtorer baserade på att vi hittar tillsammans.

Håkan, om du inte har besök Eric Wahlforss blog på http://eric.wahlforss.com/ tänker jag tipsa om den, då jag tror att den kan intressera dig. Han sysslar för övrigt en del med just kollaborativ filtrering.

Posted by: Henrik Torstensson at mars 28, 2005 11:10 EM

Du har två goda poänger, Henrik. Tack för länken till Erik. Hans blogg verkar spännande.

Din kommentar gav mig två uppslag. Det första är att det du precis gjorde - dvs personligt tipsade om en länk som du tror jag är intresserad av - skulle kunna göras i lite större skala. En tanke är att en dag om året ger man till vardera 10 bloggare 5 länkar som man tror kan vara intresserade av. Låt oss kalla det för den "Den stora Länkbytardagen"? Bytet kan naturligtvis göras via någon sajt, men det är ju roligare att få rekommendationerna "privat" via kommentarerna.

Det andra uppslaget vill jag nog fnula på en stund.

Posted by: hakank at mars 29, 2005 12:12 FM

En sajt för länkbytet vore nog lite trist, och kanske lite krångligt. Men email, email vore nåt. Som ett sslags kedjemail - Man har en lista på deltagande bloggare och skickar till varandra i tur och ordning efter listan.

Låt säga att jag står av misstag på "A" och börjar, den jag skall skicka till är Bengt på euroblog, skoj. Jag måste kolla runt lite på Bengst blogg för att se vad han gillar och finkamma mina länkhögar tills jag hittar fem länkar som jag tror att Bengt skulle gilla (och inte har). Bengt får mailet och gör en posting om de länkar han fick, samt letar rätt på fem länkar själv som han mailar till Chadie. Chadie postar att hon fått sina fem länkar och mailar fem andra till eh.. David... Och så vidare.

Som en liten länk-blogg-staffet.

Posted by: Åsk at mars 31, 2005 12:15 EM

Åsk: Håller naturligtvis med dig om emails förträfflighet, så det är inget att orda om.

Däremot behöver man diskutera utformningen av sändningslistan och hur den hålls uppdaterad. En distribuerad (icke-central) lista tenderar att komma bort, glömmas, slarvas bort eller ignoreras.

Sedan har jag den principiella uppfattningen att man egentligen inte behöver bry sig om listor för att klara sig i livet.

Posted by: hakank at april 1, 2005 07:23 FM

hakank.blogg

Anteckningar från en PopSci-junkie. Av Håkan Kjellerstrand (hakank@gmail.com).

mars 28, 2005

Economist om collaborative filtering (rekommendationssystem)

Comments