hakank.blogg: Läsning av förvanskade ord

« Att förutsäga framtiden i efterhand - hindsight bias/creeping determinism | Main | Skapa stavfel »

september 15, 2003

Läsning av förvanskade ord

Enligt en text som spridits på nätet den senaste tiden räcker det att de första X tecknen och de sista Y tecknen i ett ord ska vara i korrekt position för att vi ska kunna förstå en text. Enligt texten hos Mats Andersson är X=Y=2, och enligt texten på Kalles klätterträd är X=Y=1.

Jag tyckte det kunde vara en lite lagom avkoppling att göra ett litet snabbhack för att kolla detta llite. Så här är ett program för att slumpa de tecken som finns mellan de X första respektive Y sista tecknen i orden. X och Y är justerbara.

Man får dock själv läsa den förvanskade texten och avgöra om det är enkelt eller svårt att förstå den. Så mycket för vetenskapligheten.:-)

Default-texten är Mats Anderssons ursprungstext (något justerad). Testa gärna med andra texter och språk.

Här är alltså Reading scrambled words.

Frågor: Är det någon som verkligen läst den undersökning man skriver om? Finns det en sådan? Var?

En vidareutveckling vore kanske att göra en "inverterad" Levensthein edit distance (länken är till google) för att se hur blandad den förvanskade texten kan vara med små värden för X och Y.

Uppdatering 1
Jag kom lite senare på att ett relaterat program är AnaCheck, som givet en slik förvanskad text går igenom en ordlista för att lista ut vilka ord som kan vara korrekta. Glöm inte att kontrollera att korrekt språk är valt.

Uppdatering 2
Och så finns det en tråd på slashdot som diskuterar detta och liknande fenomen..

Uppdatering Blå
Under inspiration av Niklas Johanssons kommentar har jag nu lagt till en möjlighet att sortera de icke-fixa bokstäverna. Tack Niklas!

Uppdatering Kablagebyte
Så har vi tydligen fått tag i undersökningen. DN-artikeln Bkasotvsodnrnig sknaar bydetslee skriver mer om detta.

Enligt artikeln är det undersökningen Sublexical units and the split fovea av Richard Shillcock och Padraic Monaghan, University of Edinburgh, January 10, 2003.

Jag har dock inte läst papret ännu...

Tack till Mats Andersson som hittade DN-artikeln (hans kommentar finns här).

Posted by hakank at september 15, 2003 08:57 EM Posted to Program

Comments

Jag ger mig, det är helt klart enklare med X=Y=1 än X=Y=2. =) Det är väl inte så konstigt i och för sig, orden blir ju mer lika originalen.

Jag har inte heller läst originaltexten. Jag hörde om det här via ISerializable på http://weblogs.asp.net/rosherove/posts/27471.aspx, men det inlägget inkluderar inte en URL till originalrapporten.

Posted by: Kalle at september 15, 2003 09:55 EM

Min bror skickade texten till mig via ICQ. Det var en kompis till honom som fått den av sin bror. Var han fått den ifrån vet jag inte.

Posted by: Mats Andersson at september 15, 2003 10:17 EM

Det är alltså ingen som vet om det verkligen finns en sådan undersökning?

Man kan även leka med fall där X != Y. Det verkar rimligt att anta att det är viktigare att början på ordet är tillräckligt bekant än att slutet är det. Möjligen funkar det med X=2 och Y=1?

Posted by: Håkan Kjellerstrand at september 15, 2003 11:53 EM

Intressant att prova olika värden. Jag lyckades dock inte lägga dit en helt annan text. Den verkade använda defaulttexten i alla fall.

Defaulttexten har jag läst ett större antal gånger nu och snart kan jag den utantill. :-)

Jag har också försökt hitta undersökningen som texten refererar till, men inte lyckats. Det kan vara en vandringssägen som någon föreslog.

Vänliga hälsningar

Niklas Johansson

Posted by: Niklas Johansson at september 16, 2003 09:55 FM

Niklas: Hur gjorde du för att försöka få in en ny text?

Jag har själv inte haft några problem att först manuellt radera texten i fältet och sedan klistra/skriva in en ny text.

Någon annan som haft dessa problem?

Det är en finess att om textfältet är helt tomt så kommer den svenska texten.

En liten nyhet är att det nu finns (en av varianterna av) en engelsk text att leka med.

Posted by: Håkan Kjellerstrand at september 16, 2003 10:08 FM

När jag kikar i webbserverloggen ser jag att du inte är helt ensam om problemet.

Det finns nu en pragma no-cache på sidan som möjligen kan lösa problemet.

Posted by: Håkan Kjellerstrand at september 16, 2003 10:20 FM

Jag klippte in en annan text i fönstret och tryckte på OK. Inget konstigt. Nu fungerar det. :-)

Vänliga hälsningar

Niklas

Posted by: Niklas Johansson at september 17, 2003 12:03 EM

hakank.blogg

Anteckningar från en PopSci-junkie. Av Håkan Kjellerstrand (hakank@gmail.com).

september 15, 2003

Läsning av förvanskade ord

Comments