« juli 2006 | Main | oktober 2006 »

september 27, 2006

Generering av Nobelpris-motiveringar (Markov såklart)

Nu ...
Nu har spekulationerna om Nobelpriset i litteratur börjat.


I stället för att gissa vem...
I stället för att gissa vem som kommer att få detta välansedda kulturpris har istället skrivits ett program som genererar motiveringar i syfte att efternå dessa de synnerligen elokventa språkliga konstruktionerna. Samtliga tidigare Nobelpris-motiveringar (litteraturpriset) finns hos Svenska akademien och är precis de som utgåtts ifrån i programmet.


Markovgenererade Nobelprismotiveringar (litteraturpriset)
Det nobelprismotiveringsgenererande programmet heter Markovgenererade Nobelprismotiveringar (litteraturpriset) och använder den här tidigare använda tekniken med Markovkedjor (se nedan för referenser).


Några slumpade exempel
Här är några slumpmässiga exempel på de av programmet genererade motiveringarna. Notera att orden "hans" respektive "hennes" har ersatts med "hans/hennes" så det är enkelt att bara kopiera-och-klistra texten och stryka endera val beroende på pristagarens kän, måhända efter ytterligare viss s.a.s. bearbetning av det givna materialet.


* för hans/hennes romankonstnärlig fulländning som med liknelser burna av fantastiska och levande i skildringen av människans belägenhet inom den dramatiska diktning som i nya former för roman buddenbrooks vilken stundom i sagospelets stora ryska berättarkonst som på självständigt besjälade diktning söker svar på människans belägenhet i en värld som genom en poesi som mot bakgrund av sinnlig styrka tolkat humana värden i tecknet av en historiska framställningskraft samt den skönhet och fantasifulla berättartradition levandegör en modern människans utsatthet

* för ett vidsträckt inflytande i vår vittskådande berättarkonst som infört en ny världsdel i litteratur

* för hans/hennes intensitet


Som kan ses ... (kommentar på ovanstående)
Som kan ses med viss men inte önskad tydlighet är inte alla förslag alldeles lysande. Därför presenteras flera förslag varje gång.


Parametern n (om parametern n)
Vad gäller parametern n (n såsom i n-gram) rekommenderas ett värde kring 5 eftersom ett betydligt högre värde ger i stort sett kopior av originaltexterna, och ett betydligt lägre ger gibberish (knappt igenkännlig svenska). Men experimentera gärna, det är precis sådant sådana här program är till för.


Man bör kanske notera... (om att n-gram har två något olika betydelser)
Man bör kanske notera att n-gram i dessa sammanhang har två något olika betydelser:
1) n är antalet ord som man arbetar med
2) n är antalet tecken (normalt bokstäver samt mellanslag, möjligen även siffror).

Ovan- och nedanstående program använder n-gram i den senare betydelsen, dvs arbetar på teckennivå. Det finns säkert någon tredje variant, men den är i så fall inte relevant. Ledsen om detta förvirrat någon läsare. Ledsen om denna kommentar ytterligare förvirrar samma eller andra läsare.

Se även
Automatisk identifikation av språk (språkidentifiering)
Bloggidentifiering (Blog Identification)
Magenta: När orden inte räcker till
Wikipedia: N-gram

Några andra program som använder samma teknik:


Andra bloggar om: , , , .

Posted by hakank at 08:25 EM Posted to Program | Språk | Comments (3)