« Scale-free sonata | Main | Markov av svenska bloggar »

december 21, 2003

Automatisk bloggning? (Blog Markov)

Om ni undrat hur jag skapat mina tidigare blogganteckningar kan jag nu avslöja att det gjorts med hjälp av programmet Blog Markov.

Nej, det stämmer inte riktigt.

Däremot blev jag - efter att ha skrivit anteckningen Automatisk identifikation av språk (språkidentifiering) där några Markov-generatorer nämns - lite nyfiken hur en sådan genererad text skulle bli. Jag tycker att det fångar stilen rätt bra. (Någon kommer förmodligen att säga att de inte märker någon skillnad; det bjuder jag på. :-)

Programmet använder alltså anteckningarna från min blogg med vissa filteringar.. T.ex. har allt inom < ... >-taggarna tagits bort, eftersom det ofta är text på engelska vilket stör språkligheten för mycket.

Testa gärna själv. Ändra parametern n för att ge mer eller mindre trogen text, n=10 ger mycket trogen och n=5 är ganska trogen text.

Posted by hakank at december 21, 2003 09:21 EM Posted to Program

Comments

Det här var ju fruktansvärt roligt! Jag tänker använda en del av ordspråken (med källhänvisning) såvida Du inte kräver exklusiv äganderätt.

Hur svårt skulle det vara att göra en Markov-generator som kan användas på vilken blogg som helst? Det skulle vara oerhört intressant. Jag tror nog att man kan lära sig en del från resultaten. Naturligtvis är de genererade texterna à la hakank groteska - men nog finns det en kärna av något sant där. Jag skulle gärna se hur den körnan ser ut för Euroblog och "Ordet" men också för exempelvis mymarkup och Drullestigen och många andra.

(Om det går skulle vi kunna skriva en rolig krönika tillsammans där vi driver med oss själva men också med en del av ikonerna i bloggosfären! Jag har länge velat parodiera exempelvis jill.txt men inte vågat av PC-skäl men nu kan man ju få en vetenskaplig förevändning!)

Posted by: Bengt O. at december 21, 2003 11:59 EM

Kul du tyckte om det.

Självklart får du använda de genererade ordspråken. De kommer ju från vår gemensamma folkskatt...


Vad gäller Blog Markov använde jag en textfil (skapad via Movable Types export-funktion) så det är nog inte den väg man ska gå.

Däremot kan du testa med Web Markov där man skriver in en URL för den sida som ska markovifieras. Programmet finns på http://www.hakank.org/markov/index.html

Det använder inte samma typ av filtering som Blog Markov, vilket gör att det kan bli lite lustiga resultat emellanåt.

Några exempelmarkovifieringar:

När jag ändå har Ordet:
http://www.hakank.org/markov/markov.cgi?n=7&page=http%3A%2F%2Fwww.karlsson.at%2Fordet.htm&submit=ok

Euroblog
http://www.hakank.org/markov/markov.cgi?n=7&page=http%3A%2F%2Fwww.karlsson.at%2Feuroblog.htm&submit=ok

mymarkup.net
http://www.hakank.org/markov/markov.cgi?n=7&page=http%3A%2F%2Fwww.mymarkup.net%2Fblog%2F&submit=ok

jill.txt
http://www.hakank.org/markov/markov.cgi?n=7&page=http%3A%2F%2Fhuminf.uib.no%2F%7Ejill%2F&submit=ok

Drullestigen
http://www.hakank.org/markov/markov.cgi?n=7&page=http%3A%2F%2Fdrullestigen.blogspot.com%2F&submit=ok

Dessa använder enbart från första sidan på respektive blogg, men det är ju lätt att använda URL-ar från olika typer av längre texter, t.ex. olika arkiv etc.

Tänk på att dra upp n till 6-8 för att det ska bli tillräckligt likt.


Du får naturligtvis även använda dessa genererade texter, i alla fall för mig:-).
Länka gärna till programmet om du använder dem.

Posted by: Håkan Kjellerstrand at december 22, 2003 02:06 FM

Nu finns det ett litet mer generellt verktyg till hands för detta. Se vidare blogganteckningen "Markov av svenska bloggar": http://www.hakank.org/webblogg/archives/000398.html

Posted by: Håkan Kjellerstrand at december 22, 2003 10:41 FM