« Skapa enkla anagram | Main | Tebax eller Till min dagbok om detta vore någon »
september 21, 2005
Enkel textsummering (mestadels åt Thebe)
Som ett beställningsverk åt Thebe har skapats programmet Simple Text Summation som reducerar en text till tre tal och en vektor: (Det ska visst vara "enkelt" nu. :)
* det första talet fås genom att man tar bokstäverna (a - ö) och siffrorna (0 - 9) och gör om dem till siffror enligt deras position i alfabetet samt siffrona, varpå dessa summeras. Texten hakank.blogg får t.ex. textsumman 89 genom att summera talen i vektorn: 8,1,11,1,14,11,0,2,12,15,7,7
.
* siffrorna i detta textsummeringstal läggs sedan ihop till en tvärsumma: 17
* och till slut görs en "reducerad" tvärsumma så att det blir ett ensiffrigt tal.
Användningen av programmet kan läsas om i Thebes fantastiska och epokgörande alster: Haiku-färg och dagens Dagens humörfärg.
Det kommmer säkert att kommas på andra användningar...
Se även
Det finns betydligt mer seriös textsummeringar. Se t.ex.
SweSum - Automatisk Textsammanfattare
Vad är automatisk textsammanfattning?
The Text Summarization Project
Sist i min Automatisk identifikation av språk (språkidentifiering) finns några andra länkar.
Av någon anledning känns det ävan relevant att här länka till Devil's word.
Posted by hakank at september 21, 2005 09:22 EM Posted to Språk
Comments
Aha, du är on-line igen :-)!
Kul att du skrev programmet, oj vad här kan färgas :-)! På serösaste sätt naturligtvis! Om man nu tar och testar den på dina tre länkar där, som börjar med SweSum, och normerar med Devils word (fast 3) så blir det RGB-kod [136 141 122], en grågrön ton ... Hm, lite medel ...
Men, om man ändrar mittenlänken till "Automatisk textsammanfattning är vansinnigt skoj", så får man vektorn: [136 188 122] istället, som är en piggare grön färg :-D!
Posted by: thebe at september 26, 2005 03:50 EM