« 200 dagar | Main | Korsord och AI »
januari 05, 2004
"jag" i bloggen
I kommentaren till 200 dagar påpekar Mats Andersson mycket riktigt min rikliga användning av ordet "jag": det är det fjärde vanligaste ordet.
Eftersom jag inte riktigt förstår det själv har jag nu gjort en undersökning hur jag hittills använt ordet "jag", dvs vilka ord jag har skrivit före och efter ordet "jag" när jag skrivit mina blogganteckningar, då jag - till skillnad från denna anteckning - inte tänkte på hur jag använde ordet "jag".
[Föregående mening innehåller 10 stycken "jag", men den är å andra sidan speciellt konstruerad för ändamålet. En alternativ formulering av meningen utan något "jag" skulle kunna vara:
"Eftersom detta fenomen för närvarande inte är helt förklarat, har det sålunda, i syfte att klargöra ifrågavarande fenomen, gjorts en detaljerad undersökning, medelst bland annat s.k. datorprogrammering samt därefter en djupt penetrerande statistisk analys av förevarande ords användsfrekvenser, lämpligt nog och underlättande för analysen, varande sorterade i frekvensordning, i.e. i vilken kontext det använts i de hittillsvarande sammanhang då det existerat, utan därför erforderligt beslut, en minimal medvetenhet om att ordförekomsten erfordrades vara minimerad alternativt vara maximerad."
Tja, välj själv. :-)]
Tvåordsfraser
Det finns 324 olika tvåordsfraser med "jag". Så här ser de vanligaste konstrukterna ut:
har jag: 35
jag har: 27
att jag: 21
som jag: 19
jag inte: 19
när jag: 16
jag är: 10
eftersom jag: 9
jag läste: 8
om jag: 7
är jag: 7
men jag: 6
vad jag: 5
jag i: 4
jag nu: 4
jag kan: 4
och jag: 4
jag skriver: 4
jag på: 4
läste jag: 4
...
Exempel på användandet av frasen "har jag" kan ses via google: site:hakank.org "har jag"
Treordsfraser
Det finns 886 olika treordsfraser med "jag". De vanligaste är:
har jag inte: 5
som jag skrev: 3
när jag läste: 3
nu har jag: 3
sedan har jag: 2
jag kollat in: 2
jag inte sett: 2
jag är en: 2
jag hade tänkt: 2
som jag inte: 2
jag just nu: 2
jag inte fått: 2
var jag på: 2
har jag varit: 2
jag har ännu: 2
jag är inte: 2
jag skrev i: 2
jag har inte: 2
har jag skapat: 2
skrev jag lite: 2
eftersom jag är: 2
jag har haft: 2
jag stött på: 2
tyvärr har jag: 2
jag letar efter: 2
månader har jag: 2
till att jag: 2
jag inte har: 2
jag har nu: 2
har jag endast: 2
trots att jag: 2
jag dock inte: 2
på att jag: 2
som jag har: 2
som jag dock: 2
vad jag har: 2
jag läste en: 2
att jag inte: 2
sedan jag började: 2
jag på ett: 2
jag läst om: 2
år har jag: 2
jag mig för: 2
tidigare har jag: 2
jag tänker på: 2
menade jag slumpmässig: 1
...
"menade jag slumpmässigt" är för övrigt en favorit.
Posted by hakank at januari 5, 2004 12:07 FM Posted to Blogging
Comments
I treordskombinationerna förfaller ordet "inte" vara det mest högfrekventa bland de två tilläggsorden vilket skulle kunna tyda på en viss negativ, eller i vart fall mindre positiv, existentiell uppfattning eller kanske snarare, eftersom det är juxtapositionerat med personligt pronomen i första person singularis, en viss tendens till självförnekelse?
Ja, jag bara undrar ;-)
Posted by: Bengt O. at januari 5, 2004 02:41 EM
Bengt: Det är mycket möjligt att du har rätt i analysen av min obetydliga personlighet, men jag är inte så säker på att du har stöd för detta i data. Kanske, jag vet inte.:-)
Sedan kan man fråga sig om man använder så många "jag" om man har tendens till självförnekelse? Verkar det inte rimligare att anta att det vore tvärtom?
En analys av den datan som förevisades i blogganteckningen ger, hur som helst, vid handen följande:
Det var 48 treords-konstruktioner med "jag".
Det var 9 treords-konstruktioner med "inte".
Förhållandet mellan inte-konstrukter och totala konstruktioner: 19%
Om vi nu även tar med vikten får vi motsvarande 21 inte-konstruktioner av
totalt 103 konstruktioner, dvs 20%.
Dvs ungefär var femte "jag"-konstruktion är en "inte"-konstruktion, dvs 4 av 5 jag är inte inte-konstruktioner.
Om vi nu studerar den totala mängden av treords-konstruktioner får vi följande:
Totalt 886 olika treords-konstruktioner med "jag"
47 stycken olika "inte"-konstruktioner, dvs 5% av fallen
Viktade värden:
59 inte-konstruktioner av totalt 941, dvs cirka 6 procent.
Jag kan svårligen se att din tes har stöd av datan.
Däremot är din approach mycket intressant: Hur mycket kan man egentligen utläsa av en personlighet genom att endast analysa en text genom olika n-ordskonstruktioner?
Det vet jag inte, däremot är här är några olika sajter om att analysera personlighetsdrag etc utifrån text (och använder andra metoder).
Personlighetsanalys
-------------------
Programmet Intext (som jag inte testat) lär ha sådan personalitetsanalys:
http://www.intext.de/intexte.htm
http://www.intext.de/eindex.html
"Psycholinguistic analysis of documents by historical personalities"
http://www.phil.muni.cz/~svancara/miniaq1.html
Analysera om någon ljuger
-------------------------
LSI Laboratory for Scientific Interrogation, Inc
http://www.lsiscan.com/reports.htm
It is Not What We Say but How We Say It
http://www.qedfraud.com/whitepaper.html
Se även min blogganteckning "Lying Words"
http://www.hakank.org/webblogg/archives/000022.html
Analysera vilket kön skribenten tillhör
---------------------------------------
http://www.bookblog.net/gender/genie.html
Posted by: Håkan Kjellerstrand at januari 5, 2004 08:40 EM
Som före detta svensklärare får jag nog hålla med om att "jag" verkar dyka upp alldeles för ofta.
Hur vore det att variera med lite andra personliga pronomen? Det är numera comme il faut att hänvisa till sig själv i tredje person. Agnes tycker även att det är ett utmärkt sätt att öka den självironiska distansen.
Annars, för att citera en stor tänkare, kan vi också vidtala oss själva med "the editorial we" (The Dude, The Big Lebowski).
Posted by: Agnes at januari 6, 2004 08:33 EM
Agnes: Har det lästs flera inlägg på bloggen eller tittades det enbart på statistiken alternativt på kommentarerna i denna blogganteckning?
Angående föreslaget om att skriva i tredje-person förefaller det inte vara så passande. Det har lästs slika Dude-beskrivningar men ett sådant stilistiskt grepp passar inte kynnet, inte ens för att öka den självironiska distansen. Sådana konstruktioner kan göra det svårt att veta vem som gjort vad med vem eller vilket och hur, vilket troligen är ännu värre.
Till detta: eftersom merparten av övrig skrift som skrives utanför blogg och sajt är utan personliga pronomen överhuvudtaget, har "first person shooter"-varianten känts vara befriande, måhända - det medges naturligtvis - missbrukad i vissa fall. Det kanske är dags att återgå till den mer byråkratiska och anonyma varianten?
Möjligen kommer förevarande diskussion göra att stil, ämne eller bloggrutiner ändras på ett eller annat sätt. Det är sådant som enbart framtiden kan visa.
Någon tackar för intresset, eller som Erik Beckman så vist formulerade det: "Någon något" (1964).
:-)
Posted by: Håkan Kjellerstrand at januari 6, 2004 10:15 EM