Politisk likhet II

Författare: Håkan Kjellerstrand, hakank@bonetmail.com

Jag kunde inte riktig släppa tanken på den politiska likheten jag gjorde häromdagen (se Politisk likhet I. Så jag analyserade samtliga politiker jag hittade på SVT:s Finn din politiker-sajt för att kontrollera hur bra min egen formel var mot SVT:s formel. Jag fick faktiskt reda på vilken formel SVT använder, men när jag implementerar den blir det inte exakt samma resultat SVT visar för Malmö kommun, men det blev nästan samma. Därför skriver jag "min approximation av SVT:s formel" i det följande.

5 politiker hade svarat "varken/eller" på samtliga frågor så de tog jag sonika bort. I allt blev det efter bortsållningen data om 570 politiker.

Jämförelse av formler för politisk likhet

Jag testade SVT:s och min egen formel genom att - för samtliga politiker - se hur många korrekta förslag de två systemen föreslog som bästa match (första förslag till politisk likhet). Ett bra system ska naturligtvis returnera exakt det parti en politiker tillhör och inget annat. Den testade politikern är inte möjlig att komma som förslag till politisk likhet.

Av de 570 politikerna hade SVT:s metod (min approximation):

  76% rätt
  24% fel
och min metod:
  80% rätt
  24% fel
Det är inte speciell stor skillnad, men i alla fall...

Confusionmatrix

En confusionmatrix är ett sätt att i tabellform visa hur bra en klassificering är. Här nedan visas hur SVT:s och min metod i sådana tabeller. Korrekt klassificering visas i raderna och metodens föreslag i kolumnerna. En perfekt klassificeringsmetod skulle ge värden endast i diagonalen (dvs c-c, fp-fp etc).
       c  fp  kd   m  mp  s  v
c     39   7   9   1   3  6  0
fp     4  53   7   8   0  1  0 
kd    15  11  57  12   0  2  0  
m      0   5   1  93   0  0  0
mp     0   0   0   0  56  1  1 
s      5   1   1   1   2 59 23  
v      0   0   0   0   4  4 78

Min metod:

       c  fp  kd   m  mp   s   v
c     42   2  14   1   4   2   0
fp     0  55   8   9   0   1   0 
kd    12  14  60   7   1   1   0  
m      0   4   1  94   0   0   0
mp     1   0   0   0  56   1   1 
s      3   2   1   2   2  68  14  
v      0   0   0   0   1   5  80

Genom att i tabellerna se vilka typer av felklassificeringar som görs kan man se hur nära partierna ligger varandra, dvs då metoderna misstar en politiker med en partitillhörighet för en politiker med en annan partitillhörighet.

De båda tabellerna skiljer sig inte nämvärt, båda gör i princip samma typ av misstag, med den lilla skillnaden att min metod gör något färre misstag.

I bägge tabellerna kan man notera de två vanliga vänster/högerblocken

  (c) + (fp) + (kd) + (m)
resp
 (s) + (v)
Detta visas genom att (t.ex.) det finns ett antal felklassifikationer av (fp)-politiker till att vara (c), (kd) samt (m). Man kan också - om man lusläser siffrorna - kan man se antydan till (mp):s lite dubbla roll att vara kopplad till både (v)+(s) samt (c). De två partier som förväxlas minst är (m) och (v), vilket nog inte är speciellt förvånande.

Likhet med en specifik profil

En annan test var att se hur de två metoderna räknar ut den politiska likheten till min egen profil. Resultatet är en sorterad lista av partitillhörigheter för politiker med bäst politisk likhet till mig. Resultatet är är tagna från applikationen "Finn ditt parti" (se nedan).

SVT:s metod

s s s s s s s kd s s s s kd s s s v c v fp v s c s s s s fp s v c s s c s
kd s v fp s c s s c v kd s kd v v fp s fp s s fp fp s s v s c s s s fp kd
....   

hakanks metod

s s v s v s s s s s s s s s s s s s s s s s s s s c v v s s s v s s s s v
kd s kd s s s v s s s s s v s v s c s v s c s m c mp s s s s s v mp v v s
...

Ett försök att summera listorna ovan görs också. Det är en summering av hur bra ett speciellt parti matchade min profil. Full poäng ges till första alternativet, ett snäpp mindre poäng till andra partiet i listan osv. Exakta poängen för ett parti är viktad så att inte partiet med många politiker ska få otillbörlig fördel.

Först visas partinamnet, sedan absolutpoäng och sedan antal procent av totalt poäng.

Först SVT:s metod:

Här är tabellen för min formel:

Min subjektiva åsikt är att min egen metod verkar mer konsistent med partiernas relation till varandra.

Känslighet för "Dina tre viktigaste frågor"

Om man jämför hur olika "Dina tre viktigaste frågor" med bibehållande av svaren på "De tretton frågorna" blir det rätt stor skillnad mellan SVTs och min metod.

T.ex. om man väljer följande tre frågor

Ger SVT följande förslag

m kd c m v s s kd s s s kd s m m kd kd m fp c kd s c kd c kd c s c fp kd s c kd s v kd kd c v 
....

Min metod ger följande:

s s v s v s s s s s s s s s s s v s s c s v s mp s s s s m c kd s s s s s v v s s ...

Tar man däremot en annan typ av viktigaste frågor

ger SVT
kd s kd kd s c kd kd kd kd s kd kd kd kd kd s s v kd v s s m m kd s fp fp s s kd kd s s s v v c s 

och min metod

s s s v v s s s s s s s s s v s s s kd s s s kd s s s s c s s s s s s v v s m s s

SVT:s metod verkar mer känslig för dessa tre frågor än min metod, vilket bekräftas av den faktiska formeln för SVT metod, där man lägger mycket stor vikt, för stor enligt mig, vid dessa frågor.

Data mining

Jag gjorde även lite data mining på politikerdatan som inkluderar, förutom svaren på frågorna, även valkrets och ålder. Det gav en del intressanta saker. (Jag använde främst data mining-systemet Weka, se http://www.cs.waikato.ac.nz/~ml/.)

De olika data mining-metoderna gav i testet över samtliga politiker korrekt svar på 70-85%, så SVT:s och mina mycket enkla formler var faktiskt inte så pjåkiga!

Om man bara tar hänsyn till de tretton flervalsfrågorna (och ignorerar "Mina tre viktigaste frågor") var det två frågor som klart dominerade i hur bra de kunde förklara partitillhörighet, dvs hur klart partierna skiljer sig åt. Det var höger/vänster-skalan (inte helt förvånande) samt frågan om privatisering av vårdinrättningar och skolor. Flyktingfrågan samt resurser från storstäder skilde partierna minst åt.

Åldern på politikern verkar vara helt oviktigt för partitillhörigheten.

När jag pumpade in min egen profil i Weka så tyckte de flesta metoderna att jag var socialdemokrat till mellan 85 och 99%. VSB!

Finn ditt parti

Det blev också ett litet snabbhack som jag kallar Finn ditt parti.

Efter att du fyllt i din egen profil på de 13 frågorna samt valt "Mina tre viktigaste frågor" visas partitillhörigheten för de 570 politikerna sorterad på bästa politisk likhet med dig (bäst är först). Detta görs både för (min approximation av) SVT:s kalkyl samt min egen formel. Det visar även lite annat.

Personligen tycker jag att min metod är mer renodlad och visar klarare linjer men troligen är jag något partiskt.


Tillbaka till innehållsförteckningen över Politisk likhet
Tillbaka till min hemsida
created by Hakan Kjellerstrand hakank@bonetmail.com