5 politiker hade svarat "varken/eller" på samtliga frågor så de tog jag sonika bort. I allt blev det efter bortsållningen data om 570 politiker.
Av de 570 politikerna hade SVT:s metod (min approximation):
76% rätt 24% feloch min metod:
80% rätt 24% felDet är inte speciell stor skillnad, men i alla fall...
c fp kd m mp s v c 39 7 9 1 3 6 0 fp 4 53 7 8 0 1 0 kd 15 11 57 12 0 2 0 m 0 5 1 93 0 0 0 mp 0 0 0 0 56 1 1 s 5 1 1 1 2 59 23 v 0 0 0 0 4 4 78
Min metod:
c fp kd m mp s v c 42 2 14 1 4 2 0 fp 0 55 8 9 0 1 0 kd 12 14 60 7 1 1 0 m 0 4 1 94 0 0 0 mp 1 0 0 0 56 1 1 s 3 2 1 2 2 68 14 v 0 0 0 0 1 5 80
Genom att i tabellerna se vilka typer av felklassificeringar som görs kan man se hur nära partierna ligger varandra, dvs då metoderna misstar en politiker med en partitillhörighet för en politiker med en annan partitillhörighet.
De båda tabellerna skiljer sig inte nämvärt, båda gör i princip samma typ av misstag, med den lilla skillnaden att min metod gör något färre misstag.
I bägge tabellerna kan man notera de två vanliga vänster/högerblocken
(c) + (fp) + (kd) + (m)resp
(s) + (v)Detta visas genom att (t.ex.) det finns ett antal felklassifikationer av (fp)-politiker till att vara (c), (kd) samt (m). Man kan också - om man lusläser siffrorna - kan man se antydan till (mp):s lite dubbla roll att vara kopplad till både (v)+(s) samt (c). De två partier som förväxlas minst är (m) och (v), vilket nog inte är speciellt förvånande.
s s s s s s s kd s s s s kd s s s v c v fp v s c s s s s fp s v c s s c s kd s v fp s c s s c v kd s kd v v fp s fp s s fp fp s s v s c s s s fp kd ....
s s v s v s s s s s s s s s s s s s s s s s s s s c v v s s s v s s s s v kd s kd s s s v s s s s s v s v s c s v s c s m c mp s s s s s v mp v v s ...
Ett försök att summera listorna ovan görs också. Det är en summering av hur bra ett speciellt parti matchade min profil. Full poäng ges till första alternativet, ett snäpp mindre poäng till andra partiet i listan osv. Exakta poängen för ett parti är viktad så att inte partiet med många politiker ska få otillbörlig fördel.
Först visas partinamnet, sedan absolutpoäng och sedan antal procent av totalt poäng.
Först SVT:s metod:
Här är tabellen för min formel:
Min subjektiva åsikt är att min egen metod verkar mer konsistent med partiernas relation till varandra.
T.ex. om man väljer följande tre frågor
Ger SVT följande förslag
m kd c m v s s kd s s s kd s m m kd kd m fp c kd s c kd c kd c s c fp kd s c kd s v kd kd c v ....
Min metod ger följande:
s s v s v s s s s s s s s s s s v s s c s v s mp s s s s m c kd s s s s s v v s s ...
Tar man däremot en annan typ av viktigaste frågor
kd s kd kd s c kd kd kd kd s kd kd kd kd kd s s v kd v s s m m kd s fp fp s s kd kd s s s v v c s
och min metod
s s s v v s s s s s s s s s v s s s kd s s s kd s s s s c s s s s s s v v s m s s
SVT:s metod verkar mer känslig för dessa tre frågor än min metod, vilket bekräftas av den faktiska formeln för SVT metod, där man lägger mycket stor vikt, för stor enligt mig, vid dessa frågor.
De olika data mining-metoderna gav i testet över samtliga politiker korrekt svar på 70-85%, så SVT:s och mina mycket enkla formler var faktiskt inte så pjåkiga!
Om man bara tar hänsyn till de tretton flervalsfrågorna (och ignorerar "Mina tre viktigaste frågor") var det två frågor som klart dominerade i hur bra de kunde förklara partitillhörighet, dvs hur klart partierna skiljer sig åt. Det var höger/vänster-skalan (inte helt förvånande) samt frågan om privatisering av vårdinrättningar och skolor. Flyktingfrågan samt resurser från storstäder skilde partierna minst åt.
Åldern på politikern verkar vara helt oviktigt för partitillhörigheten.
När jag pumpade in min egen profil i Weka så tyckte de flesta metoderna att jag var socialdemokrat till mellan 85 och 99%. VSB!
Efter att du fyllt i din egen profil på de 13 frågorna samt valt "Mina tre viktigaste frågor" visas partitillhörigheten för de 570 politikerna sorterad på bästa politisk likhet med dig (bäst är först). Detta görs både för (min approximation av) SVT:s kalkyl samt min egen formel. Det visar även lite annat.
Personligen tycker jag att min metod är mer renodlad och visar klarare linjer men troligen är jag något partiskt.