« Lite länkar till videoföreläsningar 20071009 | Main | Bloggträff i Malmö torsdagen 22 november 2007, 18:30 på Kin Long »

oktober 28, 2007

Svar på Hakkes frågor angående monovokala ord

Den alltid nyfikne hakke skickade följande mail till Jonas Söderström och mig häromdagen. (Mailet är trivialt redigerat.)

Det går ju inte att kommentera den här gamla godingen :( Ooo, så långa ord

Så jag får mejla kommentaren istället :)

/Håkan (hakke)

Vissa saker man läst sitter liksom kvar i hjärnan som en lös liten
skruv, som ibland vickar till och gör sig påmind. Dit hör det här
inlägget, bland annat för att det var här jag upptäckte bloggarna men
också på grund av dess språkglädje.

Nyss stötte jag på ordet "kulturutbud" i en text. Det är inte särskilt
lättläst, en egenskap det troligen delar med många andra monovokala
ord.

Håkan Kjellerstrand hade ju vänligheten att publicera följande lilla
lista över förekomsten av monovokala ord för var och en av svenskans
vokaler:

Vokal: antal ord
----------------
a: 3137
e: 791
i: 1299
o: 960
u: 625
y: 192
ä: 590
å: 280
ö: 272

Några saker jag blir nyfiken på är:


Efter kom sedan tre (3) frågor som av besvaras (eller åtminstone bekommenteras) var och en i det nedanstående. Notera att ordlistan som användes för att skapa ovanstående förekomstfördelning är äldre i relation till den ordlista som används i dessa svar.


Hakkefråga 1. Vilka är de längsta fem monovokala orden för varje vokal?

Svar fråga 1.
Här är de inte bara de fem utan även de sex längsta ord för respektive monovokal . Ordlängden visas efter ordet. Not: Det kan finnas flera ord med samma ordlängd som den minst långa ordlängden för respektive vokal. Programmet visar då endast att det blir exakt sex stycken ord (och slumpmässighetens underbara men samtidigt starkt underskattade men starkt påverkande hand styrde exakt vilka som visas).


Vokal a:
brandalarmapparat: 17
andrahandsmarknad: 17
partssammansatt: 15
branschanpassad: 15
brandhandgranat: 15
tandspacklarnas: 15

Vokal e:
referensfrekvens: 16
frekvensmeterns: 15
telexreglemente: 15
referenselement: 15
meddelelsemedel: 15
pendelfrekvens: 14

Vokal i:
lindningsriktning: 17
tillfriskningstid: 17
lindningsstigning: 17
drivningsriktning: 17
visningsspridning: 17
stigningsriktning: 17

Vokal o:
motorfordonskontroll: 20
kontrollprotokoll: 17
domstolsprotokoll: 17
torvjordskompost: 16
fordonskontroll: 15
kontrollmottolk: 15

Vokal u:
ursprungspunkt: 14
djupbrunnspump: 14
sunhultsbrunns: 14
grundstruktur: 13
sunhultsbrunn: 13
kugghjulspump: 13

Vokal y:
skyddshytt: 10
styckfryst: 10
krymptryck: 10
tryckstyrd: 10
plymprydd: 9
frysskydd: 9

Vokal å:
stålspåntlås: 12
språngstråk: 11
tvångsvård: 10
stånggång: 9
nålsprång: 9
ståltråds: 9

Vokal ä:
rättshjälpsnämnd: 16
kärrsnäppsägg: 13
vändskärsfräs: 13
rännhärdsjärn: 13
skräntärnsägg: 13
ändskärsfräs: 12

Vokal ö:
mörkrödglöd: 11
bröstsköld: 10
förströtts: 10
bröstmjölk: 10
slöjdbjörk: 10
bröstböld: 9

Hakkefråga 2. De korta orden intresserar mig inte särskilt mycket. Det skulle vara intressant att se motsvarande sammanställning begränsad till de ord där det finns minst 3, 4 respektive 5 vokaler. Jag gissar att fördelningen mellan ordrikedomen per vokal då också kan komma att förändras något. Kanske blir ledningen för a och i ännu tydligare?

Svar fråga 2

Först kommer den totala fördelningen av antal vokaler per ord som har
minst 2 vokaler för att få en känsla för vad som kommer:


Fördelning av antal vokaler per ord:
2: 9868
3: 3215
4: 539
5: 60
6: 6

Sedan med hakkes föreslagna begränsningar om minst v vokaler.


Vanligaste bokstaven (minst 2 monovokaler):
a: 7377
e: 2080
i: 1612
o: 1275
u: 436
ä: 410
ö: 253
å: 196
y: 49

Vanligaste bokstaven (minst 3 monovokaler):
a: 2447
e: 717
i: 350
o: 229
u: 64
ä: 9
å: 2
ö: 2

Vanligaste bokstaven (minst 4 monovokaler):
a: 354
e: 179
i: 38
o: 33
u: 1

Vanligaste bokstaven (minst 5 monovokaler):
a: 42
e: 16
i: 4
o: 4

Vanligaste bokstaven (minst 6 monovokaler):
e: 4
a: 1
o: 1

Det finns inga ord i ordlistan med 7 eller fler monovokaler.


För fullständighetens skulle visas här även fördelningen av ordlängden (för ord med minst 2 monovokaler):


3: 22
4: 300
5: 1226
6: 2486
7: 2964
8: 2744
9: 1886
10: 995
11: 517
12: 299
13: 151
14: 62
15: 16
16: 6
17: 13
20: 1

Hakkefråga 3. Undrar om fördelningen ändras över tiden? Sedan listan skapades har det ju kommit en ny version av saol.


Svar (eller snarare kommentar till) fråga 3

Hakke har troligen en poäng att ovanstående beskrivna fördelningar förändras över tiden. Det är dock utanför mitt experimenterande eftersom jag inte använder SAOL utan Den stora svenska ordlistan (eller snarare ett derivat av den ordlista man kan ladda ner här och om vilket kommenteras något mer här nedan).

Svar på anticiperad följdfråga: Nej, jag har inte sparat olika DSSO-versioner för denna typ av jämförelse.

Några vidarekommentarer
För ett antal (cirka 2) månader sedan förnyades monovokaldiskussionen på Blind Höna, i Ooo, så många o:n! Monovokal toppnotering tangerad (där mina findings bygger på samma ordlista som ovanstående analyser). Se även Söndagspyssel där den ursprungliga monovokaldiskussionen fortsatte att diskuteras.

DSSO-listan är samma ordlista som man hittar på http://sv.speling.org/files/ (det görs en omdirigering till DSSO-sajten). Denna ordlista har även används i andra språk-/ordprojekt, t.ex.
* Visa ordklasser (presenteras i Svenska ordklasser samt gissning med hjälp av ordsuffix)
* Consonants Away (presentation i Consonants Away)
* samt ett gäng andra s.k. useless-projekt.

Posted by hakank at oktober 28, 2007 09:50 FM Posted to Språk | Statistik/data-analys

Comments

Tack! Jag slås direkt av några saker:

1) I listorna framgår vilka långa ord som förekommer i flera sammansatta, och därmed ännu längre, monovokala ord. Med utgångspunkt i dessa blir det lätt att skapa nya, ännu längre, monovokala sammansättningar. Som "motorfordonskontrollprotokoll".

2) Det är inte nödvändigtvis de ord med flest vokaler som hamnar på listan över de längsta monovokala orden. Mitt förslag "kulturutbud" har ju 4 stycken u, medan alla sex orden i listan över långa monovokala u-ord har tre stycken u - men alltså betydligt fler konsonanter däremellan.

3) Bokstäverna y, å och å verkar ha svårt att konstruera långa monovokala ord med fler än två vokaler i. Här får vi hjälpas åt att skapa nya kreativa sammansättningar! (Vad sägs om ståltrådsstråk?)

4) Jag hittar genast några nya favoritord. Frågan är bara när jag faktiskt ska få tillfälle att tala eller skriva om kärrsnäppsägg, torvjordskompost eller stånggång. Gärna utan att det blir krystat.

Posted by: HÃ¥kan (hakke) [TypeKey Profile Page] at oktober 28, 2007 10:46 FM

Och för att fortsätta ditt kreativa monovokalflöde kommer här samtliga ord (från ordlistan alltså) som har minst 5 monovokaler.

brandalarmapparat: 6
telexreglemente: 6
referenselement: 6
motorfordonskontroll: 6
meddelelsemedel: 6
resereglemente: 6
makadamballast: 5
nattavaaras: 5
prabhavananda: 5
hammarapparat: 5
bananklasarnas: 5
annandagarnas: 5
balatamatta: 5
pansarvagnarna: 5
svappavaaras: 5
medvetenhetens: 5
alarmapparat: 5
kontrollprotokoll: 5
sammandragbara: 5
faktadatabas: 5
kanadabalsam: 5
lannavaaras: 5
abrakadabrat: 5
tegelelement: 5
abrakadabra: 5
radarapparat: 5
infinitiviskt: 5
avdagataga: 5
mangansackarat: 5
samtalsapparat: 5
bananklasarna: 5
svappavaara: 5
andrahandsmarknad: 5
matarapparat: 5
apparattavla: 5
nattavaara: 5
abrakadabrats: 5
sekretessregel: 5
arabkramarnas: 5
marsalaflaska: 5
revetertegel: 5
abrakadabras: 5
kassaapparat: 5
avdragarplatta: 5
enkelelement: 5
medvetenheten: 5
primitivistiskt: 5
teckenelement: 5
elementpensel: 5
domstolsprotokoll: 5
panamakanal: 5
infinitivisk: 5
primitivistisk: 5
referensfrekvens: 5
monoblockmotor: 5
kardanaxlarna: 5
annandagarna: 5
eggelsemedel: 5
enhetselement: 5
ballastmakadam: 5
asfaltmakadam: 5
reglerelement: 5
pansarvagnarnas: 5
kardanaxlarnas: 5
arabkramarna: 5
lannavaara: 5

Posted by: Håkan Kjellerstrand at oktober 28, 2007 10:59 FM

"motorfordonskontrollprotokoll" tyder på att orden skulle vara sammansatt av delarna {{motor}{fordon}} och {{kontroll}{protokoll}}.

Man kan också tänka sig att det skulle ihopfogas {{{motor}{fordon}}kontroll} och {protokoll} och alltså blir motorfordonskontrollsprotokoll.

(Nej, jag vet inte riktigt vad jag vill ha sagt med denna kommentar.)

Posted by: David Hall at oktober 28, 2007 12:05 EM

De enda av de hexamonovokala orden jag hittar i SAOL (1998, den senanste jag har) är meddelelsemedel och resereglemente. Ifall det skulle intressera någon.

För övrigt får både brandalarmapparat och motorfordonskontroll mig att rynka på näsan en aning. Man säger väl inte alarm i det sammanhanget nuförtiden (fast brandalarm finns med i SAOL 1998), och så känns det som att det saknas ett bindnings-s. Jag skulle ha sagt brandlarmsapparat. Motorfordonskontroll därför att det inte fonetiskt är monovokalt – de sista två o-na uttalas ju som kort å.

Posted by: ctail at oktober 28, 2007 02:20 EM

Tack Håkan! Denna gång för listan över alla med minst 5 vokaler, en källa att ösa ur om jag någon gång blir bjuden på vokalisternas motsvarighet till nobelfesten.

Posted by: HÃ¥kan (hakke) [TypeKey Profile Page] at oktober 28, 2007 03:04 EM

Här avslöjas förstås också den underliggande ordlistans heterogenitet lite, t ex i att vissa ord i listorna ovan står i bestämd form genitiv, medan motsvarande form av andra ord inte verkar ha funnits med.

I likhet med frekvensmeterns skulle man t ex kunna få referensfrekvensens, och därmed inte bara komma upp i 19 bokstäver, utan även klämma in ett sjätte e av bara farten.

etc.

Posted by: Filip Salomonsson at oktober 28, 2007 04:15 EM

Det trevliga är att jag läste om Skururps Brukshundsklubb, och där har man ju verkligen fläskat på med monovokalitet för två ord i följd!

Posted by: Liselott Larsson at september 3, 2009 10:40 FM