A magyar nyelvtudomány hagyományosan foglalkozik költőink, íróink szókincsének vizsgálatával. Nyilvánvaló, hogy a sokat olvasott szerzők nyelve hatott, és napjainkban is hat nyelvünk fejlődésére. Számos részlettanulmány készült a különböző írók szókincséből, és egyre inkább megérett az a gondolat, hogy egy író nyelvi gazdagsága és hatása az irodalmi nyelv alakulására csak olyan összeállításból derülhet ki, amely kiterjed az író minden művének minden adatára. A különböző országokban korábban egyszerű indexeket készítettek, amelyekben felsorolták az adott szerzőtől használt összes szót, majd konkordanciákat állítottak össze, amelyek szövegösszefüggésben közölték az írók szavait. Végül kialakult az írói szótár, amely az értelmező szótárakhoz hasonlóan megadja a szavak jelentéseit, grammatikai, stilisztikai stb. sajátosságait is. Az utóbbiakból kiderül, hogy az író mit, hogyan, miért használ fel a nyelvből, mivel és hogyan gyarapítja.
A magyar szótárirodalom nem bővelkedik írói szótárakban. Csupán egy olyan szótárunk van, amely egyetlen szerzőnek minden művére kiterjed, ez a Petőfiszótár. Alcíme is jelzi, hogy Petőfi Sándor életművének szókészletét tartalmazza. A szótárt a Magyar Tudományos Akadémia Nyelvtudományi Intézetében egy népes munkacsoport készítette Gáldi László irányításával. Az anyaggyűjtés, szerkesztés és megjelentetés több mint három évtizedig tartott, és nem csekély összegbe került. Első kötete 1973-ban, a negyedik és egyben utolsó 1987-ben jelent meg az Akadémiai Kiadónál. 1972-ben talált kiadóra, így időben megelőzte a Petőfiszótárt a Benkő Lászlótól szerkesztett "Juhász Gyula költői nyelvének szótára" című mű. Ez nem terjed ki a költő minden alkotásának szókincsére, csupán verseinek szavait foglalja össze. Pásztor Emil Arany János Toldi című elbeszélő költeményének szókincsét dolgozta fel szótárszerűen (Toldiszótár. Tankönyvkiadó, 1986). Ez tehát egyetlen jelentős alkotás szókincsét tartalmazza. Ehhez hasonlóan jár el Beke József, amikor Katona József Bánk bán c. drámájának szókészletét dolgozza fel a Bánk bánszótárban (Kecskemét, 1991). (A korábbi hasonló kezdeményezésekről l. Benkő László: Az írói szótár. Akadémiai Kiadó, 1979. 23.)
Csokonai Vitéz Mihály szókincsének különféle vonatkozásaival már sokan foglalkoztak. A magyar felvilágosodás legnagyobb alakjának nyelvi gazdagságáról, az irodalmi nyelv alakulásában betöltött szerepéről csak teljes szókincsének ismeretében beszélhetünk. Az író szókincsét tartalmazó munka hű képet adhat nyelvünk korabeli állapotáról, és természetesen a nyelvújítás megítélésének is egyik fontos támpontja lehet. Hisz a nyelvújítást értékelni akkor tudjuk, ha pontosan ismerjük, mi volt előtte, mit kellett megújítani. Egy ilyen összeállítás ezeken kívül még a debreceni regionális köznyelv alakulásának is fontos dokumentuma.
Éppen ezért a Csokonaiéletmű kritikai kiadásának megjelenésével párhuzamosan hozzákezdtünk a Csokonaiszókincstár előmunkálataihoz. Munkánk alapja tehát a szerző műveinek kritikai kiadása. Ebből eddig megjelent Szilágyi Ferenc gondozásában a költő verseinek IIII. kötete (Akadémiai Kiadó, 1975, 1988, 1992), Pukánszkyné Kádár Jolán pedig Csokonai színműveit tette közzé 1978ban két kötetben (Akadémiai Kiadó). Először a KLTE Számoló Központjában számítógéppel elkészítettük az öt kötetben kiadott művek szókincsének konkordanciáját, külön a verses kötetekét és külön a színművekét. Ezek ábécérendben közlik az előforduló szavakat szövegösszefüggésben, és megjelölik az adatok előfordulási helyét.
A kritikai kiadás befejezésére még legalább egy évtizedet kell várni, ezért elhatároztuk, hogy a szerző színműveinek szókincsét feldolgozzuk és közzétesszük. Ezek a művek ugyanis már megjelentek, egy egységet alkotnak. A bennük lévő anyagot hozzáférhetővé tesszük a kutatók számára, hogy minél hamarabb, például a kritikai kiadás további köteteinek a kiadása során is hasznosíthassák. Majd további egységként elkészítjük a versek szókincsének a tárát, és ugyancsak külön egységként kezeljük Csokonai egyéb prózai írásainak a szóanyagát. Ez kétségtelenül kényszerű szétválasztás, viszont így lehetőség nyílik arra, hogy az író szókincsét műfajok szerinti megoszlásban és összehasonlításban vizsgálhassák az érdeklődők.
Ez a kötet tehát Csokonai színműveinek szókincsét foglalja magában. Tudjuk, hogy a színművek nyelve általában közel áll a beszélt nyelvhez, így az itt található szóanyag a XVIII. század vége magyar beszédnyelvének az emléke, és kétségkívül magán viseli a korabeli debreceni beszéd vonásait is.
Megemlítjük, hogy a teljes anyagot megőriztük számítógépen a "Számítógépes nyelvtörténeti adattár"ban. Így később is - kívánatra - különböző feldolgozásokat lehet készíteni belőle. Példának felhozzuk, hogy könnyen szétválasztható Csokonai eredeti műveinek és fordításainak szókincse, vagy összeállítható egyetlen drámának a szóanyaga, kiíratható egyegy szófajra vagy akár egy végződésre vonatkozó összes adat stb.
Végül köszönetet mondunk Hoffmann Istvánnénak és Kis Tamásnak, akik a szócikkek összeállításában segítségünkre voltak. Kis Tamást külön köszönet illeti a kötet technikai szerkesztéséért is.
A szókincstár munkálatait és e kötet megjelentetését az Országos Kutatási Alap támogatta. A támogatásért ezúton is köszönetet mondunk.
Jakab László - Bölcskei András
A feldolgozás jellege
Munkánk nem írói szótár, hanem az egyszerű adattár és a konkordancia (szövegszótár) kombinációja. Ezért címében nem is szótárnak, hanem szókincstárnak nevezzük. Mit tartalmaz ez a szókincstár? Tartalmazza Csokonai színműveinek minden egyes szavát szócikkekben feldolgozva. A szócikkekben megadjuk a címszó szófaját, esetleg szófajait, ha idegen szó, akkor megjelöljük, hogy latin, német stb. szó, továbbá közöljük, hogy hányszor és hol fordul elő a darabokban. A címszavak jelentésének vagy jelentéseinek illusztrálására pédamondatokat közlünk. Ha a szó kettős, hármas stb. szófajú akkor római számmal elkülönítve különkülön idézzük a példamondatokat és adatokat. Természetesen a terjedelem miatt nem közölhetjük a címszavak összes előfordulásait szövegösszefüggésben, csupán néhány példát hozunk, amelyekből a címszó jelentései, használati körülményei többékevésbé kiderülnek. A jelentéstartalom teljes bemutatására nem törekedhettünk, hisz akkor már valóságos szótárt készítettünk volna. Legtöbbször azonban az általunk közölt példákból megfelelő képet nyerhet a kutató a szavak jelentéseiről. Például Csokonai 16 színművében 9812 szó fordul elő 85 543 adatban. A 9812 szóból 5259et csak egyszer használ az író, 1454et pedig kétszer. Így tehát a szavak több mint 60 százalékának minden előfordulása szövegösszefüggésben található meg a kötetben.
A szócikkek következő része néhány kivételtől eltekintve azokat az adatokat tartalmazza, amelyeket nem mutattunk be szövegösszefüggésben. Mindkét részben megadjuk az adatok előfordulási helyét, hogy bárki visszakereshesse őket a kritikai kiadásban.
Az adattári részben helykímélés végett kénytelenek voltunk egyes szavak adatainak felsorolásától eltekinteni. Nyilvánvalóan nem szükséges a 8347szer előforduló névelők minden egyes előfordulási helyét megadni, hasonlóképpen felesleges a szintén nagyon gyakori kötőszavak, határozószavak, névmások stb. előfordulási helyeit felsorolni. Színművekről lévén szó a szereplők neve is ott áll mindig az általuk mondott szöveg előtt, ezek lelőhelyét sem tüntettük fel. Ezeken kívül néhány gyakori melléknév (jó, kedves, nagy, szép) és a 831szer szereplő úr főnév előfordulási helyeit nem adtuk meg. Természetesen e szavaknak a jelentéseit is bemutatjuk példamondatok segítségével. Ha valaki éppen ezeket kutatja, akkor annak rendelkezésére áll a teljes anyagot tartalmazó konkordancia a Kossuth Lajos Tudományegyetem Magyar Nyelvtudományi Tanszékén.
A szókincstárból meggyőződésünk szerint jó és helyes képet kapunk Csokonai színműveinek szókincséről. Nagyon fontos, hogy segítségével a kutató, de az egyszerű olvasó is könnyen visszakereshet és ellenőrizhet minden adatot. Bárki könnyen megtalálhat minden idézetet, ha legalább egy szóra emlékszik belőle. Az irodalomtörténészek tárgymutatóként is használhatják, a nyelvészek részére a szókincs bemutatásán kívül az alaktani kutatásokhoz teljes adattárat nyújt, a mondattani és jelentéstani vizsgálatokhoz pedig jó példatárat, amelyet tetszés szerint bővíthet mindenki a megadott előfordulási helyek alapján.
A szócikkek felépítése
A szókincstárban külön címszóként szerepel minden egyszerű, összetett és képzett szó, tehát a ható ige, szenvedő ige, segédige, igenév stb. is. A címszavakat mai helyesírással közöljük, megtartjuk azonban az írótól használt hangalakot. Csokonai például az ad ige alapalakját következetesen ád formában írja színműveiben, mert nyilván így is ejtette, ezért a címszó a szótári gyakorlattól eltérően nem ad, hanem ád. Ha a szó alapalakja váltakozva fordul elő, akkor a címszót mai formában írjuk, esetleg több változatban is megadjuk.
Az igenevek közül a főnévi igenévvel kivételt tettünk, ugyanis a megfelelő igével egy szócikkben mutatjuk be, minthogy az összetett igealakokban egy részük amúgy is odakerül. A szócikkfejben azonban utalunk arra hogy hány igenév fordul elő, és a gyakorisági szótárban külön szónak tekintettük. Például az ád szócikkben a 150+16 azt jelenti, hogy 150 igei alak és 16 igenév szerepel benne. Az adni fog összetett jövő időt természetesen igealaknak vettük.
A fentieken kívül külön címszót alkotnak a személyraggal vagy egyéb raggal állandósult főnevek, névmások, határozószók (gazduram, engem, bennünket, sokadmagával, őbenne stb.), a mutatónévmások határozóragos alakjai (abban, ebbe stb.), a tulajdonnevek (Firkász, Kardos, Tipptopp stb.), és különkülön címszavak a család és keresztnevek. Az egyes szavak alakváltozatai egy szócikkbe kerülnek, de utalószavakkal felhívjuk rájuk a figyelmet. Ugyancsak utalunk az összetételek utótagjaira is.
A szövegszótári részben a példamondatokat a kritikai kiadás helyesírása szerint betűhíven közöljük, de a címszóra vonatkozó adatot kurzívval kiemeljük. Csokonai kedvelte a hosszú, többszörösen összetett mondatokat, ezért olykor a mondatból csak annyit idézünk, amennyiből a címszó jelentése kiderül. Néha azonban két mondatot is közölnünk kell, mert csak így tudjuk a szó jelentését bemutatni. Minden egyes példamondat után zárójelben megadjuk az adat előfordulási helyét. Az első számjegy a színmű számát jelöli, a második azt, hogy a darabnak hányadik sorában található a kurzívval kiemelt szó.
A példamondatok után következnek a címszóra vonatkozó további adatok, névszók esetében az alábbi sorrendben: egyes és többes nominativus, birtokos személyragos formák (estrag nélkül), accusativus, genitivus, belső és külső helyhatározóragos alakok (hol?, hová?, honnan?), majd az ért, a dativusi nak/nek, ig, val/vel, vá/vé, képpen, ként, szor/szer/ször, kor ragos adatok. A közép és felsőfokú melléknévi formák ezek után következnek. Ha a címszó ige, akkor először az alanyi ragozás kijelentő mód jelen idő egyes szám 3. személyű adatai jönnek a példamondatok után. Ezt követik az alanyi ragozás kijelentő mód jelen, múlt és jövő idejű alakjai, majd a tárgyas ragozás kijelentő módú példái ugyanebben a sorrendben. Ezek után adjuk a feltételes, majd a felszólító módú adatokat értelemszerűen ugyanolyan elrendezésben, mint azt a kijelentő mód példáiban tettük. Végül a főnévi igenevek következnek. Itt, az adattári részben is minden adat után közöljük a lelőhelyet, illetőleg a lelőhelyeket. A sorszámot jelző szám fölött levő index arra utal, hogy ugyanabban a sorban többször is előfordul ugyanaz az adat. Természetesen ebben a részben is megtartottuk a kritikai kiadás helyesírását. - A szócikket a címszó Csokonai színműveiben előforduló összetett, illetőleg igekötős változatainak a felsorolása zárja.
A források feldolgozása és megjelölése
Amint említettük szókincstárunk tartalmazza a kritikai kiadás alapján Csokonai színműveinek a szókincsét. Egyes darabokból azonban csak azokat a részeket dolgoztuk fel, amelyek valóban az írótól származnak. Így A' boszorkánysíp című műből csak annak a résznek a szavait vettük át, amelyet Csokonai fordított (134-9. l.). A' Varázssíp az előző mű I. felvonása 13. jelenetének másolata, bár Csokonai javított ezen a szövegen, valójában mégsem az ő munkája, ezért ezt is kihagytuk. A' Varázssíp zeneszámai viszont már a költő saját fordításai, ezért ezek szavait felvettük a szókincstárba. Megjegyezzük azt is, hogy a kritikai kiadás jegyzeteiben közölt szövegváltozatokat az egyöntetűség kedvéért nem vettük figyelembe, ezek jó része ugyanis nem autográf kéziratból származik.
Azok az idegen szavak szerepelnek anyagunkban, amelyeket az író beépített magyar mondatba, szövegbe. A fordítatlanul hagyott, vagy összefüggő, hosszú idegen nyelvű szövegrészek szavait nem vontuk be a feldolgozásba.
Minthogy a kritikai kiadás nem látta el sorszámokkal a színműveket, ezt nekünk kellett pótolnunk. Erre a hivatkozás megkönnyítése végett volt szükség. Az egyes darabok sorrendjüknek megfelelően az alábbi számokat kapták:
1. A' méla Tempefői
2. A' voszorkánysíp
3. A' Varázssíp
4. A' Varázssíp zeneszámai
5. Galatéa
6. Ákhilles Stzirusban
7. Amintás
8. A' Szeretet Győzedelme a' Tanúltakon
9. Gerson
10. Az elhagyott Dídó
12. A' Pásztor Király
13. Angélika
14. Doctorandus
15. Cultura
16. Az Özvegy Karnyóné 's a két Szeleburdiak
Ha tehát egy adat után ez áll: (1/74, 1622), akkor ez azt jelenti, hogy a kérdéses adat az első dráma, azaz A' méla Tempefői 74. és 162. sorában található, az utóbbiban kétszer is. Az 1-7. számú darabok a Színművek 1., a 8-16. jelzésűek a 2. kötetében vannak.
A színművek szókincsének gyakorisági megoszlása
A szókincstár anyagából számítógéppel gyakorisági szótárt csináltunk. A feldolgozott szövegben, amint már említettük, 9812 szó fordul elő 85 543 adatban. A szótárból függelékképpen mellékeljük az első 1042 szót. Ezek tíznél többször szerepelnek a szövegben. Azért nem 1000et sorolunk fel, mert 68 11szer előforduló szó van, és egy részüket nem akartuk elhagyni. A szókincsről különböző táblázatokban kimutatást készítettünk, és ugyancsak táblázatokban mutatjuk be a szókincs szófaji megoszlását. Az összehasonlíthatóság megkönnyítése végett átvettük Csirikné Czachesz Erzsébet és Csirik János Újságnyelvi gyakorisági szótárának eljárását (Szeged, l986. XLI-XLVIII).
Az I. táblázatban az egyes gyakorisági intervallumokra vonatkozó számszerű és százalékos értékeket ismertetjük. A leggyakoribb szó (a névelő) 5015ször fordul elő, ez az összes előfordulás 5,86%a. Az első tíz szó, a, az (névelő), és, nem (határozószó), én, az (névmás), hogy (kötőszó), van, is,úr, 17 286szor szerepel, és ez az összes előfordulás 20,20%a stb.
I. TÁBLÁZAT
A különböző gyakorisági intervallumok összehasonlítása
Intervallum Az összes Előfordulások száma előfordulás százalékban 1- 5015 5,86 % 1-10 17286 20,20 % 1-50 31522 36,84 % 1-100 38942 45,52 % 1-500 58550 68,44 % 501-1000 8112 9,48 % 1001-1500 4259 4,97 % 1501-2000 2729 3,19 % 2001-2500 1929 2,25 % 2501-3000 1500 1,75 % 3001-3500 1099 1,28 % 3501-4000 1000 1,16 % 4001-4500 1000 1,16 % 4501-5000 553 0,64 % 5001-5500 500 0,58 % 5501-6000 500 0,58 % 6001-6500 500 0,58 % 6501-7000 500 0,58 % 7001-7500 500 0,58 % 7501-8000 500 0,58 % 8001-8500 500 0,58 % 8501-9000 500 0,58 % 9001-9500 500 0,58 % 9501-9812 312 0,36 %
A II. táblázat a szavak gyakoriságának eloszlását mutatja be. Az első oszlopban a gyakoriság sorszáma található, a másodikban számszerű értéke, a harmadikban pedig a halmozott értékeket tüntettük fel. A legmagasabb abszolút gyakoriság 5015, a második 2753, a kettő halmozott értéke 7768 stb. Ha az első oszlopban több szám szerepel egymás mellett, ez azt jelenti hogy több szó is azonos számban fordul elő. A táblázat második oszlopának segítségével könnyen megállapíthatjuk a gyakorisági szótárból kihagyott szavak helyét. Megnézzük például a szókincstárban, hogy a tapasztal ige kilencszer fordul elő a szövegben. Utána a táblázatból kiolvashatjuk, hogy a kilencszer előforduló szavak az 1130-1235. helyen állnak.
A III./a, III/.b és a III./c táblázatok a szókincs szófajok szerinti megoszlását mutatják be számszerűen és százalékos arányukat az összes szóhoz viszonyítva, ezenkívül láthatjuk belőlük a szófajok előfordulásának számát és százalékos arányát az összes előforduláshoz viszonyítva. A III./a táblázat az egyszófajú szavakat tartalmazza, a III./bben a kettős szófajúak, a III./cben pedig a hármas és négyes szófajúak vannak. Főnév például 3405 szerepel a szövegekben, ez a 9812 szó 34,70%a; ezek a főnevek 22 306szor fordulnak elő, ez pedig az összes előfordulás 26,07%a.
A IV. táblázat az idegen szavak arányát tartalmazza a III./a-c táblázatok beosztása szerint. Kiderül belőle például, hogy a színművekben 613 idegen szó van, ez az összes szavak 6,24%a. Ezek az idegen szavak 1048szor szerepelnek, ami az összes előfordulásnak csak 1,22%a.
A gyakorisági szótár és a gyakoriság megoszlását bemutató táblázatok segítségével a színművek adatait össze lehet hasonlítani Csokonai verseinek és egyéb prózai műveinek hasonló adataival. Amennyiben e színművek nyelve a XVIII. századvégi beszédnyelv emléke, akkor ez a gyakorisági szótár a XVIII. századvég beszédnyelvi gyakorisági szótára. Természetesen más korok, így például a mai magyar nyelvből készült hasonló feldolgozásokkal is össze lehet hasonlítani. Az ilyen összehasonlításokból mindenképpen hasznos nyelvi, nyelvtörténeti, stilisztikai stb. következtetéseket vonhatunk le.
II. TÁBLÁZAT
A szavak gyakoriságának eloszlása
Sorszám Abszolút Halmozott gyakoriság
gyakoriság
1. 5015 5015
2. 2753 7768
3. 1648 9416
4. 1438 10854
5. 1365 12219
6. 1207 13426
7. 1090 14516
8. 1061 15577
9. 878 16455
10. 831 17286
11. 756 18042
12. 741 18783
13. 688 19471
14. 587 20058
15. 579 20637
16. 564 21201
17. 517 21718
18. 514 22232
19. 505 22737
20. 457 23194
21. 418 23612
22. 374 23986
23. 371 24357
24. 353 24710
25. 350 25060
26. 326 25386
27. 310 25696
28. 307 26003
29. 298 26301
30. 296 26597
31-2. 278 27153
33-4. 271 27695
35. 265 27960
36. 263 28223
37. 261 28484
38. 251 28735
39. 250 28985
40. 248 29233
41. 246 29479
42-3. 242 29963
44. 240 30203
45. 236 30439
46. 232 30671
47. 221 30892
48. 215 31107
49. 211 31318
50. 204 31522
51-2. 199 31920
53. 198 32118
54. 196 32314
55. 195 32509
56. 193 32702
57-8. 175 33052
59. 174 33226
60. 172 33398
61. 170 33568
62. 169 33737
63. 165 33902
64. 163 34065
65. 162 34227
66. 157 34384
67. 155 34539
68. 154 34693
69. 153 34846
70-2. 150 35296
73. 149 35445
74-5. 148 35741
76. 147 35888
77. 139 36027
78. 137 36164
79-80. 135 36434
81-2. 133 36700
83. 132 36832
84-5. 130 37092
86-7. 129 37350
88-91. 128 37862
92. 124 37986
93. 123 38109
94-5. 121 38351
96. 120 38471
97. 119 38590
98. 118 38708
99-101. 117 39059
102-3. 115 39289
104. 114 39403
105. 109 39512
106-7. 106 39724
108-9. 105 39934
110-1. 104 40142
112-3. 103 40348
114-5. 102 40552
116. 100 40652
117-9. 95 40937
120-1. 94 41125
122. 93 41218
123-6. 92 41586
127-8. 91 41768
129-30. 90 41948
131-2. 89 42126
133-7. 88 42566
138-9. 87 42740
140-4. 86 43170
145. 85 43255
146-8. 84 43507
149-50. 83 43673
151-3. 82 43919
154-6. 81 44162
157-8. 80 44322
159-61. 78 44556
162. 77 44633
163. 76 44709
164-7. 75 45009
168-9. 74 45157
170-1. 73 45303
172-3. 72 45447
174-6. 71 45660
177. 70 45730
178-80. 69 45937
181. 68 46005
182-5. 67 46273
186-90. 66 46603
191. 65 46668
192-4. 64 46860
195-9. 63 47175
200-1. 62 47299
202-5. 61 47543
206-9. 60 47783
210-7. 59 48255
218-24. 58 48661
225-7. 57 48832
228-9. 56 48944
230-2. 55 49109
233-6. 54 49325
237-40. 53 49537
241-5. 52 49797
246-7. 50 49897
248-54. 49 50240
255-8. 48 50432
259-64. 47 50714
265-9. 46 50944
270-4. 45 51169
275-80. 44 51433
281-8. 43 51777
289-91. 42 51903
292-8. 41 52190
299-306. 40 52510
307-18. 39 52978
319-24. 38 53206
325-31. 37 53465
332-8. 36 53717
339-52. 35 54207
353-61. 34 54513
362-75. 33 54975
376-95. 32 55615
396-406. 31 55956
407-25. 30 56526
426-40. 29 56961
441-58. 28 57465
459-68. 27 57735
469-83. 26 58125
484-504. 25 58650
505-26. 24 59178
527-44. 23 59592
545-65. 22 60054
566-96. 21 60705
597-622. 20 61225
623-42. 19 61605
643-65. 18 62019
666-708. 17 62750
709-43. 16 63310
744-84. 15 63925
785-842. 14 64737
843-98. 13 65465
899-973. 12 66365
974-1042. 11 67124
1043-129. 10 67994
1130-235. 9 68948
1236-353. 8 69892
1354-512. 7 71005
1513-717. 6 72235
1718-2002. 5 73660
2003-427. 4 75360
2428-3099. 3 77376
3100-4553. 2 80284
4554-9812. 1 85543
III./a TÁBLÁZAT
Szófajok szerinti megoszlás
Szavak Százalékos Előfordulásuk Százalékos
száma arány az száma arány az
összes összes
szóhoz előfordulásho
viszonyítva z
viszonyítva
főnév 3405 34,70 % 22306 26,07 %
ige 2333 23,78 % 12637 14,77 %
igenév 1223 12,46 % 2082 2,43 %
melléknév 1018 10,38 % 3297 3,85 %
határozószó 525 5,35 % 7183 8,39 %
névmás 132 1,35 % 8710 10,18 %
számnév 98 1,00 % 987 1,15 %
kötőszó 54 0,55 % 5139 6,01 %
mondatszó 45 0,46 % 384 0,45 %
indulatszó 44 0,45 % 709 0,83 %
névutó 35 0,36 % 603 0,70 %
segédige 4 0,04 % 422 0,49 %
névelő 3 0,03 % 8347 9,76 %
igekötő 1 0,01 % 1 0,01 %
(magában
álló)
Összesen: 8920 90,92 % 72807 85,09 %
III./b TÁBLÁZAT
Kettős szófajú szavak
Szavak Százalékos Előfordulásu Százalékos
száma arány az k száma arány az
összes szóhoz összes
viszonyítva előforduláshoz
viszonyítva
fn/mn,mn/fn 165 1,68 % 3257 3,81 %
ksz/hsz,hsz/k 18 0,18 % 2628 3,07 %
sz
nm/hsz 12 0,12 % 843 0,98 %
hsz/nu,nu/hsz 12 0,12 % 207 0,24 %
fn/hsz,hsz/fn 10 0,10 % 1534 1,79 %
mn/hsz,hsz/mn 9 0,09 % 147 0,17 %
in/fn 7 0,07 % 146 0,17 %
hsz/msz,msz/h 7 0,07 % 343 0,40 %
sz
i/msz,msz/i 3 0,04 % 55 0,06 %
isz/fn 3 0,04 % 96 0,11 %
in/mn 3 0,04 % 18 0,02 %
nm/fn 2 0,02 % 143 0,17 %
szn/mn 2 0,02 % 12 0,01 %
nm/ksz 2 0,02 % 193 0,22 %
hsz/ik 2 0,02 % 12 0,01 %
i/si 1 0,01 % 92 0,11 %
szn/fn 1 0,01 % 25 0,03 %
fn/msz 1 0,01 % 3 0,01 %
nm/ne 1 0,01 % 514 0,60 %
szn/nm 1 0,01 % 198 0,23 %
szn/hsz 1 0,01 % 45 0,05 %
ksz/fn 1 0,01 % 133 0,15 %
Összesen: 264 2,70 % 10644 12,41 %
III./c TÁBLÁZAT
Hármas és négyes szófajú szavak
Szavak Százalékos Előfordulás Százalékos
száma arány az uk száma arány az
összes szóhoz összes
viszonyítva előforduláshoz
viszonyítva
hsz/ksz/msz,ks 3 0,03 % 420 0,49 %
z/hsz/msz
mn/hsz/fn,mn/f 3 0,03 % 380 0,44 %
n/hsz
nm/hsz/ksz 2 0,02 % 84 0,10 %
i/msz/fn 1 0,01 % 4 0,01 %
mn/fn/isz 1 0,01 % 9 0,02 %
in/mn/fn 1 0,01 % 59 0,07 %
szn/mn/hsz 1 0,01 % 3 0,01 %
hsz/ik/msz 1 0,01 % 7 0,01 %
hsz/ksz/ik 1 0,01 % 47 0,06 %
fn/mn/hsz/szn 1 0,01 % 31 0,04 %
Összesen: 15 0,15 % 1044 1,25 %
IV. TÁBLÁZAT
Idegen szavak előfordulása
Szavak Százalékos Előfordulásuk Százalékos
száma arány az száma arány az
összes szóhoz összes
viszonyítva előforduláshoz
viszonyítva
latin 405 4,13 % 734 0,86 %
német 82 0,83 % 147 0,17 %
francia 40 0,40 % 62 0,07 %
olasz 38 0,39 % 49 0,06 %
cigány 23 0,23 % 26 0,03 %
jiddis, 6 0,06 % 10 0,01 %
?jiddis
görög 3 0,03 % 3 0,01 %
görög-latin 1 0,01 % 1 0,01 %
szerb 1 0,01 % 2 0,01 %
török 1 0,01 % 1 0,01 %
kétes 13 0,13 % 13 0,01 %
Összesen: 613 6,23 % 1048 1,25 %