A magyar nyelvtudomány hagyományosan foglalkozik költőink, íróink szókincsének vizsgálatával. Nyilvánvaló, hogy a sokat olvasott szerzők nyelve hatott, és napjainkban is hat nyelvünk fejlődésére. Számos részlettanulmány készült a különböző írók szókincséből, és egyre inkább megérett az a gondolat, hogy egy író nyelvi gazdagsága és hatása az irodalmi nyelv alakulására csak olyan összeállításból derülhet ki, amely kiterjed az író minden művének minden adatára. A különböző országokban korábban egyszerű indexeket készítettek, amelyekben felsorolták az adott szerzőtől használt összes szót, majd konkordanciákat állítottak össze, amelyek szövegösszefüggésben közölték az írók szavait. Végül kialakult az írói szótár, amely az értelmező szótárakhoz hasonlóan megadja a szavak jelentéseit, grammatikai, stilisztikai stb. sajátosságait is. Az utóbbiakból kiderül, hogy az író mit, hogyan, miért használ fel a nyelvből, mivel és hogyan gyarapítja.
A magyar szótárirodalom nem bővelkedik írói szótárakban. Csupán egy olyan szótárunk van, amely egyetlen szerzőnek minden művére kiterjed, ez a Petőfiszótár. Alcíme is jelzi, hogy Petőfi Sándor életművének szókészletét tartalmazza. A szótárt a Magyar Tudományos Akadémia Nyelvtudományi Intézetében egy népes munkacsoport készítette Gáldi László irányításával. Az anyaggyűjtés, szerkesztés és megjelentetés több mint három évtizedig tartott, és nem csekély összegbe került. Első kötete 1973-ban, a negyedik és egyben utolsó 1987-ben jelent meg az Akadémiai Kiadónál. 1972-ben talált kiadóra, így időben megelőzte a Petőfiszótárt a Benkő Lászlótól szerkesztett "Juhász Gyula költői nyelvének szótára" című mű. Ez nem terjed ki a költő minden alkotásának szókincsére, csupán verseinek szavait foglalja össze. Pásztor Emil Arany János Toldi című elbeszélő költeményének szókincsét dolgozta fel szótárszerűen (Toldiszótár. Tankönyvkiadó, 1986). Ez tehát egyetlen jelentős alkotás szókincsét tartalmazza. Ehhez hasonlóan jár el Beke József, amikor Katona József Bánk bán c. drámájának szókészletét dolgozza fel a Bánk bánszótárban (Kecskemét, 1991). (A korábbi hasonló kezdeményezésekről l. Benkő László: Az írói szótár. Akadémiai Kiadó, 1979. 23.)
Csokonai Vitéz Mihály szókincsének különféle vonatkozásaival már sokan foglalkoztak. A magyar felvilágosodás legnagyobb alakjának nyelvi gazdagságáról, az irodalmi nyelv alakulásában betöltött szerepéről csak teljes szókincsének ismeretében beszélhetünk. Az író szókincsét tartalmazó munka hű képet adhat nyelvünk korabeli állapotáról, és természetesen a nyelvújítás megítélésének is egyik fontos támpontja lehet. Hisz a nyelvújítást értékelni akkor tudjuk, ha pontosan ismerjük, mi volt előtte, mit kellett megújítani. Egy ilyen összeállítás ezeken kívül még a debreceni regionális köznyelv alakulásának is fontos dokumentuma.
Éppen ezért a Csokonaiéletmű kritikai kiadásának megjelenésével párhuzamosan hozzákezdtünk a Csokonaiszókincstár előmunkálataihoz. Munkánk alapja tehát a szerző műveinek kritikai kiadása. Ebből eddig megjelent Szilágyi Ferenc gondozásában a költő verseinek IIII. kötete (Akadémiai Kiadó, 1975, 1988, 1992), Pukánszkyné Kádár Jolán pedig Csokonai színműveit tette közzé 1978ban két kötetben (Akadémiai Kiadó). Először a KLTE Számoló Központjában számítógéppel elkészítettük az öt kötetben kiadott művek szókincsének konkordanciáját, külön a verses kötetekét és külön a színművekét. Ezek ábécérendben közlik az előforduló szavakat szövegösszefüggésben, és megjelölik az adatok előfordulási helyét.
A kritikai kiadás befejezésére még legalább egy évtizedet kell várni, ezért elhatároztuk, hogy a szerző színműveinek szókincsét feldolgozzuk és közzétesszük. Ezek a művek ugyanis már megjelentek, egy egységet alkotnak. A bennük lévő anyagot hozzáférhetővé tesszük a kutatók számára, hogy minél hamarabb, például a kritikai kiadás további köteteinek a kiadása során is hasznosíthassák. Majd további egységként elkészítjük a versek szókincsének a tárát, és ugyancsak külön egységként kezeljük Csokonai egyéb prózai írásainak a szóanyagát. Ez kétségtelenül kényszerű szétválasztás, viszont így lehetőség nyílik arra, hogy az író szókincsét műfajok szerinti megoszlásban és összehasonlításban vizsgálhassák az érdeklődők.
Ez a kötet tehát Csokonai színműveinek szókincsét foglalja magában. Tudjuk, hogy a színművek nyelve általában közel áll a beszélt nyelvhez, így az itt található szóanyag a XVIII. század vége magyar beszédnyelvének az emléke, és kétségkívül magán viseli a korabeli debreceni beszéd vonásait is.
Megemlítjük, hogy a teljes anyagot megőriztük számítógépen a "Számítógépes nyelvtörténeti adattár"ban. Így később is - kívánatra - különböző feldolgozásokat lehet készíteni belőle. Példának felhozzuk, hogy könnyen szétválasztható Csokonai eredeti műveinek és fordításainak szókincse, vagy összeállítható egyetlen drámának a szóanyaga, kiíratható egyegy szófajra vagy akár egy végződésre vonatkozó összes adat stb.
Végül köszönetet mondunk Hoffmann Istvánnénak és Kis Tamásnak, akik a szócikkek összeállításában segítségünkre voltak. Kis Tamást külön köszönet illeti a kötet technikai szerkesztéséért is.
A szókincstár munkálatait és e kötet megjelentetését az Országos Kutatási Alap támogatta. A támogatásért ezúton is köszönetet mondunk.
Jakab László - Bölcskei András
A feldolgozás jellege
Munkánk nem írói szótár, hanem az egyszerű adattár és a konkordancia (szövegszótár) kombinációja. Ezért címében nem is szótárnak, hanem szókincstárnak nevezzük. Mit tartalmaz ez a szókincstár? Tartalmazza Csokonai színműveinek minden egyes szavát szócikkekben feldolgozva. A szócikkekben megadjuk a címszó szófaját, esetleg szófajait, ha idegen szó, akkor megjelöljük, hogy latin, német stb. szó, továbbá közöljük, hogy hányszor és hol fordul elő a darabokban. A címszavak jelentésének vagy jelentéseinek illusztrálására pédamondatokat közlünk. Ha a szó kettős, hármas stb. szófajú akkor római számmal elkülönítve különkülön idézzük a példamondatokat és adatokat. Természetesen a terjedelem miatt nem közölhetjük a címszavak összes előfordulásait szövegösszefüggésben, csupán néhány példát hozunk, amelyekből a címszó jelentései, használati körülményei többékevésbé kiderülnek. A jelentéstartalom teljes bemutatására nem törekedhettünk, hisz akkor már valóságos szótárt készítettünk volna. Legtöbbször azonban az általunk közölt példákból megfelelő képet nyerhet a kutató a szavak jelentéseiről. Például Csokonai 16 színművében 9812 szó fordul elő 85 543 adatban. A 9812 szóból 5259et csak egyszer használ az író, 1454et pedig kétszer. Így tehát a szavak több mint 60 százalékának minden előfordulása szövegösszefüggésben található meg a kötetben.
A szócikkek következő része néhány kivételtől eltekintve azokat az adatokat tartalmazza, amelyeket nem mutattunk be szövegösszefüggésben. Mindkét részben megadjuk az adatok előfordulási helyét, hogy bárki visszakereshesse őket a kritikai kiadásban.
Az adattári részben helykímélés végett kénytelenek voltunk egyes szavak adatainak felsorolásától eltekinteni. Nyilvánvalóan nem szükséges a 8347szer előforduló névelők minden egyes előfordulási helyét megadni, hasonlóképpen felesleges a szintén nagyon gyakori kötőszavak, határozószavak, névmások stb. előfordulási helyeit felsorolni. Színművekről lévén szó a szereplők neve is ott áll mindig az általuk mondott szöveg előtt, ezek lelőhelyét sem tüntettük fel. Ezeken kívül néhány gyakori melléknév (jó, kedves, nagy, szép) és a 831szer szereplő úr főnév előfordulási helyeit nem adtuk meg. Természetesen e szavaknak a jelentéseit is bemutatjuk példamondatok segítségével. Ha valaki éppen ezeket kutatja, akkor annak rendelkezésére áll a teljes anyagot tartalmazó konkordancia a Kossuth Lajos Tudományegyetem Magyar Nyelvtudományi Tanszékén.
A szókincstárból meggyőződésünk szerint jó és helyes képet kapunk Csokonai színműveinek szókincséről. Nagyon fontos, hogy segítségével a kutató, de az egyszerű olvasó is könnyen visszakereshet és ellenőrizhet minden adatot. Bárki könnyen megtalálhat minden idézetet, ha legalább egy szóra emlékszik belőle. Az irodalomtörténészek tárgymutatóként is használhatják, a nyelvészek részére a szókincs bemutatásán kívül az alaktani kutatásokhoz teljes adattárat nyújt, a mondattani és jelentéstani vizsgálatokhoz pedig jó példatárat, amelyet tetszés szerint bővíthet mindenki a megadott előfordulási helyek alapján.
A szócikkek felépítése
A szókincstárban külön címszóként szerepel minden egyszerű, összetett és képzett szó, tehát a ható ige, szenvedő ige, segédige, igenév stb. is. A címszavakat mai helyesírással közöljük, megtartjuk azonban az írótól használt hangalakot. Csokonai például az ad ige alapalakját következetesen ád formában írja színműveiben, mert nyilván így is ejtette, ezért a címszó a szótári gyakorlattól eltérően nem ad, hanem ád. Ha a szó alapalakja váltakozva fordul elő, akkor a címszót mai formában írjuk, esetleg több változatban is megadjuk.
Az igenevek közül a főnévi igenévvel kivételt tettünk, ugyanis a megfelelő igével egy szócikkben mutatjuk be, minthogy az összetett igealakokban egy részük amúgy is odakerül. A szócikkfejben azonban utalunk arra hogy hány igenév fordul elő, és a gyakorisági szótárban külön szónak tekintettük. Például az ád szócikkben a 150+16 azt jelenti, hogy 150 igei alak és 16 igenév szerepel benne. Az adni fog összetett jövő időt természetesen igealaknak vettük.
A fentieken kívül külön címszót alkotnak a személyraggal vagy egyéb raggal állandósult főnevek, névmások, határozószók (gazduram, engem, bennünket, sokadmagával, őbenne stb.), a mutatónévmások határozóragos alakjai (abban, ebbe stb.), a tulajdonnevek (Firkász, Kardos, Tipptopp stb.), és különkülön címszavak a család és keresztnevek. Az egyes szavak alakváltozatai egy szócikkbe kerülnek, de utalószavakkal felhívjuk rájuk a figyelmet. Ugyancsak utalunk az összetételek utótagjaira is.
A szövegszótári részben a példamondatokat a kritikai kiadás helyesírása szerint betűhíven közöljük, de a címszóra vonatkozó adatot kurzívval kiemeljük. Csokonai kedvelte a hosszú, többszörösen összetett mondatokat, ezért olykor a mondatból csak annyit idézünk, amennyiből a címszó jelentése kiderül. Néha azonban két mondatot is közölnünk kell, mert csak így tudjuk a szó jelentését bemutatni. Minden egyes példamondat után zárójelben megadjuk az adat előfordulási helyét. Az első számjegy a színmű számát jelöli, a második azt, hogy a darabnak hányadik sorában található a kurzívval kiemelt szó.
A példamondatok után következnek a címszóra vonatkozó további adatok, névszók esetében az alábbi sorrendben: egyes és többes nominativus, birtokos személyragos formák (estrag nélkül), accusativus, genitivus, belső és külső helyhatározóragos alakok (hol?, hová?, honnan?), majd az ért, a dativusi nak/nek, ig, val/vel, vá/vé, képpen, ként, szor/szer/ször, kor ragos adatok. A közép és felsőfokú melléknévi formák ezek után következnek. Ha a címszó ige, akkor először az alanyi ragozás kijelentő mód jelen idő egyes szám 3. személyű adatai jönnek a példamondatok után. Ezt követik az alanyi ragozás kijelentő mód jelen, múlt és jövő idejű alakjai, majd a tárgyas ragozás kijelentő módú példái ugyanebben a sorrendben. Ezek után adjuk a feltételes, majd a felszólító módú adatokat értelemszerűen ugyanolyan elrendezésben, mint azt a kijelentő mód példáiban tettük. Végül a főnévi igenevek következnek. Itt, az adattári részben is minden adat után közöljük a lelőhelyet, illetőleg a lelőhelyeket. A sorszámot jelző szám fölött levő index arra utal, hogy ugyanabban a sorban többször is előfordul ugyanaz az adat. Természetesen ebben a részben is megtartottuk a kritikai kiadás helyesírását. - A szócikket a címszó Csokonai színműveiben előforduló összetett, illetőleg igekötős változatainak a felsorolása zárja.
A források feldolgozása és megjelölése
Amint említettük szókincstárunk tartalmazza a kritikai kiadás alapján Csokonai színműveinek a szókincsét. Egyes darabokból azonban csak azokat a részeket dolgoztuk fel, amelyek valóban az írótól származnak. Így A' boszorkánysíp című műből csak annak a résznek a szavait vettük át, amelyet Csokonai fordított (134-9. l.). A' Varázssíp az előző mű I. felvonása 13. jelenetének másolata, bár Csokonai javított ezen a szövegen, valójában mégsem az ő munkája, ezért ezt is kihagytuk. A' Varázssíp zeneszámai viszont már a költő saját fordításai, ezért ezek szavait felvettük a szókincstárba. Megjegyezzük azt is, hogy a kritikai kiadás jegyzeteiben közölt szövegváltozatokat az egyöntetűség kedvéért nem vettük figyelembe, ezek jó része ugyanis nem autográf kéziratból származik.
Azok az idegen szavak szerepelnek anyagunkban, amelyeket az író beépített magyar mondatba, szövegbe. A fordítatlanul hagyott, vagy összefüggő, hosszú idegen nyelvű szövegrészek szavait nem vontuk be a feldolgozásba.
Minthogy a kritikai kiadás nem látta el sorszámokkal a színműveket, ezt nekünk kellett pótolnunk. Erre a hivatkozás megkönnyítése végett volt szükség. Az egyes darabok sorrendjüknek megfelelően az alábbi számokat kapták:
1. A' méla Tempefői
2. A' voszorkánysíp
3. A' Varázssíp
4. A' Varázssíp zeneszámai
5. Galatéa
6. Ákhilles Stzirusban
7. Amintás
8. A' Szeretet Győzedelme a' Tanúltakon
9. Gerson
10. Az elhagyott Dídó
12. A' Pásztor Király
13. Angélika
14. Doctorandus
15. Cultura
16. Az Özvegy Karnyóné 's a két Szeleburdiak
Ha tehát egy adat után ez áll: (1/74, 1622), akkor ez azt jelenti, hogy a kérdéses adat az első dráma, azaz A' méla Tempefői 74. és 162. sorában található, az utóbbiban kétszer is. Az 1-7. számú darabok a Színművek 1., a 8-16. jelzésűek a 2. kötetében vannak.
A színművek szókincsének gyakorisági megoszlása
A szókincstár anyagából számítógéppel gyakorisági szótárt csináltunk. A feldolgozott szövegben, amint már említettük, 9812 szó fordul elő 85 543 adatban. A szótárból függelékképpen mellékeljük az első 1042 szót. Ezek tíznél többször szerepelnek a szövegben. Azért nem 1000et sorolunk fel, mert 68 11szer előforduló szó van, és egy részüket nem akartuk elhagyni. A szókincsről különböző táblázatokban kimutatást készítettünk, és ugyancsak táblázatokban mutatjuk be a szókincs szófaji megoszlását. Az összehasonlíthatóság megkönnyítése végett átvettük Csirikné Czachesz Erzsébet és Csirik János Újságnyelvi gyakorisági szótárának eljárását (Szeged, l986. XLI-XLVIII).
Az I. táblázatban az egyes gyakorisági intervallumokra vonatkozó számszerű és százalékos értékeket ismertetjük. A leggyakoribb szó (a névelő) 5015ször fordul elő, ez az összes előfordulás 5,86%a. Az első tíz szó, a, az (névelő), és, nem (határozószó), én, az (névmás), hogy (kötőszó), van, is,úr, 17 286szor szerepel, és ez az összes előfordulás 20,20%a stb.
I. TÁBLÁZAT
A különböző gyakorisági intervallumok összehasonlítása
Intervallum Az összes Előfordulások száma előfordulás százalékban 1- 5015 5,86 % 1-10 17286 20,20 % 1-50 31522 36,84 % 1-100 38942 45,52 % 1-500 58550 68,44 % 501-1000 8112 9,48 % 1001-1500 4259 4,97 % 1501-2000 2729 3,19 % 2001-2500 1929 2,25 % 2501-3000 1500 1,75 % 3001-3500 1099 1,28 % 3501-4000 1000 1,16 % 4001-4500 1000 1,16 % 4501-5000 553 0,64 % 5001-5500 500 0,58 % 5501-6000 500 0,58 % 6001-6500 500 0,58 % 6501-7000 500 0,58 % 7001-7500 500 0,58 % 7501-8000 500 0,58 % 8001-8500 500 0,58 % 8501-9000 500 0,58 % 9001-9500 500 0,58 % 9501-9812 312 0,36 %
A II. táblázat a szavak gyakoriságának eloszlását mutatja be. Az első oszlopban a gyakoriság sorszáma található, a másodikban számszerű értéke, a harmadikban pedig a halmozott értékeket tüntettük fel. A legmagasabb abszolút gyakoriság 5015, a második 2753, a kettő halmozott értéke 7768 stb. Ha az első oszlopban több szám szerepel egymás mellett, ez azt jelenti hogy több szó is azonos számban fordul elő. A táblázat második oszlopának segítségével könnyen megállapíthatjuk a gyakorisági szótárból kihagyott szavak helyét. Megnézzük például a szókincstárban, hogy a tapasztal ige kilencszer fordul elő a szövegben. Utána a táblázatból kiolvashatjuk, hogy a kilencszer előforduló szavak az 1130-1235. helyen állnak.
A III./a, III/.b és a III./c táblázatok a szókincs szófajok szerinti megoszlását mutatják be számszerűen és százalékos arányukat az összes szóhoz viszonyítva, ezenkívül láthatjuk belőlük a szófajok előfordulásának számát és százalékos arányát az összes előforduláshoz viszonyítva. A III./a táblázat az egyszófajú szavakat tartalmazza, a III./bben a kettős szófajúak, a III./cben pedig a hármas és négyes szófajúak vannak. Főnév például 3405 szerepel a szövegekben, ez a 9812 szó 34,70%a; ezek a főnevek 22 306szor fordulnak elő, ez pedig az összes előfordulás 26,07%a.
A IV. táblázat az idegen szavak arányát tartalmazza a III./a-c táblázatok beosztása szerint. Kiderül belőle például, hogy a színművekben 613 idegen szó van, ez az összes szavak 6,24%a. Ezek az idegen szavak 1048szor szerepelnek, ami az összes előfordulásnak csak 1,22%a.
A gyakorisági szótár és a gyakoriság megoszlását bemutató táblázatok segítségével a színművek adatait össze lehet hasonlítani Csokonai verseinek és egyéb prózai műveinek hasonló adataival. Amennyiben e színművek nyelve a XVIII. századvégi beszédnyelv emléke, akkor ez a gyakorisági szótár a XVIII. századvég beszédnyelvi gyakorisági szótára. Természetesen más korok, így például a mai magyar nyelvből készült hasonló feldolgozásokkal is össze lehet hasonlítani. Az ilyen összehasonlításokból mindenképpen hasznos nyelvi, nyelvtörténeti, stilisztikai stb. következtetéseket vonhatunk le.
II. TÁBLÁZAT
A szavak gyakoriságának eloszlása
Sorszám Abszolút Halmozott gyakoriság gyakoriság 1. 5015 5015 2. 2753 7768 3. 1648 9416 4. 1438 10854 5. 1365 12219 6. 1207 13426 7. 1090 14516 8. 1061 15577 9. 878 16455 10. 831 17286 11. 756 18042 12. 741 18783 13. 688 19471 14. 587 20058 15. 579 20637 16. 564 21201 17. 517 21718 18. 514 22232 19. 505 22737 20. 457 23194 21. 418 23612 22. 374 23986 23. 371 24357 24. 353 24710 25. 350 25060 26. 326 25386 27. 310 25696 28. 307 26003 29. 298 26301 30. 296 26597 31-2. 278 27153 33-4. 271 27695 35. 265 27960 36. 263 28223 37. 261 28484 38. 251 28735 39. 250 28985 40. 248 29233 41. 246 29479 42-3. 242 29963 44. 240 30203 45. 236 30439 46. 232 30671 47. 221 30892 48. 215 31107 49. 211 31318 50. 204 31522 51-2. 199 31920 53. 198 32118 54. 196 32314 55. 195 32509 56. 193 32702 57-8. 175 33052 59. 174 33226 60. 172 33398 61. 170 33568 62. 169 33737 63. 165 33902 64. 163 34065 65. 162 34227 66. 157 34384 67. 155 34539 68. 154 34693 69. 153 34846 70-2. 150 35296 73. 149 35445 74-5. 148 35741 76. 147 35888 77. 139 36027 78. 137 36164 79-80. 135 36434 81-2. 133 36700 83. 132 36832 84-5. 130 37092 86-7. 129 37350 88-91. 128 37862 92. 124 37986 93. 123 38109 94-5. 121 38351 96. 120 38471 97. 119 38590 98. 118 38708 99-101. 117 39059 102-3. 115 39289 104. 114 39403 105. 109 39512 106-7. 106 39724 108-9. 105 39934 110-1. 104 40142 112-3. 103 40348 114-5. 102 40552 116. 100 40652 117-9. 95 40937 120-1. 94 41125 122. 93 41218 123-6. 92 41586 127-8. 91 41768 129-30. 90 41948 131-2. 89 42126 133-7. 88 42566 138-9. 87 42740 140-4. 86 43170 145. 85 43255 146-8. 84 43507 149-50. 83 43673 151-3. 82 43919 154-6. 81 44162 157-8. 80 44322 159-61. 78 44556 162. 77 44633 163. 76 44709 164-7. 75 45009 168-9. 74 45157 170-1. 73 45303 172-3. 72 45447 174-6. 71 45660 177. 70 45730 178-80. 69 45937 181. 68 46005 182-5. 67 46273 186-90. 66 46603 191. 65 46668 192-4. 64 46860 195-9. 63 47175 200-1. 62 47299 202-5. 61 47543 206-9. 60 47783 210-7. 59 48255 218-24. 58 48661 225-7. 57 48832 228-9. 56 48944 230-2. 55 49109 233-6. 54 49325 237-40. 53 49537 241-5. 52 49797 246-7. 50 49897 248-54. 49 50240 255-8. 48 50432 259-64. 47 50714 265-9. 46 50944 270-4. 45 51169 275-80. 44 51433 281-8. 43 51777 289-91. 42 51903 292-8. 41 52190 299-306. 40 52510 307-18. 39 52978 319-24. 38 53206 325-31. 37 53465 332-8. 36 53717 339-52. 35 54207 353-61. 34 54513 362-75. 33 54975 376-95. 32 55615 396-406. 31 55956 407-25. 30 56526 426-40. 29 56961 441-58. 28 57465 459-68. 27 57735 469-83. 26 58125 484-504. 25 58650 505-26. 24 59178 527-44. 23 59592 545-65. 22 60054 566-96. 21 60705 597-622. 20 61225 623-42. 19 61605 643-65. 18 62019 666-708. 17 62750 709-43. 16 63310 744-84. 15 63925 785-842. 14 64737 843-98. 13 65465 899-973. 12 66365 974-1042. 11 67124 1043-129. 10 67994 1130-235. 9 68948 1236-353. 8 69892 1354-512. 7 71005 1513-717. 6 72235 1718-2002. 5 73660 2003-427. 4 75360 2428-3099. 3 77376 3100-4553. 2 80284 4554-9812. 1 85543
III./a TÁBLÁZAT
Szófajok szerinti megoszlás
Szavak Százalékos Előfordulásuk Százalékos száma arány az száma arány az összes összes szóhoz előfordulásho viszonyítva z viszonyítva főnév 3405 34,70 % 22306 26,07 % ige 2333 23,78 % 12637 14,77 % igenév 1223 12,46 % 2082 2,43 % melléknév 1018 10,38 % 3297 3,85 % határozószó 525 5,35 % 7183 8,39 % névmás 132 1,35 % 8710 10,18 % számnév 98 1,00 % 987 1,15 % kötőszó 54 0,55 % 5139 6,01 % mondatszó 45 0,46 % 384 0,45 % indulatszó 44 0,45 % 709 0,83 % névutó 35 0,36 % 603 0,70 % segédige 4 0,04 % 422 0,49 % névelő 3 0,03 % 8347 9,76 % igekötő 1 0,01 % 1 0,01 % (magában álló) Összesen: 8920 90,92 % 72807 85,09 %
III./b TÁBLÁZAT
Kettős szófajú szavak
Szavak Százalékos Előfordulásu Százalékos száma arány az k száma arány az összes szóhoz összes viszonyítva előforduláshoz viszonyítva fn/mn,mn/fn 165 1,68 % 3257 3,81 % ksz/hsz,hsz/k 18 0,18 % 2628 3,07 % sz nm/hsz 12 0,12 % 843 0,98 % hsz/nu,nu/hsz 12 0,12 % 207 0,24 % fn/hsz,hsz/fn 10 0,10 % 1534 1,79 % mn/hsz,hsz/mn 9 0,09 % 147 0,17 % in/fn 7 0,07 % 146 0,17 % hsz/msz,msz/h 7 0,07 % 343 0,40 % sz i/msz,msz/i 3 0,04 % 55 0,06 % isz/fn 3 0,04 % 96 0,11 % in/mn 3 0,04 % 18 0,02 % nm/fn 2 0,02 % 143 0,17 % szn/mn 2 0,02 % 12 0,01 % nm/ksz 2 0,02 % 193 0,22 % hsz/ik 2 0,02 % 12 0,01 % i/si 1 0,01 % 92 0,11 % szn/fn 1 0,01 % 25 0,03 % fn/msz 1 0,01 % 3 0,01 % nm/ne 1 0,01 % 514 0,60 % szn/nm 1 0,01 % 198 0,23 % szn/hsz 1 0,01 % 45 0,05 % ksz/fn 1 0,01 % 133 0,15 % Összesen: 264 2,70 % 10644 12,41 %
III./c TÁBLÁZAT
Hármas és négyes szófajú szavak
Szavak Százalékos Előfordulás Százalékos száma arány az uk száma arány az összes szóhoz összes viszonyítva előforduláshoz viszonyítva hsz/ksz/msz,ks 3 0,03 % 420 0,49 % z/hsz/msz mn/hsz/fn,mn/f 3 0,03 % 380 0,44 % n/hsz nm/hsz/ksz 2 0,02 % 84 0,10 % i/msz/fn 1 0,01 % 4 0,01 % mn/fn/isz 1 0,01 % 9 0,02 % in/mn/fn 1 0,01 % 59 0,07 % szn/mn/hsz 1 0,01 % 3 0,01 % hsz/ik/msz 1 0,01 % 7 0,01 % hsz/ksz/ik 1 0,01 % 47 0,06 % fn/mn/hsz/szn 1 0,01 % 31 0,04 % Összesen: 15 0,15 % 1044 1,25 %
IV. TÁBLÁZAT
Idegen szavak előfordulása
Szavak Százalékos Előfordulásuk Százalékos száma arány az száma arány az összes szóhoz összes viszonyítva előforduláshoz viszonyítva latin 405 4,13 % 734 0,86 % német 82 0,83 % 147 0,17 % francia 40 0,40 % 62 0,07 % olasz 38 0,39 % 49 0,06 % cigány 23 0,23 % 26 0,03 % jiddis, 6 0,06 % 10 0,01 % ?jiddis görög 3 0,03 % 3 0,01 % görög-latin 1 0,01 % 1 0,01 % szerb 1 0,01 % 2 0,01 % török 1 0,01 % 1 0,01 % kétes 13 0,13 % 13 0,01 % Összesen: 613 6,23 % 1048 1,25 %