ELŐSZÓ

A magyar nyelvtudomány hagyományosan foglalkozik költőink, íróink szókincsének vizsgálatával. Nyilvánvaló, hogy a sokat olvasott szerzők nyelve hatott, és napjainkban is hat nyelvünk fejlődésére. Számos részlettanulmány készült a különböző írók szókincséből, és egyre inkább megérett az a gondolat, hogy egy író nyelvi gazdagsága és hatása az irodalmi nyelv alakulására csak olyan összeállításból derülhet ki, amely kiterjed az író minden művének minden adatára. A különböző országokban korábban egyszerű indexeket készítettek, amelyekben felsorolták az adott szerzőtől használt összes szót, majd konkordanciákat állítottak össze, amelyek szövegösszefüggésben közölték az írók szavait. Végül kialakult az írói szótár, amely az értelmező szótárakhoz hasonlóan megadja a szavak jelentéseit, grammatikai, stilisztikai stb. sajátosságait is. Az utóbbiakból kiderül, hogy az író mit, hogyan, miért használ fel a nyelvből, mivel és hogyan gyarapítja.

A magyar szótárirodalom nem bővelkedik írói szótárakban. Csupán egy olyan szótárunk van, amely egyetlen szerzőnek minden művére kiterjed, ez a Petőfiszótár. Alcíme is jelzi, hogy Petőfi Sándor életművének szókészletét tartalmazza. A szótárt a Magyar Tudományos Akadémia Nyelvtudományi Intézetében egy népes munkacsoport készítette Gáldi László irányításával. Az anyaggyűjtés, szerkesztés és megjelentetés több mint három évtizedig tartott, és nem csekély összegbe került. Első kötete 1973-ban, a negyedik és egyben utolsó 1987-ben jelent meg az Akadémiai Kiadónál. 1972-ben talált kiadóra, így időben megelőzte a Petőfiszótárt a Benkő Lászlótól szerkesztett "Juhász Gyula költői nyelvének szótára" című mű. Ez nem terjed ki a költő minden alkotásának szókincsére, csupán verseinek szavait foglalja össze. Pásztor Emil Arany János Toldi című elbeszélő költeményének szókincsét dolgozta fel szótárszerűen (Toldiszótár. Tankönyvkiadó, 1986). Ez tehát egyetlen jelentős alkotás szókincsét tartalmazza. Ehhez hasonlóan jár el Beke József, amikor Katona József Bánk bán c. drámájának szókészletét dolgozza fel a Bánk bánszótárban (Kecskemét, 1991). (A korábbi hasonló kezdeményezésekről l. Benkő László: Az írói szótár. Akadémiai Kiadó, 1979. 23.)

Csokonai Vitéz Mihály szókincsének különféle vonatkozásaival már sokan foglalkoztak. A magyar felvilágosodás legnagyobb alakjának nyelvi gazdagságáról, az irodalmi nyelv alakulásában betöltött szerepéről csak teljes szókincsének ismeretében beszélhetünk. Az író szókincsét tartalmazó munka hű képet adhat nyelvünk korabeli állapotáról, és természetesen a nyelvújítás megítélésének is egyik fontos támpontja lehet. Hisz a nyelvújítást értékelni akkor tudjuk, ha pontosan ismerjük, mi volt előtte, mit kellett megújítani. Egy ilyen összeállítás ezeken kívül még a debreceni regionális köznyelv alakulásának is fontos dokumentuma.

Éppen ezért a Csokonaiéletmű kritikai kiadásának megjelenésével párhuzamosan hozzákezdtünk a Csokonaiszókincstár előmunkálataihoz. Munkánk alapja tehát a szerző műveinek kritikai kiadása. Ebből eddig megjelent Szilágyi Ferenc gondozásában a költő verseinek IIII. kötete (Akadémiai Kiadó, 1975, 1988, 1992), Pukánszkyné Kádár Jolán pedig Csokonai színműveit tette közzé 1978ban két kötetben (Akadémiai Kiadó). Először a KLTE Számoló Központjában számítógéppel elkészítettük az öt kötetben kiadott művek szókincsének konkordanciáját, külön a verses kötetekét és külön a színművekét. Ezek ábécérendben közlik az előforduló szavakat szövegösszefüggésben, és megjelölik az adatok előfordulási helyét.

A kritikai kiadás befejezésére még legalább egy évtizedet kell várni, ezért elhatároztuk, hogy a szerző színműveinek szókincsét feldolgozzuk és közzétesszük. Ezek a művek ugyanis már megjelentek, egy egységet alkotnak. A bennük lévő anyagot hozzáférhetővé tesszük a kutatók számára, hogy minél hamarabb, például a kritikai kiadás további köteteinek a kiadása során is hasznosíthassák. Majd további egységként elkészítjük a versek szókincsének a tárát, és ugyancsak külön egységként kezeljük Csokonai egyéb prózai írásainak a szóanyagát. Ez kétségtelenül kényszerű szétválasztás, viszont így lehetőség nyílik arra, hogy az író szókincsét műfajok szerinti megoszlásban és összehasonlításban vizsgálhassák az érdeklődők.

Ez a kötet tehát Csokonai színműveinek szókincsét foglalja magában. Tudjuk, hogy a színművek nyelve általában közel áll a beszélt nyelvhez, így az itt található szóanyag a XVIII. század vége magyar beszédnyelvének az emléke, és kétségkívül magán viseli a korabeli debreceni beszéd vonásait is.

Megemlítjük, hogy a teljes anyagot megőriztük számítógépen a "Számítógépes nyelvtörténeti adattár"ban. Így később is - kívánatra - különböző feldolgozásokat lehet készíteni belőle. Példának felhozzuk, hogy könnyen szétválasztható Csokonai eredeti műveinek és fordításainak szókincse, vagy összeállítható egyetlen drámának a szóanyaga, kiíratható egyegy szófajra vagy akár egy végződésre vonatkozó összes adat stb.

Végül köszönetet mondunk Hoffmann Istvánnénak és Kis Tamásnak, akik a szócikkek összeállításában segítségünkre voltak. Kis Tamást külön köszönet illeti a kötet technikai szerkesztéséért is.

A szókincstár munkálatait és e kötet megjelentetését az Országos Kutatási Alap támogatta. A támogatásért ezúton is köszönetet mondunk.

Jakab László - Bölcskei András

A feldolgozás jellege

Munkánk nem írói szótár, hanem az egyszerű adattár és a konkordancia (szövegszótár) kombinációja. Ezért címében nem is szótárnak, hanem szókincstárnak nevezzük. Mit tartalmaz ez a szókincstár? Tartalmazza Csokonai színműveinek minden egyes szavát szócikkekben feldolgozva. A szócikkekben megadjuk a címszó szófaját, esetleg szófajait, ha idegen szó, akkor megjelöljük, hogy latin, német stb. szó, továbbá közöljük, hogy hányszor és hol fordul elő a darabokban. A címszavak jelentésének vagy jelentéseinek illusztrálására pédamondatokat közlünk. Ha a szó kettős, hármas stb. szófajú akkor római számmal elkülönítve különkülön idézzük a példamondatokat és adatokat. Természetesen a terjedelem miatt nem közölhetjük a címszavak összes előfordulásait szövegösszefüggésben, csupán néhány példát hozunk, amelyekből a címszó jelentései, használati körülményei többékevésbé kiderülnek. A jelentéstartalom teljes bemutatására nem törekedhettünk, hisz akkor már valóságos szótárt készítettünk volna. Legtöbbször azonban az általunk közölt példákból megfelelő képet nyerhet a kutató a szavak jelentéseiről. Például Csokonai 16 színművében 9812 szó fordul elő 85 543 adatban. A 9812 szóból 5259et csak egyszer használ az író, 1454et pedig kétszer. Így tehát a szavak több mint 60 százalékának minden előfordulása szövegösszefüggésben található meg a kötetben.

A szócikkek következő része néhány kivételtől eltekintve azokat az adatokat tartalmazza, amelyeket nem mutattunk be szövegösszefüggésben. Mindkét részben megadjuk az adatok előfordulási helyét, hogy bárki visszakereshesse őket a kritikai kiadásban.

Az adattári részben helykímélés végett kénytelenek voltunk egyes szavak adatainak felsorolásától eltekinteni. Nyilvánvalóan nem szükséges a 8347szer előforduló névelők minden egyes előfordulási helyét megadni, hasonlóképpen felesleges a szintén nagyon gyakori kötőszavak, határozószavak, névmások stb. előfordulási helyeit felsorolni. Színművekről lévén szó a szereplők neve is ott áll mindig az általuk mondott szöveg előtt, ezek lelőhelyét sem tüntettük fel. Ezeken kívül néhány gyakori melléknév (jó, kedves, nagy, szép) és a 831szer szereplő úr főnév előfordulási helyeit nem adtuk meg. Természetesen e szavaknak a jelentéseit is bemutatjuk példamondatok segítségével. Ha valaki éppen ezeket kutatja, akkor annak rendelkezésére áll a teljes anyagot tartalmazó konkordancia a Kossuth Lajos Tudományegyetem Magyar Nyelvtudományi Tanszékén.

A szókincstárból meggyőződésünk szerint jó és helyes képet kapunk Csokonai színműveinek szókincséről. Nagyon fontos, hogy segítségével a kutató, de az egyszerű olvasó is könnyen visszakereshet és ellenőrizhet minden adatot. Bárki könnyen megtalálhat minden idézetet, ha legalább egy szóra emlékszik belőle. Az irodalomtörténészek tárgymutatóként is használhatják, a nyelvészek részére a szókincs bemutatásán kívül az alaktani kutatásokhoz teljes adattárat nyújt, a mondattani és jelentéstani vizsgálatokhoz pedig jó példatárat, amelyet tetszés szerint bővíthet mindenki a megadott előfordulási helyek alapján.

A szócikkek felépítése

A szókincstárban külön címszóként szerepel minden egyszerű, összetett és képzett szó, tehát a ható ige, szenvedő ige, segédige, igenév stb. is. A címszavakat mai helyesírással közöljük, megtartjuk azonban az írótól használt hangalakot. Csokonai például az ad ige alapalakját következetesen ád formában írja színműveiben, mert nyilván így is ejtette, ezért a címszó a szótári gyakorlattól eltérően nem ad, hanem ád. Ha a szó alapalakja váltakozva fordul elő, akkor a címszót mai formában írjuk, esetleg több változatban is megadjuk.

Az igenevek közül a főnévi igenévvel kivételt tettünk, ugyanis a megfelelő igével egy szócikkben mutatjuk be, minthogy az összetett igealakokban egy részük amúgy is odakerül. A szócikkfejben azonban utalunk arra hogy hány igenév fordul elő, és a gyakorisági szótárban külön szónak tekintettük. Például az ád szócikkben a 150+16 azt jelenti, hogy 150 igei alak és 16 igenév szerepel benne. Az adni fog összetett jövő időt természetesen igealaknak vettük.

A fentieken kívül külön címszót alkotnak a személyraggal vagy egyéb raggal állandósult főnevek, névmások, határozószók (gazduram, engem, bennünket, sokadmagával, őbenne stb.), a mutatónévmások határozóragos alakjai (abban, ebbe stb.), a tulajdonnevek (Firkász, Kardos, Tipptopp stb.), és különkülön címszavak a család és keresztnevek. Az egyes szavak alakváltozatai egy szócikkbe kerülnek, de utalószavakkal felhívjuk rájuk a figyelmet. Ugyancsak utalunk az összetételek utótagjaira is.

A szövegszótári részben a példamondatokat a kritikai kiadás helyesírása szerint betűhíven közöljük, de a címszóra vonatkozó adatot kurzívval kiemeljük. Csokonai kedvelte a hosszú, többszörösen összetett mondatokat, ezért olykor a mondatból csak annyit idézünk, amennyiből a címszó jelentése kiderül. Néha azonban két mondatot is közölnünk kell, mert csak így tudjuk a szó jelentését bemutatni. Minden egyes példamondat után zárójelben megadjuk az adat előfordulási helyét. Az első számjegy a színmű számát jelöli, a második azt, hogy a darabnak hányadik sorában található a kurzívval kiemelt szó.

A példamondatok után következnek a címszóra vonatkozó további adatok, névszók esetében az alábbi sorrendben: egyes és többes nominativus, birtokos személyragos formák (estrag nélkül), accusativus, genitivus, belső és külső helyhatározóragos alakok (hol?, hová?, honnan?), majd az ért, a dativusi nak/nek, ig, val/vel, vá/vé, képpen, ként, szor/szer/ször, kor ragos adatok. A közép és felsőfokú melléknévi formák ezek után következnek. Ha a címszó ige, akkor először az alanyi ragozás kijelentő mód jelen idő egyes szám 3. személyű adatai jönnek a példamondatok után. Ezt követik az alanyi ragozás kijelentő mód jelen, múlt és jövő idejű alakjai, majd a tárgyas ragozás kijelentő módú példái ugyanebben a sorrendben. Ezek után adjuk a feltételes, majd a felszólító módú adatokat értelemszerűen ugyanolyan elrendezésben, mint azt a kijelentő mód példáiban tettük. Végül a főnévi igenevek következnek. Itt, az adattári részben is minden adat után közöljük a lelőhelyet, illetőleg a lelőhelyeket. A sorszámot jelző szám fölött levő index arra utal, hogy ugyanabban a sorban többször is előfordul ugyanaz az adat. Természetesen ebben a részben is megtartottuk a kritikai kiadás helyesírását. - A szócikket a címszó Csokonai színműveiben előforduló összetett, illetőleg igekötős változatainak a felsorolása zárja.

A források feldolgozása és megjelölése

Amint említettük szókincstárunk tartalmazza a kritikai kiadás alapján Csokonai színműveinek a szókincsét. Egyes darabokból azonban csak azokat a részeket dolgoztuk fel, amelyek valóban az írótól származnak. Így A' boszorkánysíp című műből csak annak a résznek a szavait vettük át, amelyet Csokonai fordított (134-9. l.). A' Varázssíp az előző mű I. felvonása 13. jelenetének másolata, bár Csokonai javított ezen a szövegen, valójában mégsem az ő munkája, ezért ezt is kihagytuk. A' Varázssíp zeneszámai viszont már a költő saját fordításai, ezért ezek szavait felvettük a szókincstárba. Megjegyezzük azt is, hogy a kritikai kiadás jegyzeteiben közölt szövegváltozatokat az egyöntetűség kedvéért nem vettük figyelembe, ezek jó része ugyanis nem autográf kéziratból származik.

Azok az idegen szavak szerepelnek anyagunkban, amelyeket az író beépített magyar mondatba, szövegbe. A fordítatlanul hagyott, vagy összefüggő, hosszú idegen nyelvű szövegrészek szavait nem vontuk be a feldolgozásba.

Minthogy a kritikai kiadás nem látta el sorszámokkal a színműveket, ezt nekünk kellett pótolnunk. Erre a hivatkozás megkönnyítése végett volt szükség. Az egyes darabok sorrendjüknek megfelelően az alábbi számokat kapták:

1. A' méla Tempefői

2. A' voszorkánysíp

3. A' Varázssíp

4. A' Varázssíp zeneszámai

5. Galatéa

6. Ákhilles Stzirusban

7. Amintás

8. A' Szeretet Győzedelme a' Tanúltakon

9. Gerson

10. Az elhagyott Dídó

12. A' Pásztor Király

13. Angélika

14. Doctorandus

15. Cultura

16. Az Özvegy Karnyóné 's a két Szeleburdiak

Ha tehát egy adat után ez áll: (1/74, 1622), akkor ez azt jelenti, hogy a kérdéses adat az első dráma, azaz A' méla Tempefői 74. és 162. sorában található, az utóbbiban kétszer is. Az 1-7. számú darabok a Színművek 1., a 8-16. jelzésűek a 2. kötetében vannak.

A színművek szókincsének gyakorisági megoszlása

A szókincstár anyagából számítógéppel gyakorisági szótárt csináltunk. A feldolgozott szövegben, amint már említettük, 9812 szó fordul elő 85 543 adatban. A szótárból függelékképpen mellékeljük az első 1042 szót. Ezek tíznél többször szerepelnek a szövegben. Azért nem 1000et sorolunk fel, mert 68 11szer előforduló szó van, és egy részüket nem akartuk elhagyni. A szókincsről különböző táblázatokban kimutatást készítettünk, és ugyancsak táblázatokban mutatjuk be a szókincs szófaji megoszlását. Az összehasonlíthatóság megkönnyítése végett átvettük Csirikné Czachesz Erzsébet és Csirik János Újságnyelvi gyakorisági szótárának eljárását (Szeged, l986. XLI-XLVIII).

Az I. táblázatban az egyes gyakorisági intervallumokra vonatkozó számszerű és százalékos értékeket ismertetjük. A leggyakoribb szó (a névelő) 5015ször fordul elő, ez az összes előfordulás 5,86%a. Az első tíz szó, a, az (névelő), és, nem (határozószó), én, az (névmás), hogy (kötőszó), van, is,úr, 17 286szor szerepel, és ez az összes előfordulás 20,20%a stb.

I. TÁBLÁZAT

A különböző gyakorisági intervallumok összehasonlítása


Intervallum         Az összes   Előfordulások 
száma             előfordulás     százalékban 

1-                       5015          5,86 % 

1-10                    17286         20,20 % 

1-50                    31522         36,84 % 

1-100                   38942         45,52 % 

1-500                   58550         68,44 % 

501-1000                 8112          9,48 % 

1001-1500                4259          4,97 % 

1501-2000                2729          3,19 % 

2001-2500                1929          2,25 % 

2501-3000                1500          1,75 % 

3001-3500                1099          1,28 % 

3501-4000                1000          1,16 % 

4001-4500                1000          1,16 % 

4501-5000                 553          0,64 % 

5001-5500                 500          0,58 % 

5501-6000                 500          0,58 % 

6001-6500                 500          0,58 % 

6501-7000                 500          0,58 % 

7001-7500                 500          0,58 % 

7501-8000                 500          0,58 % 

8001-8500                 500          0,58 % 

8501-9000                 500          0,58 % 

9001-9500                 500          0,58 % 

9501-9812                 312          0,36 % 



A II. táblázat a szavak gyakoriságának eloszlását mutatja be. Az első oszlopban a gyakoriság sorszáma található, a másodikban számszerű értéke, a harmadikban pedig a halmozott értékeket tüntettük fel. A legmagasabb abszolút gyakoriság 5015, a második 2753, a kettő halmozott értéke 7768 stb. Ha az első oszlopban több szám szerepel egymás mellett, ez azt jelenti hogy több szó is azonos számban fordul elő. A táblázat második oszlopának segítségével könnyen megállapíthatjuk a gyakorisági szótárból kihagyott szavak helyét. Megnézzük például a szókincstárban, hogy a tapasztal ige kilencszer fordul elő a szövegben. Utána a táblázatból kiolvashatjuk, hogy a kilencszer előforduló szavak az 1130-1235. helyen állnak.

A III./a, III/.b és a III./c táblázatok a szókincs szófajok szerinti megoszlását mutatják be számszerűen és százalékos arányukat az összes szóhoz viszonyítva, ezenkívül láthatjuk belőlük a szófajok előfordulásának számát és százalékos arányát az összes előforduláshoz viszonyítva. A III./a táblázat az egyszófajú szavakat tartalmazza, a III./bben a kettős szófajúak, a III./cben pedig a hármas és négyes szófajúak vannak. Főnév például 3405 szerepel a szövegekben, ez a 9812 szó 34,70%a; ezek a főnevek 22 306szor fordulnak elő, ez pedig az összes előfordulás 26,07%a.

A IV. táblázat az idegen szavak arányát tartalmazza a III./a-c táblázatok beosztása szerint. Kiderül belőle például, hogy a színművekben 613 idegen szó van, ez az összes szavak 6,24%a. Ezek az idegen szavak 1048szor szerepelnek, ami az összes előfordulásnak csak 1,22%a.

A gyakorisági szótár és a gyakoriság megoszlását bemutató táblázatok segítségével a színművek adatait össze lehet hasonlítani Csokonai verseinek és egyéb prózai műveinek hasonló adataival. Amennyiben e színművek nyelve a XVIII. századvégi beszédnyelv emléke, akkor ez a gyakorisági szótár a XVIII. századvég beszédnyelvi gyakorisági szótára. Természetesen más korok, így például a mai magyar nyelvből készült hasonló feldolgozásokkal is össze lehet hasonlítani. Az ilyen összehasonlításokból mindenképpen hasznos nyelvi, nyelvtörténeti, stilisztikai stb. következtetéseket vonhatunk le.

II. TÁBLÁZAT

A szavak gyakoriságának eloszlása

Sorszám                 Abszolút  Halmozott gyakoriság 
                      gyakoriság                       

1.                          5015                  5015 

2.                          2753                  7768 

3.                          1648                  9416 

4.                          1438                 10854 

5.                          1365                 12219 

6.                          1207                 13426 

7.                          1090                 14516 

8.                          1061                 15577 

9.                           878                 16455 

10.                          831                 17286 

11.                          756                 18042 

12.                          741                 18783 

13.                          688                 19471 

14.                          587                 20058 

15.                          579                 20637 

16.                          564                 21201 

17.                          517                 21718 

18.                          514                 22232 

19.                          505                 22737 

20.                          457                 23194 

21.                          418                 23612 

22.                          374                 23986 

23.                          371                 24357 

24.                          353                 24710 

25.                          350                 25060 

26.                          326                 25386 

27.                          310                 25696 

28.                          307                 26003 

29.                          298                 26301 

30.                          296                 26597 

31-2.                        278                 27153 

33-4.                        271                 27695 

35.                          265                 27960 

36.                          263                 28223 

37.                          261                 28484 

38.                          251                 28735 

39.                          250                 28985 

40.                          248                 29233 

41.                          246                 29479 

42-3.                        242                 29963 

44.                          240                 30203 

45.                          236                 30439 

46.                          232                 30671 

47.                          221                 30892 

48.                          215                 31107 

49.                          211                 31318 

50.                          204                 31522 

51-2.                        199                 31920 

53.                          198                 32118 

54.                          196                 32314 

55.                          195                 32509 

56.                          193                 32702 

57-8.                        175                 33052 

59.                          174                 33226 

60.                          172                 33398 

61.                          170                 33568 

62.                          169                 33737 

63.                          165                 33902 

64.                          163                 34065 

65.                          162                 34227 

66.                          157                 34384 

67.                          155                 34539 

68.                          154                 34693 

69.                          153                 34846 

70-2.                        150                 35296 

73.                          149                 35445 

74-5.                        148                 35741 

76.                          147                 35888 

77.                          139                 36027 

78.                          137                 36164 

79-80.                       135                 36434 

81-2.                        133                 36700 

83.                          132                 36832 

84-5.                        130                 37092 

86-7.                        129                 37350 

88-91.                       128                 37862 

92.                          124                 37986 

93.                          123                 38109 

94-5.                        121                 38351 

96.                          120                 38471 

97.                          119                 38590 

98.                          118                 38708 

99-101.                      117                 39059 

102-3.                       115                 39289 

104.                         114                 39403 

105.                         109                 39512 

106-7.                       106                 39724 

108-9.                       105                 39934 

110-1.                       104                 40142 

112-3.                       103                 40348 

114-5.                       102                 40552 

116.                         100                 40652 

117-9.                        95                 40937 

120-1.                        94                 41125 

122.                          93                 41218 

123-6.                        92                 41586 

127-8.                        91                 41768 

129-30.                       90                 41948 

131-2.                        89                 42126 

133-7.                        88                 42566 

138-9.                        87                 42740 

140-4.                        86                 43170 

145.                          85                 43255 

146-8.                        84                 43507 

149-50.                       83                 43673 

151-3.                        82                 43919 

154-6.                        81                 44162 

157-8.                        80                 44322 

159-61.                       78                 44556 

162.                          77                 44633 

163.                          76                 44709 

164-7.                        75                 45009 

168-9.                        74                 45157 

170-1.                        73                 45303 

172-3.                        72                 45447 

174-6.                        71                 45660 

177.                          70                 45730 

178-80.                       69                 45937 

181.                          68                 46005 

182-5.                        67                 46273 

186-90.                       66                 46603 

191.                          65                 46668 

192-4.                        64                 46860 

195-9.                        63                 47175 

200-1.                        62                 47299 

202-5.                        61                 47543 

206-9.                        60                 47783 

210-7.                        59                 48255 

218-24.                       58                 48661 

225-7.                        57                 48832 

228-9.                        56                 48944 

230-2.                        55                 49109 

233-6.                        54                 49325 

237-40.                       53                 49537 

241-5.                        52                 49797 

246-7.                        50                 49897 

248-54.                       49                 50240 

255-8.                        48                 50432 

259-64.                       47                 50714 

265-9.                        46                 50944 

270-4.                        45                 51169 

275-80.                       44                 51433 

281-8.                        43                 51777 

289-91.                       42                 51903 

292-8.                        41                 52190 

299-306.                      40                 52510 

307-18.                       39                 52978 

319-24.                       38                 53206 

325-31.                       37                 53465 

332-8.                        36                 53717 

339-52.                       35                 54207 

353-61.                       34                 54513 

362-75.                       33                 54975 

376-95.                       32                 55615 

396-406.                      31                 55956 

407-25.                       30                 56526 

426-40.                       29                 56961 

441-58.                       28                 57465 

459-68.                       27                 57735 

469-83.                       26                 58125 

484-504.                      25                 58650 

505-26.                       24                 59178 

527-44.                       23                 59592 

545-65.                       22                 60054 

566-96.                       21                 60705 

597-622.                      20                 61225 

623-42.                       19                 61605 

643-65.                       18                 62019 

666-708.                      17                 62750 

709-43.                       16                 63310 

744-84.                       15                 63925 

785-842.                      14                 64737 

843-98.                       13                 65465 

899-973.                      12                 66365 

974-1042.                     11                 67124 

1043-129.                     10                 67994 

1130-235.                      9                 68948 

1236-353.                      8                 69892 

1354-512.                      7                 71005 

1513-717.                      6                 72235 

1718-2002.                     5                 73660 

2003-427.                      4                 75360 

2428-3099.                     3                 77376 

3100-4553.                     2                 80284 

4554-9812.                     1                 85543 


III./a TÁBLÁZAT

Szófajok szerinti megoszlás


                 Szavak    Százalékos  Előfordulásuk    Százalékos 
                  száma      arány az          száma      arány az 
                               összes                       összes 
                               szóhoz                előfordulásho 
                          viszonyítva                            z 
                                                       viszonyítva 

főnév              3405       34,70 %          22306       26,07 % 

ige                2333       23,78 %          12637       14,77 % 

igenév             1223       12,46 %           2082        2,43 % 

melléknév          1018       10,38 %           3297        3,85 % 

határozószó         525        5,35 %           7183        8,39 % 

névmás              132        1,35 %           8710       10,18 % 

számnév              98        1,00 %            987        1,15 % 

kötőszó              54        0,55 %           5139        6,01 % 

mondatszó            45        0,46 %            384        0,45 % 

indulatszó           44        0,45 %            709        0,83 % 

névutó               35        0,36 %            603        0,70 % 

segédige              4        0,04 %            422        0,49 % 

névelő                3        0,03 %           8347        9,76 % 

igekötő               1        0,01 %              1        0,01 % 
(magában                                                           
álló)                                                              

Összesen:          8920       90,92 %          72807       85,09 % 



III./b TÁBLÁZAT

Kettős szófajú szavak


                 Szavak     Százalékos Előfordulásu     Százalékos 
                  száma       arány az      k száma       arány az 
                         összes szóhoz                      összes 
                           viszonyítva              előforduláshoz 
                                                       viszonyítva 

fn/mn,mn/fn         165         1,68 %         3257         3,81 % 

ksz/hsz,hsz/k        18         0,18 %         2628         3,07 % 
sz                                                                 

nm/hsz               12         0,12 %          843         0,98 % 

hsz/nu,nu/hsz        12         0,12 %          207         0,24 % 

fn/hsz,hsz/fn        10         0,10 %         1534         1,79 % 

mn/hsz,hsz/mn         9         0,09 %          147         0,17 % 

in/fn                 7         0,07 %          146         0,17 % 

hsz/msz,msz/h         7         0,07 %          343         0,40 % 
sz                                                                 

i/msz,msz/i           3         0,04 %           55         0,06 % 

isz/fn                3         0,04 %           96         0,11 % 

in/mn                 3         0,04 %           18         0,02 % 

nm/fn                 2         0,02 %          143         0,17 % 

szn/mn                2         0,02 %           12         0,01 % 

nm/ksz                2         0,02 %          193         0,22 % 

hsz/ik                2         0,02 %           12         0,01 % 

i/si                  1         0,01 %           92         0,11 % 

szn/fn                1         0,01 %           25         0,03 % 

fn/msz                1         0,01 %            3         0,01 % 

nm/ne                 1         0,01 %          514         0,60 % 

szn/nm                1         0,01 %          198         0,23 % 

szn/hsz               1         0,01 %           45         0,05 % 

ksz/fn                1         0,01 %          133         0,15 % 

Összesen:           264         2,70 %        10644        12,41 % 



III./c TÁBLÁZAT

Hármas és négyes szófajú szavak


                Szavak     Százalékos Előfordulás     Százalékos 
                 száma       arány az    uk száma       arány az 
                        összes szóhoz                     összes 
                          viszonyítva             előforduláshoz 
                                                     viszonyítva 

hsz/ksz/msz,ks       3         0,03 %         420         0,49 % 
z/hsz/msz                                                        

mn/hsz/fn,mn/f       3         0,03 %         380         0,44 % 
n/hsz                                                            

nm/hsz/ksz           2         0,02 %          84         0,10 % 

i/msz/fn             1         0,01 %           4         0,01 % 

mn/fn/isz            1         0,01 %           9         0,02 % 

in/mn/fn             1         0,01 %          59         0,07 % 

szn/mn/hsz           1         0,01 %           3         0,01 % 

hsz/ik/msz           1         0,01 %           7         0,01 % 

hsz/ksz/ik           1         0,01 %          47         0,06 % 

fn/mn/hsz/szn        1         0,01 %          31         0,04 % 

Összesen:           15         0,15 %        1044         1,25 % 



IV. TÁBLÁZAT

Idegen szavak előfordulása


                Szavak     Százalékos  Előfordulásuk     Százalékos 
                 száma       arány az          száma       arány az 
                        összes szóhoz                        összes 
                          viszonyítva                előforduláshoz 
                                                        viszonyítva 

latin              405         4,13 %            734         0,86 % 

német               82         0,83 %            147         0,17 % 

francia             40         0,40 %             62         0,07 % 

olasz               38         0,39 %             49         0,06 % 

cigány              23         0,23 %             26         0,03 % 

jiddis,              6         0,06 %             10         0,01 % 
?jiddis                                                             

görög                3         0,03 %              3         0,01 % 

görög-latin          1         0,01 %              1         0,01 % 

szerb                1         0,01 %              2         0,01 % 

török                1         0,01 %              1         0,01 % 

kétes               13         0,13 %             13         0,01 % 

Összesen:          613         6,23 %           1048         1,25 %