A felhasználói bizalom és a népszámlálási adatok digitális szolgáltatása* Múlt, jelen, jövő Magyarországon és Nagy-Britanniában

Az újabb kori – nem pusztán az adókivetés és a katonaállítás alapjául szolgáló – népszámlálások felbecsülhetetlen értékű információval szolgálnak az adott időszak társadalmi viszonyairól. Adataik nélkülözhetetlenek a társadalomtudósok, a gazdasági és politikai döntéshozók, a gazdaság-, népesség-, társadalom- és helytörténészek munkájához. A cenzusok mindenkori kérdésanyaga, a kapott válaszok összefüggéseinek értelmezése bepillantást engedhet régmúlt korok embereinek gondolkodásmódjába; az adatok elemzése fordulatot hozhat még korábbi időszakok történeti értékelésében (e helyütt elegendő csak arra utalnunk, miként változtatta meg a II. József-féle 1784–1787-es összeírások eredményeinek ismerete a török hódoltság korának népességszámáról való tudásunkat). Ennek a hatalmas méretű és jelentőségű anyagnak a lehető legszélesebb körben való hozzáférhetővé tétele közérdek – de egyben rendkívül nehéz feladat is.

A népszámlálások során felvett adatok kezelése, tárolása és szolgáltatása minden országban problémát jelent. Magyarországon az egyéni adatokat kezelő statisztikával szemben kialakult bizalmatlanság kísérte-kíséri végig a teljes körű összeírásokat. Ennek köszönhető az a világszerte egyedülálló népszámlálási módszer, hogy az adatokat a 2001. és a 2011. évi népszámlálás alkalmával név nélkül vették fel. Zaklatott történelmünk másik következménye, hogy a személyi kérdőívek csak igen kis számban maradtak fenn. Magyarországon egyik népszámlálásból sem áll rendelkezésre a személyi kérdőívek teljes állománya, és igen gyakori eset, hogy az összes kérdőív megsemmisült.

Nagy-Britanniában a szenzitív* adatok hiányának és a közigazgatás fejlettségének köszönhetően a népszámlálások személyi kérdőívei igen kevés kivételtől eltekintve fennmaradtak, és a jogszabályok betartása mellett elérhetők a tudományos kutatók és a családfa-összeállítók számára is. A száz évnél régebbi népszámlálási adatok szabadon hozzáférhetők. Az anyagok feldolgozására és szolgáltatására több alternatív lehetőség is nyílik: egyes esetekben cégek végezték a népszámlálási ívek digitalizálását, más esetben közgyűjtemények, illetve közgyűjtemények és cégek együttműködésére is találunk példát. A feldolgozott és adatbázisba rendezett személyi kérdőívek közül így némelyik ingyenesen hozzáférhető, némelyik fizetős szolgáltatásként vehető igénybe. A következőkben a történeti háttér és a brit példa bemutatása után vázoljuk fel a népszámlálási adatközlések digitalizálására és elektronikus publikálására vonatkozó javaslatainkat.

Az első népszámlálások Magyarországon

A Habsburg-birodalom területén 1754-től tartottak teljes körű lélekösszeírásokat. Ezek kezdetben az egyházi és a földesúri adminisztrációra, 1770-től a tartományi közigazgatásra és a hadseregre támaszkodtak. 1777-ben kimondottan katonai célú népességfelvételt bonyolítottak le az örökös tartományokban. Magyarországon 1764-től 1767-ig próbaszámlálásokat tartottak a kamarai birtokokon. 1771-gyel kezdődően több alkalommal készültek adatfelvételek a nem nemes népességről. A nemesség még évtizedekig kiváltságai között tartotta számon az összeírásokból való kimaradást.

1784. július 16-án tették közzé II. József népszámlálási rendeletét, amely a közjó, a közigazgatás egységesítése és az állam gazdagodása érdekében a birodalom teljes területére vonatkozóan azonos összeírási alapelveket írt elő. Az uralkodó levelezéséből és a kérdőívek tartalmából egyértelműen kiderül, hogy a népszámlálás egyik legfontosabb célja a katonakorú népesség és az utánpótlás felmérése volt. (Míg a negyven évnél fiatalabb férfiak esetében rögzítették a kort, a testalkatot és a fogyatékosságot, addig a nők, a papok és a nemesek körében ilyen adatokat nem vettek fel.) József elrendelte továbbá a községi névtáblák felállítását, a házak és a nemesi kúriák megszámozását, valamint a népességszámban bekövetkezett változásokat regisztráló települési népességkönyvek vezetését.

Az intézkedések kiváltották a privilégiumait féltő nemesség ellenállását. Októberben József így írt Lipót öccsének, Toszkána nagyhercegének: „A magyar urak sok bajt okoznak, pimasz és oktalan ellenállást tanúsítanak az összeírásnál.” Tolnában például két hónapig vártak a népszámlálási rendelet kihirdetésével, de még ekkor sem láttak munkához, hanem válaszfeliratot adtak ki, és könyörgő leveleket küldtek szét. Máshol nyílt ellenállásra, az összeírók megverésére és elkergetésére is sor került. Nyitrában és Pozsonyban felvonult a katonaság: a parancs értelmében a házszámot letörlő nemesekre beszállásolás várt, az erőszakos ellenállókat elfogták és Bécsbe hurcolták. (A tiltakozáshullám adta meg a végső lökést Józsefnek a közigazgatás átszervezéséhez: 1785-ben Magyarország területét tíz, Erdélyét három adminisztratív kerületre osztotta, amelyek élére királyi biztosok kerültek. A megyék, a szabad kerületek és a szabad királyi városok vezetőit ezután az uralkodó nevezte ki.)

A legtöbb megyében az eredetileg kitűzött 1784. szeptember helyett november végén indult meg az összeírás. Erdélyben az időközben kirobbant parasztfelkelés miatt a következő évre csúsztak át a munkálatok. A népszámlálást 1786-ban és 1787-ben megismételték.1

Mivel az összeírás adatait a korban nem publikálták, azokat nem tudták hasznosítani sem a magyar politikai vezetők, sem az országleírásokat készítő tudósok. II. József halála után a magyar nemesség jogainak sérelmétől és az adatok felhasználásától való félelmében megsemmisítette a népszámlálási anyagokat. Mivel az összeírási ívek négy példányban készültek, a települési adatok nagy része a Magyar Nemzeti Levéltár Országos Levéltárában és a megyei levéltárakban szerencsésen megmaradt, így az eredményeket Thirring Gusztáv rekonstruálni tudta a XX. század első felében.2 Ő csak aggregált adatokat* közölt, 1960-ban azonban a KSH Könyvtár gondozásában napvilágot látott a településsoros adatokat tartalmazó Az első magyarországi népszámlálás, 1784–1787 című kötet is Dányi Dezső és Dávid Zoltán szerkesztésében. Ennek kiegészítése 1997-ben jelent meg II. József népszámlálásának községi adatai címmel.

II. József 1790-ben bekövetkezett halála után Magyarországon évtizedekig nem tartottak teljes körű, a nemes és a nem nemes népességet egyaránt számba vevő összeírást. A szabadságharc után két ízben szerveztek birodalmi népszámlálást. Az 1850-esről már a kortársak megállapították, hogy szervezési-lebonyolítási anomáliák miatt a lakosság 5–6%-a kimaradt az összeírásból. Az 1857-es cenzus ugyancsak alulmérte a népességszámot, ráadásul nem is kérdezett rá a nemzetiségre, hanem az 1850. évi népszámlálás adatait igyekezett „továbbvezetni” az 1857-es állapotokra. A hivatalos magyar statisztikai szervezet létrehozása és az ország valós közállapotainak felderítése a politikai-értelmiségi elit számára elsőrendű fontosságú ügy volt.3 Az MTA Statisztikai Bizottsága – a világon egyedülálló módon – 1860-ban önkéntes népszámlálási programot hirdetett lelkészek és papok segítségével.4 Az adatgyűjtés hiányosságai és a közigazgatási hatalom és szervezet hiánya miatt a kezdeményezés nem érte el célját. 1862-ben a Statisztikai Bizottság belátta, hogy „a kitűzött czélt lehetetlen elérni.”5

 

Fennmaradt felvételi ívek az 1857. évi népszámlálásból6

A magyar közigazgatás által szervezett népszámlálások

Az 1867. február 20-án hivatalba lépett Andrássy-kormány földmívelés-, ipar- és kereskedelemügyi minisztere, Gorove István ugyanezen év májusában felkérte Keleti Károlyt, hogy szervezze meg az önálló magyar statisztikai szolgálatot. A miniszter elképzelése szerint az új szakosztálynak még 1867 folyamán le kellett volna bonyolítania egy népszámlálást. Keleti rövidesen előállt Irányelvek egyúttal javaslat a népszámlálás ügyében címet viselő tervezetével, amelyet a nyár folyamán megtárgyalt az Országos Statisztikai Tanács. Mivel kiderült, hogy az előkészületekre sokkal több időt kell szánni, a népszámlálást előbb 1868 végére, majd 1869 végére halasztották.

1869. július 13-án lépett hatályba a népszámlálási törvény, amely egyebek mellett rögzítette az összeírás december 31-i éjféli eszmei időpontját és az adatszolgáltatási kötelezettséget. Nem sokkal ezután Gorove miniszter felhívást bocsátott ki a törvényhatóságokhoz, amelynek legfigyelemreméltóbb pontjában kijelentette, hogy a népszámlálási adatokat nem fogják új terhek vagy adóemelések alapjául venni.

Bár 1868 nyarán még a felteendő kérdések között szerepelt, végül politikai okokból nem tudakolták a nemzetiségi hovatartozást az összeírás során. Ugyanakkor a közvéleményt leginkább ez a kérdés foglalkoztatta, amint erre Keleti Károly utalt is egy 1871-ben írt cikkében. A következő, 1880-as cenzus adataiból már a nemzetiségi megoszlás is kiderült. Az érdeklődőknek addig be kellett érniük a Hazánk és népe című 1873-as Keleti-műben foglalt – az 1870-es népiskolai felvételre alapozott, és mint utólag kiderült, meglehetősen pontos – becsléssel.

A feldolgozás esetenkénti nehézségei ellenére az adatokat viszonylag gyorsan publikálták. A legfontosabb eredményeket már 1870-ben közzétették egy Keleti által szerkesztett zsebkönyvben. 1871 végén jelent meg az adatokat megyei és járási szinten közlő, hatalmas alakú és terjedelmű népszámlálási kötet. A házak és a lakosság számát az 1873-as Helységnévtár részletezte települési szinten. Később tizenkét megyéről, valamint Kolozsvár és Székesfehérvár szabad királyi városról készült település-, illetve településrész-szintű adatsorokat tartalmazó füzet. A községsoros vallási adatok a Sebők László által 2005-ben összeállított Az 1869. évi népszámlálás vallási adatai című forráskiadványban láttak napvilágot.7

Az 1880. évi népszámlálás már sok tekintetben túlszárnyalta a tíz évvel korábbi összeírást. Ekkor tértek át a lajstromos adatfelvételről az egyéni kérdőívekre. Ez a népszámlálás az első, amely pontos, megbízható adatokat tartalmaz az anyanyelvre vonatkozóan. Innentől kezdve napjainkig átlagosan tízévente került sor népszámlálásra, amelyek során rendszeresen rákérdeztek az anyanyelvre, majd később a nemzetiségre (mint az előzőnél szubjektívebb tényezőre) is.8

1900-ban, 1910-ben és 1930-ban a KSH soron kívül ellenőrizte azon települések anyanyelvi adatsorait, amelyek a korábbi összeírásoktól lényegesen eltérő eredményeket produkáltak. A revízió levelezés útján vagy bizalmas kiküldetés során történt. A „gyanús” településekre ellátogató és a felülvizsgálatot lefolytató szakértők között mások mellett megtalálható volt Thirring Lajos, a népszámlálási osztály későbbi vezetője és az 1949-es népszámlálás előkészítője; Mozolovszky Sándor, az 1930-as népesség-ösz-szeírás felelőse; és – néhány alkalommal – maga Kovács Alajos, a hivatal elnöke.9

A XX. század első évtizedeiben a Statisztikai Hivatal az adatokat példaértékűen publikálta a Statisztikai közlemények című sorozatában. Ebből a megfelelő szakmai háttérrel feldolgozott adatokat részletesen megismerhette a társadalom.10

Az 1949. évi népszámlálásig bezárólag az összeírások során előállt egyéni adatokat tartalmazó ívek szinte kivétel nélkül elvesztek. A kevés megmaradt kivétel elsősorban a helyi levéltárakban megőrződött másolat.

Az 1893. évi cigányösszeírás

A népszámlálások mellett a korszak nagy de­mog­ráfiai adatfelvétele volt az 1893. évi „czi­gány­összeírás”. Ezt az összeírást a csavargók által generált társadalmi probléma hatására kellett elrendelni. A népszámlálásoktól eltérően az adatfelvétel egyetlen napon történt, amikor a települések rendeletileg nem engedhették a vándorló népesség mozgását. Ennek köszönhetően még a népszámlálásoknál is koncentráltabb, összetettebb feladatot jelentett a statisztikusok számára.11 A cigányösszeírás Hermann Antal és Jekelfalussy József vezetésével zajlott. A cigányok helyzete mellett szociológiai szempontból szerették volna vizsgálni a polgárosodás és a letelepedés kérdését. Az adatfelvételt központilag támogatták, azonban több település (köztük Budapest is) „letagadta” a cigányokat, és kivonta magát az adatgyűjtési kötelezettség alól. Az összeírás a hiányos adatokkal is sikeresnek volt mondható, de a hiányos adatszolgáltatás miatt az eredményeket közlő kötet csak részben közölt települési szinten adatokat.

Az első teljes körű cigányösszeírás egyben az utolsó is lett Magyarországon. A következő mintavételes felméréseket 1971-ben, 1993-ban és 2003-ban hajtották végre 2, illetve 1%-os reprezentatív minta segítségével.

A magyarországi németek kitelepítése

Az 1941. évi népszámlálás során lehetett először a nemzetiségi kötődést külön megjelölni. Így a magukat német anyanyelvűnek, de magyarnak jelölő lakosság számára ez egyfajta Hitlerrel történő szembenállást jelentett.

A második világháború után a KSH felsőbb utasításra az 1941. évi népszámlálás kérdőíveit használta fel arra, hogy listát készítsen a magukat német nemzetiségűnek valló állampolgárokról. A listát a kormányzat a németek kitelepítéséhez használta fel. A KSH munkatársai igyekeztek ellenállni, illetve késleltetni a lista összeállítását; a terv ellen felszólalt Elekes Dezső, a KSH elnöke, Thirring Lajos, a Magyar Statisztikai Szemle felelős szerkesztője és a Magyar Statisztikai Társaság ügyvivő alelnöke, valamint Bibó István is. A KSH-ban erősödő ellenállásra reakcióként több statisztikust is börtönbüntetésre ítéltek. A KSH vezetése 1946. szeptember 17-én kelt levelében értesítette a belügyminisztériumot és a nagyobb városokat a „német anyanyelvű és nemzetiségű lakosokról készült lajstromok” megküldéséről.12

A német lakosságot érintő lista elkészítése és felhasználása hozzájárult a lakosság bizalmatlanságához a népszámlálások és az egyedi adatok biztonságos kezelését illetően. Ennek következtében az adatfelvételek jelentős torzításokat is tartalmazhatnak. Az 1949. évi népszámlálási adatok szerint létezett olyan település, amelynek lakosai között ötszáz fő horvát anyanyelvű volt, de egy sem vallotta magát horvát nemzetiségűnek. Az is előfordult, hogy a politikai légkör enyhülésével egy településen a magukat német nemzetiségűnek vallók száma megháromszorozódott két népszámlálás között.13

Népszámlálások Magyarországon 1949 után és az egyéni adatok kezelése

Bár 1960 után a népszámlálások egyéni adatai hivatali titoknak minősültek, az 1949. évi népszámlálás után következő összeírások esetén a lakosság számára nem garantálták azt, hogy a felvett adatokat kizárólag statisztikai célokra használják.14 Ugyanakkor a népszámlálás aggregált adataihoz történő hozzáférés sem volt megoldva, mert pl. a nemzetiségekre vonatkozó adatokat nem dolgozták fel települési szinten. A felekezeti hovatartozásra vonatkozó kérdést nem vették fel egészen a 2001. évi népszámlálásig. (Ez egyébként a nemzetközi ajánlásokban sem szerepel kötelező elemként. Elhagyásával egy szenzitív adattal kevesebb szerepelt a népszámlálásokban, azonban a magyar társadalom egyik fontos jellemzőjét hagyták el negyven éven keresztül az összeírások alkalmával.)15

Erre a korszakra tehető az első archiválás is: ha nem is egy-egy népszámlálás teljes személyi anyagát, de az 1970., 1980. és 1990. évi népszámlálásokból 20%-os mintát levéltári őrizetbe helyeztek. Ez – a KSH Levéltár megszűnése után – jelenleg a Magyar Nemzeti Levéltár Országos Levéltárában található.16

2001-ben először történt név nélkül az adatszolgáltatás Magyarországon. Ez nagyrészt a nemzeti és etnikai törvénynek köszönhető, amely nem lett volna összeegyeztethető azzal, hogy az adatszolgáltatók névvel adják meg a nemzetiségüket.17 Ezt a módszert alkalmazták a 2011. évi népszámláláskor is.

A kutatók számára szükséges egyéni adatokhoz való hozzáférésre jelenleg anonimizáltan, offline keretek között nyílik lehetőség, de a KSH kutatószobája mindenki számára hozzáférést biztosít a 2001. évi népszámlálás 5%-os mintájához, illetve a 2005. évi mikrocenzus teljes adatállományához. A felhasználónak minden esetben nyilatkoznia kell arról, hogy az egyéni adatok alapján senkit sem próbál meg azonosítani.18 A KSH számára leadott adatigénylések között a mikroadatok iránti kérések száma az elmúlt években fokozatosan emelkedett.

A mikroadatok kiadása számának alakulása
a KSH-ban 2003 és 2010 között19

 

Népszámlálások Nagy-Britanniában

A magyar helyzettel összevetve a brit népszámlálások adatai teljesen más képet mutatnak. Természetesen Nagy-Britanniában is léteznek érzékeny adatok (ilyen az anyanyelv is), azonban az egyéni ívek jóval nagyobb számban maradtak fenn, mint Magyarországon. A brit statisztika első hivatalos szerve 1832-ben létesült, azonban rendszeres népesség-összeírások már 1801 óta zajlottak. A brit statisztikai hivatal megalapításával módszertani újítás is történt: 1841 óta a háztartás minden tagjának felveszik a nevét a népszámlálások alkalmával. (Korábban csak a háztartás családfőjének nevét rögzítették.) Így tulajdonképpen 1841 óta rendelkezésre állnak a teljes lakosságot lefedő személyi anyagok.20

Az egyéni ívek Nagy-Britanniában szinte hiánytalanul fennmaradtak. Egyetlen kivételt az 1931. évi népszámlálás jelent, amelynek kérdőívei tűzeset következtében megsemmisültek. A baleset – érthető módon – nagy felháborodást váltott ki, mivel több tűzoltó is felügyelt a raktárépületre, amelyben a kérdőíveket tárolták.21 1941-ben a népszámlálás a világháború miatt elmaradt, ezért az 1921 és 1951 közötti időszak a jövő kutatói számára feltáratlan marad a személyi anyag szempontjából. Problémákat okoz a társadalomtudományi kutatók számára a népszámlálások változó módszertana, ami az idősorok to­vábbvezetését gya­korta meg­ne­he­zíti. A 2001-es népszám­lá­lás al­kalmá­ból szerepelt először szenzitív adat­kör is: kötele­zően válaszolni kel­lett a felekezeti ho­va­tar­tozásra. (A fe­lekezeti hovatartozás mint kérdés szerepeltetése már a XIX. században is felmerült, azonban a javaslatot akkor még elutasították.)23 Ennek a döntésnek lett az eredménye, hogy a 2001. évi népszámlálások az angolszász országokban – elsősorban Új-Zélandon és Nagy-Britanniában – jedi-népszámlálásként terjedtek el. A lakosság egy része ugyanis ellenállását kifejezendő válaszul a felekezeti hovatartozásra vonatkozó kérdésre a Csillagok háborúja-filmekből ismert jedi vallást írta. A jedik aránya Új-Zélandon meghaladta a lakosság 1%-át.24 Az 1920. évi brit népszámlálási törvény 1000 font bírságot írt elő annak, aki megtagadja az adatszolgáltatást – ezt a 2001. évi népszámlálás előtt annyiban módosították, hogy a felekezeti adat megtagadása miatt nem érvényesíthető a bírság.25

Nagy-Britanniában a népszámlálási kérdőívekhez történő hozzáférést az úgynevezett „százéves szabály” határozza meg. Ennek értelmében az adatok felvételét követő századik évtől lehetséges a kérdőívek nem statisztikai célú felhasználása. Az 1901. évi népszámlálás személyi kérdőívei 2003 óta, az 1911. évi népszámláláséi 2011. óta elérhetők az interneten. Mivel a brit népszámlálások során kevés a szenzitív adat, ezért nincs jelentős társadalmi ellenállás sem a kérdőívek kitöltésével, sem a százéves szabállyal kapcsolatban. Az 1911. évi népszámlálás anyaga különösen azért jelentős a demográfiai családrekonstrukciós vizsgálatok szempontjából, mivel ekkor rögzítették először a házasság időpontját, a különböző házasságokból származó gyermekek számát és további népmozgalmi szempontból érdekes adatot.

A brit népszámlálási anyagok digitalizálása

Az 1801 és 1946 között kötet formájában megjelent aggregált adatokat az Essexi Egyetemen digitalizálták. A munka 2005-ben fejeződött be, az eredmény pedig az Online Historical Population Report26 elnevezésű oldal, amelyen nemcsak a népszámlálási kötetek, hanem a kapcsolódó térképek és további kiadványok is ingyenesen letölthetővé váltak. A digitalizálás nem karakterfelismeréssel történt, az egyes oldalakat JPG-formátumban lehet elérni.

Az egyéni kérdőívek digitalizálását egyes esetekben közintézmények végezték, más esetekben vállalkozások keretében zajlott a munka, illetve cégek és közintézmények együttműködésére is volt példa. A sokféle megoldást természetesen tükrözi az adatokhoz való hozzáférések változatos módja is: a skála az ingyenes hozzáféréstől a próbahozzáférésen keresztül a fizetős szolgáltatásokig terjed.

A www.1911census.co.uk oldalon az 1901. és 1911. évi népszámlálási kérdőívekhez lehet hozzáférni. Feldolgozásukat a brit országos levéltárral együttműködve a Brightsolid (Scotland Online) informatikai cég állította elő. Az adatbázisban történő keresés ingyenes, azonban a találatok részletes megjelenítése, illetve elmentése már fizetős szolgáltatás. Lehetőség van az eredeti kérdőívek letöltésére is. A Brightsolid tehát nemcsak beszkennelte a kérdőíveket, hanem adatbázisba rendezte az egyes személyi adatokat. Az anyag digitalizálását ebben az esetben nem állami pénzből, hanem üzleti alapokon oldották meg.

Hasonló módszerrel járt el az ír állami levéltár is,27 amely azonban az 1901. és 1911. évi népszámlálások személyi kérdőíveinek digitalizálását cégek bevonása nélkül, levéltárakkal, múzeumokkal és más szakmai szervezetekkel közösen végezte. A feldolgozott anyag ingyenesen hozzáférhető a levéltár honlapján. A kérdőívek beszkennelése nem történt meg, ezért a honlapon az eredeti íveket nem lehet megtekinteni. A felület az összes kitöltött mezőre biztosít kereshetőséget: név, megye, lakcím, nem, korcsoport, felekezeti hovatartozás, írástudás, foglalkozás, családi állapot, születési hely, nyelvtudás, gyerekszám. Az adatbázis egyszerre alkalmas családfakutatás céljaira, illetve társadalmi-gazdasági elemzések elvégzésére.

Helyzetértékelés

A magyar és a brit példa alapvető különbsége a fennmaradt személyi ívek állományában és a társadalom népszámlálásokhoz fűződő kapcsolatában rejlik. Míg hazánkban a lakosság nagy része bizalmatlan a statisztikai adatfelvételekkel szemben, és a személyi ívek túlnyomó része megsemmisült, addig a szigetország lakói nem fejtenek ki jelentős ellenállást a népesség-összeírásokkal kapcsolatban, és a személyi ívek szinte kivétel nélkül fennmaradtak. Nálunk is szükség volna a Magyarországra vonatkozó adatok felkutatására és digitalizálására. Jelenleg az aggregált adatokat tartalmazó kötetek elektronikus hozzáférése sincs biztosítva, illetve a levéltárakban megőrzött személyi anyagok feltérképezése is csak folyamatban van.28 A jövőben alkalmazott eljárásokhoz jó példákat adnak a Nagy-Britanniában használt modellek. Ha a népszámlálási adatok az interneten bárki számára könnyen elérhetővé és kutathatóvá válnának (a jogszabályok betartása mellett), akkor hasznosságuk a laikus felhasználó számára is könnyebben érthető volna, és ez valószínűleg csökkentené a lakosság bizalmatlanságát is az adatfelvételekkel kapcsolatban.

Magyarországon sokáig nem történt lényeges lépés a cenzusok teljes anyagának digitalizálására. A lemaradás elől kizárólag az együttműködés és szervezett szolgáltatások bevezetése jelentheti a megoldást a könyvtári szféra számára. A KSH Könyvtár keresi a lehetőséget a nyomtatott népszámlálási kiadványok digitalizálására. A munka volumenét érzékeltetendő: az eddig megjelent adatközlések kilenc polcfolyómétert tesznek ki; a tematikus összeállításokat és az online elérhető 2001-es kiadványokat nem számítva 342 kötet több mint 112 ezer oldaláról van szó.

Javaslat a magyar helyzet megoldására – első lépés

Magyarországon jelenleg négy intézmény rendelkezik digitalizált népszámlálási kötetekkel: a KSH, a KSH Könyvtár, a PTE Egyetemi Könyvtár és a Wesley János Lelkészképző Főiskola. Ezek a digitalizált állományok igen vegyes képet mutatnak tartalmuk és színvonaluk szempontjából egyaránt. A KSH Könyvtár PDF-fájlként, a PTE Egyetemi Könyvtár oldalanként JPG-fájlként szolgáltatja az anyagot. A Wesley János Lelkészképző Főiskola egyedi módon digitális fényképezőgéppel lefotózott oldalakat töltött fel a honlapjára. Ez utóbbi minősége és használhatósága sok tekintetben fejlesztésre szorul, azonban ez az egyetlen oldal, ahol az 1930. évi népszámlálás egyes kötetei elérhetők. A KSH a 2001. évi népszámlálás anyagát HTML-fájlokban, kisebb mennyiségben PDF-fájlokban tette elérhetővé. A négy intézmény azonos abban, hogy a tartalmat ingyenesen szolgáltatja, még regisztrációhoz sem köti a megtekintést.*

Digitalizált népszámlálási kötetek és szolgáltató intézményeik

Népszámlálás éve Intézmény
1784–1787 KSH Könyvtár
1850, 1857 KSH Könyvtár
1900 (nem a teljes kötetsorozat) PTE Egyetemi Könyvtár
1910 (nem a teljes kötetsorozat) PTE Egyetemi Könyvtár
1930 (nem a teljes kötetsorozat) Wesley János Lelkészképző Főiskola
1970 (nem a teljes kötetsorozat) KSH Könyvtár
2001 KSH

A táblázatból látható, hogy az 1870., 1880., 1890. és 1920. évi népszámlálási anyag jelenleg nem érhető el az interneten, holott ennek védelmi ideje már lejárt. A különböző technikák mellett egyértelmű mindenesetre, hogy a népszámlálási digitalizálás jelenlegi „szereplői” nem fizetős szolgáltatásként tekintenek a népszámlálási adatokra. Az is világos, hogy ezek az intézmények önerőből nem képesek az összes kötetet jó minőségben digitalizálni és egységes felületen szolgáltatni.

Nem szabad elfeledkezni annak a jelentőségéről, hogy a népszámlálás digitális adatvagyona könyvtárak tulajdona legyen. Ez a jelenlegi helyzetben több könyvtár együttműködését kívánná meg: egy könyvtár, amely rendelkezik az összes népszámlálási kötetből több példánnyal (KSH Könyvtár), egy könyvtár, amely rendelkezik a megfelelő infrastruktúrával (szabad kapacitású könyvszkenner), illetve egy könyvtár, amely a megfelelő felület kialakításáról és folyamatos karbantartásáról gondoskodik (KSH Könyvtár).

Mivel a magyar könyvtári rendszerben nem biztos, hogy akadna olyan szabad kapacitású könyvszkenner, amellyel a népszámlálási kötetek digitalizálása elképzelhető, ezért az alábbiakban felvázolt ötletek külső cég bevonásának szükségességét is felvetik. Amennyiben a könyvtári szereplők önerőből képesek volnának a digitalizálás elvégzésére, úgy a külső cég helyét értelemszerűen valamelyik könyvtár venné át.

Az 1949. évi népszámlálás, illetve az azt követő összeírások köteteiről a KSH hivatott dönteni: az intézmény döntheti el, hogy az anyag digitalizálható és szolgáltatható-e. Az, hogy a 2001-es szabadon hozzáférhető a KSH honlapján, és ezt tervezik a 2011. évi népszámlálás adataival is, bizakodásra adhat okot abban a tekintetben, hogy az intézmény feltehetően nem bánná, ha a népszámlálások történeti adatai online elérhetők lennének. Azonban nem valószínű, hogy a KSH a teljes anyag forgalmazását, szolgáltatását átengedné külső cégnek. Azzal is tisztában kell lenni, hogy a KSH-nak nem feladata történeti adatok szolgáltatása, így a digitalizálás összefogásával és lebonyolításával járó többletfeladatokat tapasztalat és erőforrás hiányában valószínűleg nem vállalná magára.

Elképzelhető, hogy pályázati pénzekből elvégezhető az anyag digitalizálása és adatbázisba rendezése. Ez a lehetőség azonban feltételes és eseti; semmi nem garantálja, hogy a következő években lehetőség nyílik erre a kényelmes és megnyugtató megoldásra.

A legcélravezetőbb a következő megoldás lenne: a KSH Könyvtár koordinátorként magára vállalná a népszámlálások digitalizálásának összefogását, és a KSH részéről engedélyt szerezne az 1949 utáni népszámlálási anyagok digitalizálására. A PTE Egyetemi Könyvtár szakértőinek tapasztalatait és a már feldolgozott állományait felhasználva külső cég végezné el a népszámlálási kötetek digitalizálását. Az ezzel járó szkennelési munka megfelelő felszereléssel és tapasztalattal rendelkező cég számára is több hétre való munkát, a minőség-ellenőrzés pedig újabb hónapokat jelent. A cég a szolgáltatásért cserébe az 1949 előtti népszámlálások anyagával kereskedelmi céllal rendelkezhetne, és ehhez tízévente hozzáadódna azoknak a népszámlálási köteteknek az anyaga, amelyek védelmi ideje lejár. A részt vevő könyvtárak (KSH Könyvtár és PTE Egyetemi Könyvtár) vállalnák továbbá, hogy az anyagot nem teszik szabadon hozzáférhetővé az interneten. A digitalizált könyveket dedikált hálózaton, illetve regisztrált felhasználók számára jelszóval védve szolgáltatnák. Ez lehetőséget nyújtana a digitalizálásba bevont cég számára, hogy munkája megtérüljön, és a digitalizált anyag egy részét kereskedelmi forgalomba hozhatja.

Ha a könyvtárak egységesen fontosnak találják a népszámlálások digitalizálását, és a KSH részéről a szükséges engedélyeket megszereznék, akkor mintegy fél év alatt a felhasználók rendelkezésére bocsáthatnák az aggregált adatokat tartalmazó köteteket. A felület kialakításában segítséget nyújthat a korábban ismertetett brit Histpop platformja.

A kép teljességéhez hozzátartozik, hogy egyes kiegészítő népszámlálási kötetek a KSH Levéltár, illetve a KSH Népességtudományi Kutatóintézet gondozásában jelentek meg. Mivel a KSH Levéltár jogutódja a KSH Könyvtár, ebben az esetben semmilyen probléma nem merülne fel, de a KSH NKI-val néhány kiegészítő kötetre külön megállapodást kellene kötni.

Javaslat a magyar helyzet megoldására – második lépés

Az aggregált adatokat tartalmazó népszámlálási kötetek digitalizálása után azonnal felmerülne a kérdés, hogy mi legyen a fennmaradt egyéni ívekkel. Ezeknek a felkutatása folyamatban van,29 és több esetben sikerült eredményt elérni. A fennmaradt ívek azonban kivétel nélkül (megyei) levéltárakban találhatók. Mivel ezek az adatok elsősorban családfakutatás szempontjából hasznosíthatók és az ország több intézményének állományában elszórva találhatók, mindenképpen digitalizálással és adatbázis-építéssel foglalkozó céget kellene bevonni a kutatómunka egy pontján. Ahogy korábban írtuk, egyik népszámlálás esetében sem maradt fenn teljes személyi anyag, az állomány azonban még így is figyelmet érdemelhet helytörténészek, szociológusok, történeti demográfusok és elsősorban családfakutatók számára. A könyvtári szakemberek ebben az esetben koordináló szerepkört töltenének be a történeti demográfusok, levéltárosok, kutatók és a digitalizálást végző cég között.

Külön kérdést jelentene a Magyar Nemzeti Levéltár Országos Levéltárában őrzött személyi ívek esete. Mivel ezek az 1970., 1980. és 1990. évi népszámlálásokból származnak, adatvédelmi okokból természetesen nem közölhetők. Az angol példa azonban azt mutatja, hogy az adatvédelmi határidő lejártát megelőző évben külön engedély alapján lehetőség nyílna az anyag feldolgozására, hogy a védelmi idő lejártakor azonnal digitálisan is hozzáférhetővé váljanak az adatok. A magyar társadalom népszámlálások iránti bizalmatlansága azonban óvatosságra is inthet: a személyi ívekre vonatkozó esetleges döntést mindenképpen átgondoltan és meggyőzően kell kommunikálni.

Javaslat a magyar helyzet megoldására – harmadik lépés

A digitalizált kötetek elkészülte után második ötletként új adatbázis építése merül fel. Olyan adatbázisé, amelyben települések szerint lehet lekérni az egyes adatokat. Így a felhasználónak nem tizenöt népszámlálás köteteiből kell előkeresnie az őt érdeklő településről szóló információkat. (Megjegyzendő, hogy a legfontosabb demográfiai adatokat hosszú idősorban hozza az 1991 és 2002 között megjelent Magyarország történeti statisztikai helységnévtára, a népesség nemzetiségi és vallási megoszlásáról pedig külön kötetsorozat tájékoztat az 1880 és 1941 közötti időszakra vonatkozóan.)

Az adatbázis építését nehezítené a közigazgatási változások gyakorisága. A települések összevonása és szétválása, átnevezése részletes egyeztetést és szükség esetén átszámítást kíván a koherens adatsoroknál. A munkafolyama­tok egyszerűsítéséhez célszerű volna először a helységnévtárak anyagát adatbázisba rendezni. Mivel ebben az esetben két polcfolyóméternyi anyag manuális adatbázisba rendezése történne meg, és csak utána kezdődhetne a népszámlálási adatok tényleges adatbázisba töltése, a folyamat időtartamát az erőforrások ismerete nélkül lehetetlen megbecsülni. (A munka ezen szakaszában esetleg segítséget jelenthet a Debreceni Egyetem Magyar Nyelvtudományi Intézetének Nyelv- és Névtörténeti Műhelye által üzemeltetett Magyar digitális helynévtár.) Ideális esetben a feladat felelőse önálló csoport volna a KSH Könyvtáron belül. Az adatbázis elkészülte után tovább bővíthető a mezőgazdasági összeírások települési adataival (1895-től 2010-ig), a XIX. századi adókataszteri összeírásokkal, illetve összekapcsolható volna a T-STAR településstatisztikai adatbázissal. Egy ilyen adatbázis felépítése és üzemeltetése jelentős és folyamatos anyagi és emberi erőforrást igényel: összesen  nyolcvanezer település és névváltozat százötven éves alakulását kell hozzá nyomon követni.30 Hasonló adat-összekapcsolásra láthatunk példát az MTDA említett adatbázisában, amely a népszámlálás eredményei mellett az egykorú helységnévtár és Vargha Gyula egyesületi statisztikájának információit is közli.

Az adatbázisba történő rendezés a nyelvi problémákat is megoldaná. Míg a digitalizált kötetek esetén csak a magyar nyelvű felhasználók boldogulnak az adatokkal, addig adatbázisba rendezve, többnyelvű felület mellett szlovák, német, ukrán, román, horvát nyelven is kezelhető volna az adathalmaz.

Fontos kérdés, hogy az elkészült és folyamatosan bővülő adatbázis használata ingyenesen vagy térítés ellenében történjen-e. Feltételezhető, hogy az adatbázis létrehozásával járó anyagi áldozatot a létrehozó intézmény legalább részben szeretné áthárítani a felhasználókra. Felhasználói szempontból a legszerencsésebb természetesen az volna, ha a munka pályázati pénzből történne, és így a hozzáférést is ingyenesen biztosítanák. Ez a lehetőség azért sem tűnik irreálisnak, mivel a magyar népszámlálási adatok olyan szenzitív kérdéseket is érintenek, mint a nemzetiség és a fogyatékosság. Elképzelhető tehát – bár egyáltalán nem biztos –, hogy az adatbázis létrehozására pályázati források is előállhatnak.

Nem hagyható figyelmen kívül az sem, hogy az adatbázis létrehozása vélhető gazdasági haszna mellett tudományos szempontból is kiemelkedő teljesítmény volna. Már pusztán a helységnévtárak adatbázisba rendezése is olyan tudományos munka, amely történészek, közgazdászok, demográfusok érdeklődésére egyaránt joggal tartana számot.

A magyar népszámlálások iránti lakossági bizalmatlanság és az ennek köszönhető érdeklődés kettős feladat elé állítja a könyvtári szakembereket: az adatok adatvédelmi szempontból is megnyugtató szolgáltatása jelentené az ideális megoldást. A könyvtárak így saját adatvagyonukat olyan értékes digitális tartalommal bővíthetnék, amelyre jelentős igény mutatkozik felhasználói oldalról. Ez a szolgáltatás csak könyvtárak (és levéltárak) egymás közti együttműködésével és a szolgáltatás folyamatos fejlesztésével képzelhető el. A munkák során jó példát mutat a brit gyakorlat, amelynek segítségével az egyéni ívek, az aggregált adatokat tartalmazó kötetek és a népszámlálási szakirodalom digitális szolgáltatása terén egyaránt jelentős eredményeket értek el.

Jegyzetek

1.   RÓZSA Dávid:  A II. József-féle magyarországi népszámlálás = Élet és Tudomány,  2011. 39. sz. 1241. p.

2.   THIRRING Gusztáv [1938]: Magyarország népessége II. József korában. Budapest : MTA, 1938.

3.   DÁNYI Dezső: Az 1850. és 1857. évi népszámlálás. Budapest : KSH, 1993.

4.   LENCSÉS Ákos – RÓZSA Dávid: Iratok az MTA Statisztikai Bizottságának első évtizedéből = Statisztikai Szemle, 2012. 2–3. sz. 188–205. p.

5.   Idézi BOKOR Gusztáv: A magyar hivatalos statisztika fejlődése és szervezete. Budapest : Orsz. M. kir. Statisztikai Hivatal, 1896.

6.   ŐRI Péter – PAKOT Levente: Census and census-like material preserved in the archives of Hungary, Slovakia and Transylvania (Romania), 18–19th centuries. (MPIDR Working Paper WP-2011-020). Rostock: Max Planck Institute for Demographic Research, 2011.

7.   RÓZSA Dávid:  Az 1869–1870-es magyarországi népszámlálás = Élet és Tudomány. 2011. 41. sz. 1305. p.

8.   REHÁK Aranka – RÓZSA Gábor (szerk.): Népszámlálá­sok Magyarországon. Budapest: KSH – Gregor-Delacroix, 2000.

9.   RÓZSA Dávid: Az 1930-as gépesített népszámlálás = Élet és Tudomány. 2011. 43. sz. 1369. p.

10.           LENCSÉS Ákos: A nemzetiségi statisztika forrásai = Könyvtári Levelező/lap, 2010. 12. sz. 13–15. p.

11.           HOÓZ István: A cigány lakosságra vonatkozó összeírások Magyarországon a XVIII. és XIX. században. In: A Magyarországban 1893. január 31-én végrehajtott czigányösszeirás eredményei [reprint]. Pécs: Pécsi Janus Pannonius Tudományegyetem, 1992. 5–8. p.

12.           CZIBULKA Zoltán – HEINZ Ervin – LAKATOS Miklós (összeáll.): A magyarországi németek kitelepítése és az 1941. évi népszámlálás. Budapest: KSH. 2004.

13.           CZIBULKA Zoltán (összeáll.) A nemzetiségi népesség száma egyes községekben. Budapest : KSH, 1991.

14.           LAKATOS Miklós: Az adatvédelem jogi szabályozása a magyar népszámlálások történetében. Budapest : KSH, 2000.

15.           LENCSÉS Ákos: A nemzetiségi statisztika forrásai = Könyvtári Levelező/lap, 2010. 12. sz. 13–15. p.; LENCSÉS Ákos: Felekezet és statisztika = Vigilia, 2011. 10. sz. 751–757. p.

16.           TÓTH Árpád szóbeli közlése alapján.

17.           LAKATOS Miklós: i. m.

18.           24/2011 KSH-utasítás. http://www.ksh.hu/docs/szolgaltatasok/kutatoszoba/kutatoszoba_utasitas_2011_alairt.pdf [Utolsó elérés: 2012. május 29.]

19.           ANTAL László: A kiadásra szánt adatok védelméről [előadás]. 2011.  [Utolsó elérés: 2012. május 29.]

20.           BAINES, Athelstane: The history and development of statistics in Great Britain and Ireland. In: Koren John (ed.): The History of statistics. Their development and progress in many countries. New York : Burk Franklin, 1970. 365–389. p. ; LAWTON, Richard: Introduction. In: Lawton, Richard (ed.): The census and social structure. An interpretative guide to nineteeth century censuses for England and Wales. London : Cass. 1978. 1–27. p.

21.           LAWTON, Richard i. m.

22.           LENCSÉS Ákos: Felekezet és statisztika. i. m. 751–757. p.

23.           Census Act 1920. A jogszabály hatályos szövege: http://www.legislation.gov.uk/ukpga/Geo5/10-11/41/section/8 [Utolsó elérés: 2012. május 29.]

24.           1911census: The 1931 census. http://www.1911census.org.uk/1931.htm [Utolsó elérés: 2012. május 29.]

25.           LAWTON, Richard i. m.

26. Online Historical Population Report. http://www.histpop.org/ohpr/servlet/ [Utolsó elérés: 2012. május 29.]

27.           The National Archives of Ireland: Census of Ireland 1901/1911. http://www.census.nationalarchives.ie/ [Utolsó elérés: 2012. május 29.]

28. ŐRI Péter –PAKOT Levente: Census ans census-like material preserved in the archives of Hungary, Slovakia and Transylvania (Romania), 18–19th centuries.   (MPIDR Working Paper WP-2011-020). Rostock: Max Planck Institute for Demographic Research, 2011.

29.           uo.

30.           LELKES György: Magyar helységnév-azonosító szótár. Budapest: Argumentum Kiadó – KSH Könyvtár, 2011.

További irodalom

BALÁS Judit: Laky Dezső. In: Mátyás Antal (szerk.): Magyar közgazdászok a két világháború között. Budapest : Akadémiai Kiadó, 1994. 198–228. p.

BUDAY László (szerk.): A M. Kir. Központi Statisztzikai Hivtal munkássága 1871–1911. Budapest : M. Királyi Központi Statisztikai Hivatal, 1911.

HAJNAL Béla – OROS Iván – REMETEY Ervin – VARGA Józsefné: Évfordulók a statisztika történetéből. Budapest: KSH, 1992.

FRÁTER Jánosné: A Magyar Tudományos Akadémia állandó bizottságai. Budapest: MTA Könyvtára, 1974.

HORVÁTH Róbert: A II. József korában végrehajtott magyarországi népszámlálás = Statisztikai Szemle, 1986. 6. sz. 624–639. p.

Beérkezett: 2012. november 21.

 

* A tanulmány cikkesített változata a 2012-ben „Az év fiatal könyvtárosa” címet elnyert pályaműnek. (A szerk.)
*
Szenzitív adat: egyes személyhez kapcsolódó érzékeny adat, például felekezeti vagy nemzetiségi hovatartozás.

* Aggregált adat: összetett adat, amelyből nem lehet visszakövetkeztetni a személyes adatokra.
*
  Az 1880. évi népszámlálás adatai intézményi háttér nélkül egyedi feldolgozásban érhetők el a Magyar Társadalomtudományok Digitális Archívuma (MTDA) oldalán. A cenzus adatai adatbázisba rendezve állnak az érdeklődők rendelkezésére.
**
1880/MTDA

A bejegyzés kategóriája: 2013. 1. szám
Kiemelt szavak: , , , , .
Közvetlen link.

MINDEN VÉLEMÉNY SZÁMÍT!