Hogyan építsünk nemzeti névteret? Egy működő példa: a cseh Nemzeti Besorolási Adatbázis1

Kategória: 2013/ 7

Bevezető

A komplex adatkapcsolódások létrehozásával kiépülő, az információk magas fokú visszakereshetőségét biztosító szemantikus hálózatok olyan nyelvi (lexikai) adattárak, ontológiák létezését feltételezik, amelyek struktúrája alkalmas a fogalmi relációk leképezésére. Ahhoz, hogy a névterek (névtárak) az entitások és viszonyaik tekintetében minél átfogóbbak legyenek, a szakszerűséget is garantálni képes országos vagy nemzetközi szintű koordinációra van szükség, valamint – ezzel szoros összefüggésben – a megfelelő szervezeti keretek megteremtésére.
Jó példa a nemzetközi koordinációra az OCLC (Online Computer Library Center) által működtetett VIAF (The Virtual International Authority File = Nemzetközi Virtuális Besorolási Állomány)2, amely jelenleg 19 jelentős könyvtár egységesített személynévállományát szolgáltatja, illetve teszi egy közös felületen elérhetővé. Európai szintű kezdeményezés a Linked Heritage projekt3 keretében kifejlesztett Terminology Management Platform4, amely az Europeana számára tervezett eszköz, és a digitális tartalmak szolgáltatóinak nyújt segítséget szabványos tárgyszó-rendszerek, többnyelvű kontrollált szótárak létrehozásához.Magyar viszonylatban az Országos Széchényi Könyvtár ambíciói közé tartozik a nemzeti névtér koordinációja. A nemzeti könyvtár, amely személynév-típusú rekordokat szolgáltat a VIAF számára, a megfelelő források és együttműködési lehetőségek felkutatásával igyekszik megoldást találni a névtér-típusú adatállományainak integrálására, egy országos kooperációban épített nemzeti névtér fejlesztésére. Felfogásunk szerint a Magyar Nemzeti Névtér alapját, legfőbb építőelemeit elsősorban azok a könyvtárunk adatbázisaiban található, névtér-jellegű rekordállományok jelentik, amelyek hozzáférési pontokként funkcionálhatnak a közgyűjtemények elektronikus katalógusai, valamint a magyar nemzeti bibliográfiai adatbázis rekordjai számára. Ezek eltérő típusú adatok, jelesül személynevek, testületi nevek, földrajzi nevek, tárgyszavak strukturált jegyzékei, amelyekről általánosságban elmondható, hogy valamilyen egységesítési eljárás végtermékei, és különböző (elsősorban bibliográfiai) adatok visszakeresésére szolgálnak. A besorolási rekordok elkészítésekor az OSZK gyakorlata szerint primer és szekunder forrásokat egyaránt használunk. Úgy gondoljuk, hogy egyedülálló állományunk, munkatársainknak a bibliográfiai tevékenységekben szerzett gyakorlata és tapasztalata, a nemzetközi együttműködésekben való jelenlétünk garanciát jelentenek a nemzeti névtér magas szintű karbantartására, a sokrétű visszakeresés szempontjaiból megfelelő részletességűnek tekinthető utalórendszer kidolgozására.

A szemantikus web felé

A világ könyvtárosai a tezauruszok, ontológiák építésével lerakják a szemantikus web alapjait, közelebb visznek minket a jövőhöz, amelyben a keresőkérdések informatikai feldolgozása megközelíti majd a humán értelmezést és válaszadást. A számítógépes világban a könyvtári egységesítés nem a keresett dokumentumok/információk egyetlen, kitüntetett névalakhoz való rendelését jelenti: az összetartozó fogalmakat (címkéket) egyedi azonosítók fogják össze. Személynevek esetén ilyen a VIAF ID vagy az – előbbivel szorosan összefüggő – International Standard Name Identifier (ISNI).5 A névváltozatok azonosítókkal való összekapcsolása a névalakok egyfajta demokratizálódásához vezet, amely kapcsán kérdésként merül fel például, hogy mit kezdjünk a teljes mértékben “szabványtalan” vagy rossz helyesírású változatokkal: rendeljük-e ezeket is hozzá az adott azonosítóhoz a visszakereshetőség támogatása érdekében.

1. ábra. Hagyományos könyvtári utalórendszer

A hagyományos könyvtári utalórendszert (1. ábra) tehát – a fentiek értelmében – új, az adatok komplex kapcsolódásain alapuló megoldások váltják fel, a technika megkerülhetővé teszi az “egységesített (kitüntetett) névalakkal való szembesülést”, helyette egyenesen a keresett dokumentumhoz, információhoz irányít el (2. ábra).

2. ábra. A névváltozatok korszerű, “demokratikus” kezelése

Az adatkapcsolatok komplexitásában rejlő visszakeresési potenciál az olyan, a szemantikus web felé mutató megoldásokkal is operáló kezdeményezésekben mutatkozik meg, mint amilyen a Francia Nemzeti Könyvtár (Bibliotheque Nationale de France, BnF) data.bnf.fr projektje6, amely a könyvtár besorolási állományára építve rendezi, csoportosítja egybe az összetartozó forrásokat.

3. ábra. Egy példa a http://data.bnf.fr/ oldalról

A cseh Nemzeti Besorolási Adatbázis

Kooperáció
A cseh Nemzeti Besorolási Adatbázis (Databáze národních autorit NK ČR)7 története 1998-ig nyúlik vissza. Ekkor bocsáttatta közre weboldalán a cseh nemzeti könyvtár a mintegy 48 000 tételből álló besorolási állományát (UNIMARC formátumban), valamint kezdeményezett együttműködést egy közös (nemzeti) besorolási adatbázis létrehozására. Ahogy Zdeněk Bartl fogalmazott a témát taglaló, ez idő tájt megjelent cikkében:8 “Kooperáció nélkül nem vezet előre út”.
Az adatbázis létrehozására irányuló kezdeményezés egy, a cseh kulturális tárca által finanszírozott projekt formájában valósult meg. A projekt első szakaszában az együttműködésbe bevontak további könyvtárakat, a második etapban egyéb közgyűjteménytípusokra is kiterjesztették a kooperációt. A végső cél, hogy a közgyűjtemények kötelező módon használják az adatbázist.
A múzeumoknak, levéltáraknak természetesen módjában áll speciális adatmezőket definiálni besorolási rekordjaikhoz, az adattartalom tekintetében tehát nincs mindenképp teljes átfedés az együttműködő intézmények lokális rekordállományai között. A kötelező “magadatok” azok, amelyeket minden aktív együttműködőnek meg kell adnia, de a gyűjteményspecifikus mezőkben tárolt információt “megtarthatják”.
A Nemzeti Besorolási Adatbázis építésében tevékenyen résztvevő, aktív közgyűjtemények száma jelenleg nagyjából száz körülire tehető, valamint körülbelül ötszáz olyan intézmény van, amely letölti és használja az adatbázis rekordjait. Ha valamely közgyűjtemény szeretne csatlakozni a projekthez, a jelentkezést követően az illetékes munkatársaknak háromnapos tanfolyamon kell részt venniük, amelynek során két napot a MARC21-formátumú feldolgozás módszertanának elsajátításával, egyet pedig a metodika gyakorlatban történő alkalmazásával töltenek el.

Workflow
A besorolási rekordok létrehozásának lépései a következők:
1.    ellenőrzés a központi adatbázisban (Nemzeti Besorolási Adatbázis);
2.1. ha létezik és nem szorul korrekcióra: a könyvtár beemeli a rekordot a saját besorolási állományába;
2.2.    ha létezik és hibás: a könyvtár speciális mezők (920, 930) használatával jelzi a hibát, és javaslatot tesz a korrekcióra; a COR-mezőben – a rekordtörténet szempontjából fontos – eredeti információ is tárolódik;
2.3.    ha nincs és cseh szerzőről van szó: a könyvtár a rendelkezésére álló források alapján létrehozza a rekordjavaslatot;
2.4.    ha nincs és külföldi szerzőről van szó: a könyvtár ellenőrzi az adatot az illetékes nemzeti könyvtári katalógusában, és ez alapján hozza létre a rekordot.

4. ábra. A cseh Nemzeti Besorolási Állomány kooperatív építése

A rekordjavaslatok kezelésére vonatkozó workflow eltér annak függvényében, hogy az adott könyvtár ALEPH-et vagy más integrált könyvtári rendszert használ. ALEPH-könyvtárak esetén a javaslatokat előbb a helyi revizorok (local supervisor), majd a nemzeti könyvtár személyi besorolási osztályának munkatársai ellenőrzik, míg a nem ALEPH-et használó könyvtárak esetén csak egy ellenőrzés történik (a nemzeti könyvtárban).
Az ALEPH-könyvtárak az IKR saját protokollján keresztül kommunikálnak a központi adatbázissal, míg a többiek egy Z39.50 kliensen keresztül. Ez utóbbi adatbázis-frissítő funkcióval rendelkezik, hasonlóképpen a nemzeti könyvtár által alkalmazott Z39.50 szerverhez, amely 15 percenként küldi el a frissítéseket a központi adatbázisba. (Az ALEPH-nek egyébként van saját, adatbázis-frissítő funkcióval ellátott Z39.50 szervere, de a Cseh Nemzeti Könyvtár nem ezt használja.)
A nemzeti könyvtár minden éjjel publikálja, milyen változások történtek adott napon a Nemzeti Besorolási Állományban, amely alapján a részt vevő közgyűjtemények frissíthetik saját besorolási adatbázisaikat.

A MUNKAFOLYAMATOK DEMONSTRÁLÁSA PÉLDAREKORDOKON KERESZTÜL

Új besorolási rekord készítése a Nemzeti Besorolási Adatbázisban

1. lépés: a javaslat létrehozása

  • a 990-as mezőben található “J-NÁVRH” bejegyzés jelzi, hogy név-típusú javaslatról van szó (NAME-PROPOSAL)
  • a 040-es mezőben található “ABA006″ a létrehozó könyvtár kódja
  • a 906-os mezőben található “ekuc” a létrehozó könyvtáros kódja

900    L $$a*J-NÁVRH
001    L vse2012690403
003    L CZ-PrNK
005    L 20120321093640.0
008    L 120321|n|acnnnaabn——n-a|a—
040    L $$aABA006$$bcze
1001    L $$aClark, Garcia$$7vse2012690403
670    L $$aJejí: Traders versus the state: anthropological approaches to unofficial economies
670    L $$aLC (Names), cit. 21. 3. 2012
670    L $$awww(Indiana University, Bloomington: Gracia Clark), cit. 21. 3. 2012
6780    L $$aAmerická profesorka antropologie.
906    L $$aza20120321$$bekuc
9500    L $$adefinitivní

2. lépés: helyi ellenőrzés

  • még mindig javaslat-fázisban van a rekord (“J-NÁVRH”)
  • a 906-os mezőben található “mape” az ellenőrzést elvégző könyvtáros (revizor) kódja (adott esetben egy elírás került javításra a 100-as mezőben)

900     L $$aJ-NÁVRH
001     L vse2012690403
003     L CZ-PrNK
005     L 20120322081840.0
008     L 120321|n|acnnnaabn——n-a|a—
040     L $$aABA006$$bcze
1001     L $$aClark, Gracia$$7vse2012690403
MOR0     L $$aClark, Garcia$$7vse2012690403
670     L $$aJejí: Traders versus the state: anthropological approaches to unofficial economies
670     L $$aLC (Names), cit. 21. 3. 2012
670     L $$awww(Indiana University, Bloomington: Gracia Clark), cit. 21. 3. 2012
6780     L $$aAmerická profesorka antropologie.
906     L $$aza20120321$$bekuc
906     L $$aoz20120322$$bmape
9500     L $$adefinitivní

3. lépés: legfelső szintű (nemzeti könyvtári) ellenőrzés

  • megszűnik a rekord javaslat-státusa
  • bekerül a rekordba (040-es mező) a jóváhagyást végző nemzeti könyvtár kódja (“ABA001″) és – a 906-os mezőbe – a legfelső szintű ellenőrzést végző munkatárs kódja (“tone”) (a revizor adott esetben a 678-as mezőt bővítette további életrajzi információkkal)

001     L vse2012690403
003     L CZ-PrNK
005     L 20120608090010.0
008     L 120321|n|acnnnaabn——n-a|a—
040     L $$aABA006$$bcze$$dABA001
1001     L $$aClark, Gracia$$7vse2012690403
MOR0     L $$aClark, Garcia$$7vse2012690403
670     L $$aJejí: Traders versus the state: anthropological approaches to unofficial economies
670     L $$aLC (Names), cit. 21. 3. 2012
670     L $$awww(Indiana University, Bloomington), cit. 8. 6. 2012$$bbiografické údaje
6780     L $$aAmerická profesorka antropologie zaměřená na africké ekonomické systémy, problematiku genderu a rozvoje.
906     L $$aza20120321$$bekuc
906     L $$aoz20120322$$bmape
906     L $$aop20120608$$btone$$cBiografická poznámka – doplnění, zdroj – aktualizace
9500     L $$adefinitivní

A bibliográfiai rekordok összekapcsolása a releváns besorolási rekordokkal

A bibliográfiai rekord az összekapcsolás előtt:

1001     L $$aClark, Gracia
24510     L $$aAfrican market women :$$bseven life stories from Ghana /$$cGracia Clark
260     L $$aBloomington ;$$aIndianapolis :$$bIndiana University Press,$$cc2010
300     L $$a265 s. :$$bil., mapy ;$$c24 cm
504     L $$aIncludes bibliographical references (p. [259]-262) and index.
65000     L $$aWomen, Ashanti$$xSocial conditions.$$zGhana$$zKumasi
65000     L $$aWomen, Ashanti$$xEconomic conditions.$$zGhana$$zKumasi
65000     L $$aWomen, Akan$$xSocial conditions.$$zGhana$$zKumasi
65000     L $$aWomen, Akan$$xEconomic conditions.$$zGhana$$zKumasi
65000     L $$aWomen merchants$$zGhana$$zKumasi.
65000     L $$aMarket towns$$zGhana$$zKumasi.
651 0     L $$aKumasi (Ghana)$$xSocial conditions.
651 0     L $$aKumasi (Ghana)$$xEconomic conditions.
651 0     L $$aKumasi (Ghana)$$xPolitics and government.

A bibliográfiai rekord az összekapcsolást követően (a 100-as mező 7-es almezője tartalmazza a besorolási rekord azonosítóját):

1001     L $$aClark, Gracia$$7vse2012690403
24510     L $$aAfrican market women :$$bseven life stories from Ghana /$$cGracia Clark
260     L $$aBloomington ;$$aIndianapolis :$$bIndiana University Press,$$cc2010
300     L $$a265 s. :$$bil., mapy ;$$c24 cm
504     L $$aIncludes bibliographical references (p. [259]-262) and index.
65000     L $$aWomen, Ashanti$$xSocial conditions.$$zGhana$$zKumasi
65000     L $$aWomen, Ashanti$$xEconomic conditions.$$zGhana$$zKumasi
65000     L $$aWomen, Akan$$xSocial conditions.$$zGhana$$zKumasi
65000     L $$aWomen, Akan$$xEconomic conditions.$$zGhana$$zKumasi
65000     L $$aWomen merchants$$zGhana$$zKumasi.
65000     L $$aMarket towns$$zGhana$$zKumasi.
651 0     L $$aKumasi (Ghana)$$xSocial conditions.
651 0     L $$aKumasi (Ghana)$$xEconomic conditions.
651 0     L $$aKumasi (Ghana)$$xPolitics and government.

Besorolási rekordok módosítása

A besorolási rekord a módosítási javaslat fázisában:

  • a 990-as mezőben található “J-OPRAVA” bejegyzés jelzi, hogy egy név-típusú rekord módosításáról (javításáról) van szó (NAME-CORRECTION)
  • a 040-es mezőben található “ABA013″ a módosítást kezdeményező könyvtár kódja
  • a 906-os mezőben található “anho” a módosítást kezdeményező könyvtáros kódja
  • a 930-as mezőkben található módosítások: halálozás dátuma (13. 5. 2012), tudományos fokozat (CSc.) feltüntetése, valamint ezeknek az információknak a forrása (Vodní hospodářství, Numer 6, Volume 62/2012, page 237)

900     L $$aJ-OPRAVA
001     L mzk2010564428
003     L CZ-PrNK
005     L 20120608084349.0
008     L 100311|n|acnnnaabn——n-a|a—
040     L $$aBOA001$$bcze$$dABA013
1001     L $$aBartáček, Jan$$7mzk2010564428
670     L $$aMařík, Z. – Bartáček, J. – Juránek, A.: Příručka pro vodní stráž. 1979
670     L $$awww(Nakladatelství Brázda)$$bautoritní forma
6780     L $$aIng., autor právních předpisů pro vodní hospodářství.
9201     L $$aBartáček, Jan$$dzemř. 2012$$7mzk2010564428
930     L $$1670$$aVodní hospodářství, č. 6, roč. 62/2012, s. 237
930     L $$16780$$aZemřel 13. 5. 2012. CSc.
906     L $$aza20100311$$bholefr
906     L $$ako20100312$$bvrbael
906     L $$ano20120608$$banho$$cZáhlaví – datum úmrtí, biografická poznámka – doplnění, zdroj – další výskyt
9500     L $$adefinitivní
A besorolási rekord a módosítási javaslat elfogadását követően:

  • megszűnik a rekord javaslat-státusa
  • bekerül a rekordba (040-es mező) a jóváhagyást végző nemzeti könyvtár kódja (“ABA001″) és – a 906-os mezőbe – a legfelső szintű ellenőrzést végző munkatárs kódja (“tone”) (a revizor adott esetben a 930-as mező adatait áthelyezte a releváns adatmezőkbe (100, 670, 678)

001     L mzk2010564428
003     L CZ-PrNK
005     L 20120608091113.0
008     L 100311|n|acnnnaabn——n-a|a—
040     L $$aBOA001$$bcze$$dABA013$$dABA001
1001     L $$aBartáček, Jan,$$dzemř. 2012$$7mzk2010564428
COR     L $$aBartáček, Jan$$7mzk2010564428$$0ZZZ
670     L $$aMařík, Z. – Bartáček, J. – Juránek, A.: Příručka pro vodní stráž. 1979
670     L $$awww(Nakladatelství Brázda)$$bautoritní forma
670     L $$aVodní hospodářství, č. 6, roč. 62/2012, s. 237$$bdatum úmrtí
6780     L $$aZemřel 13. 5. 2012. Ing., CSc., autor právních předpisů pro vodní hospodářství.
906     L $$aza20100311$$bholefr
906     L $$ako20100312$$bvrbael
906     L $$ano20120608$$banho$$cZáhlaví – datum úmrtí, biografická poznámka – doplnění, zdroj – další výskyt
906     L $$aoz20120608$$btone$$cZáhlaví – datum úmrtí, biografická poznámka – doplnění, zdroj – další výskyt
9500     L $$adefinitivní

Jegyzetek

1 A cikkben ismertetett , a cseh Nemzeti Besorolási Adatbázisra vonatkozó információk főként a Zdeněk Bartllal, a Cseh Nemzeti Könyvtár Nemzeti Authority Osztályának (Oddělení národních jmenných autorit NK ČR) vezetőjével folytatott beszélgetésből, részint a Martin Vojnarral, a prágai MULTIDATA cég munkatársával folytatott levélváltásokból erednek. A munkafolyamatokat demonstráló példarekordokat Nejedlý Tomáš bocsátotta rendelkezésemre.
2 http://viaf.org/ (Megtekintve: 2013 június 14.)
3 http://www.linkedheritage.eu/ (Megtekintve: 2013 június 14.)
4 http://www.culture-terminology.org/ (Megtekintve: 2013 június 14.)
5 A kérdésről bővebben: http://outgoing.typepad.com/outgoing/2011/07/viaf-and-other-ids.
html (Megtekintve: 2013 június 11.)
6 http://data.bnf.fr/ (Megtekintve: 2013 június 14.)
7 http://autority.nkp.cz/ (Megtekintve: 2013 június 14.)
8 Bartl, Zdeněk: Jmenné autority Národní knihovny ČR – http://www.ikaros.cz/jmenne-autority-narodni-knihovny-cr (Megtekintve: 2013 június 11.)

Címkék