A tárgyi besorolási adatok egységesítése egy online cikk-katalógusban és a nyomtatott változatok tárgyszóindexeiben

1. Bevezetés

Az olvasói online katalógusok közel tízéves fennállásuk során a használati kényelem, a használói barátságosság tekintetében kétségtelenül sokat fejlődtek, ezt azonban elsősorban az információtechnológia fejlődése váltotta ki, s nem a tartalmi feltárás hatékonyabb intellektuális megoldásai eredményezték. Ezért van, hogy ami a tárgy szerinti keresést, a tárgyi hozzáférést illeti, az online katalógusok szépsége és dicsősége pillanatok alatt összeomlik.1987-88-ban a brit egyetemi és közművelődési könyvtárak online katalógusainak felmérése során például a következők derültek ki. A 73 online katalógus közül az egyetemi könyvtárak katalógusainak (47) csak kétharmada, a közművelődésieknek pedig csak a fele nyújtott lehetőséget a tárgy szerinti keresésre. Ez a legtöbb (56) esetben osztályozási jelzet szerinti keresés volt, ami azt jelenti, hogy ha a jelzet nem ismert, akkor egy különálló betűrendes tárgyszójegyzéket kell átnézni a megfelelő kód kiválasztására. A felmérés szerint a legtöbb OPAC a szabad szöveges keresésre épít: a leggyakrabban a címmező kulcsszavaira lehet keresni. Tárgyszavak szerinti keresési lehetőséget 26 online katalógus nyújtott, de ezek közül csak néhány rendelkezett online elérhető tárgyszójegyzékkel, és egyetlen vizsgált OPAC sem kínált online tezauruszhasználatot.1
A Manchester Polytechnic az online katalógusokban való tárgyi keresés problémáinak megállapítására végzett kutatást, önként jelentkező egyetemi hallgatók bevonásával.2 A hallgatók kereséseit floppy lemezre rögzítették, majd ezeket elemezve kiderült, hogy a problémák egy jelentős része abból adódott, hogy a résztvevők nem tudták, hogy témájukkal kapcsolatban mit írjanak be keresőkifejezésként, kulcsszóként, mert ehhez a rendszer semmilyen segítséget nem nyújtott.
Hasonló módszerrel, a hallgatók keresési viselkedésének elemzésével vizsgálták a North Carolina State University online katalógusában való keresések problémáit is.3 Ami a tárgyi keresést illeti, itt a használóknak a Library of Congress tárgyszójegyzéke alapján kellett, illetve kellett volna a megfelelő tárgyszavakat begépelni. A vizsgált 3707 keresésből 2008 végződött kudarccal (54,25%), azaz 0 találattal, s ezek közül a legtöbbet (29,2%) a nem megfelelő deszkriptorok használata eredményezte.
A. J. Wood, az említett 1987-es brit felmérés készítője megjegyzi, hogy amíg az online katalógusokban való tárgyi keresés ilyen korlátozott lehetőségeket kínál, addig nem csoda, ha a legtöbb próbálkozás ismert művek kikeresésére irányul.

***

Korábbi cikkeinkben beszámoltunk a KMK Könyvtártudományi szakkönyvtárának MANCI nevű online cikk-katalógusáról4, és ismertettük, hogy hogyan készítjük el az adatbázis alapján a nyomtatott referálólapokat és ezek mutatóit5. A fejlesztés következő szakaszának célja az volt, hogy mind az online, mind a nyomtatott változatokban növeljük a tárgyi keresés hatékonyságát, biztosítva emellett természetesen a használati kényelmet, barátságosságot is. A megoldás kulcsa mindkét esetben a szakkönyvtárunkban már 15 éve használt és karbantartott könyvtártudományi tezaurusz, amelynek gépre vitelével a következő célok megvalósítása került elérhető közelségbe:

  • a tezaurusz összekapcsolása a MANCI-val, és online használata a tárgyi kereséshez;
  • a tezaurusz relációinak alapján a deszkriptorok lásd és lásd még utalóinak gépi előállítása és összefésülése a MANCI-ból készített tárgyszóindexszel;
  • a tezaurusz online karbantartása és tetszés szerinti időközönként, kiváló minőségű, lézernyomtatón történő kinyomtatása.

Mivel cikkünk témáját csak az első két pont érinti, a következőkben csak ezekkel foglalkozunk.

2. Online tezaurusz

Tezauruszunk gépre vitelének ötletét az adta, hogy nem sokkal a Micro-ISIS 2.3 változatának bevezetése után felfedeztük, hogy az alap ISIS-hez mellékelt ISIS-PASCAL mintaprogramok között egy tezauruszkezelő program is van. Ezt megvizsgálva kiderült, hogy a program a szakirodalomból ismert, kereskedelmi forgalomban lévő tezauruszkezelő szoftverekhez képest igen primitív ugyan, de az alapvető tezauruszkezelési funkciókat tartalmazza. Így a tezaurusz invertált fájljában (indexében) böngészve bármelyik keresőelemet kiválaszthatjuk, amire megjelenik az illető kifejezéshez tartozó deszkriptorcikk. Ekkor mód van új relációk hozzáadására, meglévő relációk törlésére, a deszkriptorcikk bármelyik tagjának keresőkifejezéskénti kijelölésére, megjelenítésére, majd – a programból kilépve – a kiválasztott keresőkifejezés(ek) keresőkérdéssé szerkesztésére és a keresésnek a kiindulási adatbázisban való végrehajtására. Az új relációk hozzáadása, illetve törlése nyomán a program automatikusan elvégzi a folyamatok inverzét, tehát pl. egy tágabb kifejezés hozzáadása után a megfelelő szűkebbet, szűkebbnél a tágabbat, rokonnál a rokont beírja a megfelelő helyre.
A szóban lévő THES nevű program egy THES nevű adatbázis meglétét feltételezi, amelynek a következő mezőit képes kezelni:

  • v1 – deszkriptor (FERM),
  • v2 – megjegyzés (NB),
  • v3 – lásd (USE),
  • v4 – nem-deszkriptor (USE FOR),
  • v5 – tágabb kifejezés (BT),
  • v6 – szűkebb kifejezés (NT), és
  • v7 – rokon kifejezés (RT).

Mindezek ismeretében úgy döntöttünk, hogy a THES adatbázis definícióit és a programot felhasználjuk saját tezauruszunk építésére és kezelésére, majd – a program csekély mértékű átírásával – alkalmassá tesszük olvasói használatra is.
E cél érdekében eredeti tezauruszunkat át kellett alakítani, mert kezdetben elődeink a relációkat az akkori informatikai divatnak megfelelően nem csupán tágabb, szűkebb és rokon fogalmakként határozták meg, hanem a tágabb kifejezések EGÉSZ és NEM (genus), a szűkebbek pedig RÉSZ és FAJ (species) fogalmakként szerepeltek. Mivel a használat szempontjából e tudományos-elméleti megkülönböztetésnek nincs értelme (az olvasót nem érdekli, hogy egy keresett szűkebb fogalom rész- vagy fajfogalma-e a vonatkozó tágabb kifejezésnek), ezen kívül a deszkriptorcikkek áttekinthetőségét is rontja, nem volt nehéz lemondanunk ezekről a nemzetközi tezauruszkészítési gyakorlatban ismeretlen relációkról. Az említett kétféle szűkebb és tágabb deszkriptorokat ezért összevontuk, majd – saját szükségleteinknek megfelelően – kiegészítettük az eredeti THES adatbázis definícióit. Ez abból állt, hogy néhány plusz mezőt definiáltunk: a deszkriptorok betűrendi kódja (erre hivatkozunk a betűrendes mutatóban), a szakjelzet és a deszkriptor használatba vételének dátuma számára, majd ennek megfelelően módosítottuk az adatbeviteli űrlapot, az FST-t és a megjelenítési formátumot. Ezután megkezdődhetett az adatbázis feltöltése.
A THES nevű tezauruszkezelő programban a következő főbb változtatásokat hajtottuk végre:

  • meghagyva az eredeti programot, létrehoztunk egy, csak az olvasók által behívható változatot;
  • az olvasói változatból töröltük azokat az opciókat, amelyekkel “bele lehet nyúlni” az adatbázisba (deszkriptor létrehozása, törlése, relációk bevezetése);
  • az üzenetek szövegeit magyarra fordítottuk;
  • a tezauruszhasználatot egy menüpontként beépítettük a MANCI olvasói keresési almenüjébe (a programhoz eredetileg csak az “ISIS-PASCAL szolgáltatások”, azaz a főmenü A opciója útján lehetett hozzáférni, és ennek kilépési opciója (Q) használatával lehetett kilépni belőle).

Tekintsük át egy egyszerű példán, hogy az online tezauruszhasználat mit nyújt az olvasók számára! Tegyük fel, hogy használónkat a közművelődési könyvtárak építése, berendezése érdekli. A keresési menüben a Z (Tezaurusz) billentyűt lenyomva megjelenik a program kiindulási képernyője, ahol az olvasó beírhatja a keresőelemet, vagy annak részét. Nem tudva, hogy az általános építési kérdésekre használt deszkriptor nálunk a “Könyvtárépítés, berendezés”, beírja az “építés” szót, mire a képernyőn e betűrendi ponttól kezdődően megjelenik a tezaurusz indexe (1 ábra).
Kiválasztva az első, a kérdéséhez közel álló “Építési program”-ot, az S billentyűt lenyomva megjelenik a vonatkozó deszkriptorcikk (2 ábra). Itt megjegyezzük, hogy a reláció-rövidítések (H – nem-deszkriptor, F – tágabb, A – szűkebb, X – rokon) az MSZ 3418-87 “Magyar nyelvű információkereső tezauruszok szerkezete, részei és formái” c. szabvány 3.5 pontja szerinti betűjelek. A kiválasztott deszkriptorcikk rávezeti a használót, hogy az “Építési program” helyett a használandó deszkriptor az “Építési terv”, és tágabb kifejezésként rendelkezésre áll még a “Könyvtárépítés, berendezés” és – például – rokonként a “Berendezés”. Ezeket a Q-val keresőkifejezésekké minősítheti, aminek nyomán a program VAGY (+) kapcsolattal összekötve megőrzi őket.
Ezután az olvasó rátérhet a kérdés második részére. A T opcióval beírhatja például a “Közkönyvtár” terminust, amire a deszkriptorcikkből egyrészt kiderül, hogy nem ezt, hanem a “Közművelődési könyvtár”-t kell használnia, másrészt érdemes szűkebb fogalmakat is (Városi könyvtár, Megyei könyvtár stb.) kijelölni. X-el kilépve, a képernyőn +-al összekötve megjelenik az összes, keresésre kijelölt kifejezés:

Építési terv + Könyvtárépítés, berendezés + Berendezés + Közművelődési könyvtár + Városi könyvtár + Megyei könyvtár

A keresőkérdés most megszerkeszthető (az építéshez, illetve a közkönyvtárhoz tartozó deszkriptorokat zárójelek közé tesszük, és a közöttük lévő VAGY kapcsolatot ÉS-re (*) módosítjuk), és az ENTER leütésével a keresés a MANCI-ban végrehajtható.

3. Utalókészítési program

A MANCI alapján két negyedéves nyomtatott kiadvány: egy bibliográfia, illetve egy referálólap készül, az egyik a magyar (Magyar Könyvtári Szakirodalom Bibliográfiája, MAKSZAB), a másik pedig a külföldi szakirodalmat tárja fel (ez utóbbi 1991-tól a Könyvtári Figyelő egyik rovataként jelenik meg). Mindkettő tárgyszóindexe a MicroISIS-ben definiált nyomtatási, illetve rendezési űrlapok segítségével készül. A végtermék egy nyers mutató, amelyet a Word 5.0, illetve a Ventura Publisher szoftverek használatával alakítunk nyomdakész indexszé, úgy, hogy előzőleg a megfelelő betűrendi helyekre begépeljük a szükséges lásd és lásd még utalókat. Tezauruszunk géprevitelével elérhető közelségbe került az utalók automatikus előállítása is, hiszen a THES adatbázisban mindkét típusú utalók jelen vannak (a lásd-ok a nem-deszkriptorok, a lásd még-ek pedig a tágabb, szűkebb és rokon fogalmak közül kerülnek ki), ezért egy utalólista készítése és ennek összefésülése a tárgyszóindexszel – némi programozással – megvalósíthatónak látszott.
Mindenekelőtt szükségünk volt egy olyan adatbázisra, amelyikben csak a vezérdeszkriptorok és az ezekhez szükséges utalók vannak jelen. A THES erre “egy az egyben” nem alkalmas, mert a lásd még-ek számára értelmetlen lenne mindhárom szóba jöhető kapcsolat összes deszkriptorának a felhasználása. Ezért a THES-t THESL néven lemásoltuk, majd töröltünk belőle minden olyan deszkriptort, amelyet nem kívánunk lásd még-ként használni. Ezzel egy olyan állandó utaló-adatbázishoz jutottunk, amelyhez csak új deszkriptorok bevezetése esetén kell hozzányúlni.
Mind a feladat megfogalmazásában, mind a megvalósításban arra törekedtünk, hogy a rendelkezésre álló szoftverek (ISIS, kiadványszerkesztők) képességeit használjuk feladataink megoldására, igényeinknek megfelelően “körülpárnázva” azokat programokkal.

3.1 Az ISIS-szel közvetlenül nem megoldható probléma

A Micro-ISIS szolgáltatások segítségével könnyen elkészíthetnénk egy listát a THESL-beli összes utalóról; a megoldandó feladat az lenne, hogy ebben csak azok szerepeljenek, amelyek a MANCI-ból aktuálisan kiszerkesztett tárgyszavakhoz tartoznak. Egy tárgyszóhoz (THESL-beli vezérdeszkriptorhoz) ezek a következők: az összes lásd utaló, de csak azok a lásd még utalók, amelyek a MANCI-ból szerkesztett tárgyszavak között is szerepelnek. Így, mivel egy vezérdeszkriptorból nem az összes hozzá tartozó utalót kell kiszerkeszteni, nem elegendő, hogy a THESL adatbázisból leválogassuk a tárgyszó-listában szereplő deszkriptorokat, s a hozzájuk tartozó utalókat kiszerkesszük, hanem a lista szerkesztéskor meg kell tudni állapítani, hogy az egyes lásd még relációk szerepelnek-e az aktuális MANCI tárgyszójegyzékben.

3.2 Milyen megoldást választottunk?

Az ISIS formátumnyelv lehetőséget ad feltételes szerkesztésre (if struktura), valamint arra is, hogy adatokat, feltételeket ISIS-PASCAL program (format exit) határozzon meg, így programmal válaszolhatnánk arra a kérdésre, hogy bizonyos deszkriptorok szerepelnek-e az aktuális tárgyszójegyzékben. Ez azonban hosszadalmas lenne, hiszen közvetlenül a hosszú, szekvenciális indexfájlból keresnénk ki egyenként a deszkriptorokat. Ezért célszerű az indexbeli tárgyszavakat egy véletlen elérésű állományba szervezni. Az ISIS invertált fájlja ilyen, ún. random access adathalmaz, amelyben bármely adat bármikor gyorsan megtalálható. Az invertált fájl a formátumnyelvből közvetlenül elérhető az L függvénnyel, így a format exit program sem szükséges. Ha létrehozunk egy olyan “munka” invertált fájlt, amely az aktuális tárgyszavakat tartalmazza, a feltételes szerkesztés elvégezhető az ISIS formátumnyelvvel: az L függvény segítségével egyrészt megállapítható, hogy a THESL vezérdeszkriptoraira kell-e lásd-dal utalni, másrészt, hogy a lásd még relációk közül melyekre van szükség.

3.3 Az utalókkal ellátott tárgyszóindex létrehozásának lépései

1. A nyers tárgyszóindex előállítása a MANCI aktuális negyedévéből, majd ennek az utalószerkesztés környezetébe helyezése.
2. Az ISIS-hen agyidőben csak egy invertált fájt lehet egy adatbázishoz, ezért az eredeti invertált fájl anyagait és FST-jét el kell menteni, és a munka-invertálás FST-jét kell az adatbázis invertálási FST pozíciójába helyezni. Ezt egy DOS folyamat végzi.
3. A munka invertált fájl létrehozása egy ISIS PASCAL nyelven írt programmal történik, melynek funkciói a következők:

  • Ellenőrzi, hogy megfelelő-e az invertálási FST (lezajlott-e a mentő-cserélő folyamat), ha nem, hibaüzenettel leáll.
  • A tárgyszóindex szövegéből kiválogatja a fejlécként kiemelt tárgyszavakat (az egyes bibliográfiai tételekhez tartozó egységek, nevezetesen a kiemelt tárgyszó, a további tárgyszavak és a megfelelő hivatkozási tételszám a Ventura formázáshoz konstansokkal vannak minősítve – a program ugyanezt az információit használja a kiemelt tárgyszó felismerésére), és felviszi a THESL adatbázis e célra kiválasztott munkamezőjébe. Az adatbázisba való felvitel csak azért történik, hogy az invertált fájlt el lehessen készíteni, az aktuális tárgyszavak a valódi adatoktól függetlenül, bárhova elhelyezhetőek az adatbázisban. Kezelési és teljesítményi okokból MFN 1-től, MFN-enként 25 darab deszkriptort tesz a program a munkamező ismétlődéseibe, addig az MFN-ig, amíg az összes tárgyszó szövege fel nem került. (Az előző listaszerkesztésből ottmaradt munkamező-tartalmakat törli, ha vannak.)
  • Végül a program elindítja a kialakult MFN határok között az invertálást, amely a tárgyszavakat felviszi az invertált fájlba.

4. Amikor elkészült az invertálás, sor kerülhet a szerkesztő folyamatra. A szerkesztés a teljes THESL adatbázison történik az említett L függvény segítségével. Az utalókat rendezési kulcsként, a feltételes szerkesztést és az L függvényt használva készíttetjük el az ISIS-szel, ellátva azokkal a konstansokkal, amelyeket a kiadványkészítő (Ventura) felhasznál a szöveg megformálására. E folyamat eredményéből a 3. ábra mutat be egy mintát.
5. A rendezett utalólista elkészülte után DOS folyamattal visszacseréljük az eredeti invertálási adatállományokat.
6. A tárgyszóindex és az utalólista összefésülése egy C nyelven írt programmal történik, amely használja az ISIS szerkesztésnek a megfelelő betűrend megállapításához szükséges rendezési tábláját, hogy a program számára is az összefésülendő anyagok rendezettek legyenek, s így egy egyszerű szekvenciális összefésülést kelljen végeznie. A 4. ábra a program végtermékét szemlélteti, természetesen a Ventura formázás és tipografizálás előtti állapotban.

4. Összefoglalás

Az online tezaurusszal kapcsolatos eddigi olvasói visszajelzések igen pozitívak. Az információkeresés jóval egyszerűbb és hatékonyabb, mint a nyomtatott tezaurusszal, s nem megvetendő az az előnye sem, hogy a kiválasztott keresőelemeket nem kell begépelni, ami nemcsak fáradságos, de a gépelési hibák (s az ennek megfelelő 0 találatok) veszélyét is magában rejti.
Ami az utalókészítési programot illeti, ennek hatékonyságát legjobban a megtakarított munkával, illetve idővel lehetne jellemezni. Erre vonatkozó számszerű adatokkal nem rendelkezünk ugyan, de elképzelhető, hogy milyen megtakarítást jelent, ha nem kell a két kiadványhoz évente kb. 1500 utalót kijelölni, egy cédula-nyilvántartásból kiszedni, betűrendezni, megkeresni helyüket a gépi indexfájlban, majd beírni őket.
Reméljük, hogy a gépi utalókészítéshez más bibliográfiaszerkesztő könyvtárosok is kedvet kapnak, s hasznát tudják venni az ismertetett megoldásunknak.

Hivatkozások

1. WOOD, Anthony J. – SLACK, Frances: Subject searching on British OPACS: Problems and progress = Libr.Rev. 39.vo1. 199?. 6.no. 41-48.p.
2. SLACK, F.E.: OPACs: Using enhanced transaction logs to achieve more effective online help facilities for subject searching. PhD Thesis. Manchester Polytechnic.
3. HUNTER, Rhonda: Successes and failures of patrons searching the online catalog at a large academic library: a transaction log analysis = RO, Spring, 1991.395-402.p.
4. NOVÁK István: Kísérlet egy Micro-ISIS adatbázis olvasói online katalógusként való használatára = Könyvtári Figyelő. 35.évf. 1989. 2.sz. 173-182.p.
5. NOVÁK István: Céduláktól hajlékony lemezig: egy referálólap előállításának fejlődése = Könyvtári Figyelő. 36.évf. 1990. 1-2.sz. 81-90.p.

1. ábra Részlet a tezaurusz indexéből

_ÉPÍTÉSI PROGRAM
_ÉPÍTÉSI TERV
_ÉPÍTÉSÜGYI …
_ÉPÍTÉSZETI …
_ÉPÍTŐIPARI …
_ÉPÜLET -AKADÉMIAI KÖNYVTÁRÉ
_ÉPÜLET -ÁLTALÁNOS TUDOMÁNYOS
_ÉPÜLET -EGYETEMI KÖNYVTÁRÉ
_ÉPÜLET -EGYETEMI, FŐISKOLAI
_ÉPÜLET -FELSŐOKTATÁSI KÖNYVTÁR
_ÉPÜLET -FŐISKOLAI KÖNYVTÁRÉ
_ÉPÜLET -GYERMEKKÖNYVTÁRÉ
_ÉPÜLET -IFJÚSÁGI KÖNYVTÁRÉ
_ÉPÜLET -ISKOLAI KÖNYVTÁRÉ
_ÉPÜLET -KÖNYVTÁR-
_ÉPÜLET -KÖZMŰVELŐDÉSI KÖNYVTÁR

? -következő       B-előző    P-lapozás    S-kiválasztás
T-keresőelem    X-kilépés

2. ábra Az “Építési terv” deszkriptorcikke

ÉPÍTÉSI PROGRAM MFN 188
_Építési terv
_NB “Forma” váłtozatban is!
_H Berendezési terv
_H Beruházási program
_H Építési program
_H Típusterv
_F Könyvtárépítés, berendezés
_A Flexibilitás
_X Berendezés
_X Könyvtárépület

? -következő           B-előző                     F-első                     P-lapozás                      S-kiválasztás
T-keresőelem        O-keresőkérdés      ?-keresőkérdés mutatás                          X-kilépés

3. ábra Részlet az utalókat tartalmazó fájlból

@pu=GÉPI FORMÁTUM
@pl=lásd
Formátum -gépi
@pu=GÉPI HÁLÓZAT -HELYI
@pl=lásd
Helyi gépi hálózat
@pu=GÉPI INDEXELÉS
@pl=lásd még
Gépi osztályozás
@pu=GÉPI INFORMÁCIÓKERESÉS
@pl=lásd még
Adatbázis-kezelési útmutató
Ember-gép kapcsolat
Keresőkép
Online információkeresés
@pu=GÉPI INFORMÁCIÓKERESÉSI RENDSZER
@pl=lásd még
Adatbázis
Ember-gép kapcsolat
Gépi katalógus
Információkeresési rendszer értékelése
Hiperszöveg

4. ábra Az utaló-fájlnak megfelelő részlet a végleges tárgyszóindexből, formázás előtt

@pu=GÉPI FORMÁTUM
@pl=lásd Formátum-gépi
@pu=GÉPI HÁLÓZAT -HELYI
@pl=lásd Helyi gépi hálózat
@pu=GÉPI INDEXELÉS
@pl=lásd még Gépi osztályozás
@pt=Gépi szövegelemzés; Információkeresési rendszer értékelése; Kísérlet; Tárgyszó
@pn-91/232 Autoref(eng )-
@pu=GÉPI INFORMACIÓKERESÉS
@pl=lásd még Adatbázis-kezelési útmutató; Ember-gép kapcsolat; Keresőkép; Online információkeresés
@pt=Teljes szövegű adatbázis
@pn =91 /053 Autoref(ger) -
@pt=Ember-gép kapcsolat
@pn =91 /056 Autoref(ger) -
@pt=Hatékonyság; Szoftver
@pn =91 /094 Autoref(cze)CS
@pt= ETO
@pn=91/132 Ref(eng)-
@pt=Használók képzése -felsőoktatásban
@pn=91/158 Ref(eng)GB
@pt=Online katalógus; Tárgyi feltárás

A bejegyzés kategóriája: 1992. 1. szám
Kiemelt szavak: , , , , , , .
Közvetlen link.

MINDEN VÉLEMÉNY SZÁMÍT!