Hír

Mesterséges intelligencia az elsődleges katalogizálási munkafolyamatokban 5/2

Mesterséges intelligencia az elsődleges katalogizálási munkafolyamatokban 5/2
A könyvtárak folyamatos kihívásokkal szembesülnek a metaadatok kezelése terén, ideértve a katalogizálatlan források felhalmozódását, az inkonzisztens régi metaadatokat, valamint a személyzet szakértelmével nem rendelkező nyelveken és írásrendszerekben meglévő források feldolgozásának nehézségeit. Ezek a problémák korlátozzák a keresést, és megterhelik a személyzet kapacitását. Ugyanakkor a mesterséges intelligencia (MI) fejlődése lehetőséget kínál a munkafolyamatok racionalizálására és az emberi szakértelem bővítésére – de hogyan segítheti az MI a katalogizáló személyzetet a hatékonyabb munkavégzésben?
 
Ezekre a kérdésekre választ keresve az OCLC Research Library Partnership (RLP) idén létrehozta a Metaadatok munkafolyamatában az MI kezelése munkacsoportot. Ez a csoport világszerte összehozta a metaadatok kezelőit, hogy megvizsgálják az MI munkafolyamatba való integrálásának lehetőségeit és kockázatait. Céljuk: felkelteni a kollektív kíváncsiságot, azonosítani a legfontosabb kihívásokat, és felhatalmazni a könyvtárakat, hogy megalapozott döntéseket hozzanak arról, hogyan és mikor célszerű MI eszközöket alkalmazni a keresés javítása, a hatékonyság növelése és a metaadatok kezelésének integritásának fenntartása érdekében.
 
Ez a blogbejegyzés – egy négyrészes sorozat első része – a csoport egyik legfontosabb munkaterületére, az elsődleges katalogizálási munkafolyamatokra összpontosít. A bejegyzésben megtalálhatóak a munkacsoport észrevételei, ajánlásai és nyitott kérdései azzal kapcsolatban, hogy az MI hogyan oldhatja meg az elsődleges katalogizálás kihívásait, például a lemaradásokat és a metaadatok minőségét, miközben a katalogizálás középpontjában továbbra is az emberi szakértelem marad.
 
A Primer katalogizálási munkafolyamatok csoport volt a három munkacsoportunk közül a legnagyobb, hét résztvevővel Ausztráliából, Kanadából, az Egyesült Államokból és az Egyesült Királyságból. A résztvevők elsősorban angol nyelvű országok intézményeit képviselték, ahol hiányozhat az a könyvtári kapacitás, hogy metaadatokat biztosítsanak a nem latin betűs írásrendszerrel írt forrásokhoz, mint például a kínai és az arab.
(A csoport tagjai: Jenn Colt (Cornell Egyetem), Chingmy Lam (Sydney-i Egyetem), Elly Cope (Leeds-i Egyetem). Yasha Razizadeh (New York-i Egyetem), Susan Dahl (Calgary-i Egyetem), Cathy Weng (Princeton Egyetem), Michela Goodwin (Ausztrál Nemzeti Könyvtár))
 
Motivációk: közös (és tartós) szükségletek
 
A munkacsoport tagjai az MI segítségét veszik igénybe egy sor ismerős katalogizálási kihívás megoldásához, amelyek az erőforrások korlátozottságából és a speciális szakértelemhez való korlátozott hozzáférésből adódnak. 
Ezek a kihívások a következők:
- A katalogizálás hatékonyságának növelése;
- A régi metaadatok javítása;
- Segítségnyújtás olyan forrásokhoz, amelyekhez korlátozott szakértelem áll rendelkezésre.
A munkacsoport tagjai megvizsgálták az MI-eszközök képességeit és korlátait ezeknek a kihívásoknak a megoldásában, és megvizsgálták azokat a konkrét eszközöket és munkafolyamatokat, amelyek támogathatják ezt a munkát.
 
A katalogizálás hatékonyságának növelése
 
A katalogizálatlan források felhalmozódása megakadályozza a felhasználókat abban, hogy értékes forrásokat fedezzenek fel. Még a tapasztalt, elkötelezett munkatársak sem képesek lépést tartani a leírásra váró források mennyiségével. Az MI lehetőséget kínál ennek a problémának a megoldására azáltal, hogy egyszerűsíti és felgyorsítja ezeknek az anyagoknak a katalogizálási munkafolyamatát. A munkacsoport azonosította a felhalmozódott források legfontosabb felhasználási eseteit, ideértve a kötelező példányokat, az ajándékokat, a saját kiadású forrásokat és az ISBN-számmal nem rendelkező forrásokat.
 
A katalógusok másolása elengedhetetlen a felhalmozódott lemaradások kezeléséhez, de a legfőbb kihívás itt a „legjobb rekord” azonosítása. A munkacsoport résztvevői megvitatták, hogy az MI hogyan tudná egyszerűsíteni ezeket a munkafolyamatokat azáltal, hogy automatizálja a rekordok kiválasztását olyan kritériumok alapján, mint a birtokban lévő példányok száma vagy a metaadatok teljessége.
 
Ha eredeti katalogizálás szükséges, az MI által generált rövid rekordok lehetővé teszik, hogy ezek az anyagok hamarabb megjelenjenek a keresőrendszerekben, gyorsítva ezzel a rejtett gyűjtemények felfedezésének folyamatát és támogatva a helyi leltárkezelést. Ez a megközelítés megoldja a felfedezés azonnali igényét, miközben lehetővé teszi a rekordok idővel történő kiegészítését, gazdagítását vagy finomítását.
 
A régi metaadatok javítása
 
A régi metaadatok hibákat, következetlenségeket vagy elavult terminológiát tartalmazhatnak, ami megnehezíti a keresést és megakadályozza, hogy a felhasználók a releváns forrásokhoz jussanak. Az MI segíthet a metaadatok tisztításában és gazdagításában, csökkentve a kézi munkát, miközben magas színvonalat biztosít. Ez egy olyan terület volt, ahol a munkacsoport tagjai nem kísérleteztek közvetlenül MI-eszközökkel, de számos felhasználási esetet elképzeltek, többek között:
- A meglévő metaadatokban szereplő elavult kifejezések azonosítása és cseréje
- MI-eszközök használata a duplikátumok, diakritikus hibák vagy anomáliák jelölésére a tisztítási munkák egyszerűsítése és az adatminőség javítása érdekében
- További metaadatmezők vagy leírások javaslása a kereshetőség javítása érdekében
- Helyi hatósági fájlokból származó, meglévő engedélyezett címszavakhoz vagy validált entitásokhoz illeszkedő címszavak biztosítása
 
A metaadatok minőségének javítása, beleértve az ismétlődő rekordok számának csökkentését, szintén olyan terület, amelyre az OCLC jelentős erőfeszítéseket fordított, ideértve az ember által támogatott gépi tanulási folyamatok fejlesztését és alkalmazását, amint azt a Scaling de-duplication in WorldCat: Balancing AI innovation with cataloging care (A duplikációk csökkentése a WorldCatban: az MI innováció és a katalogizálás gondossága közötti egyensúly) című legutóbbi blogbejegyzés is bemutatja.
 
Támogatás biztosítása szkriptekhez
 
A nyelv és az írásjelek szakértelme régóta fennálló katalogizálási probléma. Az angol nyelvű országokban ez abban nyilvánul meg, hogy nehéz leírni a nem latin írásjeleket használó nyelveken írt forrásokat, és azokat, amelyeket a helyi iskolákban nem tanítanak gyakran. Az MI-eszközök segíthetnek a transzliterációban, a transzkripcióban és a nyelv azonosításában, lehetővé téve ezeknek az anyagoknak a hatékonyabb feldolgozását. Egyes eszközök nem rendelkeznek az alapvető funkciókkal vagy a szükséges speciális nyelvek támogatásával. Még akkor is, ha az MI-eszközök megbízhatóan végzik el a transzliterációt, az MI által generált munkák értékeléséhez továbbra is nagy szükség van emberi szakértelemre. Azok a könyvtárak, amelyek az MI-re támaszkodnak ezeknek a nyelveknek a szakértelmi hiányosságainak pótlására, kettős kihívással szembesülnek: nem bíznak teljes mértékben az MI-eszközökben, és nem rendelkeznek belső nyelvi szakértelemmel, amelynek segítségével hatékonyan értékelhetnék és javíthatnák az MI munkáját.
 
A munkacsoport tagjai ötleteket gyűjtöttek, hogyan lehetne megoldani ezt a helyzetet. A kutatókönyvtárak több tucat, akár több száz nyelven gyűjtenek forrásokat a meglévő tudományos programok támogatására. Bár a könyvtárnak nincs közvetlen hozzáférése a nyelvtudáshoz, ez a szakértelem bőségesen megtalálható az egyetemen, ahol a hallgatók, a tanárok és a kutatók szakértői azoknak a nyelveknek, amelyekre a nehezen katalogizálható forrásokat kiválasztják. A campus közösség tagjai segíthetnek egy adott készséghiány pótlásában és az MI-támogatott munkafolyamatok pontosságának biztosításában, miközben elősegítik a közösség bevonását, és biztosítják, hogy az emberek is részt vegyenek a folyamatban. Egy ilyen program megvalósításához a könyvtáraknak létre kell hozniuk egy olyan elkötelezettségi keretrendszert, amely magában foglalja a részvétel ösztönzését szolgáló jutalmakat és ösztönzőket, például kompenzációt, kurzus kreditpontokat vagy nyilvános elismerést.
 
Az MI használatával kapcsolatos nyitott kérdések
 
Nem meglepő, hogy mint minden új technológiánál, a lehetőségek kérdésekkel és aggályokkal is járnak. A metaadatok kezelői elmondták, hogy néhány munkatársuk bizonytalanságát fejezte ki az MI-munkafolyamatok bevezetésével kapcsolatban, és úgy érezte, több képzésre és bizalomépítő támogatásra van szükségük. Mások azt kérdezték, hogy a metaadatok létrehozásától az MI által generált rekordok felülvizsgálatára való áttérés nem teszi-e kevésbé izgalmassá vagy tartalmassá a munkájukat.
 
A metaadat-kezelők maguk vetettek fel egy különösen fontos kérdést: ha az MI olyan alapvető feladatokat lát el, mint a rövid rekordok létrehozása – ami hagyományosan az új katalogizálók alapvető képzésének része –, akkor hogyan biztosíthatjuk, hogy az új szakemberek továbbra is elsajátítsák azokat az alapvető készségeket, amelyekre szükségük van az MI eredményeinek hatékony értékeléséhez?
 
Ezek fontos szempontok, amikor az MI-eszközök bevezetését az emberi szakértelem kiegészítőjeként, nem pedig helyettesítőjeként vizsgáljuk. A cél olyan elsődleges katalogizálási munkafolyamatok létrehozása, amelyekben az MI nagy léptékben kezeli a rutinfeladatokat, így a képzett személyzetet felszabadítva magasabb szintű munkákra, miközben megőrzi a metaadatok létrehozásának azokat a jelentőségteljes aspektusait, amelyek ezt a területet értékessé teszik.
 
Következtetés
 
Bár nem csodaszer, az MI jelentős lehetőségeket kínál az elsődleges katalogizálási kihívások kezelésére, beleértve a lemaradásokat, a szkriptek támogatását és a metaadatok tisztítását. Pragmatikus megközelítés alkalmazásával és az emberi szakértelem folyamatos relevanciájának hangsúlyozásával a könyvtárak óvatosan kihasználhatják az MI-t a jelenlegi kapacitási problémák kezelésére, ami megkönnyíti az anyagok hozzáférhetőségét, és javítja a felhasználók számára a keresést.
 
Share

További oldalak

 

Kapcsolat

Cím: 1016 Budapest, Szent György tér 4-6. (Budavári Palota F épület)
Postacím: 1276 Budapest, Pf. 1205

Tel: +36 1 224-3725

Corporate Site - This is a contributing Drupal Theme
Design by WeebPal.