Hír

Mi a tudományos rekord elemi egysége?

Évtizedekig a tudományos könyvkiadás egy hallgatólagos válasszal működött: ez a PDF. Teljes infrastruktúránkat erre a feltételezésre építettük. DOI-kat rendelünk dokumentumokhoz. Dokumentumgyűjteményeket értékesítünk. A hatást a dokumentumokra való hivatkozásokban mérjük.
 
A PDF-nek volt értelme a maga korában: hordozható, platformfüggetlen és vizuálisan egységes. Azt feltételeztük, hogy a tudás a tárolóban lakik és ez a tároló stabil, hordozható és elégséges.
Ám ahogy nemrég a Research Informationben, a „Tudás mint szolgáltatás” (Knowledge-as-a-Service) kapcsán érveltem: az iparág a hozzáférés-alapú gazdaságról a válaszalapú gazdaságra tér át. Ez sürgető kérdést vet fel: ha a „válaszok” jelentik az új terméket, mi az a lényegi egység, amit valójában csomagolunk? Nem dokumentumok. Valami kisebb, sűrűbb és géppel feldolgozható.
 
Egy MI-közvetítette világban a PDF már egyáltalán nem a tudás hordozója. Sőt, gyakran inkább akadályt jelent. Ha a kiadók „fájlok” helyett „válaszokat” akarnak nyújtani, a tudás másfajta elemi egységére van szükségünk. A Cikktől a Tudásobjektum (Knowledge Object) felé kell elmozdulnunk.
 
Miért „veszteséges” formátum a PDF a kontextus szempontjából?
 
Bárki, aki próbált már strukturált információt kinyerni egy PDF-ből, ismeri az érzést. A keresett ábra a 3. oldalon van. A felirat közvetlenül alatta. A kísérleti korlátokat meghatározó módszertan pedig az 5. oldalra van elrejtve. Az adatkészlet valahol máshol, egy repozitóriumban található, és csak szerencsés esetben van belinkelve. Az eredet pedig – beleértve a szakmai lektorálás státuszát, a szerzőségi szerepeket és a licencelést – vagy csak implikált, vagy szétszórva található a különböző metaadatmezőkben.
 
Az emberek össze tudják ezt rakni, mert a narratíva koherenciát biztosít. Elolvassuk a bevezetést, követjük az érvelést, és menet közben rekonstruáljuk az állítások és a bizonyítékok közötti kapcsolatokat. A gépek ezt csak megközelíteni tudják. A vizuális nyelvi modellek térbeli jelzéseket vonnak ki az oldalelrendezésből, a nagy nyelvi modellek (LLM-ek) pedig statisztikai alapon következtetnek a kapcsolatokra a környező szövegből, de ez a rekonstrukció valószínűségi alapú, nem determinisztikus. A modell valószínűségi asszociációk alapján tippel a kapcsolatokra; nem egy explicit módon kódolt struktúrát olvas. Ha ezek a következtetések tévesek, a hiba gyakran észrevétlen maradhat. Az eredmény egyfajta veszteséges tömörítés: a jelentés szétszóródik a térben, a kritikus kapcsolatok jelöletlenek, és nincs garancia arra, hogy amit a gép „megért”, az megegyezik a szerzők szándékával.
 
Az eredmény borítékolható: hallucinált értékek, téves feltételezések, félreértelmezett diagramok, megalapozottság nélkül felépített szintetikus „válaszok”. Ezek nem a mesterséges intelligencia képességeinek, hanem a tudásarchitektúrának a kudarcai. Az MI teljesítménye meredeken romlik, ha a kontextus összeomlik. A PDF pedig, amely emberi olvasásra kiváló, szerkezetileg alkalmatlan a kontextus megőrzésére gépi léptékben.
 
A megoldást nem a jobb PDF-ek vagy a bonyolultabb metaadatrétegek jelentik. Hanem a tudás egy alapvetően más egysége, amelyet relációs következtetésre terveztek, nem pedig lineáris narratívára.
 
Mi az a Tudásobjektum?
 
Ha a PDF egy tároló, a Tudásobjektum (Knowledge Object) a hasznosítható tudás molekulája: egy önálló csomag, amely magát az állítást és annak alátámasztó szerkezetét együtt tartalmazza. Három rétege van; mindegyik szükséges, de önmagában egyik sem elégséges.
 
1. réteg: Az eszköz (a „Mi”)
A nagy jelértékű elem a középpontban: gyakran vizuális, néha szöveges, de mindig értelmezésileg sűrű. Áramköri rajzok. Kristályszerkezetek. Génexpressziós hőtérképek. Folyamatábrák. A PDF-korszakban ezek csupán elemek egy oldalon. A Tudásobjektumok világában ezek elsődleges digitális entitások: lekérdezhetők, címezhetők és a kontextusukkal párosítva önálló jelentéssel bírnak.
 
2. réteg: A kontextus (a „Hogyan” és a „Miért”)
Ez az, ahol az objektumok jelentéssel telivé válnak, nem csupán informatívvá. A Tudásobjektum az eszközt (asset) az értelmező keretrendszeréhez köti, méghozzá explicit, szemantikus és géppel olvasható módon.
Az ábraaláírás számít, de nem mint próza, hanem mint strukturált metaadat, amely rögzíti a korlátokat, a feltételezéseket és a változódefiníciókat. A módszertani töredékek is számítanak, de csak azok a részek, amelyek relevánsak az adott eszköz szempontjából: szintéziskörülmények, reagensek, hiperparaméterek, peremfeltételek és adatkészlet-hivatkozások.
Egy Tudásobjektumban az aláírás nem „közel” van az ábrához a tipográfiai térben; hozzá van csatolva, explicit és tartós módon. A kapcsolatokat nem a közelség sugallja; azok az objektum szerkezetének részeként vannak kódolva.
 
3. réteg: Az eredet (a „Ki” és a „Mikor”)
Egy MI vezérelte világban a bizalom az új hiánycikk. A Tudásobjektumok belsőleg hordozzák eredettörténetüket (lineage): a szülőcikk DOI-ját, a szerzők ORCID-azonosítóit és CRediT szerepköreit, az intézményi azonosítókat (ROR), a pályázati azonosítókat, a verziótörténetet, a licencfeltételeket és a szakmai lektorálás (peer review) státuszát mint ellenőrizhető adatot.
Ez az eredetleírás lehetővé teszi az MI-rendszerek számára, hogy megindokolják a válaszokat, ne csak kibocsássák azokat. Amikor egy modell egy Tudásobjektumot idéz, bizalmi jeleket közvetít: ezt a szerkezetet szakmailag lektorálták, ezek a szerzők hitelesített referenciákkal rendelkeznek, ez az adatkészlet nyíltan elérhető. Az eredet nem díszítő metaadat; ez a mechanizmus, amely által a gépek öröklik az emberi ítélőképességet.
 
Miért van szüksége az MI-nek Tudásobjektumokra?
 
A gépek statisztikai alapon következtetnek a kontextusra. Egy LLM (nagy nyelvi modell) a környező szöveg és a tanítóadataiban lévő minták alapján tippel arra, mit ábrázol egy ábra, ám ezek a következtetések valószínűségiek, nem pedig megalapozottak. Egy MI számára a felirat nélküli ábra nem értelmetlen, hanem alulspecifikált.
Egy LLM ettől még generál egy értelmezést, de explicit korlátok híján ez az értelmezés észrevétlenül eltérhet a szerző szándékától. A paraméterek nélküli módszer egy sablonná válik, amelyet a modell a tanítóadatokból tölt ki. Az eredetmegjelölés nélküli adatkészlet használható, de nem ellenőrizhető. A kockázat nem az, hogy a gépek képtelenek feldolgozni ezeket az objektumokat, hanem az, hogy magabiztosan, ám helytelenül dolgozzák fel őket.
A Tudásobjektumok az implicit kapcsolatokat géppel olvasható struktúrává alakítják. Önállóak, kontextusban gazdagok, követhető eredetűek, jogilag tisztázottak, interoperábilisak, és készen állnak a következtetésre, nem csupán a visszakeresésre. Ez a híd a kereséstől a megértésig: a „keress nekem egy tanulmányt X-ről” kéréstől a „segíts eldönteni, hogy X alkalmazható-e Y kontextusban” kérésig.
 
A kontextusrétegért folytatott közelgő küzdelem
 
Ha a kiadók nem definiálják és szolgáltatják a Tudásobjektumokat, mások fogják azokat rekonstruálni – tökéletlenül, drágán és forrásmegjelölés nélkül. Ez már most is zajlik. A modellfejlesztők annotátorok hadseregeit alkalmazzák az ábrák kinyerésére, a képaláírások OCR segítségével történő feldolgozására, valamint a módszerek és eredmények manuális összekapcsolására. A vállalati K+F csapatok licencelt tartalmakból építenek saját tudásgráfokat, mivel a szükséges strukturált kapcsolatok nem állnak rendelkezésre megvásárolható formában. A keresőmotorok eredetmegjelölés nélkül generálnak válaszokat, elhomályosítva azt, hogy ki, milyen munkát és milyen körülmények között végzett.
 
Az érték a tartalom birtoklásáról a kontextus gondozása felé tolódik el. Aki uralja a kapcsolatokat (ki hitelesítette ezt, milyen módszerekkel készült, milyen megbízhatósági szintekkel), az uralja a választ is. A Tudásobjektumok révén a kiadók visszaszerezhetik ezt a réteget – nem azzal, hogy fizetőfalak mögé zárják a tartalmat, hanem azzal, hogy az ellenőrzött, strukturált tudományos kapcsolatok hiteles forrásává válnak.
 
A gazdasági logika egyértelmű. Az MI-cégek fizetnek a jó minőségű tanítóadatokért, de ez egy statikus, egyszeri tranzakció. A kutatók, intézmények és vállalatok folyamatos előfizetést fognak fizetni azokért a megbízható tudásrétegekért, amelyek megoldják az általuk egyedül áthidalhatatlan hitelesítési válságot. A Tudásobjektum-modell a kiadókat nem nyersanyag-beszállítóként, hanem az MI-t megbízhatóvá tevő „kötőszövet” gondozóiként pozicionálja.
 
Mit igényel ez a gyakorlatban?
 
Ez nem igényli, hogy mindent egyetlen éjszaka alatt újjáépítsünk. Az első lépés koncepcionális: kezeljük legértékesebb tartalmainkat (ábrák, adatkészletek, módszerek) elsődleges tudástermékként, ne pedig a cikkek melléktermékeként.
A működési kihívások valósak, de megoldhatók. Határozott váltásokat igényelnek:
Munkafolyamatok, amelyek már a benyújtáskor rögzítik a strukturált metaadatokat, nem pedig utólagos gondolatként.
Technológiai csapatok, amelyek ezt a struktúrát használható, megbízható végpontokon keresztül teszik elérhetővé.
Szabványok, amelyek lehetővé teszik az interoperabilitást, nem pedig egyedi szigeteket hoznak létre.
Üzleti modellek, amelyek a dokumentumok értékesítéséről a kontextus gondozására térnek át.
Az átállás forgatókönyve már kirajzolódóban van. Az építőkockák töredékesen már ma is léteznek: tartós azonosítók, metaadatsémák, API-k, jogkezelési keretrendszerek és olyan feltörekvő szabványok, mint a Model Context Protocol, amelyek segítik az MI-rendszereket a strukturált tartalmak felfedezésében és értelmezésében.
A részletek tudományterületenként és portfóliónként változnak, de a cél világos: strukturált, kontextualizált tudást termékként kínálni, és a Tudásobjektumok tervezését folyamatos stratégiai programként kezelni, nem pedig egyszeri projektként.
 
A felfedezés infrastruktúrája
 
A PDF egy olyan korszakban vált a tudományosság egységévé, amikor az emberek lineárisan olvastak, a gépek pedig egyáltalán nem. Egy olyan világra optimalizálták, ahol a jelentés a narratívában élt, a koherencia az olvasás aktusából fakadt, az elsődleges terjesztési kihívás pedig a dokumentumok eljuttatása volt az emberek asztalára. Ez a világ elmúlt.
A PDF utódja nem egyszerűen egy gazdagabb médiaformátum lesz, mint a videó vagy a végrehajtható kód. Ennél alapvetőbbnek kell lennie. A Tudásobjektumok (Knowledge Objects) a hasznosítható tudás egységei egy új valóságban: ahol emberek és gépek együtt gondolkodnak; ahol a mesterséges intelligencia (MI) olyan mintázatokat tár fel, amelyeket az emberek nem vennének észre; ahol a kutatók tudásgráfokat kérdeznek le a PDF-ek kulcsszavas keresése helyett; és ahol a bizalom nem a folyóirat presztízsén, hanem a visszakövethető eredeten múlik. Legyen a hordozott tartalom szöveg, kód vagy videó, a Tudásobjektum biztosítja azt a kötőszövetet, amely ezt géppel feldolgozhatóvá teszi.
Ha az elmúlt korszak a hozzáférésről szólt – kapuk nyitásáról, hogy mindenki olvashasson –, a következő a kontextusról fog szólni: azon kapcsolatok megőrzéséről és terjesztéséről, amelyek értelmessé teszik az olvasást. Ennek infrastruktúrája töredékesen már létezik (azonosítók, metaadatok, gráfok és munkafolyamatok). Ami hiányzik, az a stratégiai elkötelezettség, hogy a strukturált, relációs tudást termékként kezeljük, ne pedig a cikkgyártás melléktermékeként.
A PDF-korszakban a dokumentum működőképes helyettesítőként szolgált, mert az emberek olvasás közben rekonstruálni tudták a kontextust. A válaszalapú gazdaságban ennek a rekonstrukciónak explicitnek kell lennie. Az állításokhoz csatolni kell az alátámasztó kontextust és a visszakövethető eredetet, méghozzá olyan formában, amelyet a gépek determinisztikusan tudnak használni, nem pedig valószínűségi alapon tippelni.
A Tudásobjektumok jelentik ezt az egységet. A Hozzáférés korszaka azt kérdezte: Mindenki el tudja olvasni? A Válaszok korszaka azt kérdezi: Tudnak-e a gépek következtetéseket levonni belőle? Azok a kiadók, amelyek megválaszolják ezt a kérdést, nemcsak a tudományos kommunikáció módját formálják majd, hanem magát a felfedezés infrastruktúráját is.
 
Steven D. Smith, DPhil, a STEM Knowledge Partners alapítója és független tanácsadó. A szerző köszönetet mond Philip Carpenternek, Ben Kaube-nak, Bill Trippe-nek és Jonathan Woahnnak a cikk korábbi vázlataival kapcsolatos megjegyzéseikért.
 
A kép forrása a cikk.
 
Share

További oldalak

 

Kapcsolat

Cím: 1016 Budapest, Szent György tér 4-6. (Budavári Palota F épület)
Postacím: 1276 Budapest, Pf. 1205

Tel: +36 1 224-3725

Corporate Site - This is a contributing Drupal Theme
Design by WeebPal.