Adatmodellek és adatmegosztás
(adatcsere helyett)

Az adatmodellnek rugalmasnak kell lennie, és teljes mértékben a csatlakozó, résztvevő rendszerek szabad választásán kell alapuljon. Nem szabad korlátozni az adatok leírását és az entitások összekapcsolásának módját. Csak ez a megközelítés biztosítja, hogy az adatok cseréje és karbantartása ne korlátozódjon a könyvtári szakterületre, és kibővíthető legyen bármely létező területre, ingyenes és egyedi adatformátumaival. A kulturális intézményekkel, például a múzeumokkal és az archívumokkal való kapcsolat nyilvánvaló, de lehetőséget kell biztosítani az együttműködésre a földrajzi névtereket karbantartó intézményekkel, a katonai, oktatási, közlekedési, termelési, tervezési stb. területekkel. Az adatforrások nem korlátozódhatnak intézményekre, hiszen bizonyos területeken számos szakértő, és sok tudós nincs beágyazva az intézményi hierarchiába. Képeseknek kell lenniük a platform adatainak gazdagítására, a digitális adatok és a katalógus információk beszerzésének nyitva kell állnia a résztvevők lehető legszélesebb köre számára. Az írók örökségének, sok elektronikus kézirattal és nem közzétett anyaggal együtt, képesnek kell lennie arra, hogy megtalálja útját a védett és archivált könyvtári gyűjteményekbe. Engedélyezni kell a „civilek” által gazdagított tudományt (citizen science) és a tömegek bevonását a forrásgazdagításba (crowdsourcing). Az adatmodellnek lehetővé kell tennie bármilyen típusú adatformátumot, rugalmasan meghatározható módon, programozók beavatkozása nélkül.

Célunk: az entitásokat azoknak a szakértőknek a segítségével leírni, akik a legmélyebb és legmegbízhatóbb tudással rendelkeznek róluk. Ilyen entitások bármelyek lehetnek; a könyvtári kontextusban leginkább használtak a személynevek, intézmények (könyvtárak, kiadók) nevei, földrajzi névterek és időrendi dátumokat tartalmazó névterek.  Ezek közül is a legfontosabbak a művek, példányok, közreműködők. Ezeket az entitásokat csak egyszer kell leírni, és ezután már csak összekapcsolni kell őket más entitásokkal. Az adatgazdagodásnak szigorúan úgy kell történnie, hogy nagyon pontos információkkal egészüljön ki a forrás, mindenekelőtt a forrás megbízhatóságát tükrözve, jelezve. Ez a megközelítés mindegyik entitásnak és a hozzárendelt kapcsolatoknak „minőségi szintet” biztosít, és ez egyértelműen jelzi az adatok és a kapcsolatok megbízhatóságát. Ez lehetővé teszi minden résztvevő számára, hogy szabadon és azonnali hatállyal csatolja az információkat, de a fogyasztók és a felhasználók választhatnak a megbízhatósági tartományban, mivel dolgoznak és miképpen használják fel a kiválasztott adatokat. Projektünkben bevezetjük továbbá a Loca Credibilia (Hiteles Hely) elnevezésű modult, amely azonosítja a digitális objektum forrását és eredőjét, lehetővé téve az adott digitális objektum útvonalának visszakeresését. Az összes bejegyzésnek sok változata lehet, versengő adatbevitellel is rendelkezhet, de még egyedi mezőszinten is a fellelhető a forrás információ, és ezzel a megbízhatóság foka.

Az előállított és feldolgozásra váró növekvő adatmennyiség mellett naiv elképzelés lenne feltételezni, hogy a problémát az alkalmazottak számának növekedése és az új katalógizálók felvételével meg lehetne oldani. Szükség van egy szélesebb szakértői közösség bevonására, de nem szabad figyelmen kívül hagyni a gépi támogatású feldolgozás lehetőségét sem. A gép képes önállóan elvégezni a folyamatokat, kézi emberi beavatkozás nélkül, és vannak eszközök és módok, amelyek segítségével a résztvevők megtaníthatják a gép munkafolyamatait és jelentősen megnövelhetik a számítógép feldoldozó munkafolyamatának pontosságát. A digitális anyagok minőségének javításával kapcsolatos számos folyamat már megkönnyíti a kollégák életét, és ezt a funkciót könnyen be lehet építeni az interneten összegyűjtött, webaratott” anyagok katalogizálásába, vagy az arcok, tárgyak stb. felismerésébe az álló- és mozgó képek esetében egyaránt. A gép hatalmas támogatást nyújthat az adatminőség javításában.

A munkamegosztás nagy esélyt és potenciált jelent a személyzet hiányának (és gyakran a területspecifikus szakértelem hiányának) kiküszöbölésére. Ez javítja az adatok minőségét, és soha nem látott termelékenységet és adatgazdagságot eredményezhet. Az együttműködés modelljének nyitottnak és átláthatónak kell lennie minden lehetséges résztvevő számára. A világ és az információs rendszerek kialakításának, meghatározásának hajlandósága adott, mivel a fiatal felhasználók ehhez szoktak hozzá a meglévő informatikai adottságok által, és itt az ideje, hogy a könyvtárak kihasználják ezt a meglévő potenciált. További előnye, hogy azok a felhasználók, akik hozzájárulnak a könyvtár gazdagságához, nagy valószínűséggel használják a rendszer által biztosított anyagokat, és közelebb kerülnek a könyvtárhoz. A szakadék a nyitott információs környezetek és a könyvtárak zártsága / titkossága között eltűnhet, ha a könyvtár kincseit széles körű együttműködési rendszerbe integráljuk. A WikiData, a WikiMedia, az OpenStreetMap és a hasonló rendszerekhez vezető hidak kiépíthetők és szélesebb körben használhatók, és ez további felhasználókat fog összekapcsolni a könyvtárak hálózatával.

Az adatkoncepció szempontjából a legjelentősebb előrelépés és fejlődés az, hogy a kapcsolt adatok bevezetésével támaszkodunk arra, hogy az adatok ott vannak, ahol lennük kell, azaz ahol számítunk rájuk. Nem másoljuk az adatokat – valószínűleg a gyors hozzáférés érdekében ideiglenesen tárolunk néhány adatot, de hosszú ideig nem tárolunk felesleges másolatokat. Ez szükségtelenné teszi az adatcserét, így az adatcsere formátumának jelentősége idővel eltűnik. Ebben az irányben haladunk, de mindannyian tudjuk, hogy van egy ökoszisztéma a múlt (és a jelen) örökölt adataival, amelyeket mostantól körülbelül egy évtizedig még táplálnunk kell. Ez összetett kapcsolódást tesz szükségessé a kapcsolt adatok univerzuma és a meglévő, az adatok másolásán alapuló rendszerek között.