Online térben – az online térért

2021.04.27.
Online térben – az online térért
Sikerrel mutatkoztak be az ELTE BTK oktatói és kutatói a 2021. évi Networkshop konferencián. Tószegi Zsuzsanna beszámolója (ELTE Könyvtár- és Információtudományi Intézet).

Az ELTE volt a házigazdája a Hungarnet Egyesület által immár harmincadik alkalommal megrendezett Networkshop konferenciának 2021. április 6-9. között. A felsőoktatás, a köznevelés, a közgyűjtemények és a tudományos kutatás nélkülözhetetlen informatikai hátterét biztosító számítógéphálózatok és -alkalmazások terén zajló új eredményekről számot adó Networkshop a maga nemében a legnagyobb múltra visszatekintő, legrangosabb és legnépszerűbb hazai rendezvénysorozat, amelynek minden évben az ország valamelyik felsőoktatási intézménye ad otthont. A jubileumi konferencia a Hungarnet Egyesület, az Innovációs és Technológiai Minisztérium (ITM), valamint a Digitális Jólét Program együttműködésével valósult meg, a számítógépes hátteret az ELTE informatikai igazgatósága biztosította. A konferencia mottója az „Online térben – az online térért” volt.

Egyetemünk oktatói, kutatói, munkatársai jelentős számban járultak hozzá az online környezetben megtartott rendezvény sikeréhez – sokan vettek részt a szervezésben, a lebonyolításban, a szakmai programokban.

A 105 előadás közül 2 plenáris és 13 szekcióelőadást kollégáink tartottak, beszámolva legújabb kutatási eredményeikről, fejlesztéseikről.

Az előzetesen meghirdetett, kiemelt témakörök közül az ELTE Bölcsészettudományi Kar szempontjából legfontosabb témák az alábbiak voltak:

  • A felsőoktatás, a kutatás és a közgyűjtemények digitális transzformációja; 
  • Digitális módszerek a bölcsészeti és társadalomtudományokban;
  • A digitális bölcsészet és társadalomtudomány fokozott színre lépése – és e témán belül
    • Digitális bölcsészet az ELTE-n.

Mint ismeretes, a BTK-n 2017-ben jött létre a Digitális Bölcsészet Központ, a Történeti Intézeten belül pedig 2020 novemberében alakult meg a Digitális Bölcsészet Tanszék. Ugyancsak 2020 őszén kezdte meg a munkáját a Digitális Örökség Nemzeti Laboratórium, valamint a Társadalmi Innovációs Nemzeti Laboratórium. Az ITM kezdeményezésére létrejött 12 nemzeti laboratórium a nemzetgazdaság számára különösen ígéretes tématerületek hazai tudáscentrumait fogja össze.

Céljuk, hogy a legfontosabb,

világméretű kihívásokra válaszokat adó, nemzetközi szinten elismert tudományos központokká váljanak.

A fent említett két nemzeti laboratórium konzorciumának vezető szerepét az ELTE tölti be.

Csík Tibor, a Könyvtár- és Információtudományi Intézet (KITI) adjunktusa „A könyvtárak az új digitális világban” című előadását arra a gondolatra fűzte föl, hogy az olvasók és a könyvtárak osztoznak egymás sorsában. A könyvtárak helyzete, vagyis az információforrásokhoz való hozzáférés jól mutatja egy társadalom állapotát. Az előadó elmondta, milyen hatást gyakorol a könyvtárakra és szolgáltatásaikra a neoliberális gazdasági környezet, illetve a kommodifikáció egyre szélesedő folyamata. A 2000-es évek elején bekövetkezett gazdasági válság számos könyvtár bezárásához vezetett, a megmaradtak állományában viszont egyre nagyobb arányt képviselnek az online források. A könyvtáraknak nincs elegendő erőforrásuk az analóg dokumentumok digitalizálására; ezt a helyzetet jó néhány technológiai cég kihasználta a maga javára. Nem csökken sem a nyomtatott, sem a digitális kiadványok folyamatos áremelkedési üteme, amely világszerte egyre nagyobb gondot okoz.

A könyvtárak számos területen igyekeznek megfelelni a kihívásoknak: részt vesznek az információs műveltség terjesztésében, az olvasóikat jogkövető magatartásra ösztönzik, és digitális gyűjteményeik, repozitóriumaik révén bekapcsolódnak az elektronikus kiadásba is.

Mielőtt áttérünk a digitális bölcsészeti előadásokra, ismerkedjünk meg röviden a BTK-n létrejött új tudományos műhelyekkel. A kar vezetésének kezdeményezésére kialakított Digitális Bölcsészet Központ (DBK) 2017-ben a KITI intézetigazgatója, Kiszl Péter vezetésével – és az akkor még a Petőfi Irodalmi Múzeumban dolgozó – Palkó Gábor társvezetésével kezdte meg munkáját. Ahogy a szakterület jelentősége nőtt, úgy vált mindinkább fontossá, hogy a digitális bölcsészet diszciplína önálló szervezeti egységként kapjon helyet a BTK struktúrájában – ezt szolgálta a Digitális Bölcsészet Tanszék megalapítása. A szakterület országos jelentőségét mi sem bizonyítja jobban, mint a kormányzati kezdeményezésre életre hívott Digitális Örökség Nemzeti Laboratórium (DH-LAB) életre hívása. A Tanszék és a Laboratórium szoros együttműködésben végzi tevékenységét; mindkét szervezet munkáját Palkó Gábor egyetemi docens irányítja.

A Tanszék és a Laboratórium kutatóiból álló csapat a Networkshop konferencián mutatta be  eddig elért eredményeit, amelyek mindegyike az egyetem, illetve a nagyközönség érdekeit szolgálja.

Talán nem tévedünk nagyot, ha azt jósoljuk, a legnagyobb érdeklődésre a DH-LAB internetes újságcikk-kereső és archiváló szolgáltatása számíthat, amelyet Sárközi-Lindner Zsófia és Indig Balázs mutatott be. A webarchiválás világszerte az egyik legnagyobb kihívás a szakemberek számára, ugyanis az online hírportálok kiadói főként az új tartalmakra, és nem az archívumaikra koncentrálnak. A nemzeti kulturális örökség szerves részét képező online sajtó megőrzése sokkal nehezebb feladat, mint a nyomtatott kiadványoké. A 2019-ben a DBK-ban indult webaratás projekt keretei között kidolgozott módszertan és a kifejlesztett eszköz – a bevett webaratási technológiákkal eltérően – a lehető legteljesebb módon, szabványos adat- és metaadat-formátumokkal (Schema.org, TEI XML) leírva rögzíti a hírportálok cikkeit, lehetővé téve ezáltal a cikkek repozitóriumba helyezését, verziókövetését, keresését. A webaratási munkamenetre épülő cikk-kereső szolgáltatás a learatott cikkek metaadatait (szerző, cím, rovat, megjelenés időpontja, az aratás ideje stb.), illetve a cikkek teljes szövegét is kereshetővé teszi.

Elsősorban a magyar irodalommal hivatásszerűen foglalkozók érdeklődésére számíthat az a két új szolgáltatás, amely a kiválasztott szépirodalmi művek sokszempontú elemzését lehetővé tevő adatbázisokban nyújt kvantitatív vizsgálatokra lehetőséget. Mindkét fejlesztés a DBK-ban indult, és mindkettő egyik hívószava a Franco Moretti által bevezetett, az általa az irodalomhoz való új viszonyulás kulcsának tartott „távoli olvasás” fogalom. A távoli olvasás kifejezést – némileg leegyszerűsítve – ma gyakran a számítógépes olvasás szinonimájaként használják.

Bajzát Tímea Borbála, Szemes Botond és Szlávich Eszter „A magyar regény korpusza és a »távoli olvasás«” című előadásában az immár bárki által elérhető adatbázis szolgáltatásait ismertette. A projekt szervesen illeszkedik az ELTeC (European Literary Text Collection) nemzetközi gyűjteményébe, ugyanis a korpuszba került első 100 regény ezen összeállítás magyar nyelvű alkorpuszát képezi. A szövegek feldolgozásának és tárolásának formátuma a strukturált szövegfeldolgozást és megosztást az interneten lehetővé tevő TEI XML. Az előadók bemutatták, hogy a keresőfunkciók használata, illetve a statisztikai és nyelvészeti megközelítések együttes alkalmazása milyen szerepet tölthet be a szövegek értelmezésének folyamatában. A regénykorpuszban tárolt nagy mennyiségű szöveg kvantitatív vizsgálata és a ráépülő vizualizáció az egyes művek, de akár a történeti korszakok olyan jellemzőit képes láthatóvá tenni,

amelyek a hagyományos olvasás révén vagy reflektálatlanok maradnak, vagy a mérések hiányában nehezen igazolhatók.

Nemcsak a prózai, de a lírai művek újszerű elemzését lehetővé tevő adatbázis is elkészült a DBK műhelyében. A konferencia óta a nagyközönség számára is elérhető szolgáltatásról szólt Horváth Péter, Kundráth Péter és Palkó Gábor: „Magyar líra a »távoli olvasás« horizontján: az ELTE Verskorpusz fejlesztése” című előadása. Az adatbázis a középiskolai irodalmi kánonban szereplő 45 magyar költő gépileg annotált verseit tartalmazza. A korpusz a magyar költészettel foglalkozó irodalomtudományi és nyelvészeti vizsgálatokat segíti, de a közoktatásban is haszonnal alkalmazható. Az ELTE Verskorpusz építésének első lépéseként gépileg annotálták a versek szerkezeti egységeit, majd az annotáció kézi ellenőrzését követően szintén gépileg annotálták a szavak grammatikai tulajdonságait, valamint a vershangzás formailag egyszerűbben megragadható jellemzőit. A kimeneti formátum itt is a szabványos TEI XML. A kutatók bemutatták a korpusz online elérhető lekérdezőfelületének számos keresőfunkcióját.

Ugyancsak a stilometriai kutatások eredményeiről szólt Timári Mária, Bajzát Tímea Borbála és Palkó Gábor „A szerzői »ujjlenyomat« stilometriai koncepciója Jókai Mór prózájának szövegterében” című közös előadása. A számítógépes stilisztika területén közkeletű nézet szerint léteznek az egyéni nyelvhasználatra jellemző egyedi mintázatok, az ún. szerzői "ujjlenyomatok", amelyek felderítése a kvantitatív szöveghasonlósági vizsgálatokat alkalmassá teheti a szerzőazonosítás céljaira. Óvatosnak kell lenni azonban az "ujjlenyomat" metaforával, mert azt a téves képzetet keltheti, hogy a szövegekből objektív módon volnának kiolvashatók a szerzőre jellemző, számszerűsíthető minták. A szerzői "ujjlenyomat" megalkotása egy kreatív digitális bölcsészeti feladat. A DH-LAB kutatói Jókai Mór szövegeinek nyelvezetéről széles körű stilometriai elemzést készítenek, feltérképezik a Jókaira jellemző nyelvstatisztikai alapú mintázatokat, és ezek alapján kísérletet tesznek szerzői "ujjlenyomatának" megalkotására. A szerzőséggel kapcsolatos vizsgálatokat a Kritikai Kiadás Kutatócsoporttal együttműködve végzik. 

Kiss Margit, Palkó Gábor és Szakács Béla Benedek: „Szöveghasonlósági vizsgálatok automatizálása” címen regisztrált előadása szintén egy újonnan indult szolgáltatásról számolt be. A stilometriai elemzésekhez jelentős számítási kapacitásra és komoly nyelvészeti-statisztikai háttértudásra is szükség van. Ez annak ellenére van így, hogy ma már elérhető néhány elemzőszoftver (Websty, JGAAP, Stylene stb.). A prezentáció első részében a hallgatóság megismerhette a stilometriai elemzés különféle alkalmazási területeit és eddigi eredményeit, különös tekintettel a magyarországi fejleményekre. A második részben az előadók azt a szolgáltatást mutatták be, amelyet a BME, az ELTE Digitális Bölcsészet Tanszék, illetve az ELKH BTK Irodalomtudományi Intézet együttműködésében fejlesztettek ki, és amelyet a DH-LAB üzemeltet. Az előadók a fejlesztésben részt vállaló három intézményt képviselték. A DH-LAB szerverén futó szolgáltatás webes környezetbe ágyazva működik, így a felhasználók mentesülnek a szoftver telepítéséhez, illetve a számítási feladatok elvégzéséhez szükséges, igen jelentős gépi erőforrás biztosítása alól. A webes szoftverkörnyezet, illetve az elemzések automatizálása révén korszerű, felhasználóbarát eszköz áll a számítógépes szövegelemzési munkálatokat végzők rendelkezésére, és ez megkönnyíti a stilometriai elemzést végzők munkáját.

Sebestyén Ádám „Prozopográfiai adatbázis-fejlesztés” című előadása az ELTEdata szolgáltatást mutatta be, amely prozopográfiai, bibliográfiai és más történeti témájú kutatások anyagainak szemantikus adathálózatba rendezésével és közzétételével foglalkozik. Az ELTEdata mind a szemantikus állítások, mind pedig az entitások szintjén össze van kapcsolva a Wikidata megfelelő állításaival, melynek révén az ELTEdata a Wikidata részeként, de attól független, önálló hálózatként is szemlélhető és kereshető. Az adatbázis egyedi azonosítóval rendelkező elemekből épül fel, valamennyi szemantikus kijelentés a tulajdonság (property) és az érték (value) kettőséből áll. Az adatbázisban komplex lekérdezések is végrehajthatók, az eredmények megjeleníthetők térképen vagy idővonalon. Jelenleg a Humanizmus Kelet-Közép-Európában (HECE) kutatócsoport anyaga férhető hozzá, amelyben lekérdezhetők a közel 500 szócikkből manuális úton bevitt biográfiai adatok. Az előadó kitért a bibliográfiai rekordok bevitelének automatizálási lehetőségeire is.

Smrcz Ádám az ELTE BTK több ezer hallgatóját érintő kurzusának tanulságairól számolt be „A digitális bölcsészet oktatása digitális platformokon” című prezentációjában. Az ELTE BTK első ízben a 2019/20. tanévben indította azt a valamennyi hallgató számára kötelező új kurzust,

melynek célja, hogy a bölcsészhallgatók megismerkedjenek a digitális bölcsészet alapjaival.

Az első tanévben még hibrid oktatás folyt, a 2020/21. évben azonban már kizárólag online környezetben kellett a kurzust megtartani. Az előadó ismertette a kurzus tematikáját és az első két félév eredményeit, tanulságait. Az egyes modulok során a hallgatók megismerkedhettek az információs műveltség, az információmenedzsment, a digitálisan létrejött tartalmak, az információs túlterheltség, a Big Data stb. témakörével. Az egyik legnagyobb nehézséget az okozta, hogy a BA-, MA- és PhD-hallgatók tudásszintje és a téma iránti érdeklődése nagyon heterogén; nehéz a különböző képzési szinten álló hallgatók eltérő ismereteinek megfelelő tananyagot összeállítani. A nehézségek ellenére az első tapasztalatok jónak mondhatók, a digitális bölcsészeti képzést mindenképpen érdemes folytatni; a jövőben azonban a különböző tudományos háttérrel rendelkező hallgatókat eltérő módokon kell megszólítani.