Társadalmi Innovációs Díjat kapott a DH-LAB fejlesztése

2024.11.22.
Társadalmi Innovációs Díjat kapott a DH-LAB fejlesztése
Az ELTE-s vezetésű Digitális Örökség Nemzeti Laboratóriumot a magyar nyelvre optimalizált MI-alapú kézírásfelismerő modellek kialakításáért ismerték el. A fejlesztés forradalmasítja a kulturális örökség feldolgozását, és nemzetközi szinten is példát mutathat az MI technológiák alkalmazásában.

A Kulturális és Innovációs Minisztérium elismerése olyan új ötlet kifejlesztéséért és megvalósításáért adományozható, amely társadalmi szükséglet kielégítésére irányul, közösségi kapcsolatokat erősít, vagy együttműködést alakít ki, ezáltal megoldást nyújthat a társadalmi folyamatokat befolyásoló problémákra, és végső célként javíthatja egy adott térség vagy közösség jólétét, illetve nemzetközileg is adaptálható megoldást mutat be. 

Digitális Örökség Nemzeti Laboratórium (DH-LAB) az ELTE Digitális Bölcsészet Tanszék, a HUN-REN Irodalomtudományi Intézet valamint a Miskolci Egyetem szakértőinek közreműködésével, az ELTE IK Mesterséges Intelligencia Tanszék hallgatóival közösen alakítja ki a magyar nyelvre optimalizált MI eszközök alkalmazásának módszertanát a közgyűjteményekben, a nyílt tudományosság elveinek megfelelően, saját hardware környezetben. A projekt vezetője Palkó Gábor, az ELTE Digitális Bölcsészet Tanszék vezetője, a HUN-REN Irodalomtudományi Intézet főmunkatársa.

E munka egyik első és legjelentősebb eredménye a kézírásfelismerő modell kifejlesztése, amely lehetővé tette a Magyar Tudományos Akadémia Könyvtárában őrzött Arany János hivatali iratok kereshetővé tételét, egyben a rendkívül értékes korpusz hozzáférhetőségét a kutatók és a nagyközönség számára.

Fellegi Zsófia, Palkó Gábor, Kecskeméti Gábor és Balogh Balázs

1859 és 1877 között, főtitkárként végzett adminisztratív munkája során Arany több mint 9200 dokumentumot hozott létre, ami közel 30.000 kéziratoldalt jelent. Az iratok digitalizálását egy speciális HTR (Handwritten Text Recognition) modell használatával végezték el, amelyet Arany és titkára, Ring Adorján kézírásai, valamint további kézírásminták alapján tanítottak. A modell hibaaránya mindössze 5%, és a dokumentumok kétrétegű PDF formában elérhetők az MTA Könyvtár repozitóriumában.

A DH-LAB által fejlesztett kézírásfelismerő modell nemcsak az Arany-kéziratok feldolgozására alkalmas, hanem más közgyűjtemények is szabadon alkalmazhatják. A fejlesztés során olyan technológiai tudás (know-how) jött létre, amely a kulturális örökség digitális feldolgozásának európai trendjeihez igazodik, és akár a céges dokumentumok MI-alapú kezelésében is hasznosítható.

A projektben kizárólag magyar szakemberek és eszközök vettek részt, így teljes mértékben a hazai innovációt képviseli. A magyar nyelvű kézírás digitalizálása különösen fontos, mivel a nemzetközi MI modellek elsősorban nagy világnyelvekhez optimalizáltak, a kisebb nyelvek, mint a magyar, alulreprezentáltak. A projekt nemcsak a magyar kulturális örökség feldolgozását forradalmasítja, hanem nemzetközi szinten is példát mutathat az MI technológiák alkalmazásában – mondta el Palkó Gábor projektvezető a díjátadón.

A DH-LAB fejlesztését a 2024. november 21-23. között megrendezett World Science Forumon is bemutatják a Szépművészeti Múzeumban.

Forrás: ELTE