Muzgo

Gondolkodj, nagyban!

A museumgeek-en jelent meg egy kisebb fejtegetés Suse Cairns tollából a múzeumok és a Big Data néven futó, egyre népszerűbb kutatási trend összekapcsolódásáról. Mivel a téma még nem szerepelt a blogon, úgy gondoltam megér egy-két kört, hogy alaposabban is körbejárjuk.

A Big Data, mint nevében is benne van, hatalmas adathalmazokat jelent. Ki ne emlékezne még Bill Gates mára már viccesnek tűnő kijelentésére, hogy 64 kilobájtnak elégnek kell lenni minden felhasználónak? Egyike a számítástechnika azon jóslatainak, ami nem jött be. Olyannyira nem, hogy manapság olyan mértékű adatmennyiség áll rendelkezésünkre, amit már nem mega- és gigabájtokban, hanem exo- és zetabájtokban mérünk. Szinte elképzelni is lehetetlen ezeket a mennyiségeket, ami a nap minden percében, sőt másodpercében növekszik. A mellékelt infographic nagyon jól érzékelteti, hogy csupán az internet milyen mértékben nő egyetlen egy perc alatt. De nem csupán az internetnek köszönhetjük az ugrásszerű növekedést. Az ipari kamerák, környezeti szenzorok, RFID, metaadatok, de szinte minden elektronikai eszköz előállít és tárol valamilyen információt.

Látszik, hogy a Big Data legszembetűnőbb problémája a hatalmas mérete, de ebből kifolyólag nem egyszerű az adatokkal dolgozni sem. Tehát nem elég csak az adatokat összegyűjteni és tárolni, de meg kell teremteni azokat az erőforrásokat is, amik lehetővé teszik, hogy számításokat tudjunk végezni egy ilyen nagyra duzzadt rendszerben.

Itt is minden azon múlik, mennyire jó kérdést teszünk fel.

Mire is jók ez? Nagyságukból fakad a legnagyobb előnyük is: az adatok kvantitatív, statisztikai vizsgálata. Olyan ismereteket lehet szerezni, amit kisebb mintán nem lehetne kimutatni. A legtöbb tudományterületre a Big Data már betört: genetika, fizika, kémia, gazdaság, szociolgóia, meteorológia stb. Nem nehéz elképzelni, hogy egy légköri jelenség szimulálásához rengeteg adatot kell begyűjteni. A multinacionális nagyvállalatok egyik kedvelt piackutatási témáját képezik a fogyasztói trendek alakulásának elemzése, ami szintén az adatok robosztussága miatt működik.

Hogy lássuk, konkrétan minden tudományterületet érint, hadd vesztegessek pár szót a tudománymetriára. Igen, citációs jegyzékek, H-indexek stb. A tudománymetria egy furcsa állatfaj, ami egy objektív mérőszámot adna egy kutató tudományos tevékenységéről az alapján, hogy hányszor hivatkoztak a műveire. Egyszóval egy "kinek nagyobb a" típusú játékot lehet játszani. Épp azért jó példa a tudománymetria, mert egyértelműen törekedni kell az adatok robosztusságára azért, hogy a kapott eredmények reprezentatívak legyenek. Persze ezernyi buktatója van ennek a rendszernek azon kívül is, ha nem áll rendelkezésre a megfelelő adatmennyiség.

Facebook szakításokKicsit könnyedebb vizekre evezve. Köszönhetően a közösségi hálózatoknak, a 2000-es évek eleje óta felhalmozódó adat megreformálta a szociális háló vizsgálatát is. Kezdetben vala az IWIW, aztán jött a Facebook, látott és győzött. Ma már több, mint 600 millió regisztrált felhasználónál tart. Az emberek önként és dalolva osztanak meg személyes információkat és ezekből, egy jó kérdés-feltevés és egy kis programozói tudás segítségével szép grafikonokat kaphatunk. Például David McCandless arra a kérdésre kereste a választ, hogy mikor szakítanak az emberek a párjukkal? Szépen kirajzolódnak a csúcsok, nem?

Visszatérve a linkelt cikk témájához, a múzeumokban is hatalmas mennyiségű adat halmozódott fel. Persze ha múzeumokról beszélünk, akkor elsősorban műtárgyakra gondolunk, mert ez a fő profilja az intézményeknek. Ha belegondolunk, akkor egy-egy tárgyról rengeteg metaadat is lapul a múzeumok mélyén. Információt rejtenek a leltárkönyvek, az adattári jelentések vagy a leírókartonok. A gyűjtőkörből fakadóan is rendelkezhetnek adatbázissal, például a holocaust múzeumok gyűjtik a népírtás áldozatainak adatait. Természetesen ahhoz, hogy ezek az adatok kvantitatívan is vizsgálhatóak legyenek, vagy részei lehessenek egy nagy mintán alapuló kutatásnak, elengedhetetlen, hogy elektronikusan is tárolják azokat. Az intézmények különböző módon állnak hozzá a digitalizációhoz, így annak mértéke is változó. Nézzük meg, hogyan látja a cikk szerzője a Big Data és a múzeumok kérdéskörét.

Ahogy haladunk előre ebben az új érában, ahol az adatok egyre sokrétűbben kapcsolódnak egymáshoz, valamint könnyebben válnak kutathatóvá és összegyűjthetővé, mint eddig bármikor. Egy ilyen helyezetben az adatok haszna a tudásteremtésben felértékelődött, így a múzeumoknak foglalkozni kell ezzel a kérdéssel. Gondolnunk kell az adataink minőségére és arra, hogy a felhasználók hogyan férhetnek hozzá és hogyan használhatják. Fel kell tenni a kérdést, hogy milyen adatokkal kell rendelkeznünk és kinek kell ezeket menedzselnie és rendszereznie. Ha ezek az adatok potenciálisan ugyanolyan értékesek (értékesebbek?) lehetnek a társadalom számára, mint a tárgyaink, akkor bizony ezzel a kérdéssel is ugyanolyan szinten foglalkozni kell.

Természetesen a Big Data nem a Szent Grál, kritikák is megfogalmazódtak a hasznosságát illetően. Nem szorítja háttérbe a források klasszikus mélyreható vizsgálatát. Mint minden jó kutatás itt is minden azon múlik, hogy mennyire jó kérdést teszünk fel. Jelen esetben mi a legnyilvánvalóbb kérdés? Kell-e a múzeumoknak foglalkozni ezzel? Mit gondoltok?

Világhy Gergely

-->
Vissza a lap tetejére