Otevřená věda a automatizace: Marek Cebecauer mění přístup ke správě výzkumných dat

- Foto: Universitas (archiv): Otevřená věda a automatizace: Marek Cebecauer mění přístup ke správě výzkumných dat
- Video: EOSC Czech Republic: Záznam EOSC CZ konference 2024
Marek Cebecauer je biochemik a průkopník v oblasti zobrazovacích technik, který se věnuje nejen imunologickému výzkumu, ale také správě vědeckých dat. V rozhovoru přibližuje, jak ho náhodná setkání s předními odborníky přivedla k mikroskopii a jaké výzvy přináší práce se složitými daty. Sdílí, jak otevřená věda a automatizace mohou zjednodušit a zpřehlednit správu dat. A vysvětluje, proč je otevřená věda klíčová pro budoucnost výzkumu.
Můžete přiblížit svůj výzkum, čemu se věnujete a proč děláte vědu?
Mám tu výhodu, že i můj otec je vědec. Dovedl mě do laboratoře už jako dítě, mně se to líbilo, a tak jsem u toho zůstal. Už je to čtyřicet let. Vystudoval jsem biochemii, kterou ve svém výzkumu aplikuji na imunologické otázky. Okolo roku 2000 jsem se přesunul do oblasti zobrazovacích technik a mikroskopie, protože do té doby jsem převážně využíval biochemické nástroje.
Měl jsem štěstí, když jsem v Londýně narazil na lidi, kteří se podíleli na vývoji nejnovějších technologií mikroskopie, a získal jsem možnost využívat tyto technologie dávno předtím, než byly komerčně dostupné. Tím jsem se dostal do Ústavu fyzikální chemie J. Heyrovského AV ČR, kde dlouhodobě působí skupina Martina Hofa, která se zabývá fluorescencí. Jedná se o jev, který se v biologické mikroskopii využívá, a přišlo mi vhodné být v blízkosti někoho, kdo tomuto jevu rozumí a umí složité zobrazovací techniky správně využívat. To je obrovská výhoda, kterou v Ústavu Heyrovského mám, i když je samozřejmě složitější věnovat se biologii v chemickém kampusu. Momentálně ale úzce spolupracujeme s nemocnicí v Motole v rámci klinické mikrobiologie a ukazuje se, že není tak těžké dělat biologicky orientovanou vědu v chemických nebo fyzikálních ústavech.
Jak jste se dostal k otázkám správy výzkumných dat?
K práci s daty mě přivedlo to, že jsem začal používat zobrazovací techniky, které produkují nejen velké objemy dat, což většina lidí ví, ale především data velmi složitá.
Můžete blíže vysvětlit pojem složitá data?
Jeden obrázek, který vidíte v publikaci, vznikl poskládáním například deseti tisíc snímků. Tyto snímky byly pořízeny v různých časech a na různých místech, přičemž prostor v biologickém zobrazování je skutečně mnohorozměrný, rozhodně větší než 4D.
Správa dat tedy byla nutnost?
V naší skupině byl v datech takový nepořádek, že jsme se jejich správě museli začít věnovat, protože už by se v tom nikdo nevyznal. Zjistil jsem, že nejsme jediní, ale nebyl nikdo, kdo by mi s tím pomohl, takže jsem si musel pomoci sám. Postupně jsem zjistil, že se v kontextu otevřené vědy stávám expertem.
Jak dlouho jste expertem na otevřenou vědu?
Seriózně jsem se tomu začal věnovat před třemi lety. Do té doby jsem se otázkám správy dat věnoval jen s ohledem na vlastní výzkum. My vědci jsme zvyklí se učit rychle. V oblasti EOSC a open science však stále vidím relativně málo vědců, což je pochopitelné, protože raději věnují čas svým experimentům. Pořád mám svou laboratoř a imunologický výzkum, jen k tomu přibylo několik dalších starostí.
Co jsou ty další starosti? Mít pořádek v datech zní jako něco, co si srovnám do šuplíku a vím, kde to mám, ale s daty je to asi složitější, že?
Ta analogie se šuplíkem vlastně docela sedí, jen musíme do šuplíku přidat pořadače. Problém je, že šuplíky musí být popsané a musí se do nich vkládat správné věci. Vědec není knihovník nebo archivář, který ví přesně, kde co je, protože jeho hlavním úkolem je být kreativní. To je i můj případ. Pořádek ve věcech není moje silná stránka, ale hledám nová řešení. Nejvíce se věnuji automatizaci.
EOSC a EOSC CZ
- European Open Science Cloud je iniciativa Evropské komise zaměřená na rozvoj infrastruktury poskytující svým uživatelům služby podporující postupy otevřené vědy.
- Iniciativa EOSC CZ je národním uzlem evropské iniciativy European Open Science Cloud (EOSC), která se zaměřuje na podporu efektivní správy a využívání výzkumných dat v evropském výzkumném prostoru.
- EOSC CZ usiluje o zajištění přístupu k výzkumným datům, která budou splňovat zásady FAIR (Findable, Accessible, Interoperable, Reusable), což znamená, že budou snadno vyhledatelná, přístupná, dobře popsaná a připravená k opětovnému využití.
- V rámci České republiky iniciativa vytváří Národní datovou infrastrukturu (NDI), která propojí existující datové repozitáře, nástroje pro správu a analýzu dat a zajistí dlouhodobou udržitelnost datových zdrojů.
- Cílem EOSC CZ je nejen podpořit multidisciplinární výzkum, ale také vytvořit technologické a procesní zázemí pro efektivní správu dat, což umožní vědcům a vědkyním pracovat s výzkumnými daty bez zbytečných bariér a přispěje k urychlení vědeckého pokroku.
Můžete své řešení automatizace blíže popsat?
Myslím tím automatizaci sběru dat i sběru informací o datech samotných. Nechci tvrdit, že všechno funguje dokonale, to je ještě daleko, ale většina lidí zažila, že musí neustále dokola vyplňovat svoje jméno, afiliaci, e-mailovou adresu a podobně, a to i v dokumentech EOSC asociace. Neustále vyplňujeme to samé, přičemž systém by dávno měl vědět, kdo jsme. To, čemu se věnuji, je zlepšit to tak, aby například systém rozpoznal pomocí telefonu, že jsem to já, a rovnou vyplnil moji afiliaci místo toho, aby mi nabízel celý seznam institucí v Česku.
Pomocí laboratorních deníků se to dá řešit ještě jednodušeji, protože mohu mít připravené „templates“ a struktury práce se všemi informacemi o daném experimentu. Často se experiment liší od předchozího jenom ve dvou nebo třech parametrech. Díky tomu, že jsem už nějaký protokol napsal, není problém vytvořit v elektronickém deníku kopii, kde jen změním drobnosti. Automatizační systémy rozpoznávají různé experimenty a každý má svůj vlastní identifikátor. To nás vrací zpět k archivářům, ale trik je v tom, že vědec nemusí vědět, že tyto procesy běží na pozadí, a nemusí sám přiřazovat identifikátory ke svým experimentům.
Jak se tyto možnosti správy dat dostanou k ostatním vědcům a vědkyním?
Jednak vedu jednu pracovní skupinu EOSC CZ. Sice jsem biochemik, ale vedu pracovní skupinu zaměřenou na materiálové vědy a technologie. Tato role vznikla díky tomu, že se na Heyrovského ústavu, kde je zaměření na materiály a technologie velmi silné, zabývám data management plány a celkově open science a správou vědeckých dat. Osobní setkávání, to je jedna cesta. Tyto informace se pak šíří především virálně.
Můžete to přiblížit?
Před dvěma lety jsme na Heyrovského ústavu zavedli povinné data management plány pro každý projekt, který u nás vzniká. Ukazuje se, že nám to pomáhá zvyšovat povědomí o potřebě kvalitního řízení dat. Náš model pro plány správy dat jsme vytvořili v kontrastu s tím, jak je používá EU, a to proto, že jsme se zaměřili výhradně na data. Nejzajímavější otázka, kterou v těchto plánech máme, se týká znovuvyužití dat, kde je odpověď v 99 procentech případů chybná. Lidé si neuvědomují, že i data z jejich deset let starého výzkumu mohou být stále relevantní, že žádný výzkum nevzniká na zelené louce a že i tato data by měla být k dispozici, pokud chceme dělat reprodukovatelnou vědu. Tato otázka v data management plánech na to upozorňuje a vychovává.
Ústav fyzikální chemie J. Heyrovského: Mgr. Cebecauer Marek Ph.D.
Mgr. Marek Cebecauer, Ph.D.
- Je biochemik a průkopník v oblasti zobrazovacích technik, který se věnuje nejen imunologickému výzkumu, ale také správě vědeckých dat.
- Vystudoval biochemii (UK Bratislava), diplomovou práci psal v oboru molekulární virologie.
- Má Ph.D. z imunologie (UK Praha).
- Deset let strávil v zahraničí (Švýcarsko, Velká Británie).
- Mimopracovní zájmy: hra na basovou kytaru, toulky v horách, práce se dřevem.
...
