Průlom ve zpracování velkých dat. Hledat chemické látky ve složitých směsích je mnohem jednodušší
- Foto: ÚOCHB/Tomáš Belloň: Tomáš Pluskal (vlevo) a Robin Schmid (oba z ÚOCHB)
- Video: IOCB Prague: Průlom ve zpracování velkých dat. Hledat chemické látky ve složitých směsích je mnohem jednodušší
Mezinárodní tým vědců vedený Tomášem Pluskalem z Ústavu organické chemie a biochemie AV ČR (ÚOCHB) představil novou generaci softwaru umožňujícího vědcům analyzovat rozsáhlá kvanta dat získaná při zkoumání složení látek. Článek o nové verzi softwaru MZmine 3 vyšel nyní v jednom z nejcitovanějších světových vědeckých časopisů Nature Biotechnology.
Výzvy biochemické analýzy
Analytičtí chemici všech zemí, spojte se! Tak by bylo možné charakterizovat kolektivní snahu vědců z celého světa, kteří se pomocí metod hmotnostní spektrometrie snaží rozluštit a analyzovat chemické složení různých, zejména biologických vzorků. Jednotlivé vzorky mohou obsahovat statisíce různých chemických sloučenin, které vědci potřebují identifikovat a kvantifikovat, aby porozuměli jejich dopadu na lidské zdraví či jejich ekologické úloze.
ÚOCHB/Robin Schmid: Počet spuštní modulů MZmine v letech 2017–2022
Výsledkem jsou i v případě poměrně malých vzorků gigabajty „surových“ dat. Právě zpracování, analyzování a porovnání různých dat o měřených molekulách představuje přitom jeden z nejnáročnějších úkonů v biochemických analýzách současnosti. Odstranění téhle překážky by vědcům umožnilo dramaticky rozšířit potenciál pro nové objevy a taky rychleji posunovat hranice poznání.
Komunitní vývoj
Proto již od roku 2005 vědci vyvíjejí otevřený software MZmine, který jim s analýzou dat z hmotnostní spektrometrie pomáhá. Tuto komunitu pomohl založit také český vědec Tomáš Pluskal, který projekt koordinuje téměř od jeho počátku a dnes vede vlastní výzkumnou skupinu v ÚOCHB.
„Největší síla projektu MZmine je v mezinárodní komunitě expertů, která se kolem projektu vytvořila. Na vědeckých konferencích mají prezentace o MZmine vždy ohromný ohlas,“ říká o projektu Tomáš Pluskal z ÚOCHB.
Jeden z prvních autorů práce Robin Schmid z ÚOCHB a Kalifornské univerzity v San Diegu (USA) k tomu dodává: „Je skvělé, když se poprvé setkáme se zahraničními výzkumníky a oni nám řeknou, že MZmine a naše podpora zachránila jejich dizertaci či projekt. To je to nejlepší ocenění, v jaké můžete doufat.“
ÚOCHB/Tomáš Belloň: Tomáš Pluskal (vlevo) a Robin Schmid (oba z ÚOCHB)
První verze MZmine umožnila vědcům do té doby nevídanou automatizaci zpracování datových souborů generovaných analytickými přístroji. V roce 2010 následovala druhá generace softwaru, která projekt dostala do širšího povědomí a vedla k vytvoření celosvětové komunity vědců, kteří software využívají a nadále rozšiřují o další moduly a aplikace. Publikace informující o druhé generaci MZmine nasbírala od té doby přes 2 200 citací ve vědeckých článcích a samotný nástroj byl využit ke zpracování milionů různých měření.
Třetí generace
Nejnovější MZmine 3 přináší několik zásadních zlepšení. Tam, kde předchozí verze umožňovala vědcům analyzovat stovky vzorků v řádu několika dní, umožňuje nová generace zpracovat tisíce vzorků za hodinu. Kromě významného urychlení zpracování dat umožňuje nová verze softwaru také propojení různých typů dat, například kombinaci dat z analytických a zobrazovacích metod, což dosud nebylo možné v žádném akademickém ani komerčním softwaru.
ÚOCHB/Nature Biotechnology: MZmine, open-source komunitní projekt pro integrativní zpracování dat LC–IMS–MS a IMS–MS
Vědcům se tak otevírají možnosti pro snazší analýzu a interpretaci komplexních biologických vzorků, zkoumání příčin a mechanismů různých nemocí, detekování klinických biomarkerů pro diagnostiku, anebo identifikaci chemických látek v životním prostředí, včetně dosud nepopsaných chemických struktur využitelných např. pro vývoj nových léčiv.
Na třetí generaci softwaru se kromě Tomáše Pluskala jako hlavního autora právě publikovaného článku podíleli také první autoři článku, už citovaný Robin Schmid, Steffen Heuckeroth a Ansgar Korf z Univerzity v Münsteru a několik desítek dalších vědců z celého světa.
„MZmine se za posledních deset let etabloval jako důvěryhodný nástroj pro výzkumníky v oblasti hmotnostní spektrometrie. Jeho modulární rámec vytvořil prostor pro zapojení celé komunity do vývoje kódu, což vedlo k významným pokrokům v nově vydaném MZmine 3,“ říká Ansgar Korf.
Vývoj projektu MZmine podpořila Grantová agentura ČR (č. 21-11563M).
- Literatura k využití software MZmine v knihovně LabRulezLCMS
- Literatura k využití software MZmine v knihovně LabRulezGCMS
Ústav organické chemie a biochemie AV ČR / ÚOCHB je přední mezinárodně uznávaná vědecká instituce, jejímž hlavním posláním je základní výzkum v oblasti chemické biologie a medicinální chemie, organické a materiálové chemie, chemie přírodních látek, biochemie a molekulární biologie, fyzikální chemie, teoretické chemie a analytické chemie. Nedílnou součástí poslání ÚOCHB je přenos výsledků základního výzkumu do praxe. Důraz na mezioborové zaměření výzkumu ústí do řady aplikací v medicíně, farmacii a dalších odvětvích.