Výsledky soutěže o nejlepší práci mladých autorů v oboru spektroskopie 2025 - 2. místo v Kategorii A

Filip Jozefov: Obr. 1. (a) Úspěšnost modelu napříč stupni fragmentace. (b) Rozložení monoisotopických hmot napříč spektrálními knihovnami. (c) Začlenění vyvinutých nástrojů do výzkumného procesu.
Soutěž o nejlepší práci mladých autorů v oboru spektroskopie byla i letos nedílnou součástí lednového zasedání Hlavního výboru Spektroskopické společnosti. Letošní ročník hostila tradičně Univerzita Pardubice a do soutěže bylo přihlášeno dvacet soutěžících, z toho sedm v kategorii A a třináct v kategorii B. Počet přihlášených prací tak znovu potvrdil, že tato soutěž zůstává pro mladé autory atraktivní a stabilně vyhledávanou příležitostí k odborné prezentaci.
Nad průběhem soutěže dohlížela čestná předsedkyně doc. Ing. Anna Krejčová, Ph.D. Samotný program pak dobře ukázal šíři současného spektroskopického výzkumu, přičemž jednotlivé směry a metody byly zastoupeny poměrně vyrovnaně. Soutěžní blok navíc nepředstavoval pouze přehled jednotlivých výsledků, ale poskytl i přehled o rozmanitosti metodických přístupů a aplikací současné spektroskopie.
V kategorii A, zaměřené na diplomové práce, porota udělila první místo Ing. Janě Knytlové z Vysoké školy chemicko-technologické v Praze za práci na téma „Ambientní hmotnostní spektrometrie pro analýzu selektivních modulátorů androgenního receptoru“. Druhé místo získal Filip Jozefov z Ústavu organické chemie a biochemie AV ČR za práci „Predikce molekul z vícestupňové hmotnostní spektrometrie pomocí grafových neuronových sítí a AI modelu DreaMS“ a třetí místo pak Mgr. Lucie Březinová z Ústavu analytické chemie AV ČR za práci „Začlenění stříbrných nanostruktur do kapilárního prostředí pro detekci povrchem zesílenou Ramanovu spektrometrii“.
V kategorii B publikovaných prací obsadil první místo Dr. rer. nat. Marius Constantin Chirita Mihaila z Matematicko-fyzikální fakulty Univerzity Karlovy v Praze za práci „Light-based Aberration Correction in Electron Optics for Advanced Spectroscopic Applications“. Na druhém místě se umístila Mgr. Markéta Bosáková, Ph.D. z Ústavu chemie Masarykovy univerzity za práci „Acoustic spectroscopy of laser-induced plasma“ a třetí místo obsadil Mgr. et Mgr. Vít Pavelka, Ph.D. z Ústavu analytické chemie AV ČR za práci „Povrchem zesílená Ramanova spektroskopie snadno a spolehlivě“.
Soutěž opět potvrdila svou roli důležité platformy pro prezentaci kvalitních prací mladých autorů a pro odbornou diskusi napříč spektroskopickými obory. Poděkování patří všem soutěžícím za předložené práce, hodnotitelům za pečlivé posouzení příspěvků a oceněným autorům náleží blahopřání k dosaženým výsledkům.
Kategorie A - 2. místo
Predikce molekul z vícestupňové hmotnostní spektrometrie pomocí grafových neuronových sítí a AI modelu DreaMS
- Mgr. Filip Jozefov (Ústav organické chemie a biochemie AV ČR, Skupina Tomáše Pluskala)
- E-mail: [email protected]
Metabolomika je vědní disciplína zaměřená na identifikaci a kvantifikaci malých molekul, které řídí biologické systémy. Přesto zůstává značná část těchto molekul dosud neznámá. Hlavní technologií pro strukturální identifikaci metabolitů ve velkém měřítku je tandemová hmotnostní spektrometrie (MS2). Interpretace jejích spekter je však často nejednoznačná a neúplná, a proto většina dat zůstává bez anotace, tzv. dark metabolome tak zůstává z velké části neprozkoumaný. I když strojové učení v posledních letech významně pokročilo, současné modely obvykle pracují pouze s jedním stupněm fragmentace (MS2), což omezuje jejich schopnost zachytit detailnější informace o molekulární struktuře.
V této práci navrhujeme nový směr: využití vícestupňových fragmentačních dat (multi-stage MSn), při nichž dochází k postupnému štěpení již fragmentovaných molekul. Tento přístup umožňuje získat detailnější pohled na molekulární strukturu a tím zpřesnit anotaci. Na rozdíl od konvenční hmotnostní spektrometrie, která molekulu fragmentuje pouze jednou (MS2), metoda MSn fragmentuje produkty předchozích štěpení, čímž vytváří hierarchický fragmentační strom namísto jednoho spektra. Klíčové je, že MSn je plně kompatibilní se stávajícími MS2 pracovními postupy, rozšiřuje je, nikoli nahrazuje. V minulosti se MSn data využívala jen výjimečně kvůli složitosti akvizice a veřejné knihovny hmotnostních spekter prakticky neobsahovaly data nad rámec MS2 (Brungs C. et al., Nat. Methods 2025).
Za účelem prozkoumání tohoto přístupu jsme vyvinuli první neuronové modely trénované přímo na MSn spektrech. Tyto modely kombinují pokročilé grafové neuronové sítě a velký AI model pro hmotnostní spektrometrii DreaMS (Bushuiev R. et al., Nat. Biotechnol. 2025). Modely jsme otestovali ve dvou klíčových úlohách: (1) zpětné vyhledávání molekulární struktury z množiny kandidátů a (2) de novo generování struktur.
Naše výsledky ukazují, že vícestupňová fragmentace zvyšuje přesnost vyhledávání až desetkrát oproti konvenčním MS2 metodám. Navíc hlubší úrovně MSn poskytují výrazně bohatší a informativnější reprezentace hmotnostních spekter, což potvrzuje analýza pomocí centered kernel alignment (Kornblith S. et al., ICML 2019).
Pro podporu dalšího výzkumu a srovnatelnosti metod jsme vytvořili MassSpecGymMSn, první otevřený benchmark pro molekulární anotaci založenou na MSn datech. Tento benchmark poskytuje jednotný rámec pro férové a reprodukovatelné porovnávání různých přístupů a zahrnuje 16 476 fragmentačních stromů (až do úrovně MS5) a více než dva miliony anotovaných hmotnostních spekter, včetně nástrojů pro předzpracování.
Tato práce již byla prezentována na několika mezinárodních konferencích, včetně ICMB/ECCB 2025 (Liverpool, UK), kde získala cestovní grant, a konference Metabolomics Society 2025 (Praha). Autor rovněž přednesl přednášku na EPFL Summer School (Lausanne, Švýcarsko).
Projekt byl dále podpořen grantem MISTI, který umožnil pokračování spolupráce v laboratoři Dr. Connora Coleyho na MIT. Získal rovněž doktorandské stipendium a fellowship od společnosti Enveda Therapeutics (Boulder, USA).
V současnosti rozšiřujeme naši datovou sadu více než pětinásobně a aplikujeme vyvinuté modely na reálné případové studie. Tyto aktivity představují klíčový krok v našem úsilí, které ve spolupráci s mezinárodními partnery směřuje k rozšíření dosahu a dopadu výzkumu. Naše práce tak posouvá hranice moderní metabolomiky založené na datech a umělé inteligenci a má potenciál urychlit vývoj léčiv, objasnit biosyntetické dráhy a podpořit pokrok v diagnostice.
Filip Jozefov: Obr. 1. (a) Úspěšnost modelu napříč stupni fragmentace. Graf ukazuje, jak se přesnost modelu zlepšuje při trénování na hlubších fragmentačních stromech. Nejlepších výsledků je dosaženo při použití AI modelu DreaMS pro reprezentaci hmotnostních spekter a dat až do úrovně MS4, kdy top-20 hit rate dosahuje 45 %, což představuje přibližně čtyřnásobné zlepšení oproti modelu trénovanému pouze na MS2. (b) Rozložení monoisotopických hmot napříč spektrálními knihovnami. Žlutá část histogramu představuje veřejně dostupné molekuly, tmavě modrá část molekuly přidané v rámci této práce a světle modrá oblast molekuly aktuálně měřené. Červený obrys zvýrazňuje sloučeniny naměřené ve skupině Tomáše Pluskala na ÚOCHB. (c) Začlenění vyvinutých nástrojů do výzkumného procesu. Schéma ukazuje, jak nástroje vyvinuté v rámci této práce přispívají k vědeckým objevům. AI model PhantoMS zpracovává MSn data a predikuje nejpravděpodobnější molekulární struktury, které lze následně experimentálně ověřit při identifikaci bioaktivních sloučenin.




