Novor.ai – Increased precision and accuracy utilizing an AI model for de novo sequencing
Postery | 2025 | Bruker | ASMSInstrumentace
De novo sekvenování peptidů umožňuje získat primární aminokyselinové sekvence bez použití databází, což je zásadní pro obory jako imunopeptidomika, metaproteomika nebo výzkum nekonvenčních proteinů. Tradiční databázové vyhledávání selhává tam, kde chybí homologní záznamy nebo je neznámá proteolytická specifita. Rychlé a přesné de novo řešení šetří čas a rozšiřuje dosah analýz v biologii a medicíně.
Studie hodnotila výkon nového AI modelu Novor.ai pro de novo sekvenování na datech MHC I a II. Cílem bylo porovnat přesnost a preciznost Novor.ai s algoritmem BPS Novor optimalizovaným pro přístroje timsTOF. Testovací data pocházela z publikovaných MHC datasetů, jež nebyly dříve součástí tréninku.
Novor.ai nahrazuje původní rozhodovací strom váhovací funkcí založenou na AI, zatímco vlastní de novo sekvence generuje pomocí dynamického programování tak, aby byla splněna tolerance chyb hmotnostního předskupení. Model byl natrénován na 7,3 milionu MS/MS spekter z různých zdrojů s vysokým zastoupením MHC peptidů a zároveň s dostatkem ne-MHC dat pro udržení obecnosti. Testovací dataset obsahoval replikáty MHC třídy I a II s peptid-spektrálními páry odsouhlasenými v 1 % FDR.
Novor.ai dosáhl průměrného nárůstu správně identifikovaných aminokyselin o 19 % u MHC I a 26 % u MHC II oproti BPS Novor. Na úrovni celých peptidů se zvýšení pohybovalo kolem 16 % u MHC I. Přesnost a recall v preciznost-recall grafech potvrdily výrazný posun směrem k ideálním hodnotám. Novor.ai je sice pomalejší než BPS Novor, avšak další optimalizace parametrů a architektury slibují zkrácení doby výpočtu.
Novor.ai rozšiřuje možnosti de novo sekvenování v oblastech bez adekvátních databází, zejména v imunopeptidomice a metaproteomice. Zvýšená přesnost usnadní objev nových biomarkerů, monitorování imunitních odpovědí a charakterizaci proteomických variant. Díky generalizaci na ne-MHC peptidy má potenciál ve farmaceutickém výzkumu i potravinářské analýze.
Další kroky zahrnují srovnání Novor.ai s jinými AI modely pro de novo sekvenování, optimalizaci rychlosti výpočtu a rozšíření na data z různých typů spektrometrů. Integrace hlubších neuronových sítí a transfer learningu může dále zlepšit adaptabilitu na nová experimentální nastavení. Očekává se, že pokrok v AI přinese komplexní řešení pro proteomické aplikace v klinické diagnostice i průmyslové analýze.
Novor.ai představuje významný posun v de novo sekvenování peptidů, nabízející vyšší přesnost identifikace než stávající algoritmy optimalizované pro timsTOF. Model prokázal robustní výkon na MHC I a II datech a otevírá nové možnosti v oblastech bez spolehlivých databází. Další vylepšení slibují širší uplatnění a rychlejší analýzy.
Software
ZaměřeníProteomika
VýrobceBruker
Souhrn
Význam tématu
De novo sekvenování peptidů umožňuje získat primární aminokyselinové sekvence bez použití databází, což je zásadní pro obory jako imunopeptidomika, metaproteomika nebo výzkum nekonvenčních proteinů. Tradiční databázové vyhledávání selhává tam, kde chybí homologní záznamy nebo je neznámá proteolytická specifita. Rychlé a přesné de novo řešení šetří čas a rozšiřuje dosah analýz v biologii a medicíně.
Cíle a přehled studie
Studie hodnotila výkon nového AI modelu Novor.ai pro de novo sekvenování na datech MHC I a II. Cílem bylo porovnat přesnost a preciznost Novor.ai s algoritmem BPS Novor optimalizovaným pro přístroje timsTOF. Testovací data pocházela z publikovaných MHC datasetů, jež nebyly dříve součástí tréninku.
Použitá instrumentace
- timsTOF hmotnostní spektrometr značky Bruker
- Software ProteoScape s workflow TIMS2rescore
- Spektrální knihovny NIST, MassIVE-KB, SysteMHC Atlas a vlastní MHC knihovna
Metodika
Novor.ai nahrazuje původní rozhodovací strom váhovací funkcí založenou na AI, zatímco vlastní de novo sekvence generuje pomocí dynamického programování tak, aby byla splněna tolerance chyb hmotnostního předskupení. Model byl natrénován na 7,3 milionu MS/MS spekter z různých zdrojů s vysokým zastoupením MHC peptidů a zároveň s dostatkem ne-MHC dat pro udržení obecnosti. Testovací dataset obsahoval replikáty MHC třídy I a II s peptid-spektrálními páry odsouhlasenými v 1 % FDR.
Hlavní výsledky a diskuse
Novor.ai dosáhl průměrného nárůstu správně identifikovaných aminokyselin o 19 % u MHC I a 26 % u MHC II oproti BPS Novor. Na úrovni celých peptidů se zvýšení pohybovalo kolem 16 % u MHC I. Přesnost a recall v preciznost-recall grafech potvrdily výrazný posun směrem k ideálním hodnotám. Novor.ai je sice pomalejší než BPS Novor, avšak další optimalizace parametrů a architektury slibují zkrácení doby výpočtu.
Přínosy a praktické využití metody
Novor.ai rozšiřuje možnosti de novo sekvenování v oblastech bez adekvátních databází, zejména v imunopeptidomice a metaproteomice. Zvýšená přesnost usnadní objev nových biomarkerů, monitorování imunitních odpovědí a charakterizaci proteomických variant. Díky generalizaci na ne-MHC peptidy má potenciál ve farmaceutickém výzkumu i potravinářské analýze.
Budoucí trendy a možnosti využití
Další kroky zahrnují srovnání Novor.ai s jinými AI modely pro de novo sekvenování, optimalizaci rychlosti výpočtu a rozšíření na data z různých typů spektrometrů. Integrace hlubších neuronových sítí a transfer learningu může dále zlepšit adaptabilitu na nová experimentální nastavení. Očekává se, že pokrok v AI přinese komplexní řešení pro proteomické aplikace v klinické diagnostice i průmyslové analýze.
Závěr
Novor.ai představuje významný posun v de novo sekvenování peptidů, nabízející vyšší přesnost identifikace než stávající algoritmy optimalizované pro timsTOF. Model prokázal robustní výkon na MHC I a II datech a otevírá nové možnosti v oblastech bez spolehlivých databází. Další vylepšení slibují širší uplatnění a rychlejší analýzy.
Reference
- Hoenisch Gravel N et al. TOFIMS mass spectrometry-based immunopeptidomics refines tumor antigen identification. Nat Commun 14, 7472 (2023)
Obsah byl automaticky vytvořen z originálního PDF dokumentu pomocí AI a může obsahovat nepřesnosti.
Podobná PDF
A CCS-centric HLA-specific trained de novo module for precise and accurate real-time immunopeptide identification on the Bruker ProteoScape platform
2024|Bruker|Postery
US HUPO 2024, ABSTRACT 651 A CCS-centric HLA-specific trained de novo module for precise and accurate real-time immunopeptide identification on the Bruker ProteoScape platform Rui Zhang1; Qixin Liu1; Mingjie Xie1; Dennis Trede2; Tharan Srikumar3; Jonathan Krieger3; Bin Ma1; George Rosenberger4…
Klíčová slova
novor, novormhc, mhcbps, bpsrecall, recallcorrect, correctproteoscape, proteoscapenovo, novotimstof, timstofmodel, modelimmunopeptidomics, immunopeptidomicsscoring, scoringpeptide, peptidesequencing, sequencingprecision, precisionbruker
Precise and accurate real-time de novo sequencing of timsTOF data with the Novor algorithm on the Bruker ProteoScape™ platform
2023|Bruker|Postery
ASMS 2023 Precise and accurate real-time de novo sequencing of timsTOF data with the Novor algorithm on the Bruker ProteoScape™ platform The results suggest even greater performance improvements of BPS Novor for challenging immunopeptidomic applications, where typically a lower fraction…
Klíčová slova
novor, novorbps, bpsnovo, novosequencing, sequencingprolucid, prolucidreal, realrecall, recalltraining, trainingtimstof, timstofdataset, datasetpeptide, peptidecorrect, correctpre, pregpu, gpuproteoscape
Real-time de novo sequencing of peptide antigens using Bruker ProteoScape™ for 'Run & Done' 4D-immunopeptidomics
2023|Bruker|Postery
ASMS 2023 - THP 378 Real-time de novo sequencing of peptide antigens using Bruker ProteoScape™ for 'Run & Done' 4D-immunopeptidomics A 5000 4500 4000 3500 3000 2500 2000 1500 1000 500 0 1Monash University, Clayton, Australia, 2Rapid Novor Inc., Kitchener,…
Klíčová slova
novor, novorbps, bpsproteoscape, proteoscapenovo, novochymo, chymoelastase, elastasehye, hyealgorithm, algorithmgluc, glucimmunopeptidomics, immunopeptidomicsbruker, brukerpepsin, pepsincorrect, correctreal, realrecall
TIMSrescore: timsTOF-optimized PSM rescoring boosts identification rates for immunopeptidomics
2024|Bruker|Postery
US HUPO 2024, ABSTRACT 641 TIMSrescore: timsTOF-optimized PSM rescoring boosts identification rates for immunopeptidomics Dennis Trede1, Arthur Declercqi2, Ralf Gabriels2, Robbin Bouwmeester2, Jonathan Krieger3, Tharan Srikumar3, Sven Degroeve2 and Lennart Martens2 1Bruker Daltonik GmbH, Fahrenheitstraße 4, 28359 Bremen, Germany 2VIB-UGent…
Klíčová slova
timsrescore, timsrescoremhc, mhcengine, enginetimstof, timstofelastase, elastaserescoring, rescoringsearch, searchpsms, psmsrcc, rccramp, rampimmunopeptidomics, immunopeptidomicspeptides, peptidespeptide, peptidereprocessing, reprocessingtims