Separating the Wheat from the Chaff: Prediction-Assisted Rescoring of Peptidic Fragment Ion Spectra
Postery | 2020 | Thermo Fisher Scientific | ASMSInstrumentace
Ve stávajících proteomických vyhledávacích postupech se experimentální a teoretické fragmentační spektra porovnávají především na základě shody m/z, zatímco intenzita iontů zůstává často bez využití. To vede k nižší spolehlivosti při rozlišení správných (target) a nesprávných (decoy) shod a nepotlačuje falešné identifikace. Zapojení predikce intenzit fragmentů zvyšuje robustnost identifikace peptidů a umožňuje přísnější kontrolu falešné míry detekcí (FDR).
Studie si klade za cíl demonstrovat přínos využití hlubokého učení k predikci intenzit fragmentačních iontů (Prosit) a následnému přepočtu skóre (rescoring) v platformě Thermo Scientific Proteome Discoverer 2.5. Testovány byly tři typy datových souborů:
Experimentální postup:
U každého typu vzorku vedlo rescoringové skórování k významnému nárůstu počtu identifikací při 1% FDR:
Dále bylo možné snížit nastavení FDR na 0,1 % při zachování podobného počtu peptidových identifikací. Predikce intenzit zlepšila oddělení cílových a decoy PSM skóre, což značně zvyšuje důvěryhodnost výsledků.
Zapojení intenzitních skóre:
Metoda bude dále rozšiřitelná:
Predikce intenzit fragmentačních iontů a následné rescoringové skórování významně zvyšují spolehlivost a rozsah proteomických identifikací. Umožňují striktnější kontrolu FDR i v náročných aplikacích, jako je imunopeptidomika či metaproteomika, a otevírají cestu k širšímu využití hlubokého učení v analytické chemii.
Software
ZaměřeníProteomika
VýrobceThermo Fisher Scientific
Souhrn
Význam tématu
Ve stávajících proteomických vyhledávacích postupech se experimentální a teoretické fragmentační spektra porovnávají především na základě shody m/z, zatímco intenzita iontů zůstává často bez využití. To vede k nižší spolehlivosti při rozlišení správných (target) a nesprávných (decoy) shod a nepotlačuje falešné identifikace. Zapojení predikce intenzit fragmentů zvyšuje robustnost identifikace peptidů a umožňuje přísnější kontrolu falešné míry detekcí (FDR).
Cíle a přehled studie
Studie si klade za cíl demonstrovat přínos využití hlubokého učení k predikci intenzit fragmentačních iontů (Prosit) a následnému přepočtu skóre (rescoring) v platformě Thermo Scientific Proteome Discoverer 2.5. Testovány byly tři typy datových souborů:
- Standardní tryptický HeLa digest
- Metaproteomické analýzy lidského střevního mikrobiomu
- Imunopeptidomické vzorky (HLA Class I)
Použitá metodika a instrumentace
Experimentální postup:
- Platforma: Proteome Discoverer 2.5 (beta) s vyhledávačem SequestHT
- Rescoring node: MSAID Prosit-derived intensity prediction
- Postprocessing: Percolator SVM pro odlišení cílových a kontrolních zápasů
- Databáze: SwissProt s izoformami (HeLa, HLA), Integrated Reference Catalogue (IGC) pro metaproteomiku
- Parametry: délka peptidů 7–30 aa, náboje 2–6, kolísání kolizní energie dle PSM
Hlavní výsledky a diskuse
U každého typu vzorku vedlo rescoringové skórování k významnému nárůstu počtu identifikací při 1% FDR:
- HeLa: +10 % PSM, +8 % peptidů, +4 % proteinů
- Metaproteomika: +13 % PSM, +11 % peptidů, +10 % proteinů
- Imunopeptidomika: +59 % PSM, +55 % peptidů, +34 % proteinů
Dále bylo možné snížit nastavení FDR na 0,1 % při zachování podobného počtu peptidových identifikací. Predikce intenzit zlepšila oddělení cílových a decoy PSM skóre, což značně zvyšuje důvěryhodnost výsledků.
Přínosy a praktické využití metody
Zapojení intenzitních skóre:
- Umožňuje aplikaci přísnějších FDR hranic a snižuje falešné pozitivní nálezy
- Zvyšuje počet identifikovaných peptidů a proteinů bez dalšího laboratorního měření
- Podporuje nové oblasti, např. imunopeptidomiku, kde je materiál omezený a falešné nálezy kritické
Budoucí trendy a možnosti využití
Metoda bude dále rozšiřitelná:
- Integrace s jinými vyhledávači a postprocessingovými nástroji
- Reálné časové skórování během datového akvizice
- Rozšíření predikce na modifikované peptidy a proteogenomiku
- Využití v multi-omických studiích a klinických aplikacích
Závěr
Predikce intenzit fragmentačních iontů a následné rescoringové skórování významně zvyšují spolehlivost a rozsah proteomických identifikací. Umožňují striktnější kontrolu FDR i v náročných aplikacích, jako je imunopeptidomika či metaproteomika, a otevírají cestu k širšímu využití hlubokého učení v analytické chemii.
Reference
- Gessulat S., Schmidt T., et al. Prosit: proteome-wide prediction of peptide tandem mass spectra by deep learning. Nat Methods. 2019;16(6):509–518.
- Käll L., Storey J. D., et al. Semi-supervised learning for peptide identification from shotgun proteomics datasets. Nat Methods. 2007;4:923–925.
- Chong C., Coukos G., Bassani-Sternberg M. Integrated proteogenomic deep sequencing and analytics accurately identify non-canonical peptides in tumor immunopeptidomes. Nat Commun. 2020;11(1):1293.
- Rechenberger J., Heyer R., Zolg D. P. Challenges in Clinical Metaproteomics Highlighted by the Analysis of Acute Leukemia Patients with Gut Colonization by Multidrug-Resistant Enterobacteriaceae. Proteomes. 2019;7(1).
- Li J., Jia H., et al. An integrated catalog of reference genes in the human gut microbiome. Nat Biotechnol. 2014;32:834–841.
Obsah byl automaticky vytvořen z originálního PDF dokumentu pomocí AI a může obsahovat nepřesnosti.
Podobná PDF
Thermo Scientific Proteome Discoverer software
2022|Thermo Fisher Scientific|Brožury a specifikace
The intelligent protein informatics platform Thermo Scientific Proteome Discoverer software Transform proteomics mass spectrometry data into insights Thermo Scientific™ Proteome Discoverer™ software enables comprehensive proteomics data processing workflows empowered by artificial intelligence. • Powerful and flexible framework: Optimized analysis for…
Klíčová slova
inferys, inferysrescoring, rescoringdiscoverer, discovererproteome, proteomepsms, psmschimerys, chimerysworkflows, workflowspeptides, peptideslfq, lfqsearch, searchpeptide, peptidetmt, tmtsequest, sequestproteomics, proteomicsconsensus
Proteome Discoverer 3.0 software with the CHIMERYS intelligent search algorithm
2022|Thermo Fisher Scientific|Ostatní
Mass spectrometry Proteome Discoverer 3.0 software with the CHIMERYS intelligent search algorithm comparison to previous strategies, CHIMERYS finds more PSMs Current generation proteomics data analysis tools are unable to per tandem mass spectrum and markedly improves the spectrometers. Tandem mass…
Klíčová slova
min, minchimerys, chimeryspsms, psmssequest, sequestrescoring, rescoringsearch, searchspectrum, spectrumintelligent, intelligenthla, hlasvm, svminferys, inferyspercolator, percolatorpeptides, peptideschimeric, chimericunique
CHIMERYS: An AI-Driven Leap Forward in Peptide Identification 
2021|Thermo Fisher Scientific|Postery
CHIMERYS: An AI-Driven Leap Forward in Peptide Identification Martin Frejno1; Daniel P Zolg1; Tobias Schmidt1; Siegfried Gessulat1; Michael Graber1; Florian Seefried1; Magnus Rathke-Kuhnert1; Samia Ben Fredj1; Shyamnath Premnadh1; Patroklos Samaras1, Kai Fritzemeier2; Frank Berg2; Waqas Nasir2; David Horn3; Bernard Delanghe2;…
Klíčová slova
chimerys, chimerysidentified, identifiedpsms, psmssequest, sequestfdr, fdrpeptides, peptidesentrapment, entrapmentchimeric, chimericsearch, searchprecdet, precdetspectra, spectraspectrum, spectrumproteins, proteinspercolator, percolatorhela
The Good, the Bad and the Ugly: when statistics tells you to throw away peptide IDs
2020|Thermo Fisher Scientific|Postery
The Good, the Bad and the Ugly: when statistics tells you to throw away peptide IDs. Siegfried Gessulat1, Tobias Schmidt2, Michael Graber1, Florian Seefried1, Dave Horn3, Christoph Henrich4, Bernard Delanghe4, Daniel Zolg2, Mathias Wilhelm2, Bernhard Kuster2, Martin Frejno1 1msAId GmbH,…
Klíčová slova
fasta, fastadecoys, decoysthreshold, thresholddecoy, decoydata, datareversing, reversingfdr, fdreasy, easybad, baddiscoverer, discovererdivided, dividedthousands, thousandsproteome, proteomeidentifications, identificationsscore