Nuus - Mikrobiese metaproteomika: van monsterverwerking, data-insameling tot data-analise

Wu Enhui, Qiao Liang*

Departement Chemie, Fudan Universiteit, Sjanghai 200433, China

Mikro-organismes is nou verwant aan menslike siektes en gesondheid. Hoe om die samestelling van mikrobiese gemeenskappe en hul funksies te verstaan, is 'n groot kwessie wat dringend bestudeer moet word. In onlangse jare het metaproteomika 'n belangrike tegniese middel geword om die samestelling en funksie van mikroörganismes te bestudeer. As gevolg van die kompleksiteit en hoë heterogeniteit van mikrobiese gemeenskapsmonsters, het monsterverwerking, massaspektrometrie data-verkryging en data-analise egter die drie groot uitdagings geword wat tans deur metaproteomika in die gesig gestaar word. In metaproteomika-analise is dit dikwels nodig om die voorbehandeling van verskillende tipes monsters te optimaliseer en verskillende mikrobiese skeidings-, verrykings-, ekstraksie- en lisisskemas aan te neem. Soortgelyk aan die proteoom van 'n enkele spesie, sluit die massaspektrometrie data-verkrygingsmodusse in metaproteomika data-afhanklike verkryging (DDA) modus en data-onafhanklike verkryging (DIA) modus in. Die DIA data-verkrygingsmodus kan die peptiedinligting van die monster heeltemal versamel en het groot ontwikkelingspotensiaal. As gevolg van die kompleksiteit van metaproteoommonsters, het die DIA-data-analise daarvan egter 'n groot probleem geword wat die diep dekking van metaproteomika belemmer. Wat data-analise betref, is die belangrikste stap die konstruksie van 'n proteïenvolgordedatabasis. Die grootte en volledigheid van die databasis het nie net 'n groot impak op die aantal identifikasies nie, maar beïnvloed ook die ontleding op die spesie- en funksionele vlakke. Tans is die goue standaard vir die konstruksie van 'n metaproteoom databasis 'n proteïen volgorde databasis gebaseer op die metagenoom. Terselfdertyd is bewys dat die publieke databasisfiltreermetode gebaseer op iteratiewe soektog sterk praktiese waarde het. Vanuit die perspektief van spesifieke data-ontledingstrategieë, het peptiedgesentreerde DIA-data-analisemetodes 'n absolute hoofstroom beklee. Met die ontwikkeling van diep leer en kunsmatige intelligensie sal dit die akkuraatheid, dekking en ontledingspoed van makroproteomiese data-analise grootliks bevorder. In terme van stroomaf bioinformatika-analise, is 'n reeks annotasie-instrumente in onlangse jare ontwikkel, wat spesie-annotasie op die proteïenvlak, peptiedvlak en geenvlak kan uitvoer om die samestelling van mikrobiese gemeenskappe te verkry. In vergelyking met ander omika-metodes, is die funksionele analise van mikrobiese gemeenskappe 'n unieke kenmerk van makroproteomika. Makroproteomika het 'n belangrike deel van multi-omika-analise van mikrobiese gemeenskappe geword, en het steeds groot ontwikkelingspotensiaal in terme van dekkingsdiepte, opsporingsensitiwiteit en data-analise volledigheid.

01Voorbehandeling

Tans word metaproteomika-tegnologie wyd gebruik in die navorsing van menslike mikrobiome, grond, voedsel, oseaan, aktiewe slyk en ander velde. In vergelyking met die proteoomanalise van 'n enkele spesie, staar die monstervoorbehandeling van metaproteoom van komplekse monsters meer uitdagings in die gesig. Die mikrobiese samestelling in werklike monsters is kompleks, die dinamiese omvang van oorvloed is groot, die selwandstruktuur van verskillende tipes mikroörganismes verskil baie, en die monsters bevat dikwels 'n groot hoeveelheid gasheerproteïene en ander onsuiwerhede. Daarom, in die ontleding van metaproteoom, is dit dikwels nodig om verskillende tipes monsters te optimaliseer en verskillende mikrobiese skeidings-, verrykings-, ekstraksie- en lisisskemas aan te neem.

Die onttrekking van mikrobiese metaproteome uit verskillende monsters het sekere ooreenkomste sowel as sommige verskille, maar tans is daar 'n gebrek aan 'n verenigde voorverwerkingsproses vir verskillende tipes metaproteoommonsters.

02 Massaspektrometrie data-verkryging

In haelgeweerproteoomanalise word die peptiedmengsel na voorbehandeling eers in die chromatografiese kolom geskei, en gaan dan die massaspektrometer binne vir data-verkryging na ionisasie. Soortgelyk aan enkelspesie-proteoomanalise, sluit die massaspektrometrie-data-verkrygingsmodusse in makroproteoomanalise DDA-modus en DIA-modus in.

Met die deurlopende iterasie en opdatering van massaspektrometrie-instrumente word massaspektrometrie-instrumente met hoër sensitiwiteit en resolusie op metaproteoom toegepas, en die dekkingsdiepte van metaproteoomanalise word ook voortdurend verbeter. Vir 'n lang tyd is 'n reeks hoë-resolusie-massaspektrometrie-instrumente onder leiding van Orbitrap wyd in metaproteoom gebruik.

Tabel 1 van die oorspronklike teks toon 'n paar verteenwoordigende studies oor metaproteomika vanaf 2011 tot op hede in terme van monstertipe, ontledingstrategie, massaspektrometrie-instrument, verkrygingsmetode, ontledingsagteware en aantal identifikasies.

03 Massaspektrometrie data-analise

3.1 DDA-data-ontledingstrategie

3.1.1 Databasissoektog

3.1.2de novovolgordebepalingstrategie

3.2 DIA data-analise strategie

04Spesiesklassifikasie en funksionele annotasie

Die samestelling van mikrobiese gemeenskappe op verskillende taksonomiese vlakke is een van die sleutelnavorsingsareas in mikrobioomnavorsing. In onlangse jare is 'n reeks annotasie-instrumente ontwikkel om spesies op die proteïenvlak, peptiedvlak en geenvlak te annoteer om die samestelling van mikrobiese gemeenskappe te verkry.

Die essensie van funksionele annotasie is om die teikenproteïenvolgorde met die funksionele proteïenvolgordedatabasis te vergelyk. Deur gebruik te maak van geenfunksiedatabasisse soos GO, COG, KEGG, eggNOG, ens., kan verskillende funksionele annotasie-ontledings uitgevoer word op proteïene wat deur makroproteome geïdentifiseer is. Aantekeninginstrumente sluit Blast2GO, DAVID, KOBAS, ens.

05Opsomming en vooruitsigte

Mikro-organismes speel 'n belangrike rol in menslike gesondheid en siektes. In onlangse jare het metaproteomika 'n belangrike tegniese middel geword om die funksie van mikrobiese gemeenskappe te bestudeer. Die analitiese proses van metaproteomika is soortgelyk aan dié van enkelspesie-proteomika, maar as gevolg van die kompleksiteit van die navorsingsobjek van metaproteomika, moet spesifieke navorsingstrategieë in elke analisestap, van monstervoorbehandeling, dataverkryging tot data-analise, aanvaar word. Tans, danksy die verbetering van voorbehandelingsmetodes, die voortdurende innovasie van massaspektrometrie-tegnologie en die vinnige ontwikkeling van bioinformatika, het metaproteomika groot vordering gemaak in identifikasie-diepte en toepassingsomvang.

In die proses van voorbehandeling van makroproteoommonsters moet die aard van die monster eers oorweeg word. Hoe om mikro-organismes van omgewingselle en proteïene te skei is een van die sleuteluitdagings wat makroproteome in die gesig staar, en die balans tussen skeidingsdoeltreffendheid en mikrobiese verlies is 'n dringende probleem wat opgelos moet word. Tweedens moet die proteïenekstraksie van mikroörganismes die verskille wat deur die strukturele heterogeniteit van verskillende bakterieë veroorsaak word, in ag neem. Makroproteoommonsters in die spoorreeks vereis ook spesifieke voorbehandelingsmetodes.

Wat massaspektrometrie-instrumente betref, het hoofstroom-massaspektrometrie-instrumente 'n oorgang ondergaan van massaspektrometers gebaseer op Orbitrap-massaontleders soos LTQ-Orbitrap en Q Exactive na massaspektrometers gebaseer op ioonmobiliteit-gekoppelde tyd-van-vlug-massaontleders soos timsTOF Pro . Die timsTOF-reeks instrumente met ioonmobiliteit-dimensie-inligting het hoë opsporing akkuraatheid, lae opsporing limiet, en goeie herhaalbaarheid. Hulle het geleidelik belangrike instrumente geword in 'n verskeidenheid navorsingsvelde wat massaspektrometrie-opsporing vereis, soos die proteoom, metaproteoom en metaboloom van 'n enkele spesie. Dit is opmerklik dat die dinamiese reeks massaspektrometrie-instrumente vir 'n lang tyd die proteïenbedekkingsdiepte van metaproteoomnavorsing beperk het. In die toekoms kan massaspektrometrie-instrumente met 'n groter dinamiese reeks die sensitiwiteit en akkuraatheid van proteïen-identifikasie in metaproteome verbeter.

Vir massaspektrometrie-data-verkryging, alhoewel die DIA-data-verkrygingsmodus wyd in die proteoom van 'n enkele spesie aangeneem is, gebruik die meeste huidige makroproteoom-ontledings steeds die DDA-dataverkrygingsmodus. Die DIA data-verkrygingsmodus kan die fragmentiooninligting van die monster ten volle verkry, en in vergelyking met die DDA-dataverkrygingsmodus het dit die potensiaal om die peptiedinligting van die makroproteoommonster ten volle te verkry. As gevolg van die hoë kompleksiteit van DIA-data staar die ontleding van DIA-makroproteoomdata egter steeds groot probleme in die gesig. Die ontwikkeling van kunsmatige intelligensie en diep leer sal na verwagting die akkuraatheid en volledigheid van DIA-data-analise verbeter.

In die data-analise van metaproteomika is een van die sleutelstappe die konstruksie van proteïenvolgordedatabasis. Vir gewilde navorsingsareas soos dermflora kan dermmikrobiese databasisse soos IGC en HMP gebruik word, en goeie identifikasieresultate is behaal. Vir die meeste ander metaproteomika-ontledings is die doeltreffendste databasiskonstruksiestrategie steeds om 'n monsterspesifieke proteïenvolgordedatabasis te vestig wat gebaseer is op metagenomiese volgordebepalingdata. Vir mikrobiese gemeenskapsmonsters met hoë kompleksiteit en groot dinamiese omvang, is dit nodig om die volgordebepalingsdiepte te verhoog om die identifikasie van lae-abundant spesies te verhoog, en sodoende die dekking van die proteïenvolgordedatabasis te verbeter. Wanneer volgorde van data ontbreek, kan 'n iteratiewe soekmetode gebruik word om die publieke databasis te optimaliseer. Iteratiewe soektog kan egter FDR-gehaltebeheer beïnvloed, so die soekresultate moet noukeurig nagegaan word. Daarbenewens is die toepaslikheid van tradisionele FDR-gehaltebeheermodelle in metaproteomika-analise steeds die moeite werd om te ondersoek. In terme van soekstrategie kan die hibriede spektrale biblioteekstrategie die dekkingsdiepte van DIA-metaproteomika verbeter. In onlangse jare het die voorspelde spektrale biblioteek wat op grond van diep leer gegenereer is, uitstekende prestasie in DIA-proteomika getoon. Metaproteoomdatabasisse bevat egter dikwels miljoene proteïeninskrywings, wat 'n groot skaal van voorspelde spektrale biblioteke tot gevolg het, baie rekenaarhulpbronne verbruik en 'n groot soekruimte tot gevolg het. Daarbenewens verskil die ooreenkomste tussen proteïenvolgordes in metaproteome grootliks, wat dit moeilik maak om die akkuraatheid van die spektrale biblioteek voorspellingsmodel te verseker, so voorspelde spektrale biblioteke is nie wyd gebruik in metaproteomika nie. Daarbenewens moet nuwe proteïeninferensie en klassifikasie annotasie strategieë ontwikkel word om van toepassing te wees op metaproteomika analise van hoogs volgorde soortgelyke proteïene.

Samevattend, as 'n opkomende mikrobioomnavorsingstegnologie, het metaproteomika-tegnologie beduidende navorsingsresultate behaal en het ook groot ontwikkelingspotensiaal.

Pos tyd: Aug-30-2024