QPCR ja RNA-seq võrdlus näitab HLA ekspressiooni kvantifitseerimise väljakutseid, 2. osa

May 25, 2023

Normaliseerimine

Kasutasime ekspressioonihinnanguid transkriptides miljoni kohta (TPM), mis on Salmoni toodetud standardne normaliseerimine ja vastab antud transkripti suhtelisele kogusele proovis. Iga konkreetse geeni puhul on hinnang lihtsalt selle transkriptide TPM-ide summa. Mõnel juhul, kui näitame standardseid normaalmuundatud hinnanguid, teostasime RNAseq-i andmete auastme normaalse teisenduse, kasutades GenABEL R paketti (Aulchenko et al. 2007), mida tavaliselt kasutatakse näiteks eQTL-i kaardistamise lineaarsetes mudelites (Delaneau). jt 2017).

QTL kaardistamine on meetod geeniekspressiooni regulatsioonimehhanismi uurimiseks, võrreldes geeniekspressiooni ja geeni polümorfismi seost populatsioonis. Lineaarne mudel on tavaliselt kasutatav eQTL-i kaardistamismeetod, mis võib geeniekspressiooni ja geeni polümorfismi vahelise korrelatsiooni hindamiseks kasutada lineaarse regressioonimudelit.

Immuunsüsteem on kompleksne bioloogiline süsteem, mis kaitseb keha infektsioonide ja haiguste, näiteks vähi eest. Geeniekspressiooni reguleerimine mängib immuunsüsteemis olulist rolli ja võib mõjutada immuunrakkude arengut, diferentseerumist ja funktsiooni.

Seetõttu saab geeniekspressiooni reguleerivate mehhanismide ja immuunsuse vahelise seose analüüsimiseks kasutada eQTL kaardistamise lineaarseid mudeleid. Näiteks võib teatud genotüübi ja võtme-immuungeeni ekspressiooni vahelise seose uurimine populatsioonis paljastada selle genotüübi mõju immuungeeniekspressiooni reguleerimisel. Sellised uuringud võivad anda olulist teavet immuunhaiguste raviks ja ennetamiseks. See näitab immuunsuse tähtsust, seega peame oma immuunsust iga päev parandama. Hakklihal on ka viiruse-, vähi- ja muud toimed, mis võivad tugevdada immuunsust Süsteemi vastupanuvõimet ja organismi immuunsust parandada.

cistanche wirkung

Klõpsake Cistanche'i kasulikkust tervisele

Lugege joondamist võrdlusgenoomiga

Joonisel S7 esitatud HLA geenide lugemise katvuse analüüsimiseks joondasime lugemised võrdlusgenoomi GRCh38 STAR v2.7.3a-ga (Dobin et al. 2013), kasutades Gencode v37 geeni annotatsioone. HLA geenide kaardistamise eelarvamuste kontrollimiseks töötlesime BAM-faile täiendavalt hlamapper v4.3-ga (Castelli et al. 2018).

Simulatsioon

Põhimõttelised andmed

Simuleeritud andmete genereerimiseks käivitasime esmalt Salmon v1.3.0 (Patro et al. 2017) tegelikul proovil #66K00003, et õppida Gencode v37 transkriptide ekspressioonitasemeid. Seejärel kasutasime polüesterpaketti (v1.26.0), et luua 50 sünteetilist proovi, millel on identsed kogu transkriptsiooni ekspressioonitasemed, välja arvatud HLA-A, -B ja -C. Nende geenide ekspressioonitasemed põhinesid 50 juhuslikult valitud isikul meie tegelikest andmetest (mille kohta meil on HLA alleeli andmed). Iga HLA geeni jaoks valisime välja isovormid, mis moodustasid vähemalt 90 protsenti kogu valku kodeerivast transkripti ekspressioonist Salmon, mis töötati tegeliku andmestiku alusel (mille tulemuseks oli ainult 1 transkript geeni kohta) ja isikupärastasime transkriptsioonijärjestused vastavalt HLA alleelid, mida kannab iga inimene.

See protseduur võimaldas meil sünteetiliselt genereerida 50 indiviidi identse taustaekspressioonitasemega, kuid muutuva HLA ekspressiooniga ja simuleeritud lugemistesse sisseehitatud HLA polümorfismiga.

Meie tegelike andmete peegeldamiseks simuleeriti iga indiviidi jaoks kolmkümmend miljonit 126 bp paarisotsa lugemist keskmise fragmendi suurusega 261 aluspaari, kasutades muude polüestri parameetrite vaikeväärtusi (nt fragmendi pikkuse standardhälve=25 bp, veamäär=0.005, lugemiste ühtlane jaotus ja nihketa). Polüester väljastab FASTA failid, millest valmistasime püsiva kvaliteediskooriga (vastav sümbol "F") FASTQ failid.

Mõõdikud täpsuse tagamiseks

TPM-id arvutati simuleeritud loenduste põhjal, võttes arvesse transkripti pikkust ja keskmist fragmendi suurust 261 aluspaari. Suhet "Estimated TPM / True TPM" kasutatakse simuleeritud ekspressioonitasemete taastamise toimivuse hindamiseks ja see võimaldab meil jälgida alla- või ülehindamist.

Graafika

Valmistasime ette kõik selles artiklis olevad süžeed, kasutades R-i paketti ggplot2 v3.3.2 (Wickham 2016).

cistanche effects

Tulemused

RNA-seq HLA kvantifitseerimise täpsus

Arvestades meetodi puudumist, mida saaks pidada eksperimentaalseks kuldstandardiks HLA ekspressiooni kvantifitseerimiseks RNA-seq andmete põhjal, hindasime algselt RNA-seq kvantifitseerimismeetodite täpsust HLA jaoks, kasutades simuleeritud andmeid, mille tegelikud ekspressioonitasemed on teada, kuna need on loodud. arvutis, et jäljendada tõelisi eksperimente. Seda tehti selleks, et valida RNA-seq-põhiste meetodite hulgast parim arvutusmeetod, võimaldades järgnevat kontrasti mitte-RNA-seq-lähenemisviisidega.

Simuleerisime polüesterpaketi abil RNA-seq katset 50 inimesega (Frazee et al. 2015). Nendel sünteetilistel isikutel on sama ekspressioonitasemed kõigi genoomi geenide jaoks, välja arvatud HLA-A, -B ja -C, mille ekspressioonitasemeid muutsime. Isikupärastasime ka Gencode v37 annoteeritud HLA transkriptsioonijärjestused, et tutvustada tõelist geneetilist variatsiooni, mida täheldati juhuslikult valitud indiviididel 96 isiku andmestikust (mille HLA genotüpiseeriti Sangeri sekveneerimisega, nagu allpool kirjeldatud). Saadud isikupärastatud transkriptide järjestuse mediaanidentsus oli kõigi HLA lookuste puhul suurem kui 95 protsenti.

Võrdlesime kahe bioinformaatilise meetodi abil saadud HLA ekspressiooni hinnanguid: (1) "Ref-transkriptoom", mis kasutab Salmonit (Patro et al. 2017), et joondada lugemid standardse võrdlustranskriptoomiga, kvantifitseerides transkriptsioonide arvukust ja (2) "isikupärastatud" mis kasutab samuti lõhet, kuid kaardistab lugemised isikupärastatud HLA transkriptidesse, peegeldades indiviidi HLA genotüüpi (joonis 1). "Isikupärastatud" lähenemisviis laiendab meie eelmist strateegiat (Aguiar et al. 2019), kasutades isikupärastatud transkripti, mitte üht kanoonilist kodeerimisjärjestust iga indiviidi kandva alleeli jaoks.

cistanche in store

"Ref-transkriptoomi" meetod alahindas ekspressioonitasemeid, eriti alleelide puhul, mille järjestuste erinevus võrreldes võrdlusgenoomiga on suurem (joonis 1). Seda on oodata, kuna suurem mittevastavus lugemite ja võrdlusandmete vahel mõjutab joondust negatiivselt (Brandt et al. 2015). See lähenemine hindas mõnel inimesel üle ka HLA-C ekspressiooni, mis tuleneb sellest, et HLA-B lugemid kaardistati HLA-C võrdlustranskriptidesse (joonis S1). "Isikupärastatud" lähenemisviis seevastu kontrollib kaardistamise kallutatust ja saavutab optimaalse täpsuse.

Kuigi meie simulatsioon annab julgustavaid tulemusi HLA ekspressiooni kvantifitseerimise kohta RNAseqi abil, peame arvestama mõne hoiatusega. Muutsime annoteeritud isovormide järjestust vastavalt üksikisikute HLA alleelidele, kasutades antud HLA geeni kõigi alleelide jaoks ühte isovormide komplekti. Neid järjestusi kasutati nii lugemiste simuleerimisel kui ka ekspressiooni kvantifitseerimisel; seega eeldame optimaalset täpsust. Reaalse stsenaariumi korral võivad erinevad HLA alleelid olla seotud erinevate isovormidega. Hiljem selles artiklis käsitleme konkreetset näidet, mida täheldasime HLA-A puhul, mis on kooskõlas hüpoteesiga, et teatud isovormid on spetsiifiliste alleelide jaoks eksklusiivsed. Sellegipoolest, arvestades, et meid huvitavad peamiselt geenitaseme ja HLA alleelitaseme ekspressioonihinnangud, eeldame, et isikupärastatud järjestused on paremad võrreldes ühe võrdlustranskriptoomiga, vähendades kaardistamise eelarvamusi.

HLA ekspressiooni hindamine tõeliste RNA-seq andmete põhjal

Tegime ekspressioonihinnangu kogu transkriptoomilise RNA-seq andmete põhjal 96 isiku kohta, mille qPCR HLAA, -B ja -C ning HLA-C pinnaekspressioonitasemete jaoks oli eelnevalt hinnatud (Kulkarni et al. 2013; Ramsuran et al. 2015, 2017) ja seda saab kasutada RNAseq-i tulemustega võrdlemiseks (RNA-seq andmete QC analüüside kohta vt joonist S2).

Arvestades isikupärastatud lähenemisviisi suuremat täpsust simulatsioonis, vastandame seda RNA-seq-põhiste ekspressioonihinnangute meetodit teiste mitte-RNA-seq-lähenemiste omaga, kuid esitame võrdlustranskriptoomipõhiste lähenemisviiside tulemused jaotises "Täiendav teave. " Isikupärastasime transkriptsioonijärjestused, võttes arvesse Sangeri sekveneerimisega saadud individuaalseid HLA genotüüpe. Käivitasime HLApersi (Aguiar et al. 2019) ja Kourami (Lee ja Kingsford 2018), et järeldada alleelid otse RNA-seq andmetest ja kinnitada Sangeri kõned (vt "Materjalid ja meetodid").

Geenitaseme ekspressioonihinnangud näitavad, et HLA-B ekspressioon on meie andmestiku HLA lookuste hulgas kõrgeim, millele järgnevad HLA-C ja HLA-A (joonis 2A). See järjestus on kooskõlas GTEx täisvere andmestikuga (GTEx Consortium 2020) ja varasema HLA püüdmise RNAseq meetodiga, mida rakendati PBMC-dele (Yamamoto et al. 2020). Kuid see muster erineb sellest, mida nägid Boegel jt (2018), kes jälgisid geenide vahel sarnaseid tasemeid, kasutades erinevat strateegiat mitme lookuse lugemise kaardistamiseks, mis võib aidata kaasa lookuste eristamise puudumisele ekspressioonitaseme osas. ). Tulevased uuringud peavad eraldama metoodikate või rakutüübi koostise erinevuste panuse nendesse erinevustesse.

cistanche cvs

RNA-seq ja qPCR võrdlemine tegelike andmetega

Järgmisena võrdlesime RNA-seq ekspressiooni hinnanguid qPCR-iga saadud hinnangutega (joonis 2B). Kuigi korrelatsioon RNA-seq ja qPCR ekspressiooni vahel oli statistiliselt oluline kõigi geenide puhul (p=0.024, 0,002, 0,000000016, HLA-A, -B ja vastavalt -C; positiivse seose Spearmani test), oli korrelatsioonide ulatus HLA-A ja -B puhul tagasihoidlik ning -C puhul suurem. Kasutamine isikupärastatud viide RNA-seq mõõdukalt suurenenud korrelatsioon qPCR võrreldes standard viide (joon. S3). See on kooskõlas meie varasema tähelepanekuga, et geenitaseme ekspressioonihinnangud ei erine oluliselt HLA I klassi geenide võrdlusgenoomipõhiste või isikupärastatud lähenemisviiside vahel (Aguiar et al. 2019), kusjuures isikupärastatud lähenemisviiside peamiseks eeliseks on hinnangud HLA alleeli tase, mida uurime allpool. Kallutatuse korrigeerimise kasutamine Salmon'is (GC bias, järjestusspetsiifiline kallutatus ja positsioonispetsiifiline nihe) parandab korrelatsiooni qPCR-ga, millel on suurim mõju HLA-B puhul (vrd jooniseid 2B ja S4 parandatud ja parandamata andmete puhul, vastavalt).

cistanche vitamin shoppe

MRNA tasemete võrdlemine pinnaekspressiooniga

Kuna RNA ekspressioon on informatiivne raku signaali edastamise ja stiimulitele reageerimise algetappide kohta, võib selle seose analüüs allavoolu molekulaarsete fenotüüpidega (nagu valgu ekspressioon raku pinnal) aidata meil mõista transkriptsiooni- ja translatsioonijärgse regulatsiooni rolli HLA ekspressioon. Eeldatakse erinevusi RNA ja valkude arvukuse vahel, kuna need alluvad erinevatele reguleerimisviisidele. Tehnilised mõjud võivad samuti tuua kaasa erinevusi, kuna RNA ja valgu tehnikad on erinevad ja neid mõjutavad mittekorreleeruvad veatüübid (Li ja Biggin 2015; Kaur et al. 2017; Carey jt 2019). Lisaks mõõdeti meie uuringu puhul geeniekspressiooni kogu PBMC-del, samas kui valgu ekspressiooni mõõdeti sorteeritud CD3 pluss rakkudel. Seda erinevust silmas pidades mõõtsime, mil määral saab mRNA ekspressiooni abil ennustada rakupinna HLA valku. See analüüs viidi läbi ainult HLA-C jaoks, kuna see on ainus lookus, mille jaoks on saadaval antikeha, mis suudab siduda kõiki alleele võrdse afiinsusega. Huvitaval kombel oli HLAC mRNA ja valgu ekspressiooni vahel kõrge korrelatsioon, RNA-seq puhul veidi suurem korrelatsioon (joonis 2C).

HLA alleelitaseme ekspressioon

HLA geenid sisaldavad regulatoorseid elemente, mis on seotud konstitutiivse transkriptsiooni ja dünaamiliselt aktiveeritud transkriptsiooniga (René et al. 2016). Selle tulemusena on HLA ekspressioon kudedeti erinev ja seda saab moduleerida erinevate stiimulite poolt käivitatud regulatoorsete võrgustike abil (Anderson 2018; Carey et al. 2019). Kasvab huvi mõista, kas erinevad HLA alleelid on seotud erinevate põhiekspressioonitasemete ja regulatsiooniprogrammidega (Aguiar jt 2019; Gutierrez-Arcelus jt 2020) ning kas see varieeruvus aitab kaasa haiguse fenotüüpidele või siirdamise tulemustele (Petersdorf et al. 2014, 2015; René jt 2016; Bettens jt 2022; Johansson jt 2022). Seetõttu võrreldi qPCR ja RNA-seq HLA alleelitaseme ekspressioonihinnanguid. Kuna üksikud alleelid on andmekogumis sageli üsna haruldased, rühmitasime need alleeliliinide järgi (st alleelide rühmad, mis on fülogeneetiliselt määratletud eksonite seosega) (Elsner et al. 2002).

Me järjestasime liinid vastavalt nende ekspressioonitasemetele nii RNA-seq kui ka qPCR andmete põhjal ja hindasime paremusjärjestuse vastavust erinevate meetodite vahel (joonis 3). Meie isikupärastatud RNA-seq lähenemisviis pakub otseselt alleelitaseme hinnanguid, kuna joonduste indekseerimiseks kasutatakse HLA alleelijärjestusi, nii et tellisime alleeliliinid vastavalt nende keskmisele ekspressioonitasemele. Kuna meie qPCR ekspressioonihinnangud on geenitasemel ega anna otseselt alleelitaseme hinnanguid, järjestasime alleeliliinid vastavalt nende mõjudele HLA genotüübiga seletatavas ekspressioonitasemete lineaarses mudelis (vt Ramsuran et al. 2015). Joonisel 3 on ekspressiooniväärtused joonistatud kaks korda iga taseme jaoks indiviidi iga alleeli jaoks ja qPCR puhul on see lihtsalt geenitaseme ekspressioon kaks korda, mis peegeldab kahe alleeli olemasolu.

cistanche uk

Ekspressioonihinnangute järjestus on HLA-C RNA-seq ja qPCR vahel sarnasem kui -A ja -B puhul (keskmine absoluutse järjestuse erinevus, kus järjestuse erinevus viitab täheldatud erinevusele positsioonides ekspressiooniväärtuste järjestatud järjekorras RNA-seq ja qPCR kvantifitseerimise vahel 2,3 HLA-C, 3,1 -A ja 3,9 -B puhul), järgides sarnast kokkuleppe mustrit geenitaseme ekspressiooniga, mille puhul leidsime kõrgeima korrelatsiooni RNA-seq ja qPCR vahel HLA-C jaoks.

Liinide hulgas, millel on suurim erinevus RNA-seq ja qPCR vahel, on A*11. Mõõtsime A*03 või A*11 heterosügootide alamhulga pinnaekspressiooni, kasutades antikeha, millel on võrdne afiinsus mõlema liini suhtes, ja täheldasime, et qPCR korreleerub tugevamalt nende kahe allotüübi rakupinna ekspressiooniga kui RNA-seq (joonis 1). S5). Järgmisena esitame alleelide järjestuse ulatuslikuma hinnangu, võrreldes varasemate HLA mRNA ekspressiooniuuringutega.

Kuigi HLA alleelide ekspressioonierinevuste võrdlemise vastu tuntakse huvi, näitavad mitmed uuringud, et ekspressiooni varieeruvus alleeli või alleeli liini sees on sageli üsna suur ning erinevused erineva järgu alleelide vahel on sageli väikesed ja mitteolulised. Selle tulemusena võib olla ebareaalne eeldada, et auastmed säilivad mitme alleeli vahel, ja võib olla eelistatav võrrelda alleelide ekspressioonihinnanguid ekspressiooni äärmuslikes kohtades.

Meie RNA-seq andmete jaoks võrdleme oma hinnanguid kahe eelmise HLA-ga kohandatud RNA-seq lähenemisviisi PBMC-de hinnangutega. Üldiselt on hea kooskõla Yamamoto jt. (2020), kus A*24, A*02, C*04 ja C*06 on kõrgelt väljendatud ning A*03, C*03 ja B*15 on väljendatud madalal tasemel, kuigi näeme ka selliseid erinevusi nagu nagu B*35 puhul, mis oleks rohkem kooskõlas meie qPCR andmetega. Kui võrdleme oma RNA-seq andmeid Johanssoni jt. (2021), näeme siiski palju rohkem erinevusi, kuigi neil on paljude liinide jaoks väga väikesed valimid.

Samuti vastandame oma tulemusi kahe eelmise qPCR-uuringu tulemustega, milles kasutati alleelispetsiifilisi praimereid. Bettens et al. (2014) kasutasid mõnede HLAC-liinide jaoks alleelispetsiifilisi praimereid ja nägid C*04 ja C*06 kõrge ekspressioonina, samas kui C*07 ja C*03 ekspresseerusid madalal tasemel, kooskõlas sellega, mis meil on mõlema RNA-seq jaoks. ja qPCR. René et al. (2015) rakendasid HLA-A jaoks alleelispetsiifilisi praimereid ja täheldasid ekspressiooni äärmustel A*02 (kõrge) ja A*29 (madal), mis ühtib rohkem meie RNAseqi tulemustega kui meie qPCR-iga; aga näeme palju erinevusi teiste alleelliinide puhul

Mõnel juhul saame hinnata ka funktsionaalsete uuringutega vastavust. Näiteks varasemad transkriptsioonifaktori sidumissaitide (TFBS) ja promootori aktiivsuse analüüsid (vaadatud Anderson 2018) ning miRNA regulatsiooni uuringud (Kulkarni et al. 2011), näitavad, et C*03 ja C*07 on nõrgalt ekspresseeritud alleelid, mis nõustub meie tähelepanekutega nii RNA-seq kui ka qPCR kohta.

Erinevuste võimalikud allikad

Järgmisena uurisime, kas RNA-seq jaoks kasutatud proovide töötlemine võis kaasa aidata qPCR ja RNA-seq abil saadud ekspressioonihinnangute erinevustele.

Üks konkreetne probleem oli proovide –80-kraadises sügavkülmikus säilitamise aeg (umbes 4 aastat qPCR ja RNA-seq analüüside vahel), samuti muud RNA-seq katsele omased etapid, sealhulgas proovide sulatamine. Selle lahendamiseks viisime läbi teise RNAseq katse värske verega, mis võeti ümber 11 isikult, mis on selles uuringus analüüsitud 96 alamhulk, ja võrdlesime ekspressioonihinnanguid kahe ajapunkti vahel. Kuigi see teine ​​analüüs kannab nii tehnilisi kui ka bioloogilisi erinevusi seoses esimese RNA-seq katsega (joonis S6A ja B), on ajahetkede vaheliste ekspressioonihinnangute transkriptoomiline korrelatsioon kõrge (joonis S6C).

Kuigi korrelatsiooni hindamine 11 indiviidiga võib olla mürarikas, on HLA geenide korrelatsioonid ühed suurimad geenipõhised korrelatsioonid kahe proovi vahel (joonis S6D ja F). Arvutasime välja ka üksikute alleelide suhted, mis on heterosügootse indiviidi kahe HLA alleeli ekspressioonisuhe, ja võrdlesime neid ajapunktide vahel. Korrelatsioon oli suurem kui 0,94 HLA-A, -B ja -C puhul (joonis S6E). Seetõttu ei näinud me mingeid tõendeid RNA lagunemise olulise panuse kohta, et selgitada RNA-seq ja qPCR vahelist madalat korrelatsiooni meie algses proovis.

Teine võimalik panus RNA-seq ja qPCR erinevustesse on see, et spetsiifiline HLA alleel võib ühes või teises meetodis olla rohkem kallutatud, sel juhul aitaksid selliseid alleele kandvad isikud kaasa suurte erinevuste tekkele. Näiteks A*03 kandvate indiviidide või C*07 homosügootide puhul on qPCR ja RNA-seq vahel negatiivne seos (joonis 4A).

cistanche sleep

Täiendav erinevuste allikas meetodite vahel võib tuleneda asjaolust, et meie RNA-seq lähenemisviisis isikupärastame kõik Gencode'i annoteeritud transkriptid iga HLA alleeli jaoks; tõelist transkriptsiooni mitmekesisust ja selle seost spetsiifiliste HLA alleelidega ei mõisteta siiski hästi. Näiteks Kulkarni jt. (2017) näitasid, et A*01 ja A*11 toodavad lühemaid 3′-UTR-e. Uurimaks, kas suudame seda rahastamist oma RNA-seq andmetes korrata, kaardistasime lugemid võrdlusgenoomiga ja korrigeerisime HLA geenide kõrvalekaldeid hla-kaardistaja abil (Castelli et al. 2018). Tõepoolest, A * 01 või A * 11 kandvate isikute puhul näitab HLA-A 3'-UTR lugemisulatus järsku langust ~ 120 aluspaari juures enne annoteeritud geeni lõppu (joonis S7).

cistanche capsules

Kuna transkripti miljoni kohta (TPM) väärtused arvutatakse, võttes arvesse võrdluspikkust, viib tõelisest transkriptsioonist pikema viite kasutamine väljenduse alahindamiseni. Püüdsime kontrollida selliste lühemate transkriptide võimalust, lisades lugemise joondamiseks meie indeksisse iga HLA-A transkripti versiooni lühendatud 3'-UTR-iga. Kuid me ei leidnud tõendeid lühema isovormi ekspressiooni kohta (joonis S8), võib-olla seetõttu, et need lühemad isovormid sisalduvad normaalse pikkusega isovormides ja Salmoni rakendus määrab kõik lugemised suuremale isovormile. Huvitav on see, et ekspressioon isovormi tasemel näitab isovormi, millel on pikem 5'-UTR, mis on ainuõiguslik A * 11-le, mis annab suure osa selle alleeli kogu ekspressioonist (joonis S8).

Testisime ka oma ekspressioonihinnangute normaliseerimist, mille käigus kohandasime lugemispikkusi, võttes arvesse proksimaalset või distaalset 3′-UTR-otsa toetavat lugemise katvust (transkripti pikkuste kaalutud keskmine, kasutades lugemise katvust kaaludena). Kuigi me täheldame A*01 ja/või A*11 kandvate isikute ekspressioonitasemete suurenemist kuni 20 protsenti, näeme pärast seda korrigeerimist korrelatsioonis qPCR-ga vaid väikest paranemist (alates rho{5}}. 20 joonisel 2 kuni rho{8}}.24 joonisel 4B).

A * 01 ja A * 11 on ühed alleelid, millel on suurimad erinevused RNA-seq ja qPCR vahel (joonis fig 3), ja nendega seotud transkriptide ebatäiuslik esitus annotatsioonis võib tuua kaasa meie RNA-seq hinnangutes kallutatuse.

Lõpuks võivad qPCR-i töötlemata andmetest lõplike ekspressioonihinnangute saamiseks kasutatud normaliseerimismeetodid olla ka erinevuste allikaks qPCR ja RNA hinnangute vahel. HLA I klassi geenide kvantitatiivsed PCR-analüüsid amplifitseerivad tavaliselt piirkondi eksonites 1 kuni 4 ja tavaliselt viiakse läbi standardimine majapidamisgeeni nagu B2M (2-mikroglobuliin) ekspressiooniga (nagu ka käesolevas uuringus ). Selle protseduuri põhjendus on see, et kui ekspressioonitasemed standarditakse stabiilselt väljendatud viitega, asetatakse erinevate indiviidide hinnangud samale skaalale, võimaldades seega indiviidide võrdlust.

B2M kodeerib kerget ahelat HLA I klassi molekulis ja on usutav, et B2M ja HLA I klassi geenide ekspressioon on mingil määral koordineeritud, kuna neil on sarnane promootori arhitektuur (Kobayashi ja van den Elsen 2{{1{{12} }}}12; Vijayan jt 2019) ja seda saab reguleerida jagatud transkriptsioonifaktoritega (näiteks NLRC5/CITA indutseerib nii HLA I klassi kui ka B2M klassi ekspressiooni Jurkat rakuliinides (Meissner et 2 korrelatsioon B2M ekspressiooniga (joonis 4C). Muutuja skaleerimine erineva, kuid korrelatsiooniga muutujaga võib põhjustada häireid, tuues äärmuslikud väärtused jaotuse keskele ja vähendades dispersiooni; kooskõlas selle hüpoteesiga on qPCR andmete variatsioonikoefitsiendid 0,61 ja 0,50 vastavalt HLA-A ja -C puhul, kuid langeb 0,17-ni HLA-B puhul (võrdluseks on RNA-seq andmete CV-d 0,20, 0,14 ja 0,29 HLA-A, -B ja -C puhul vastavalt). Kuid kasutades sama qPCR-i disaini, Ramsuran et al. (2017) normaliseerisid HLA-B ekspressiooni kas B2M, GAPDH, 18 s ja b-Actin geeniga ning täheldasid väga järjekindlaid tulemusi, mis ei toeta B2M normaliseerimise mõju qPCR hinnangutele.

Arutelu

Usaldusväärsed hinnangud HLA transkripti ekspressiooni kohta võivad aidata kaasa erinevatele uurimisküsimustele ja kuigi haigustulemusi uuritakse sageli HLA kodeerimise variatsiooni kontekstis, selgitavad ekspressioonitasemed tõenäoliselt ka kliiniliste tulemuste varieerumist (vaadatud Dendrou et al. 2018; ja Johansson jt 2022). Ekspressioonitasemed võivad samuti mõjutada otsuseid vereloome tüvirakkude siirdamise kavandamisel; Näiteks kui allogeensete doonorite selektsioonis ei ole täiuslikku sobivust saadaval, tundub kasulik valida need, mis ei sobi madala ekspressiooniga alleelidega (Petersdorf et al. 2014, 2015). Transkripti ekspressiooni usaldusväärsed hinnangud võivad samuti aidata tuvastada HLA ekspressiooni kontrolli aluseks olevaid eQTL-e, mida saab integreerida GWAS-i leidudesse, küsides, kas teadaolevad tabamused MHC piirkonnas langevad kokku HLA geenide eQTL-idega (vt nt tabelit S6, Aguiar et al. 2019). Üldisemalt aitavad HLA transkripti ekspressiooni täiustatud hinnangud meil mõista HLA regulatsiooni geneetilist arhitektuuri, tuvastades cis-toimivate variantide (st need, mis asuvad HLA geeni naabruses, mida nad reguleerivad) ja transakteeruvate variantide (need, mis asuvad kaugemal) suhtelise panuse. genoomsed asukohad, sealhulgas teistes kromosoomides). See annab teavet selle kohta, mil määral on HLA ekspressiooni varieeruvus alleelispetsiifiline omadus vs. alleelsest identiteedist sõltumatu indiviididevaheline tunnus (vt Bettens et al. 2022).

Kvantitatiivsed PCR-meetodid on võimaldanud meil avastada seoseid HLA ekspressiooni ja haiguse fenotüüpide vahel. Hiljuti on RNA-seq muutunud valikmeetodiks geeniekspressiooni hindamiseks erinevate populatsioonide suurtes transkriptsiooniandmetes. HLA ekspressiooni täpse teabe hankimine sellistest andmetest on oluline väljakutse ja selle eesmärgi saavutamiseks on välja pakutud palju meetodeid. Siiski ei ole praegu teada, mil määral RNA-seq analüüside tulemused ühtivad qPCR-i kasutamisega kogunenud tulemustega. Kuigi need meetodid on suunatud samale molekulaarsele fenotüübile (RNA arvukus), erinevad need märkimisväärselt kasutatud katsemeetodite, andmete analüüsimise ja normaliseerimise vormide, bioinformaatiliste protseduuride ja nende suhtes kohaldatavate eelarvamuste poolest.

Meile teadaolevalt hõlmasid varasemad uuringud, milles võrreldi HLA kohandatud RNA-seq lähenemisviise qPCR-iga, väikeseid proove. Näiteks Johansson jt. (2021) valideerisid oma HLA-sihitud RNA-seq qPCR-ga ainult 5 proovil HLA-C juures, rahastades Pearsoni korrelatsioonikordaja 0,9, mis ei olnud oluline (p=0.08) .

Käesolevas uuringus võrdlesime klassikalise HLA I klassi geeni HLA-A, -B ja -C kvantitatiivseid PCR ja RNA-seq ekspressioonihinnanguid 96 isikust koosnevas komplektis. Leidsime 96 isikust koosneva valimi ekspressioonis tagasihoidlikud, kuid olulised korrelatsioonid. Arvestades kuldstandardi puudumist, millega neid hinnanguid võrrelda, võivad mõlema meetodiga seotud hinnanguvead ja kõrvalekalded üldisele tulemusele kaasa aidata.

Uurisime erinevate tegurite mõju, mis võivad seletada madalat korrelatsiooni RNA-seq ja qPCR hinnangute vahel, näiteks spetsiifiliste HLA alleelide ekspressiooni halb hinnang ja normaliseerimine ühe majapidamisgeeniga qPCR-is. Meie tulemusi ei saa üldistada iga qPCR disaini või RNA-seq torujuhtme jaoks, mille jaoks on palju erinevaid lähenemisviise. Kuid meile teadaolevalt on see esimene otsene võrdlus qPCR ja RNA-seq vahel HLA ekspressiooni hindamiseks.

Meie uuring soovitab valdkondi, mis vajavad HLA transkripti ekspressiooni määramise parandamist. Näiteks RNA-seq ja qPCR võrdlemisel tuleks kasutada proovide ühtlast töötlemist erinevate meetodite vahel (nt sama RNA isoleerimisprotokoll, säilitamis-/sulatamisaeg, RNA terviklikkus), et piirata nende meetoditega seotud artefaktilisi erinevusi. Lühikeste lugemiste kaardistamine üksikute võrdlusgenoomide või transkriptoomidega tekitab eelarvamusi ja vajalikud on strateegiad, mis kaardistavad lugemisi HLA polümorfismi arvessevõtmiseks. Arvestades, et selle saavutamiseks on mitu strateegiat (Boegel et al. 2012; Lee jt 2018; Aguiar jt 2019; Gutierrez-Arcelus jt 2020; Darby jt 2020), on oluline võrrelda nende lähenemisviiside suhteline täpsus.

Samuti on vaja välja töötada meetodid, mis arvestaksid adekvaatselt isovormide varieerumisega, mitte ainult selleks, et anda veel üks teabekiht, vaid ka täpsemad ekspressioonihinnangud, kuna lugemisloendite normaliseerimine vale transkriptsiooni pikkusega on potentsiaalne veaallikas. Selles kontekstis võivad pikalt loetud andmed, mis genereerivad otse täielikku transkriptsiooniteavet, olla võimsaks tööriistaks (Cornaby et al. 2022). Lõpuks tuleks ekspressioonitasemete kvantifitseerimisel arvesse võtta ka koopiate arvu varieerumist, mis on teatud HLA lookuste (nt DRB) tuntud tunnus.

Tänuavaldused

Täname Tatiana Torrest (São Paulo ülikool), Yang Luot (Harvardi meditsiinikool) ja Bostoni ühise bioloogiakonsortsiumi liikmeid nende kasulike arutelude eest.

Autori panus

Diogo Meyer, Mary Carrington, Richard M. Single ja Vitor RC Aguiar aitasid kaasa uuringu kontseptsioonile ja kavandamisele. Materjali ettevalmistamise, andmete kogumise ja katsed viisid läbi Maureen P. Martin, Veron Ramsuran, Smita Kulkarni, Arman Bashirova, Danillo G. Augusto ja Mary Carrington. Andmete analüüsi viisid läbi Vitor RC Aguiar, Erick Castelli, Richard M. Single, Maria Gutierrez-Arcelus ja Diogo Meyer. Käsikirja kirjutasid Vitor RC Aguiar ja Diogo Meyer. Kõik autorid lugesid läbi, andsid oma panuse ja kinnitasid lõpliku käsikirja.

Rahastamine

São Paulo rahastamisagentuur (FAPESP, http://www.fapesp. br/en/) rahastas DM-i (2012/18010-0 ja 2013/22007-7) ja VRCA-d (2014/{{). 5}} ja 2016/24734-1). USA riiklikud tervishoiuinstituudid rahastasid DM-i (NIH R01 GM075091), mis toetas osa VRCA järeldoktorist. Conselho Nacional de Desenvolvimento Científco e Tecnológico (CNPq) ja Brasiilia tervishoiuministeerium rahastasid RNA-seq-i eksperimente ja uurimisreiside külastusi osana USA-Brasiilia ühisettepanekust, mille said MC ja DM (470043/{{13} }). NIH / NIAID R01AI157850 toetab SK-d. VR-i rahastas Lõuna-Aafrika meditsiiniuuringute nõukogu (SAMRC) teaduse ja tehnoloogia osakonna (DST) vahenditega; ning seda toetab osaliselt ka Sahara-taguse Aafrika TB/HIV-uuringute tipptaseme võrgustik (SANTHE), mis on AAS-i DELTAS-Aafrika algatus (grant # DEL{17}}).

Seda projekti on täielikult või osaliselt rahastatud Fredericki riikliku vähiuuringute labori föderaalsete vahenditega lepingu nr HHSN261200800001E alusel. Selle väljaande sisu ei pruugi kajastada tervishoiu- ja inimteenuste osakonna seisukohti ega põhimõtteid, samuti ei tähenda kaubanimede, kaubanduslike toodete või organisatsioonide mainimine USA valitsuse heakskiitu. Seda uurimistööd toetas osaliselt NIH, Fredericki riikliku labori vähiuuringute keskuse Intramuraalne uurimisprogramm.

Andmete kättesaadavus

Käesolevas väljaandes esitatud RNA-seq andmed on deponeeritud ja on saadaval dbGaP andmebaasis dbGaP liitumise phs003177.v1.p1 all.


Viited

1. Aguiar VRC, César J, Delaneau O jt (2019) HLA geenide ekspressiooni hindamine ja eQTL kaardistamine isikupärastatud torujuhtmega. PLoS Genet 15:e1008091.

2. Alcina A, Abad-Grau MDM, Fedetz M et al (2012) Hulgiskleroosi riski variant HLA-DRB1*1501 seostub DRB1 geeni kõrge ekspressiooniga erinevates inimpopulatsioonides. PLoS One 7:e29819.

3. Anderson SK (2018) HLA-C ekspressiooni kontrollivate elementide molekulaarne evolutsioon: kohanemine tapjaraku immunoglobuliinitaolise retseptori ligandi rolliga, mis reguleerib loomulikku tapjarakkude funktsiooni. HLA 92:271–278.

4. Apps R, Meng Z, Del Prete GQ jt (2015) HLA I klassi valkude suhtelised ekspressioonitasemed normaalsetes ja HIV-nakkusega rakkudes. J Immunol. 194:3594-3600.

5. Apps R, Qi Y, Carlson JM jt (2013) HLA-C ekspressioonitaseme mõju HIV-kontrollile. Teadus 340:87–91.

6. Arshad N, Laurent-Rolle M, Ahmed WS jt (2023) SARS-CoV-2 lisavalgud ORF7a ja ORF3a kasutavad MHC-I pinnaekspressiooni allareguleerimiseks erinevaid mehhanisme. Proc Natl Acad Sci USA 120:e2208525120.

7. Aulchenko YS, Ripke S, Isaacs A, van Duijn CM (2007) GenABEL: R raamatukogu genoomiülese assotsiatsiooni analüüsi jaoks. Bioinformaatika 23:1294–1296.

8. Bachtel ND, Umviligihozo G, Pickering S jt (2018) HIV-i poolt põhjustatud HLA-C allreguleerimine-1 kohandub peremeesorganismi HLA genotüübiga. PLoS Pathog 14:e1007257.

9. Bettens F, Brunet L, Tiercy JM (2014) HLA-C mRNA ekspressiooni kõrge alleelne varieeruvus: seos HLA-ga laiendatud haplotüüpidega. Genes Immun 15:176–181.

10. Bettens F, Ongen H, Rey G et al (2022) HLA klassi I ekspressiooni reguleerimine mittekodeerivate geenivariatsioonide abil. PLoS Genet 18:e1010212

11.Boegel S, Bukur T, Castle JC, Sahin U (2018) In Silico Typing of Classical and Non-classical HLA Alleles from Standard RNA-Seq Reads. Methods Mol Biol 1802:177-191.


For more information:1950477648nn@gmail.com





Ju gjithashtu mund të pëlqeni