Masinõppe algoritmide toimivus mälukliiniku patsientide dementsuse progresseerumise ennustamiseks
Mar 25, 2022
Rohkem informatsiooni:ali.ma@wecistanche.com
Abstraktne
TÄHTSUS
Masinõppe algoritme võiks kasutada kliiniliste otsuste tegemise abivahendite aluseks, et parandada kliinilist praktikat.
EESMÄRK
Hinnata masinõppe algoritmide võimet ennustada dementsuse esinemissagedust kahe aasta jooksul võrreldes olemasolevate mudelitega ning määrata optimaalne analüütiline lähenemine ja vajalike muutujate arv.
DISAIN, SEADISTUS JA OSALEJAD
Selles prognostilises uuringus kasutati 15 307 osalejast koosneva potentsiaalse rühma andmeid, kellel ei olnud algtasemel dementsust, et viia läbi teisene analüüs teguritest, mida saaks kasutada dementsuse esinemissageduse ennustamiseks. Osalejad osalesid riiklikus Alzheimeri koordineerimiskeskusesmäluAnalüüsid viidi läbi 2021. aasta märtsist maini. KOKKUPUUDED 258 muutujat, mis hõlmavad dementsusega seotud kliiniliste näitajate ja riskitegurite valdkondi.
PEAMISED TULEMUSED JA MEETMED
Peamine tulemus oli juhuslik dementsus, mis diagnoositi kahe aasta jooksul pärast algtaseme hindamist.
Charlotte James, Ph.D.; Janice M. Ranson, Ph.D.; Richard Everson, Ph.D.; David J. Llewellyn, PhD
TULEMUSED
{{0}} osalejate valimis (keskmine [SD] vanus, 72,3 [9,8] aastat; 9129 [6{{20}} protsenti ] naist ja 6178 [4{{24) }} protsenti ] meestest), kellel ei olnud algtasemel dementsust, diagnoositi 1568 (10 protsenti) dementsuse diagnoos kahe aasta jooksul pärast esialgset hindamist. Võrreldes kahe olemasoleva dementsuse riski prognoosimise mudeliga (st südame-veresoonkonna riskifaktorid, vananemine ja dementsuse riskiskoor ning dementsuse sõeluuringu lühinäitaja) olid masinõppe algoritmid paremad kõigist põhjustest tingitud dementsuse ennustamisel kahe aasta jooksul. Gradientvõimendatud puude algoritmi keskmine (SD) üldine täpsus oli 92 protsenti (1 protsent), tundlikkus 0,45 (0,05), spetsiifilisus 0,97 (0,01) ja kõvera alune pindala 0,92 (0,01), kasutades kõiki 258 muutujat. Muutuja tähtsusega analüüs näitas, et masinõppealgoritmide jaoks oli vaja ainult 6 muutujat, et saavutada täpsus 91 protsenti ja kõveraalune pindala vähemalt 0,89. Masinõppe algoritmid tuvastasid ka kuni 84 protsenti osalejatest, kellel oli esialgne dementsuse diagnoos, mis hiljem muudeti kergeks kognitiivseks kahjustuseks või kognitiivselt kahjustamata, mis viitab võimalikule valediagnoosimisele.
JÄRELDUSED JA ASJAKOHASUS
Need leiud viitavad sellele, et masinõppe algoritmid võivad täpselt ennustada dementsust kahe aasta jooksul patsientidel, kes saavad ravimälukliinikutes, kasutades ainult 6 muutujat. Neid leide saab kasutada otsustusabivahendite väljatöötamisel ja valideerimiselmälukliinikud.

Klõpsake DHT-i mälu jaoks tühjendamiseks
Sissejuhatus
Paljud patsiendid, keda hinnati eriasutustes, ntmälukliinikutes ei esine dementsust, kui nad esimest korda külastavad.1 Oluline on eristada patsiente, kellel tekib dementsus kliiniliselt olulise aja jooksul, ja nende patsientide vahel, kes jäävad dementsusest vabaks, kuna seda teavet saab kasutada patsientide järelkontrollide prioriseerimiseks. ja sekkumised. Arstide jaoks on keeruline tuvastada patsiente, kellel on suur risk dementsuse tekkeks. Üks lähenemisviis on keskenduda neile, kellel on esialgsel hindamisel kerge kognitiivne kahjustus (MCI), ja kutsuda need patsiendid järelkontrolli. Selle tulemuseks võib aga olla märkimisväärne väärklassifitseerimine patsientide puhul, kellel ei ole järelkontrolli, kuid kellel tekib dementsus, ja patsientide puhul, kes on suunatud edasistele uuringutele, kuid kellel ei teki dementsust. Enamikul MCI-ga mälukliiniku patsientidest ei arene dementsusse isegi 10 aasta pärast, aastane konversioonimäär on 9,6 protsenti.
Kliinilised otsuste tegemise abivahendid võivad parandada arstide võimet hinnata dementsuse algust. Dementsuse keskmise ja pikaajalise esinemissageduse hindamiseks erinevates populatsioonides on olemas olemasolevad kliinilised otsustusabivahendid. Näiteks kardiovaskulaarsete riskifaktorite, vananemise ja dementsuse esinemissageduse (CAIDE) riskiskoor3 töötati välja selleks, et ennustada dementsuse tekkeriski 20 aasta pärast keskealistel inimestel ning lühikese dementsuse sõeluuringu indikaatori (BDSI)4 eesmärk on tuvastada eakad inimesed. kognitiivse sõeluuringu sihtmärgiks, määrates kindlaks nende riski haigestuda dementsusesse 6 aasta pärast. Kuid meile teadaolevalt ei ole välja töötatud ühtegi kliinilist otsustamisabi, mis ennustaks dementsuse esinemissagedust mälukliinikutes lühema kliiniliselt olulise perioodi jooksul.

Masinaõpe (ML) võimaldab kasutada suurtest ja keerukatest andmekogumitest pärinevat teavet. Hiljuti on seda kasutatud dementsuse diagnoosimisel ja riskide prognoosimisel.{0}} Need mudelid sisaldavad aga sageli teavet, mis pole tavapärases kliinilises praktikas tavaliselt saadaval, nagu täiustatud neuropildistamine, geneetiline testimine ja tserebrospinaalvedeliku biomarkerid, mis piirab kliinilist kasutamist spetsialisti või uurimistöö seaded.
Uurisime, kas ML-tehnikaid saab kasutada dementsuse esinemissageduse ennustamiseks 2-aastase perioodi jooksul, kasutades USA riikliku mälukliiniku andmeid.AlzheimerKoordineerimiskeskus (NACC). Uurisime ka minimaalset muutujate kogumit, mis on vajalik ML-mudelite jaoks täieliku diagnostilise jõudluse saavutamiseks.

meetodid
NACC uuring sai iga saidi institutsionaalselt läbivaatamisnõukogult eetilise heakskiidu, enne kui see sai andmeid esitada, ja kõik osalejad olid andnud teadliku kirjaliku nõusoleku. See prognostiline uuring loeti vabastatuks institutsionaalsest eetilisest heakskiidust, kuna kasutasime varem kogutud tuvastamata andmeid. Selles uuringus kasutatud andmed on NACC-le andmete päringu alusel kättesaadavad. See uuring on esitatud kooskõlas individuaalse prognoosi või diagnoosi mitme muutujaga prognoosimudeli läbipaistva aruandluse (TRIPOD) aruandlusjuhisega. Andmeid analüüsiti 2021. aasta märtsist maini.
Uuringu näidis
Kasutasime varem kogutud andmeid NACC ühtsest andmekogumist (UDS).10 UDS sisaldab USA riikliku vananemisinstituudi tulevasi kohordiandmeid.AlzheimerHaigusKeskuse programm mitmekeskuseliseks koostööks uurimiseksAlzheimeri tõbihaigusja muud neurodegeneratiivsed häired.11 Meie andmekogum koosneb mälukliiniku andmetest, mis on kogutud ajavahemikus september 2005 kuni veebruar 2015 alates 30.Alzheimeri tõbiHaigusAmeerika Ühendriikides asuvad keskused. Andmekogum sisaldab osalejate ja osalejate sotsiaaldemograafilisi tunnuseid, perekonna ajalugu, funktsionaalset seisundit, 12 käitumissümptomeid (hinnatud neuropsühhiaatrilise inventuuri küsimustiku tulemustega13), neuropsühholoogilist testi,14 ja NACC kliinilist dementsuse diagnoosi, mille on määranud igaüks.AlzheimerHaigusKeskus kasutab standardiseeritud UDS-i kliinilisel hinnangul põhinevaid avaldatud kliinilisi diagnostilisi kriteeriume. UDS-protokolliga vastuvõetud diagnostiliste kriteeriumide üksikasjad ja nendega seotud juhised on avaldatud varem.15

Kasutasime UDS-i versioone 1 ja 2, mis hõlmavad 32 573 mälukliinikus osalejat koos algtaseme hinnanguga. Kuigi meie mudelid on kavandatud ennustama dementsuse esinemissagedust 2 aasta jooksul, et võtta arvesse järelkontrolli kohtumiste vahelise aja erinevusi, hõlmasime järelkontrolli, mis toimus 29 kuu jooksul pärast esmast visiiti, tagamaks, et visiit oli kas esimene või teine järelkontroll.
Tulemuste muutuja
Tulemusmuutuja oli juhusliku dementsuse diagnoos 29 kuu (umbes 2 aasta) jooksul pärast algtaseme hindamist. See hõlmab dementsuse alatüüpe, nagu Alzheimeri dementsus, Lewy kehadega dementsus, vaskulaarne dementsus ja muud haruldasemad alatüübid. Alzheimeri dementsus diagnoositi NINCSD-ADRDA kriteeriumide järgi,16 vaskulaarne dementsus diagnoositi NINDS-AIRENi kriteeriumide järgi,17 Lewy kehadementsus (LBD) diagnoositi vastavalt Lewy kehadega dementsuse konsortsiumi kriteeriumide kolmandale aruandele18 ja frontotemporaalne dementsus. diagnoositi Neary ja kolleegide 1998. aasta kriteeriumide järgi.19
Kandidaadid ennustajad
Lisasime kõik esmase visiidi ajal kogutud kliiniliselt olulised muutujad UDS-i versioonidesse 1 ja 2 (lisa e-tabel 1). Välistasime vabatekstiväärtustega muutujad, nagu ravimite nimed, ja muutujad, mis olid kõigi osalejate puhul konstantsed, näiteks külastuste arv. Neli sünteetilist muutujat genereeriti, et aidata hinnata muutuja tähtsust (need muutujad peaksid olema madalad); Neist muutujatest 3 olid olemasolevate muutujate permutatsioonid (1 binaarne, 1 kategooriline ja 1 numbriline muutuja) ja 1 muutuja genereeriti juhuslikult normaaljaotusest. Selle tulemuseks oli kokku 258 muutujat.
Meie mudelitesse kaasatud UDS-i muutujad hõlmavad osalejate demograafilisi tunnuseid (15 muutujat), kaasosalejate demograafilisi tunnuseid (7 muutujat), perekonna ajalugu (3 muutujat), haiguslugu (47 muutujat), ravimeid (21 muutujat), füüsilisi (12 muutujat) ) ja neuroloogiliste (4 muutujat) uuringute tulemused, Unified Parkinson Disease Rating Scale20 (UDPRS) (28 muutujat), Clinical Dementia Rating (CDR) skaala21 (8 muutujat), funktsionaalne seisund (10 muutujat), neuropsühholoogilise testi aku (50 muutujat) , Geriaatrilise depressiooni skaala (17 muutujat) ja sümptomite kliiniline hinnang (32 muutujat). Nendest muutujatest puudus 239 (93 protsenti) vähemalt ühel osalejal ja kõigil osalejatel oli puudu vähemalt 1 muutuja.
Mudeli väljatöötamine
Rakendasime 4 ML-algoritmi22: logistiline regressioon (LR), 23 tugivektori masin (SVM), 24 juhuslik mets (RF), 25, 26 ja gradientvõimendatud puud (XGB)27 (e-meetodid lisas). Need algoritmid täidavad klassifitseerimisülesande: nad määravad, kas osaleja kuulub klassi 0 (ennustuste kohaselt jääb dementsusest vabaks 29 kuud alates algtasemest) või klassi 1 (prognoositakse, et ta kogeb dementsust 29 kuu jooksul alates algtasemest). Klassifikatsioon põhineb muutujatel, mis on registreeritud nende esimesel (algtasemel) mälukliiniku visiidil. ML-algoritmide rakendamiseks kasutasime Pythoni sci-kit-learn teeki (Python Software Foundation),28 koos 5-kordse ristvalideerimisega (e-meetodid lisas). Puuduvad väärtused imputeeriti valimi võtmisega, asendades mittepuuduvate väärtustega. Kogu andmetöötlus ja analüüs rakendati Pythoni versioonis 3.9, NumPy versioonis 1.19.4 ja sci-kit-learn versioonis 0.24.0.
Statistiline analüüs
Mudeli hindamine
Hindasime kõigi mudelite toimivust, võrreldes nende üldist täpsust, tundlikkust ja spetsiifilisust kirjanduses eelnevalt määratletud otsustuslävedega (olemasolevad mudelid) või lävega 0,5 (ML mudelid), mis kaalub võrdselt valepositiivseid ja valenegatiivsed vead. Vastuvõtja töökarakteristiku kõvera (AUC)29 alune ala kasutati mudeli jõudluse kokkuvõtmiseks kõigist võimalikest lävedest ja seega väärklassifikatsiooni vigade kaalumisest.30 Keskmised jõudlusnäitajad ja SD-d saadi alglaadimise abil (e-meetodid lisas).
Võrdlus olemasolevate mudelitega
BDSI ja CAIDE on olemasolevad dementsuse riski ennustamise mudelid, mis määravad patsientidele skoori, mis näitab nende riski dementsuse tekkeks pikema aja jooksul. BDSI ja CAIDE riskiskooride tuletamiseks valisime UDS-ist muutujad, mis vastavad kõige paremini varem kasutatud muutujatele (lisa tabel 2). Meie ML-mudelite toimivust võrreldi BDSI ja CAIDE-ga, et ennustada 2-aastast dementsuse esinemissagedust.
Mudeli toimivus dementsuse alatüüpide lõikes
Dementsusel võib olla mitmesuguseid põhjuseid, mis vastavad erinevatele dementsuse alatüüpidele. Et hinnata ML-mudelite võimet tuvastada erinevaid dementsuse alatüüpe, jagasime dementsuse juhtumid Alzheimeri dementsuse, LBD, vaskulaarse dementsuse ja muude dementsuse alatüüpide vahel. Kasutades neid 4 kihistumist, arvutasime õigesti klassifitseeritud osalejate protsendi (tõeline positiivne määr) ja võrdlesime iga ML-mudeli ROC-kõveraid.
Diagnostilise stabiilsuse uurimine
Teadaolevalt hõlmab dementsuse kliiniline diagnoos patsiente, kellel on algselt valesti diagnoositud (tõhusalt nii valepositiivsed kui ka valenegatiivsed vead).31 Me defineerime pöördumist kui osalejat, kellel diagnoositi dementsus kuni 2 aastat pärast esimest mälukliiniku visiiti. ja seejärel diagnoositakse 2 aasta jooksul pärast dementsuse diagnoosimist dementsuse puudumine (kas MCI või kahjustusteta kognitsioon). Põhjendades, et need reversioonid on ebastabiilsed diagnoosid ja tõenäoliselt dementsuse väärdiagnoosi tagajärg, uurisime ML-mudelite klassifitseerimise täpsust reversiooniga osalejate valimis (e-meetodid lisas). Kasutasime iga ML-mudeli klassifikatsiooniskooride kumulatiivset jaotusfunktsiooni (CDF), et võrrelda taastunud osalejaid patsientidega, kellel tekkis dementsus, ja patsientidega, kes jäid dementsusest vabaks.
Tulemused
Pärast {{0}} osaleja väljajätmist, kellel oli algtasemel dementsuse diagnoos, 4557 osalejat, kellel ei olnud jälgimisandmeid, ja 573 osalejat, kelle esimene järelkontroll tehti rohkem kui 29 kuud pärast esimest visiiti , sisaldas lõplik analüütiline valim 15 307 osalejat (keskmine [SD] vanus, 72,3 [9,8] aastat; 9129 [60 protsenti] naist ja 6178 [40 protsenti] meest). Proovi karakteristikud on toodud tabelis 1. Kahe aasta jooksul alates algtasemest sai 1568 osalejat (10 protsenti) dementsuse diagnoosi. Dementsuse diagnoosi saanud 1568 osalejast 273 (17 protsenti) diagnoositi ühe arsti poolt ja 1216 (78 protsenti) konsensuskomisjoni poolt; 79 osaleja puhul (5 protsenti) diagnoosi allikat ei täpsustatud. Peamised tulemuslikkuse mõõdikud, mis hindavad iga mudeli ennustusvõimet, on toodud tabelis 2. Võrreldes olemasolevate mudelitega olid ML-mudelid paremad oma võimes ennustada, kas inimesel tekib 2 aasta jooksul dementsus, ja nad edestasid olemasolevaid mudeleid kõigi näitajate osas. Kõik ML-mudelid toimisid sarnaselt hästi, XGB-l oli suurim võimsus, mõõdetuna üldise täpsuse (92 protsenti) ja AUC-ga (keskmine [SD], 0,92 [0,01]). Iga mudeli vastuvõtja tööomaduste kõver näitab ML-mudelite sarnasust ja nende paremust võrreldes kahe olemasoleva riskimudeliga (joonis 1).


Mudeli toimivus dementsuse alatüüpide lõikes
ML-mudeli toimivuse hindamiseks erinevates dementsuse alatüüpides jagasime elanikkonna neljaks dementsuse alatüübiks: Alzheimeri dementsus (1285 osalejat), LBD (82 osalejat), vaskulaarne dementsus (21 osalejat) ja muud dementsuse alatüübid (180 osalejat). LR-mudel aitas kõige paremini tuvastada Alzheimeri tõve dementsust ja teisi alatüüpe, klassifitseerides õigesti 589 osalejat (46 protsenti) Alzheimeri dementsusega ja 99 osalejat (55 protsenti) muude alatüüpidega. SVM-mudel toimis kõige paremini LBD-ga osalejatel, liigitades õigesti 40 osalejat (49 protsenti). Kõik mudelid klassifitseerisid õigesti 7 osalejat (33 protsenti), kellel oli vaskulaarne dementsus. Vastuvõtja tööomaduste kõverad näitavad, et kõik mudelid toimisid iga alatüübi puhul ligikaudu võrdselt (e. Lisa joonis 1).
Muutujate miinimumarvu uurimine
ML-meetodi kasutamise üks võimalik puudus on sellega seotud muutujate suur arv. Kuna mudelis nõutavate muutujate arv suureneb, muutub rakendamine kliinilises keskkonnas vähem praktiliseks ja mudeli tõlgendatavus halveneb. Et hinnata, kui palju muutujaid vajab iga ML-mudel, et saavutada samaväärne ennustusvõime, kui leidsime kõigi 258 muutujaga (tabel 2), hindasime, kuidas AUC varieerus mudelites sisalduvate muutujate arvuga. Täpsemalt järjestasime iga mudeli muutujad järjestades need tähtsuse kahanevas järjekorras (st iga muutuja diskrimineeriv jõud vastavalt algoritmile; e-meetodid lisas). Seejärel õpetasime iga mudelit ümber järjest suurema arvu muutujatega, alustades kõige olulisemast. Leidsime, et kõik mudelid vajasid ainult 22 muutujat, et saavutada diagnostiline jõudlus, mis on statistiliselt eristamatu nende optimaalsest keskmisest jõudlusest (joonis 2; e joonis 2 lisas). Muutuja tähtsuse hindamise kehtivuse tagamiseks lisatud sünteetilised muutujad ei kuulunud ühegi mudeli 22 parima muutuja hulka, peegeldades tõsiasja, et pärast täieliku diagnostilise jõudluse saavutamist oli muutujate järjestuse tugevaks määramiseks vähe teavet.
Peamiste riskitegurite tuvastamine
Iga mudeli 22-st kõige olulisemast muutujast olid ainult 5 kõigi mudelite jaoks ühised (st kliiniline hinnang mälu, kognitiivsete võimete, käitumise, asjade juhtimise võime või motoorsete ja liikumiste muutuste kohta; jälje tegemise testi lõpuleviimise aeg B osa; CDR: orientatsioonihäired; CDR: kodu ja hobide häired; ja iseseisvuse tase). Ülejäänud muutujatest oli 1 0 paari, mille korrelatsioon oli suurem kui 0,7, mis näitab, et tegemist on sarnaste muutujatega (lisa e-tabel 3). Arvestades seda korrelatsiooni tugevas korrelatsioonis olevate muutujate vahetamisega, leidsime, et oli 6 väga ennustavat muutujat (kliiniline hinnang languse kohta, aeg jälje tegemise testi B osa täitmiseks, CDR-i 3 komponenti [orientatsioon, mälu ning kodu ja hobid kahjustus] ja sõltumatuse tase), mis olid ühised kõikidele ML-mudelitele (lisa e-tabel 4). Koolitades iga mudelit ainult nende muutujate abil, leidsime, et LR ja XGB puhul ei olnud diagnostiline jõudlus oluliselt vähenenud: seda 6 muutujast koosnevat põhikomplekti kasutades oli nende mudelite keskmine (SD) täpsus 91 protsenti (0 protsenti ) LR puhul ja 91 protsenti (1 protsent ) XGB puhul ning keskmine (SD) AUC 0,89 (0.01) LR ja 0,89 (0,02) XGB puhul (e-tabel 5 lisas).
Diagnostiline stabiilsus
1568 osalejast, kellel diagnoositi 2 aasta jooksul dementsuse diagnoos, tuvastasime 130 (8 protsenti) taastumist, kellel diagnoositi tõenäoliselt algselt valesti ja seetõttu märgistati nad ML-i eesmärgil valesti. Leidsime, et kuigi pöördumistest teatati ainult 0,8 protsendil osalejatest, moodustasid need 92–109 osalejat (7 protsenti -8 protsenti) valesti klassifitseeritud osalejatest, kusjuures mudelite vahel oli väike erinevus (tabel 3). RF-mudelil oli kõrgeim diagnostiline stabiilsus, tuvastades õigesti 109 130-st taastunud osalejast (84 protsenti), klassifitseerides nad kahe aasta pärast prognoositavalt dementsusevabaks. ML-mudelite diagnostilise stabiilsuse uurimiseks eemaldasime osalejad koolituse ajal tagasikäiguga (e-meetodid lisas). Pärast mudelite ümberõpet ilma reversioonideta leidsime, et RF tuvastas 106 osalejat, kes kogesid reversioone (mediaan [IQR], 82 protsenti [78 protsenti -82 protsenti ]), SVM tuvastas 93 osalejat, kes kogesid reversioone (mediaan [IQR], 72 protsenti [69 protsenti -74 protsenti ]) ning LR ja XGB tuvastasid mõlemad 92 osalejat, kes kogesid taastumist (mediaan [IQR], 71 protsenti [68 protsenti -75 protsenti ]). IQR-id saadi reversiooni kogenud osalejate alglaadimisega.

Et mõista erinevust valesti klassifitseeritud osalejate, reversiooniga osalejate ja osalejate vahel, kellel tekkis dementsus ilma taastumiseta, analüüsisime iga ML-mudeli klassifikatsiooniskooride CDF-e. Leidsime, et valesti klassifitseeritud osalejate ja konkreetsete pöördumisega osalejate hinded erinesid osalejatest, kellel tekkis dementsus, ja nendest, kellel seda ei tekkinud (e. Lisa joonis 3). Osalejate klassifikatsiooniskooride CDF-id, kellel ei tekkinud dementsust, langesid iga graafiku vasakpoolsesse serva, mis näitab, et ML-mudelid määrasid neile osalejatele väikese dementsuse tekke tõenäosuse. Seevastu osalejate puhul, kellel tekkis dementsus, langesid CDF-id graafikutest paremale: neile määrati suur tõenäosus dementsuse tekkeks. Kõigi mudelite puhul langes reversiooniga osalejate skooride jaotus vasakule nende osalejate omast, kellel tekkis dementsus, mis tähendab, et nende mudelite kohaselt hinnati dementsusega osalejatel väiksema tõenäosusega dementsust.
Arutelu
Selles prognostilises uuringus oli ML-algoritmidel parem prognostiline täpsus võrreldes BDSI ja CAIDE-ga, et ennustada dementsuse esinemissagedust 2 aasta jooksul pärast patsiendi esimest mälukliiniku hindamist. Kahe ML-algoritmi puhul hinnati 91-protsendilist täpsust ja 0,89 AUC-d ainult 6 võtmemuutujaga. Tundlikkusanalüüsid näitavad, et ML-mudelid suudavad õigesti klassifitseerida suure osa osalejatest, kes kogesid taastumist ja kes said potentsiaalselt valesti diagnoositud kahe aasta jooksul pärast esmast visiiti. Sellel uuringul on mitmeid tugevaid külgi, sealhulgas suur patsientide valim mitmest Ameerika Ühendriikide mälukliinikust, kasutatud ML-i tehnikate lai valik, olemasolevate riskimudelite võrdlus ning diagnostilise stabiilsuse ja tõenäolise valediagnoosi uurimine.
Varasemad uuringud ML kasutamise kohta dementsuse riski ennustamiseks on keskendunud häireteta kognitsiooni muutumisele Alzheimeri dementsuseks või MCI-ks,6,8 või MCI-lt Alzheimeri dementsuseks.5 Need lähenemisviisid on kliinilises keskkonnas vähem kasulikud, kuna need välistavad. muud tüüpi dementsus5,6,8 või patsiendid, kellel on algselt kognitiivsed häired.5 Nendes uuringutes kasutatud andmed hõlmasid positronemissioontomograafia skaneeringuid5,8 ja tserebrospinaalvedeliku biomarkereid,8 millest mälukliinikus tavaliselt ei ole. Lini jt uuring6 sai sellest üle, kasutades NACC andmeid, et leida 15 mitteinvasiivset kliinilist muutujat, et hinnata 4--aastase perioodi jooksul kahjustamata tunnetusest MCI-le ülemineku riski. Siiski on MCI konstruktsioon endiselt mõnevõrra vastuoluline32 ning MCI ja dementsuse vahelised konversioonimäärad on sageli madalad.32,33 Meie ML-mudelid täiendavad neid analüüse ja nende eeliseks on see, et nad hõlmavad kliiniliselt olulise ajakava jooksul ainult 6 peamist muutujat ja ennustavad mis tahes põhjusega dementsuse tulemus.
Meie uuringus uuritud olemasolevatest mudelitest oli CAIDE mudel kõige vähem täpne dementsuse riski ennustamisel kahe aasta jooksul, mis pole üllatav, kuna see töötati välja keskealiste täiskasvanute pikaajalise dementsuse riski ennustamiseks palju pikemaks ajaks. jälgimisperiood 20 aastat. BDSI toimis paremini kui CAIDE, mis näitab tõenäoliselt, et see oli mõeldud kasutamiseks vanematel täiskasvanutel mõõdukama 6-aastase jälgimisperioodi jooksul. Kuid kõik ML-mudelid ületasid olemasolevaid mudeleid. Kasutades kõiki muutujaid, oli XGB kõige võimsam ML-lähenemine patsientide ennustamiseks, kellel diagnoositi tõenäoliselt kahe aasta jooksul dementsus, mis viitab sellele, et viis, kuidas uusi otsustuspuid koolitatakse parandama viimase kolme vigu, annab tulemuseks marginaalse jõudluse. kasu. Kuid XGB näis olevat ka kõige vähem suuteline tuvastama osalejaid, kes kogesid taastumist, st neid, kellel algselt diagnoositi dementsus kahe aasta jooksul ja kelle diagnoos tühistati kahe aasta jooksul pärast esialgset diagnoosi.
ML-mudelite jõudlust saab oluliselt vähendada valesti märgistatud treeningandmetega.34 Vastupidiselt ei paranda valesti märgistatud treeningandmete väljajätmine alati jõudlust.35 Kui treeningandmetes sisalduv müratase suureneb, väheneb selle müra välistamise või vähendamise väärtus, kui sama müra on ka valideerimisandmetes.36 Seega võib treeningandmete filtreerimine isegi vähendada jõudluse kehtetuks tunnistamise andmeid, nagu leiti selles uuringus. Kui aga valesti märgistamise tase on alla umbes 20–40 protsenti, võib valesti märgistatud andmete eemaldamine parandada valideerimisandmete täpsust, isegi kui need sisaldavad valesti märgistatud andmeid.35,37,38 See illustreerib diagnostilise stabiilsuse uurimise tähtsust koolitusel ja koolitusel. valideerimisandmed: isegi kriteeriumi standardandmed sisaldavad vigu.
Täheldatud taastumismäär (8 protsenti) oli sarnane 2019. aasta uuringuga, mis põhines erinevatel USA populatsioonidel.31 Meie uuringus leiti, et valepositiivsete protsent varieerub 7–19 protsendini, olenevalt kognitiivsest seisundist. kasutatud hinnangut. Meile teadaolevalt on see esimene võimaliku valediagnoosi analüüs NACC UDS-is ja viitab sellele, et ML-i kasutamine kliinilise otsustusabivahendina võib vähendada valepositiivsete valediagnoosimist kuni 84 protsenti. Arvestades, et patsiendid, kes kogevad taastumist, on kliinilisest vaatenurgast diagnostilises mõttes piiripealsed, võib olla mõistlik neid siiski jälgida, kuna kliiniliseks mureks on olnud põhjust. Seega võib XGB olla parim mudel kliiniliste otsuste tegemise abistamiseks. Alternatiivina võib veelgi kasulikumaks osutuda ansamblipõhine lähenemine, mis teeb sekundaarsed prognoosid tõenäolise diagnostilise stabiilsuse ja valesti klassifitseerimise võimalikkuse kohta.
Piirangud
Sellel uuringul on mitmeid piiranguid. Esiteks töötati välja nii CAIDE kui ka BDSI, kasutades selles uuringus kasutatud populatsioone. Kõigil nende mudelite väljatöötamiseks kasutatud muutujatel ei olnud UDS-is täpset ekvivalenti, mis võis mõjutada nende toimivust selles andmekogumis. Teiseks võib andmete imputeerimiseks kasutatav meetod põhjustada imputeerimisviga. Täpsemalt, imputatsioon asendab kõik puuduvad väärtused arvväärtusega, kuid mõned väärtused puuduvad nende seose tõttu mõne teise väärtusega; seetõttu on väärtuse puudumise fakt informatiivne. Kuigi osalejatel puudusid andmed keskmiselt 14 protsenti, puudusid kuus tuvastatud peamist muutujat keskmiselt 1 protsendil osalejatest. Kolmandaks, kuigi meie uuringus kasutati suurt valimit Ameerika Ühendriikide mälukliinikus osalejatest, muutes meie tulemused selle seade jaoks väga kasutatavaks, pole teada, mil määral need tulemused üldistavad teistele populatsioonidele.
Järeldused
Selles prognostilises uuringus leiti, et ML-mudelid ületasid olemasolevaid dementsuse riski prognoosimise mudeleid ja neil võib olla potentsiaali parandada mälukliinikutes kahe aasta jooksul juhtunud dementsuse prognoosi. Kuus selles uuringus tuvastatud dementsuse riski peamist tegurit võivad parandada mälukliinikute kliinilist praktikat, kui need kaasatakse tulevaste kliiniliste otsuste tegemise abivahenditesse.
VIITED
1. Hejl A, Høgh P, Waldemar G. Potentsiaalselt pöörduvad seisundid 1000 järjestikusel mälukliiniku patsiendil. J Neurol Neurosurg Psychiatry.
2. Mitchell AJ, Shiri-Feshki M. Kerge kognitiivse kahjustuse progresseerumise määr dementsuseks – 41 tugeva algkohortuuringu metaanalüüs. Acta Psychiatr Scand. 2009;119(4):252-265.
3. Barnes DE, Beiser AS, Lee A jt. Esmatasandi dementsuse sõeluuringu indikaatori väljatöötamine ja valideerimine. Alzheimeri dementsus. 2014;10(6):656-665.e1. doi:10.1016/j.jalz.2013.11.006
4. Kivipelto M, Ngandu T, Laatikainen T, Winblad B, Soininen H, Tuomilehto J. Risk score for the ennustada dementia riski 20 aasta jooksul keskealiste inimeste seas: longitudinal, population-based study. Lancet Neurol. 2006;5(9):735-741. doi:10.1016/S1474-4422(06)70537-3
5. Cui Y, Liu B, Luo S jt; Alzheimeri tõve neuroimaging algatus. Kergest kognitiivsest kahjustusest Alzheimeri tõveks muutumise tuvastamine mitme muutujaga ennustajate abil. PLoS One.
6. Lin M, Gong P, Yang T, Ye J, Albin RL, Dodge HH. Suurandmete analüütilised lähenemisviisid NACC andmekogumile: prekliinilise uuringu rikastamise abistamine. Alzheimeri tõve assotsiatsiooni häire. 2018;32(1):18-27.
7. Park JH, Cho HE, Kim JH jt. Masinõppe ennustus Alzheimeri tõve esinemissageduse kohta, kasutades suuremahulisi administratiivseid terviseandmeid. NPJ Digit Med. 2020;3(1):46.
8. Zhan Y, Chen K, Wu X jt; Alzheimeri tõve neuroimaging algatus. Normaalse eaka tunnetuse konversiooni tuvastamine Alzheimeri tõveks, kasutades multimodaalset tugivektori masinat. J Alzheimers Dis. 2015; 47(4):1057-1067.
9. Burgos N, Colliot O. Masinõpe ajuhaiguste klassifitseerimiseks ja prognoosimiseks: hiljutised edusammud ja tulevased väljakutsed. Curr Opin Neurol. 2020;33(4):439-450.
10. Beekly DL, Ramos EM, Lee WW jt; NIA Alzheimeri tõve keskused. Riikliku Alzheimeri tõve koordineerimiskeskuse (NACC) andmebaas: ühtne andmekogum. Alzheimeri tõve assotsiatsiooni häire. 2007;21(3):249-258.
11. Riiklik vananemisinstituut. Alzheimeri tõve uurimiskeskused. Kasutatud 21. mail 2021.
12. Pfeffer RI, Kurosaki TT, Harrah CH Jr, Chance JM, Filos S. Funktsionaalsete tegevuste mõõtmine vanematel täiskasvanutel kogukonnas. J Gerontol. 1982;37(3):323-329.
13. Kaufer DI, Cummings JL, Ketchel P, et al. NPI-Q, neuropsühhiaatrilise inventuuri lühikese kliinilise vormi, valideerimine. J Neuropsychiatry Clin Neurosci. 2000;12(2):233-239.
14. Weintraub S, Salmon D, Mercaldo N, et al. Alzheimeri tõve keskuste ühtne andmekogum (UDS): neuropsühholoogilise testi aku. Alzheimeri tõve assotsiatsiooni häire. 2009;23(2):91-101.
15. Morris JC, Weintraub S, Chui HC, et al. Ühtne andmekogum (UDS): kliinilised ja kognitiivsed muutujad ning kirjeldavad andmed Alzheimeri tõvekeskustest. Alzheimeri tõve assotsiatsiooni häire. 2006;20(4):210-216.
16. McKhann G, Drachman D, Folstein M, Katzman R, Price D, Stadlan EM. Alzheimeri tõve kliiniline diagnoos: NINCDS-ADRDA töörühma aruanne tervishoiu ja inimteenuste osakonna Alzheimeri tõve töörühma egiidi all. Neuroloogia. 1984;34(7):939-944.
17. Román GC, Tatemichi TK, Erkinjuntti T jt. Vaskulaarne dementsus: teadusuuringute diagnostilised kriteeriumid: NINDS-AIRENi rahvusvahelise töötoa aruanne. Neuroloogia. 1993;43(2):250-260.
18. McKeith IG, Dickson DW, Lowe J jt; DLB konsortsium. Dementsuse diagnoosimine ja juhtimine Lewy kehadega: DLB konsortsiumi kolmas aruanne. Neuroloogia.
19. Neary D, Snowden JS, Gustafson L jt. Frontotemporaalne lobari degeneratsioon: konsensus kliiniliste diagnostiliste kriteeriumide osas. Neuroloogia. 1998;51(6):1546-1554.
20. Martínez-Martín P, Gil-Nagel A, Gracia LM, Gómez JB, Martínez-Sarriés J, Bermejo F; Ühistuline Multitsentriline Grupp. Parkinsoni tõve ühtse hindamisskaala omadused ja struktuur. Mov Disord. 1994;9 (1):76-83.
21. Morris JC. Kliinilise dementsuse hinnang: usaldusväärne ja kehtiv Alzheimeri tüüpi dementsuse diagnostiline ja staadiumiline meede. Int Psychogeriatr. 1997;9(S1)(suppl 1):173-176.
22. Hastie T, Tibshirani R, Friedman J. Statistilise õppimise elemendid: andmekaeve, järeldused ja ennustamine. Springer Science & Business Media; 2009.
23. Hosmer Jr DW, Lemeshow S, Sturdivant RX. Rakenduslogistiline regressioon. John Wiley & Sons; 2013. aasta.
24. Cortes C, Vapnik V. Tugi-vektori võrgud. Mach Learn. 1995;20(3):273-97. doi:10.1007/BF00994018
25. Breiman L. Juhuslikud metsad. Mach Learn. 2001;45(1):5-32. doi:10.1023/A:1010933404324
26. Ho TK. Juhusliku otsusega metsad. In: 3. rahvusvahelise dokumendianalüüsi ja tunnustamise konverentsi materjalid. IEEE; 1995:278-282.
27. Friedman JH. Stohhastiline gradiendi suurendamine. Arvutuslik statistika andmete analüüs. 2002; 38(4):367-78.
28. Pedregosa F, Varoquaux G, Gramfort A jt, Scikit-learn: masinõpe Pythonis. J Mach Learn Res. 2011; 12:2825-2830.
29. Krzanowski WJ, Hand DJ. ROC kõverad pidevate andmete jaoks. CRC Press; 2009.
30. Fawcett, T. ROC analüüsi sissejuhatus. Mustri äratundmise Lett. 2006;27(8):861-874. doi:10.1016/j. Patric.2005.10.010
31. Ranson JM, Kuźma E, Hamilton W, Muniz-Terrera G, Langa KM, Llewellyn DJ. Dementsuse vale klassifitseerimise ennustajad lühikeste kognitiivsete hinnangute kasutamisel. Neurol Clini praktika. 2019;9(2):109-117.
32. Bruscoli M, Lovestone S. Kas MCI on tõesti ainult varajane dementsus: konversiooniuuringute süstemaatiline ülevaade. Int Psychogeriatr. 2004;16(2):129-140.
33. Farias ST, Mungas D, Reed BR, Harvey D, DeCarli C. Kerge kognitiivse kahjustuse progresseerumine dementsuseni kliinikus- vs kogukonnapõhistes kohortides. Arch Neurol. 2009;66(9):1151-1157.
34. Guan D, Yuan W, Ma T, Khattak AM, Chow F. Valesti märgistatud treeningandmete kulutundlik kõrvaldamine. Inf Sci. 2017; 402:170-81.
35. Brodley CE, Friedl MA. Valesti märgistatud treeningandmete tuvastamine.J Artif Intelligence Res.
36. Quinlan JR. Otsustuspuude esilekutsumine. Mach Learn. 1986;1(1):81-106.
37. Brodley CE, Friedl MA. Valesti märgistatud koolitusjuhtumite tuvastamine ja kõrvaldamine. In: AAAI '96: Kolmeteistkümnenda riikliku tehisintellekti konverentsi materjalid. AAAI; 1996:799-805.
38. Brodley CE, Friedl MA. Maakatte automaatse kaardistamise täiustamine, tuvastades ja kõrvaldades koolitusandmetest valesti märgistatud vaatlused. In: IGARSS '96: 1996 rahvusvaheline geoteaduse ja kaugseire sümpoosion. IEEE;1996:1379-1381.
