Microsoft Word – süvaõpe vs traditsioonilised mudelid_Abdel Hai_finaal.2. osa
Jan 03, 2024
Andmete ettevalmistamiseks masinõppemudelite jaoks viidi läbi järgmised andmete eeltöötlustehnikad.
Andmed ja mälu on omavahel tihedalt seotud. Kaasaegses ühiskonnas saame iga päev suure hulga teavet ja andmeid, sealhulgas teksti, pilte, videoid jne. Nende andmete tõhus töötlemine ja korrastamine nõuab meilt tugevat mälu.
Ühest küljest võivad andmed anda meile mälutuge. Näiteks kui me õpime uusi teadmisi, saame asjakohaseid andmeid ja fakte meelde jättes kiiremini ja paremini teadmistepunkte mõista ja omandada. Selline õppemeetod võib aidata meil luua tugevat mälu ja säilitada oskust teadmisi pikka aega kontrollida.
Teisest küljest võivad andmed aidata meil ka treenida ja mälu parandada. Läbi erinevate mälutreeningu meetodite saame paindlikult kasutada andmeid mälutreeningu läbiviimiseks, tõsta teatud määral oma mäluvõimet ning seeläbi paremini kohaneda ühiskonna arengu ning töö- ja eluvajadustega.
On näha, et andmete ja mälu suhe on väga tihe ja oluline. Ainult andmete aktiivse ja tõhusa töötlemise ja kasutamisega saame paremini kasutada oma mäluvõimalusi ja saavutada paremaid tulemusi. Seetõttu peaksime aktiivselt käsitlema andmete ja mälu seost, tegema vastavaid koolitusi ja rakendusi ning pidevalt oma võimeid täiendama. On näha, et peame parandama mälu ja Cistanche deserticola võib oluliselt parandada mälu, sest Cistanche deserticola suudab reguleerida ka neurotransmitterite tasakaalu, näiteks tõsta atsetüülkoliini ja kasvufaktorite taset. Need ained on mälu ja õppimise jaoks väga olulised. Lisaks võib liha parandada ka verevoolu ja soodustada hapniku kohaletoimetamist, mis tagab aju piisava toitainete ja energia kättesaamise, parandades seeläbi aju elujõudu ja vastupidavust.

Klõpsake teada, kuidas ajufunktsiooni parandada
Kategoorilised tunnused olid üks kuumalt kodeeritud; Pidevad ja diskreetsed tunnused normaliseeriti min-maxnormaliseerimismeetodite abil,32 määratleti järgmiselt:
![]()
Igas kohtumises oli iga järgmise funktsiooni jaoks erinev arv salvestusi. Seega arvutati selle asemel järgmised statistilised väärtused. Diastoolse ja süstoolse vererõhu jaoks arvutasime miinimum-, maksimum- ja keskmised väärtused.
KMI jaoks kasutati miinimumi, maksimumi, keskmist ja dispersioonikoefitsienti. Need statistilised väärtused normaliseeriti ja kasutati tunnustena. Veelgi enam, funktsioonide arv erines kohtumistel laboratoorsete testide, diagnooside ja protseduuride erineva arvu tõttu. Kokkupuutel võib olla mitu diagnoosi ja/või protseduurikoode või mitte ühtegi.
Selle parandamiseks ja tunnusvektorite mõõtmete ühtlustamiseks kasutati mudelite õppimise parandamiseks järgmisi andmeesitusmeetodeid. Diagnostika- ja protseduurikoodide jaoks kasutasime ühekuulise kodeeringu esitust, kus iga väärtus määrati väärtusele 0 või 1, mis näitab, kas diagnoosi/protseduuri kood oli iga kohtumise jaoks olemas või mitte. Muutsime seda andmete esitamise tehnikat veidi laborikatsete jaoks, kuna igal katsel oli seotud tulemus.
Seetõttu asendasime 1, mis näitas koodi olemasolu, laboratoorse tulemusega. Laboratoorsed tulemused normaliseeriti võrrandi 1 abil. Kuna tulemused olid erinevate ühikute ja mõõtude kaupa, siis laboritulemuste normaliseerimisel arvestasime iga laborikoodi miinimumi ja maksimumiga eraldi. See meetod lõi paljude ainulaadsete koodide tõttu suuremõõtmelise hõreda massiivi.
Seejärel kasutasime manustamise ja vähendatud mõõtmete õppimiseks Singular Value Decomposition (SVD) algoritmi. SVD-d kasutati, kuna see ei kasuta sisendina ruutmaatriksit ja sobib paremini hõredate andmete jaoks.33 Laboratoorsed testid vähendati 50 komponendini, protseduur koodid vähendati 45 komponendini ja diagnoosikoodid vähendati 25 komponendini.
Dimensioonide vähendamiseks optimaalse komponentide arvu määramiseks uuriti erinevaid komponente ja vaadeldi dispersioonisuhte summat. Kõik funktsioonid ühendati iga kohtumise funktsioonivektoriga. SVD-d rakendati mõõtmete vähendamiseks ja ühtlustamiseks igal kohtumisel eraldi; kohtumiste dimensiooni vähendati 50 funktsioonini kohtumise kohta.

Seejärel ühendasime kõik antud patsiendi kohtumised tunnusvektorisse, mis oli järjestatud vastuvõtukuupäeva järgi. Klasside jaotus oli 27 511 tagasivõtmiseta patsienti (negatiivne klass) ja 9 130 patsienti, kes võeti tagasi (positiivne klass).
Eksperimentaalsed lähenemisviisid
Viisime läbi ulatuslikud katsed, kasutades EHR andmeid, et saavutada järgmised eesmärgid:
- Ennustage, kas diabeediga patsiendid võetakse tagasi 30 päeva jooksul
- Võrrelge kasutatud DL-meetodite jõudlust mitme traditsioonilise mudeliga
- Analüüsige, kui palju varasemaid kohtumisi (st ajaloolisi andmeid) kahe aasta jooksul on tagasivõtmise ennustamiseks optimaalne
- Hinnake kõigi laboratoorsete testide andmetesse lisamise mõju võrreldes valdkonnaeksperdi valitud testide alamhulgast õppimisega.
Selles uuringus kasutavad DL-mudelid sisendiks 3-3-mõõtmetensorit � x � x �, et esindada f omadust iga p patsiendi kohtumise kohta. Seevastu traditsioonilistes mudelites esitatakse andmed tavaliselt 2-dimensioonimaatriksina, kus kõigi kohtumiste kõik tunnused vastavad üksikule patsiendile, mis on ühendatud pika tunnusvektoriga.
Iga kohtumise mõõtmeid vähendati ja ühendati 50 tunnuseni, seega on süvamudelis � suurus 50. Algses mudelis koosneb tunnusvektor kõigist kohtumistest ja seetõttu on selle suurus � x 50.
Patsientidel on erinev arv kohtumisi, mille tulemuseks on ebaühtlased mõõtmed; seetõttu on funktsioonivektorid polsterdatud 0-ga, et saavutada ühtne vorm. Andmete esitus, mida kasutatakse DL-i ja traditsiooniliste mudelite sisendina, on illustreeritud vastavalt joonise 1 vasakul ja paremal paneelil.
Heterogeensete järjestikuste andmete modelleerimiseks töötasime välja kaks DL-mudelite varianti ja võrdlesime mõlemat mitme traditsioonilise mudeliga, mida kasutati lähtejoontena. Meie uuringus kasutatud DL-mudelid olid: 1) 1-viis pika lühiajalise mälu (LSTM) võrgud, mis on korduva närvivõrgu (RNN) variant, mis on võimeline õppima järjestusest sõltuvaid järjestikulisi andmeid32; ja 2) kahesuunaline korduv üksus (GRU), mis on teine RNN-i variant.
Traditsioonilised baasmudelid olid järgmised: 1) Random Forest (RF), klassifitseerimise ja regressiooni kogumeetod; koolituse ajal konstrueerib see mitu otsustuspuud;30 RF saavutab sageli meditsiinilisi andmeid kasutades olemasoleva kirjanduse tipptasemel jõudluse prognooside kohta. 2) Multi-layer Perceptron (MLP), lihtne närvivõrgu mudel, mis ei võta arvesse ajalist teavet.
MLP koosneb mitmest pertseptroni kihist, teostab tagasilevitavat õppimist ja kasutab mittelineaarset aktiveerimisfunktsiooni.31 3) Logistic Regression (LR), tõlgendatav mudel, mida kasutatakse sageli olemasolevas tagasivõtuprognooside kirjanduses ja mida rakendatakse meditsiiniandmetele; ja 4) AdaBoost, mis on vähem altid ülepaigutamisele, kuna selle sisendparameetrid ei ole ühiselt optimeeritud.

DL-mudelid rakendati "Keras" Pythoni teekide abil, mis on "TensorFlow" kõrgetasemeline API. "Scikit-learn" raamatukogu kasutati traditsiooniliste mudelite rakendamiseks Pythonis.
Pakutud mudeli LSTM arhitektuur koosneb 128 neuronist, järjestikusest kihist, ümberkujundamise kihist, mida kasutati sisendi ümberkujundamiseks 3-mõõtmeliseks tensoriks, ja maskeerimiskihti maski väärtusega 0 kasutatakse ajasammude vahelejätmiseks, mille kohta andmed puudusid.
Kuna mõõtmete ühendamiseks tehti polsterdus 0-ga, kasutati maskeerimiskihti, et vältida puuduvate väärtustega arvutamist kõigis maskeerimiskihile järgnevates kihtides, seega ei võetud õppimise ajal puuduvaid väärtusi arvesse.
Lisaks lisati varjatud ja väljundkihtide vahele väljalangevus. Selle tehnika kasutamine teatud protsendi juhuslikuks valimiseks, mida langetada, on tavaline reguleerimistehnika, mis aitab mudelil õppida andmete üldisi mustreid.
RNN on närvivõrkude variant, mis koosneb peidetud neuronitest, mis on võimelised analüüsima ajalisi EHR-andmeid.32 RNN-il on sama struktuur kui põhinärvivõrgul, kuid samas kihis olevad neuronid on ühendatud, võimaldades neuronil õppida samast võrgustikust. naaberkihte, lisaks eelmiste kihtide väljunditest ja sisendandmetest õppimisele. Seega sisaldavad RNN-i neuronid kahte sisendiallikat, olevikku ja lähiminevikku. Õppimisprotsess on määratletud järgmiselt:

Peidetud neuroni väärtuse � arvutamiseks � rakendatakse selle vasaku peidetud neuroni kaalutud �väärtusele �"#$ ja selle sisendi kaalutud � väärtusele �" mittelineaarset teisendusfunktsiooni ReLU.
Prognoosid arvutatakse, kasutades asigmoidfunktsiooni kaalutud � kõigi peidetud neuronite summa, millele on lisatud kallutatus�. RNN-i puuduseks on see, et see kannatab kaduva gradiendi probleemi all, mis tähendab, et kaalud jäävad muutumatuks, mistõttu mudelil on raske ühtlustada, mistõttu mudelil on raske õppida.
Selle lahendamiseks võeti kasutusele LSTM kiht, milles RNN-i sigmoidneuronid asendatakse keerukama lühiajalise mälu struktuuriga. LSTM jagab samu ülekihte, mis vähendab võrgu arvutatavate parameetrite arvu.

GRU on alternatiivne lahendus gradiendiprobleemi kaotamiseks. See asendab lihtsa neuroni lukustatud üksusega, millel on vähem parameetreid kui LSTM-i neuronitel, kuna sellel puudub väljundvärav.33
For more information:1950477648nn@gmail.com






