PDF (орыс тілі)

Кілт сөздер

машиналық оқыту, биоинформатика, мутациялардың патогендігі, Apache Spark, Random Forest, генетикалық нұсқаларды жіктеу, ClinVar, жекелендірілген медицина.

Дәйексөзді қалай келтіруге болады

Мутация патогендігін болжауға арналған ML жүйесін жобалау. (2025). SMART TECHNOLOGIES JOURNAL, 1(8). https://doi.org/10.62687/STJ.8.1.2025.6

Аңдатпа

Мақалада ClinVar клиникалық деректері негізінде генетикалық нұсқалардың патогендігін автоматты түрде жіктеуге арналған үлестірілген машиналық оқыту жүйесін жобалау ұсынылған. Өзектілігі клиникалық практикада жаңа буын секвенирлеу нәтижелерін интерпретациялауды жылдамдату қажеттілігімен анықталады, мұнда жүз мыңдаған нұсқаларды қолмен талдау генетиктердің апталап жұмысын алады.

Apache Spark MLlib технологиясы мен ансамбльдік оқыту әдістерін қолдана отырып, генетикалық деректердің үлкен көлемін өңдеуге арналған архитектуралық шешімдер зерттеледі. Биомедициналық деректер базаларын жүйелік талдау, категориялық генетикалық белгілер үшін feature engineering, кросс-валидация және жіктеу алгоритмдерін салыстырмалы талдау әдістері қолданылды.

Үш кезеңді әдістеме жасалды: clinical significance қалыпқа келтірумен және категориялаумен деректерді дайындау, StringIndexer және OneHotEncoder пайдаланумен feature engineering, Grid Search арқылы гиперпараметрлерді оңтайландырумен үш модельді (Logistic Regression, Random Forest, Gradient Boosted Trees) оқыту. Патогендік ықтималдықтары негізінде нұсқаларды бес деңгейлі басымдықпен (CRITICAL/HIGH/MEDIUM/LOW/MINIMAL) ұсыну жүйесі жобаланды.

Нәтижелерге 1млн+ жазбаларды өңдеуге арналған масштабталатын архитектура және клиникалық ұсынымдарды автоматты түрде жасау модулі кіреді.

 

PDF (орыс тілі)