학술논문

Miyeloproliferatif Hastalık Ön Tanılı Hastalarda Makine Öğrenmesi Yöntemi ile Genetik Test Seçimine İlişkin Metodolojik Bir Modelleme Çalışması.
Document Type
Article
Source
Turkiye Klinikleri Journal of Biostatistics. 2022, Vol. 14 Issue 1, p45-54. 10p.
Subject
*FISHER discriminant analysis
*MEDICAL genetics
*SUPPORT vector machines
*MACHINE learning
*K-nearest neighbor classification
*NAIVE Bayes classification
*DECISION trees
*BLOOD cell count
Language
Turkish
ISSN
1308-7894
Abstract
Amaç: Miyeloproliferatif hastalıkların tanısının konulabilmesi için Dünya Sağlık Örgütünün belirlediği hastalık tanı şeması doğrultusunda, klinisyen tarafından genetik mutasyonların varlığı incelenmektedir. Bu çalışmada; kliniğe başvuru yapmış hastaların kemik iliği ve tam kan sayımı bulgularından yola çıkılarak oluşturulabilecek model ile uygun tanı testinin tahmin edilebilmesi hedeflenmiştir. Bu doğrultuda, kliniğe başvuran hastaların zaman ve maddi açıdan tasarruf etmesi amaçlanmaktadır. Gereç ve Yöntemler: Başkent Üniversitesi Ankara Hastanesi Tıbbi Genetik Ana Bilim Dalı Genetik Hastalıklar Değerlendirme Merkezine yönlendirilmiş hastaların bulguları ele alınarak, makine öğrenmesi algoritmaları kullanılarak tahminleme yapılmıştır. Çalışma verilerine ait tanımlayıcı istatistikler medyan olarak verilmiş olup, Kruskal-Wallis test istatistiği kullanılarak istatistiksel olarak anlamlı farklılıklar araştırılmıştır. Tahminlemede Naive Bayes, K-En Yakın Komşuluk, Doğrusal Diskriminant Analizi, Destek Vektör Makineleri, Entropi Tabanlı Sınıflandırma ve Karar Ağacı gibi sınıflandırma algoritmaları kullanılmıştır. Algoritmalar ile doğruluk, özgüllük, duyarlılık gibi belirleyici değerler elde edilmiştir. Yapılan tahminlemeler elde edilen doğruluk oranlarına göre incelenmiş ve en iyi model seçilmeye çalışılmıştır. Bulgular: İncelenen tam kan sayım değerleri ile mutasyon varlığı arasında istatistiksel olarak anlamlı farklılıklar tespit edilmiştir. Ele alınan Naive Bayes, K-En Yakın Komşuluk, Doğrusal Diskriminant Analizi, Destek Vektör Makineleri, Entropi Tabanlı Sınıflandırma ve Karar Ağacı Algoritmaları ile oluşturulan modellemelerde doğruluk oranları %60 olarak saptanmıştır. Sonuç: Kullanılan makine öğrenmesi algoritmalarından elde edilen doğruluk oranı orta seviyede olmasına rağmen benzer çalışmaların literatürde yer almamış olması sebebiyle çalışma sonuçlarının alana önemli katkısının olacağı sonucuna varılmıştır. [ABSTRACT FROM AUTHOR]