Köse, Serdal KenanDemir, Emre2023-12-262023-12-262019http://hdl.handle.net/20.500.12575/90049Randomizasyonun yapılamadığı gözlemsel araştırmalarda, tedavi ve kontrol grupları arasında araştırma öncesinde birçok ortak değişken veya faktöre göre farklılıklar bulunabilir. Gruplar araştırılan etken dışında diğer özellikler açısından homojen olmadığında saf tedavi etkisi kestirilemeyecek ve yanlı tahminlere ulaşılacaktır. Gözlemsel araştırmalarda tedavi etkisinin yansız tahminlerini elde etmek ve karıştırıcı (confounder) değişkenlerin etkisini gidermek için literatürde yaygın olarak Lojistik Regresyon (LR) ile hesaplanan Propensity skor (PS) tahminine dayalı eşleştirme analizi kullanılmaktadır. Bu çalışmada tedavi grupları ile ortak değişkenler arasında ana etkiler dışında etkileşim etkilerinin ve doğrusal olmayan ilişkilerin bulunduğu modellerde PS tahmini için klasik yöntem olan LR'ye alternatif olarak makine öğrenme yöntemleri (genelleştirilmiş boosted modeller, sınıflandırma ve regresyon ağaçları, destek vektör makineleri ve yapay sinir ağları vb.) ve bazı yaygın kullanılan yöntemlerin (bayesci genelleştirilmiş doğrusal modeller, kuadratik diskriminant analizi ve adımsal akaike bilgi kriteri vb.) başarısını benzetim çalışması ile değerlendirmek suretiyle yeni bir kombine tahminci model geliştirmek amaçlanmıştır. Bu amaçla gerçekleştirilen birinci benzetim çalışmasında sadece ana etkilerin bulunduğu modelde LR ile hesaplanan PS değerleri ile en uyumlu sonuç veren ilk üç algoritma 500 ve 1000 örneklem büyüklüğü için sırasıyla BAYESGLM, GLMNET ve GAM olarak bulunmuştur. Sadece temel etkilerin olduğu birinci benzetim senaryosunda LR ile rekabet edebilen ve etkileşim ve kuadratik ilişkilerin olduğu daha karmaşık ikinci ve üçüncü benzetim senaryosunda da LR'den daha başarılı olan 1000 örneklem büyüklüğünde KSVM, NNET, DBARTS, QDA, EARTH, STEPAIC ve 500 örneklem büyüklüğünde NNET, QDA, EARTH ve STEPAIC algoritmaları PS tahmininde üstün algoritmalar olarak belirlenmiştir. LR ile birlikte bu algoritmalar kullanılarak oluşturulan yeni kombine PS tahmin modelleri ile yapılan üç farklı benzetim senaryosu sonucunda model zorluluk derecesi arttıkça LR ile elde edilen tahminlerde yanlılık değerinin arttığı görülmüştür. Özellikle karmaşık modellerde kombine tahminci ile LR sonuçları arasında büyük yanlılık farkı bulunması kombine tahmincinin veya KSVM, NNET, DBARTS, QDA, EARTH ve STEPAIC algoritmalarının LR'ye alternatif veya daha başarılı algoritma olarak PS tahmininde kullanılabileceğini göstermiştir. Ayrıca gerçek veri ile yapılan uygulama sonuçları da tez hipotezini desteklemiştir. PS vaka ve kontrol grubundaki bireylerin sahip olduğu karıştırıcı değişken özelliklerine göre elde edilen bir özet istatistiktir. Bu yüzden vaka veya kontrol grubuna atanma olasılığı ile ortak değişkenler arasında doğrusal olmayan ilişkiler veya etkileşimlerin bulunduğu modellerde LR yöntemiyle PS hesaplanması durumunda yanlı tahminler elde edilmiş olacaktır. Elde ettiğimiz sonuçlara göre gözlemsel çalışmalarda LR'ye ek olarak başarılı bulunan ML algoritmaları veya diğer algoritmaların da PS hesaplanmasında kullanılarak denge değerlendirmesinin yapılması önerilebilir. Parametrik yöntemler (LR) deney gruplarına atanma olasılığı ile ortak değişkenler arasındaki ilişkinin fonksiyonel yapısı ile ilgili varsayımlar gerektirir. PS hesabı için modelin yanlış belirlenmesi tedavi etkisinin yanlı tahminlerine sebep olabilmektedir. Modelde sadece temel etkiler olduğunda LR ile dengeli eşleştirme analizi gerçekleştirilmekte ve buna dayalı olarak yansız tahminlere ulaşılmaktadır. Ancak tedavi veya kontrol grubuna atanma olasılığı ile ortak değişkenler/farktörler arasında etkileşim etkileri ve/veya kuadratik ilişkiler bulunan modeller için ML yöntemleri ve kombine tahminciler ile daha dengeli ve yansız tahminler elde edilmiştir. Bu çalışma sonucunda araştırmacılara bu modellerin denenmesi önerilmektedir. ML yöntemlerinde doğrusallık veya etkileşimler incelenmeden doğrudan ortak değişkenler seçilerek skorlar hesaplanabilmektedir. PS hesaplamak ve gruplar arası dengeyi değerlendirebilmek için son yıllarda kullanımı artmaya başlayan ML yaklaşımlarının gözlemsel çalışmaların güvenirliğini arttıracağı düşünülmektedir.trAlgoritmalarEşleştirmeMakine öğrenmesiRandomize olmayan klinik çalışmalarda en uygun eşleştirme analizi için makine öğrenme algoritmaları ile yeni propensity skor tahmin modellerinin geliştirilmesiDevelopment of new propensity score estimation models with machine learning algorithms for optimal matching analysis in non-randomized clinical trialsdoctoralThesis