Sağkalım analizi için derin öğrenme yaklaşımı
dc.contributor.advisor | Elhan, Atilla Halil | |
dc.contributor.advisor | Coşgun, Erdal | |
dc.contributor.author | Kar, İrem | |
dc.contributor.department | Biyoistatistik | tr_TR |
dc.date.accessioned | 2024-01-03T11:33:04Z | |
dc.date.available | 2024-01-03T11:33:04Z | |
dc.date.issued | 2021 | |
dc.description.abstract | Tıp alanında sıklıkla kullanılan sağkalım analizi, ilgilenilen sonuç değişkeninin; olayın gerçekleştiği ana kadar geçen süre olduğu veriler için kullanılan istatistiksel yöntemlerin bütünüdür. Sağlık alanında, veri kümelerinin boyutunun artması ve derin öğrenmenin yaygınlaşması ile birlikte, sağkalım analizinde makine öğreniminin kullanımına olan ilgi artmaktadır. Son zamanlarda, derin öğrenme yöntemleri, çeşitli uygulama alanlarında sağkalım analizi problemlerini çözme konusunda büyük ilgi görmüştür. Bu çalışmada sağkalım analizine derin öğrenme tabanlı bir yaklaşım olan DeepSurv uygulanmış ve sonuçlar makine öğrenmesi yöntemlerinden RSF ve klasik istatistiksel yöntemlerden Cox regresyon ile karşılaştırılmıştır. Bu amaçla, türetilmiş veri setleri kullanılarak bir benzetim çalışması gerçekleştirilmiştir. Bu kapsamda örneklem büyüklüğü, sağkalım süresi, bağımsız değişken sayısı, sansür oranının çeşitli düzeylerinin ele alındığı ve bağımsız değişkenlere ilişkin katsayıların tekdüze dağılımdan türetildiği toplam 60 senaryo oluşturulmuştur. Oluşturulan her senaryo ise 100 kez tekrarlanmıştır. Belirlenen senaryolara ek olarak, bağımsız değişken katsayılarına ilişkin ön belirlemenin yapılmadığı, R programlama dilindeki "coxed" paketindeki mevcut haliyle bırakıldığı 60 ayrı senaryo daha oluşturulmuştur. Ayrıca, bu çalışmada evre I akciğer adenokarsinomu veri seti kullanılarak da DeepSurv, RSF ve Cox regresyon yönteminin karşılaştırılması yapılmıştır. Yöntemlerin karşılaştırılmasında Harrell'in C-indeks değeri kullanılmıştır. Verilerin türetilmesi, RSF ve Cox regresyon yöntemlerinin uygulanması R programlama dili (ver. 3.6.3) ile gerçekleştirilmiştir. Derin öğrenmeye ilişkin analizler ise Python programlama dilinde gerçekleştirilmiştir. Yapılan benzetim çalışması sonucunda, bağımsız değişken katsayılarının tekdüze dağılımdan türetildiği senaryolarda tüm yöntemlerin tahminleme başarısı yüksek bulunmuştur. Örneklem büyüklüğü arttıkça yöntemlerin performansı artmıştır. Sansür oranının artması DeepSurv ve RSF yöntemlerinin tahminleme başarısını azaltmıştır. Bağımsız değişken katsayılarının paketteki mevcut haliyle kullanılıp normal dağılımdan türetildiği durumda ise üç yöntem sonucunda da 0,50-0,60 civarında bir C-indeks değeri elde edilmiştir. Gerçek veri setinde yapılan analizler sonucunda ise DeepSurv, RSF ve Cox regresyon yöntemleri benzer sonuçlar vermiştir. | tr_TR |
dc.description.ozet | Time to event analysis is used often within medical research. Generally, survival analysis is a collection of statistical procedures for data analysis for which the outcome variable of interest is time until an event occurs. In the healthcare field, with the increasing size of datasets and the popularity of deep learning, interest in the use of machine learning in survival analysis has increased. Recently, deep learning methods have received great interest in solving survival analysis problems in various application areas. In this study, DeepSurv, a deep learning-based approach, was applied to survival analysis and the results were compared with RSF from machine learning methods and Cox regression from classical statistical methods. For this purpose, a simulation study has been carried out using simulated data sets. In this context, a total of 60 scenarios were designed, in which various levels of sample size, survival time, number of independent variables and the probability of censored data were discussed and the coefficients of the independent variables were simulated from the uniform distribution. Each scenario was repeated 100 times. In addition to these scenarios, 60 different scenarios were created in which the coefficients of independent variables were used with the default in "coxed" package in R programming language. In addition, a comparison of DeepSurv, RSF and Cox regression methods was made using the stage I lung adenocarcinoma dataset in this study. Harrell's C-index value was used to compare the methods. The data simulation, RSF and Cox regression methods were performed with the R programming language (ver. 3.6.3). Analysis of deep learning was carried out in the Python programming language. As a result of the simulation study, the performance of all methods was found to be high in scenarios where the coefficients of independent variables are simulated from the uniform distribution. As the sample size increased, the performance of the methods increased. The increase in the probability of censored data decreased the prediction success of DeepSurv and RSF methods. In the case where the independent variable coefficients are used as null, the C-index value of around 0.50-0.60 was obtained as a result of all three methods. According to the analyzes made on the real data set, the results of DeepSurv, RSF and Cox regression methods are similar. | tr_TR |
dc.identifier.uri | http://hdl.handle.net/20.500.12575/90220 | |
dc.language.iso | tr | tr_TR |
dc.publisher | Sağlık Bilimleri Enstitüsü | tr_TR |
dc.subject | Cox regresyon modeli | tr_TR |
dc.subject | Derin öğrenme | tr_TR |
dc.subject | Regresyon | tr_TR |
dc.title | Sağkalım analizi için derin öğrenme yaklaşımı | tr_TR |
dc.title.alternative | A deep learning approach for survival analysis | tr_TR |
dc.type | doctoralThesis | tr_TR |