Soldan sansürlü verilerin farklı istatistiksel yöntemlerle değerlendirilmesi
dc.contributor.advisor | Yavuz, Yasemin | |
dc.contributor.author | Tekindal, Mustafa Agah | |
dc.contributor.department | Biyoistatistik | tr_TR |
dc.date.accessioned | 2022-09-23T07:39:00Z | |
dc.date.available | 2022-09-23T07:39:00Z | |
dc.date.issued | 2014 | |
dc.description.abstract | Türkiye'de soldan sansürlü veriler için kullanılan istatistik yöntemlerin detaylı bir şekilde irdelendiği bir çalışmaya rastlanmamıştır. Endüstride ve medikal alanda belirleme limitinin altında kalan verisi bulunan birçok çalışmaya rastlanmaktadır. Bu çalışmalarda belirleme limitinin altında kalan veriler çeşitli yöntemlerle en az yanlı sonuç verecek şekilde değerlendirilmektedir. Bu doktora tezinde, hangi örnek genişliğinde ve hangi yöntemde ne kadar yanlılık olduğu belirlenmeye çalışılmıştır. Bu bağlamda çalışmanın amacı; tam ve sansürlü veri örneklemesi durumunda Log-normal, Üstel ve Weibull dağılımı için farklı örneklem büyüklüklerinde ve sansür oranlarında ortalama, standart sapma ve ortancadan farkların belirlenmesidir. Bu nedenle çalışma içerisinde öncelikle "sansürleme" kavramı ve sansürleme çeşitleri konularına değinilmiştir. Daha sonra, soldan sansürlü gözlemlerin değerlendirilmesi için önerilen yerine koyma, parametrik (MLE), parametrik olmayan (KM) ve yarı parametrik (ROS) yöntemler tanıtılmıştır. Uygulama bölümünde her bir dağılımın farklı parametrelerine göre öncelikle veriler sansürsüz olarak üretilmiştir. Daha sonra veri setleri %5, %25, %45, %65 oranlarında soldan sansürlenmiştir. Yerine koyma (LOD ve LOD/√2), Parametrik yöntem (MLE), Yarı parametrik yöntem (ROS) ve parametrik olmayan yöntem (KM) uygulanarak sansürlenmiş veriler tahmin edilmiştir. Ayrıca örnek genişlikleri 20'den 300'e kadar 10'ar artırılarak değerlendirme yapılmıştır. Soldan sansürlü verilerin analizinde kullanılan yöntemleri sansürsüz veri setiyle ve birbirleriyle performanslarını belirlemek için farklı örnek genişliklerinde ve farklı sansür oranlarında değerlendirilmiştir. Sansürsüz veri seti ile sansürlü veri seti, ortalamadan, standart sapmadan ve ortancada sapmaları alınarak performans kıyaslaması yapılmıştır. Yapılan benzetim çalışmaları sonucunda, ortalamadan sapmalarda farklı örneklem genişlikleri ve sansür oranlarında LOD/√2 ve ROS yöntemi diğer yöntemlere üstünlük sağlamıştır. Ortancadan sapmalarda ise, neredeyse tüm örneklem genişikleri ve sansür oranlarında ROS yöntemi diğer yöntemlere ciddi bir üstünlük sağlamıştır. Bu bağlamda, belirtilen üç dağılım içinde ortalama ve ortancadan sapmalarına göre öneri diyagramları geliştirilmiştir. Bu doktora tezinde, soldan sansürlü veriler için kullanılan istatistik yöntemlerin değerlendirilmesinde farklı yöntemlerin çeşitli örnek genişliklerinde ve sansür oranlarında kullanılacak olması ve ilerde soldan sansürlü verilerin bulunduğu daha karmaşık yöntemlerin geliştirilmesi için kaynak teşkil edebilecek olması, araştırmayı orijinal kılmaktadır. | tr_TR |
dc.description.ozet | In Turkey, no study has conducted a detailed examination of the statistical methods used for left-censored data. There are many studies in the fields of industry and medicine that contain data below the limit of determination. These studies evaluate the data below the limit of determination through various methods in such a way that the least biased results are obtained. This doctoral thesis attempted to determine the degrees of bias in particular sampling sizes and methods. According to the aim of study was to determine differences from median, mean, and standard deviation in different sample sizes and censoring rates for Log-normal, Exponential and Weibull distributions in the case of full and censored data sampling. Thus, the concept "censoring" and censoring types were handled in the first place. Then substitution, parametric (MLE), non-parametric (KM), and semi-parametric (ROS) methods were introduced for the evaluation of left-censored observations. In this study, the maximum likelihood method was used for making estimation in parametric life models. In the practice part of the study, the data were produced uncensored based on different parameters of each distribution. Then the data sets were left-censored at the ratios of 5%, 25%, 45%, and 65%. The censored data were estimated through substitution (LOD and LOD/√2), parametric (MLE), semi-parametric (ROS), and non-parametric (KM) methods. In addition, evaluation was made by increasing the sample size from 20 to 300 by tens. The methods used in the analysis of the left-censored data were evaluated in different sample sizes and at different censoring rates in order to determine their performance with the uncensored dataset and one another. Performance comparison was made between the uncensored dataset and the censored dataset on the basis of deviation from median, mean, and standard deviation. As a result of simulation studies conducted in deviation from the mean rates of different sample size, censor rates LOD/√2 and, ROS methods give better results than other methods. In deviation from the median, according to almost all sample size and the censor rates, ROS method gives better results than other methods. In this regard, suggestion diagrams have been developed according to deviations from median and mean in the above-mentioned three distributions. The authenticity of this doctoral thesis is that different sample sizes and censoring rates were employed for evaluating the statistical methods used for the left-censored data; and it may be used as a source for the development of more complex methods containing left-censored data in the future. | tr_TR |
dc.identifier.uri | http://hdl.handle.net/20.500.12575/84297 | |
dc.language.iso | tr | tr_TR |
dc.publisher | Sağlık Bilimleri Enstitüsü | tr_TR |
dc.subject | Test istatistikleri | tr_TR |
dc.subject | Biyoistatistik | tr_TR |
dc.subject | Kantitatif özellikler | tr_TR |
dc.title | Soldan sansürlü verilerin farklı istatistiksel yöntemlerle değerlendirilmesi | tr_TR |
dc.type | doctoralThesis | tr_TR |