Sağlık verileri üzerinde büyük dil modeli ile yeni bir yaklaşım
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Ankara Üniversitesi
Abstract
Bu tez çalışması, sağlık alanındaki yapılandırılmamış metin verilerinden (akademik tezler gibi) etkin bilgi çıkarımı ve sorgulaması için Büyük Dil Modelleri (BDM) ve Almayla Artırılmış Üretim (RAG) teknolojilerine dayalı yenilikçi bir yaklaşım sunmaktadır. Amaç, sağlık profesyonellerinin bilgiye erişimini hızlandırmaktır. Bu kapsamda, Otizm Spektrum Bozukluğu (OSB) üzerine yazılmış Türkçe tezler üzerinde, anlamsal benzerliğe dayalı Vektör Tabanlı RAG ile yapısal bilgi çıkarımına odaklanan Bilgi Grafiği (KG) Tabanlı RAG prototipleri geliştirilip karşılaştırılmıştır. Sistemlerin performansı, farklı zorluk seviyelerinde 100 soruluk bir benchmark veri seti ve BDM tabanlı otomatik skorlama ile ölçülmüştür. Bulgular, Vektör Tabanlı RAG'ın genel sorgularda (%71,45 başarı) daha yüksek performans gösterdiğini ortaya koymuştur. Buna karşın KG Tabanlı RAG (%66,55 başarı), özellikle karmaşık ve ilişkisel bilgi gerektiren zor sorularda daha güçlü bir potansiyel sergilemiştir. İki yaklaşımın birleştirildiği ideal bir hibrit senaryonun ise başarıyı %79,1'e yükseltebileceği görülmüştür. Bu çalışma, gelişmiş RAG sistemlerinin Türkçe sağlık metinlerine uygulanabilirliğini ve görece düşük maliyetli BDM'ler ile etkili çözümlerin potansiyelini göstermektedir. Elde edilen bulguların, gelecekteki klinik karar destek sistemlerine ve Türkçe doğal dil işleme araştırmalarına katkı sağlaması hedeflenmektedir.
