Takviye öğrenme kullanarak merkezi olmayan toplu robot navigasyonu
Özet
Bu tez çalışmasında, kısmen dağınık ortamlarda merkezi olmayan çok ajanlı sistemlerde gezinme sorunu ele alınmaktadır. İlgili problemi çözmek için özgün bir makine öğrenimi tabanlı yaklaşım bu çalışma kapsamında önerilmektedir. Bu yaklaşım temelinde, yeni Q-Öğrenme tabanlı sağlam ve esnek bir model önerilmiştir. Bu yöntem sürekli uzay problemini ele almaktadır. Takviyeli Öğrenme algoritmalarında olduğu gibi, Q-Öğrenme bir çevre modeli gerektirmez. Ayrıca, Q-Öğrenme, basit tasarım ve hızlı olma avantajlarına sahiptir. Bununla birlikte, Q-Öğrenmenin bir dezavantajı, çok büyük miktarda belleğe ihtiyaç duyması ve durum alanına eklenen her yeni özellik ile bu bellek ihtiyacının katlanarak büyümesidir. Bu araştırmada, kısmen dağınık ortamlarda sürekli bir alan sorununu çözmek için ajan düzeyinde merkezi olmayan çarpışmadan kaçınma için düşük maliyetli bir model tanıtıyoruz, ardından boyutunu önemli ölçüde (%70) azaltmak için örtüşmeyen Q-Öğrenme özelliklerini birleştirmek için bir yöntem tanıtıyoruz. Ek olarak, bu çalışmada denetleyici tarafından kullanılan duyusal verileri en aza indirmek için başka bir yöntem önerilmiştir. Bu yöntemlerin bir birleşimi, en az 18 adet robotla, düşük bellek maliyetiyle sürü gezinimin üstesinden gelebilir. Bu yöntemler aynı zamanda derin q-öğrenme mimarilerine uyarlanabilir ve performanslarını artırmak ve aynı zamanda öğrenme süresini azaltmak için kullanılabilir. Deneyler, önerilen yöntemin karmaşık senaryolarda çok ajanlı sistemler için de yüksek derecede doğruluk sağladığını ortaya koymaktadır.