Büyük veri: uygulama alanları, analitiği ve güvenlik boyutu
No Thumbnail Available
Date
2018
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Ankara : Ankara Üniversitesi
Abstract
Dünyadaki veri hacmi ve veri çeşitliliği, insanlık tarihinde daha önce hiç
görülmediği hızda artmaktadır. İnternet teknolojilerinin ve sosyal medyanın
hayatımızın her evresine ve hatta cep telefonlarımıza girmesiyle, insanlar
günlük faaliyetlerinde bile veri üretir duruma gelmiştir. Dünün manuel olarak
çalışan araç gereçleri, bugün akıllı cihazlar olarak anılmakta ve hemen hepsi
sensörleri vasıtasıyla veri üretmektedir. Bu kadar yoğun ve farklı verinin farklı
kaynaklardan giderek artan bir şekilde üretilmesi, yeni bir kavramı ortaya
çıkarmıştır: “Büyük Veri”. Büyük veri yüksek hacim, hız ve çeşitlilikte üretilen
yapısal, yarı yapısal ve yapısal olmayan veri bütünüdür. Birçok endüstriyel alan,
yeni veri üreterek veya mevcut veriyi sayısallaştırarak büyük veriye kaynak
oluşturmaktadır. Organizasyonların rekabet avantajı kazanmasında, bilgi
önemli bir üretim faktörüdür. Bu noktada büyük verinin bilginin ham maddesi
olması ve dolayısıyla karar verme süreçlerini etkilemesi, büyük veri analitiğinin
önemini artırmaktadır. Büyük veriden ekonomik değer elde edilebilmesi için,
doğruluğu sağlanmış verinin ileri analitik yöntemlerle işlenmesi gerekmektedir.
Bugün, ekonomik ve ticari faaliyetlerden kamu yönetimine, ulusal güvenlikten
bilimsel araştırmalara kadar birçok alanda, büyük veri ve analitiğinden
yararlanılmaktadır. Hergün 2,5 eksabayt (1 eksabayt=1.073.741.824 gigabayt)
hacminde verinin üretildiği günümüzde, dünün ilişkisel veritabanı ve yapısal
sorgulama dilleri ile büyük veri analitiğinin gerçekleştirilmesi mümkün
gözükmemektedir. Büyük veriyi işlemek adına başta Hadoop, Eşle-İndirge
(Map-Reduce) olmak üzere, Hive, Hcatalog, Hbase, MPP (Massively Parallel
Processing), PIG, Mahout, NoSQL ve Cassandra gibi dağıtık dosya sistemleri
üzerinde çalışan ileri analitik yöntemlerden yararlanılmaktadır. Büyük veri
analitiği, sunmuş olduğu faydaların yanı sıra kişisel bilgilerin mahremiyetini
tehlikeye atabilecek güvenlik zafiyetlerini de oluşturabilmektedir. Bu
çalışmada; büyük veri olgusu, bileşenleri ve kaynakları boyutunda ele alınmış,
büyük verinin uygulama alanlarında sağladığı avantajlar üzerinde durulmuş,
büyük veri analitiği süreçleri ve ileri analitik yöntemlerden, dağıtık dosya
sistemi üzerinde Eşle-İndirge modelini çalıştıran Hadoop yazılım mimarisinin
işleyişi incelenmiştir. Bununla birlikte büyük verinin sunduğu avantajların yanı
sıra oluşturduğu güvenlik sorunları da irdelenmiş ve bu kapsamda alınması
gereken güvenlik önlemleri değerlendirilmiştir.
Description
Keywords
Big data, Büyük veri, Büyük veri güvenliği, Big data security