Web Bir Dijital Kütüphane mi ?

Dr. Özlem Bayram

 

Giriş

 

İnternetin dünya genelinde hızlı gelişimi, birey ve kurumlar tarafından, web bilgi arama araçlarının, kütüphanelerin ve hatta ticari veri tabanlarının kullanımına tercih edildiği bir ortam sunmaktadır. Bu yönüyle Web , dijital kütüphane olarak nitelendirilmektedir. Bu genel kanıya rağmen web bilgi erişim araçlarının yetkinliğini sorgulayan ve bu konuda daha tedbirli davranılması gerektiği işaretini veren pek çok araştırma yapılmaktadır. Eldeki çalışma,  Web’in optimum düzeyde bilgi erişimini nasıl destekleyeceği yönündeki endişelere cevap ararken,  yine kütüphanelerde bilginin kataloglanma ve sınıflandırılmasına temel oluşturan yaklaşımlardan yola çıkılması  gerektiğini ifade eden bir deneme niteliği taşımaktadır.  Son yıllarda İnternette bilginin sınıflandırılması için başvurulan daha etkili  bilgi erişim modelleri oluşturma arayışlarının  belirli bir tarihi paradigmada gelişim göstermesi dikkat çekicidir. Sınıflandırma sistemleri başlangıçta kütüphaneler için oluşturulmuş ve bilginin organizasyonu için yüzyıllardır kullanılagelmiştir. Önceleri internette bilginin sınıflandırılması için  bu yöntemlerin kullanımı fazla teknik bulunarak ticari kuruluşlar tarafından daha kolay yöntemler benimsenmiştir. Bugün İnternet büyüdükçe web bilgilerinin sınıflandırılması ve bilgi erişim için daha etkili yöntemlerin kullanılması gerektiği düşüncesi yaygınlaşmaktadır.  Bu durum, tarihte kütüphanelerin bilgi kaynaklarının tür ve çeşitliliğinin zenginleşmesi sonucu bilginin denetlenmesi sorunu ile karşı karşıya kaldığı süreçle özdeş düşünülebilir. Ancak kütüphaneler basılı ve dijital bilginin erişimini sağlamak için denetimli sınıflandırma ve dizinleme tekniklerine bağlı kalmaktadırlar. Bununla beraber, Web ortamında kullanıma sunulan popüler bilgi erişim araçları kapsamında kütüphaneler açık erişimi de sağlayabilecek içerikleri olmasına ve internetin dağınık yapısının tersine, bilgiyi yapılandırılmış veri sistemleri halinde organize ettikleri halde bugüne kadar Web bilgi erişim araçları  ile istenilen düzeyde bütünleşememiştir. Bu nedenle,  bilgi erişimde tercih edilen yeni eğilimler doğrultusunda, kütüphanelerin de geliştirebilecekleri politikalara da kısaca  değinilecektir.

 

Web ’in Doğal  Yapısı

 

Web ortamını sürekli büyüyen ve yönü değişim gösteren bir akıntıya benzetebiliriz. Bu akıntıda kürek çekmeye çalışanların sayısı her geçen gün geometrik bir artış gösteriyor. 1996 – 1997 tarihlerinde internet üzerindeki web sayfası yaklaşık 100 – 600 milyon arasında değişim gösterirken 2000 yılında bu sayı 1- 1.5 milyara yükselmiştir (Koehler 2000). Bu sayı sadece şifre dışı diğer bir deyişle herkesin kullanımına açık erişim oranını ifade etmektedir.

İnternet kullanıcılarına ilişkin en son edinilen genel sayısal yönelime bakıldığında 2003 yılında 751 milyon internet kullanıcısının %46’ nı İngilizce konuşan, %13’ ünü  ise  diğer milletlerin toplulukları oluşturmaktadır. 2004 yılında toplam İnternet kullanıcısı 901 milyon olarak tahmin edilmekte ve  %49’ nun İngilizce %16’ nın ise diğer milletlerin oluşturacağı beklenmektedir. Dillere göre kullanım incelendiğinde Türkçe tercihi ile kullanan kişi sayısı 5.8 olarak belirlenmiştir  (Global Reach 2004). Bu istatistiklere göre Amerika Birleşik devletleri ve Kanada, İnternet’i en çok kullanan ülkelerin başında yer almaktadır. İngilizce dilini konuşan milletlerde kullanım istatistikleri katlanarak büyümektedir. İnternetin kullanımın bu ölçüde yaygınlık kazanmasında temel neden, gerçekte tüm birey ve sektörlerin bir standarda bağımlı kalmaksızın yapısal olmayan veri (unstructured data) leri sisteme yükleme ve bu veri ögelerini istenilen kapsamda, istenilen kitlelerin kullanıma  açabilme özgürlüğü yer almaktadır. Bu durumda yine enformasyon teknolojisinin terminolojisinde kullanılan ifade ile veri ve bilgi yönetimi için gerekli araçlar kullanılmaksızın veri bağımsız ve düzensiz bir ağda bir yerden bir başka yere eklenerek büyük bir kulvarda yerini almaktadır. İnternetin yaygın kullanım alanı bulmasının temel nedenlerinden bir diğeri ise web sitelerinde yer alan blgiye erişimi sağlamak amacıyla kullanılan arama motorlarıdır.

Web üzerinde bilgi taraması için kullanılan arama motorları sağladıkları bulguları alfabetik ya da sistematik bir düzende sıralamak yerine farklı bir mantık uyarınca ve sürekliliği olmayan bir sistem uyraınca sıralamaktadır. Çünkü arama motorlarının aynı tarama sözcüğü ile kapsadığı bibliyografik liste içeriği neredeyse  her gün yenilenmektedir. İnternet dünyası bir yandan çok kısa aralıklarla yeni site ve sayfalarla sürekli güncellenirken, bir yandan da her sayfanın diğer sayfalarla arasındaki algoritmik ilişki çok hızlı bir değişim göstermektedir.  Bu durumda aynı tarama sözcüğü ve/veya aynı işlemci kullanılarak farklı zamanlarda gerçekleştirilen bir sorgulama sonucunda bütünüyle farklı sonuçların yer aldığı ya da benzer sonuçların farklı bir sıralamada yer alması dikkati çekecektir. Bunun nedenleri arama motorlarının kullandığı dizinleme yöntemlerinin farklı olmasının yanısıra bir defa erişilen bir web sitesine aradan çok kısa bir zaman geçse bile erişememe olasılığının  bulunmasından kaynaklanmaktadır.   Bir belgenin web üzerindeki ömrü çok kısa olabilmekte ; üretilen bilgiler kısa sürede üst kullanım düzeyine çıkabilmekte ve aynı hızla yaşamsal değerini yitirebilmektedir.  Genellikle bir web sayfası ya da sitesinin yarı ömrü iki ya da üç yıldan daha az olmaktadır. [*]

Dünya ölçeğinde en büyük ağ yapısını temsil etmekle beraber Web, evrensel boyutta üretilen bilginin çok azınlıkta bir bölümünü kapsamaktadır. Bilgi ve iletişim teknolojilerinden önce kütüphenelerde bulunan basılı materyalin büyük bir bölümüne internette erişim henüz sağlanamamıştır. Sayısı milyonları bulan web belgelerinin tümünü kapsayan bir web kataloğu ya da bibliyografyası olmadığı için evrensel bir bibliyografik denetimden söz edilememektedir. Bazı yazarlar, web üzerinde kayıtlı bilgi yığınının nicelik bakımından devasa büyüklüğünün bibliyografik denetime izin vermeyeceği görüşünü savunmaktadır (Koehler 1999).

İnternetin hızlı gelişimine paralel olarak Web ve özellikle arama motorlarına gerçek niteliklerinin ötesinde farklı sıfatlar kazandırılmıştır. Arama motorlarının kütüphanelerin yerini alacağı ve hatta dijital kütüphane konumunu da üstleneceği görüşü ortaya atılmışıtr.

Hafner, New York Times’da yazdığı makalesinde son bir kaç yıldır kütüphanecilerin üniversite öğrencilerinden akademisyenlere kadar farklı kesimde yer alan araştırıcıların çevrimiçi(online) arama sitelerini araştırma kütüphanelerine tercih ettiklerini  farkettiklerini ifade etmektedir ( New York Times June 21, 2004).

Lancaster 1999 yılında yazdığı makalesinde teknolojinin giderek bilgi uzmanlarının yerini doldurmaya başladığı görüşünü savunmuştur .  Bilgi ve iletişim teknolojilerinin gelişimi özellikle bilgi ve belge bilimi dışında kalan alanlarda da farklı bir kütüphane kavramı anlayışı getirmeye başlamıştır. Belki de hayatında hiç kütüphane kullanmamış bazı araştırıcılar teknolojinin yaygın kullanımıyla internetin sunduğu olanakların tüm bilgi gereksinimlerine cevap verebileceği inancıyla  kütüphane olgusuna farklı bir yaklaşım getirmişlerdir.

Ülkemizde de İnternetin doğuşu ile beraber sanal kütüphane, duvarsız kütüphane ya da kağıtsız toplum kavramları literatürümüzde kullanım alanı bulmaya başlamıştır. Ancak bu tanımlamalar özellikle olan ülkeler için kavramsal boyuttan öteye pratik hayatta kütüphanelerimiz için istenen ve beklenilen düzeyde bilgiye duyulan gereksinimi ve bilgi kullanımını zenginleştirmeyi başaramamıştır. Ülkemizde geleneksel olarak kütüphane kavramı toplumsallaşamadığı için İnternet başlı başına birincil düzeyde temel bilgi aracı olarak benimsenebilmektedir. Kaldı ki, İnternete erişim hizmeti veren İnternet kafeler bile dijital kütüphaneler olarak nitelendirilebilmiştir (Gümüş 2003).

Web bir kütüphane olmamakla birlikte bilginin üretimi ve yayımında radikal değişiklikler yaparak dijital kütüphanelerin önemli bir parçası haline gelmiştir.  Ancak tek başına bir kütüphane olgusu ile karşılaştırıldığında web,  raflara rastgele yerleştirilmiş bilgi kaynaklarını toplayan; merkezi denetimden oldukça uzak bir kütüphane yapısına benzetilebilir. Web pek çok kütüphaneye  erişim sağlamada net otoyolu görevini yürütmekte ve diğer yandan da  geleneksel kütüphanelere bilgi kaynağı sağlayarak kütüphane kurumu ile organik bir bağ kurmaktadır. Koehler, web’in bir kütüphane olduğunu kabul eden görüşe göre Web ancak dijital, elektronik ya da sanal kütüphane formlarından birisine karşılık gelmektedir (2000). Bize göre bugünkü dağınık yapısıyla web, bu olgulardan herhangi birisini karşılamaktan uzaktır. Sözkonusu beklentilere cevap verebilmek için mevcut kütüphanelerin içeriklerini de arama motorlarına ve/veya çoklu arama motorlarına taşıyan bütünleşik bir yapısal veri tabanları ağı ile sistemde yerini almasıyla mümkün olabilecektir.

 

Web Ortamında Bilgi Erişiminin Etkinliği

 

İnternetin geleneksel kütüphane yapısının yerini alacağı yaygın görüşü bugün gelişmiş dünya ülkelerinde bazı akademik çevrelerce bile benimsenebilmektedir. Bu düşüncenin her tür araştıma konusu için savunulabilmesi olanaklı değildir. Çünkü web ortamında depolanan bilgiler, ağ düzeyinde ilişkili diğer yüklenmiş tüm bilgilerle bütünleşik bir indekste organize edilmiş değildir. Oysaki bilgiler hem standart olarak yapılandırılmamış bir veri sistemi içinde yüklendiğinden ve hem de kısa süreli depolanıp buna bağımlı olarak yaşam döngüsü düşük olduğundan en kolay ve en kapsamlı olarak  güncel bilgilere dayalı araştırmalardan olumlu sonuç alınabilmektedir. Örneğin, bilgi ve iletişim teknolojisi ile ilgili son gelişmelerle ilgili  bilgiye Web kaynakları ile erişmek çok daha iyi sonuç verebilmektedir. Alanında bir otorite kabul edilen William Arms, dijital kütüphaneler konusunda kitabını hazırlarken birinci el kaynaklara erişmesinde İnternetin kendisi için neredeyse bir kütüphane konumunda olduğunu belirtmektedir (Arms, 2000). Ancak pek çok alanda yapılan araştırmalar için, kolayca indirilen görüntü ve metin dosyaları dışında doğrudan ilişkili asıl bilgi kümesi erişim kapsamı dışında kalmaktadır.

İnternetin plansız büyüme hızı düşünülürse bilgilerin doğruluk ve güvenilirlik bakımından değerlendirilmesi her geçen gün daha da olanaksızlaşmaktadır. Bu anlamda kütüphanelerde uygulandığı gibi elektronik bilginin seçim ve sağlama kriterleri ile doğruluğu ve güvenilirliğinin de değerlendiği bir derme yönetimi sürecinden söz edilememektedir. Yine kütüphanelerde olduğu gibi hem güncel hem de geriye dönük bilgilerin tümüne erişmek olanaklı değildir. Her ne kadar bazı alanlarda geriye dönük bilgi aktarımı da belirli ölçülerde gerçekleşmekteyse de halen en sık ve en kolay erişim güncel bilgi için sağlanabilmektedir. Üstelik bazı bilgiler hala sadece basılı ortamda kayıtlıdır. İnternet üzerinde azımsanmayacak büyüklükte bilimsel ve değerli bilgi hala ücret karşılığında kullanıma  sunulmaktadır. Bununla beraber web üzerinde oluşturulan arama motorları az düzeyde bir bilgisayar kullanım becerisi ile belirli ölçüde bilgiye erişimi desteklemektedir. Oysa kütüphanelerde araştırma yapabilmek için bilgi erişimini destekleyecek temel bilgilerin yanısıra danışma kütüphanecisine gereksinim duyulmaktadır. Arama motorlarına zaman ve mekana bağımlı olmaksızın erişim mümkün olduğu için fiziksel olarak kütüphanelere giderek zaman harcamak da modern dünyada büyük bir yük kabul edilmektedir. Bugün çok sayıda kütüphane dermesinin çevrim içi katalog taraması yapılabilmesine olanak tanıyabilmekle beraber aranan her tür bilgiye doğrudan erişim çoğu kütüphane kullanıcısı için hala büyük bir sorun olmaktadır. Özellikle gelişmekte olan ülkelerde dermesinin bir bölümünü dahi dijital ortama aktarabilmiş kütüphaneler şanslı sayılmaktadır.

Bütün bunlara ek olarak, İnternette bilgi aramak için kütüphanelerde yaygın olarak kullanılan ayrıntılı kataloglama ve sınıflama sistemlerini öğrenmeden de bilgiye erişebilmek için arama motorları, hiyerarşik konu dizinleri, çoklu arama motorları (meta search engines) ve konu odaklı web sayfaları(subject-oriented web sites) gibi çok çeşitli seçenekler sunulmaktadır (Wukovitz, 2001 : 122)). Bugünün yaygın görüşü herkesin aradığı bilgiye web ortamında erişebileceğidir. Bununla beraber literatürde, arama motorları temel alınarak yürütülen araştırma bulguları, web ortamındaki bilgi erişim düzeyinin çok da yeterli olmadığı tezini ortaya koymaktadır. Gordon ve Pathak, bu anlamda sekiz arama motoru üzerinde yürüttükleri araştırmada sonuçlar arasında sayısal farklılıklar doğmasına karşın deneyin yapıldığı arama motorlarının hepsinde  de erişim etkinliğinin düşük düzeyde kaldığını belirlemişlerdir (1999). Tıp alanında yayımlanmış kaynaklara İnternette ulaşmayı hedefleyen bir başka çalışmada, bu kaynaklara erişim oranı %0 ile en iyi %43 oranları arasında değişmektedir (Evaluation 2001).  Yayımlanmış ya da yayımlanmamış bilimsel çalışmalara İnternette erişim sağlanamamasının iki temel nedeni bulunmaktadır: Birincisi, arama motorları sadece kamuya açık  diğer bir deyişle şifre gerektirmeyen bilgiye erişim sağlamaktadır. İkincisi, bilimsel ve verimlillik düzeyi yüksek bilgi kümesine erişim  ise doğrudan özel (ticari) veri tabanları  ile ve/veya dijital kütüphane desteği ile sağlanmaktadır.

Tillotson’ın yaptığı araştırmada, üniversite öğrencileri ilk sırada başvurdukları kaynak olarak Web ’i göstermişler; azınlıkta bir öğrenci grubu ise Web ortamında bulunduğunu bildikleri halde aradıkları bilgiye arama motorlarıyla erişemediklerini bildirmişlerdir (2002 / 2003).

Arama motorları ile yapılan sorgulamaların çoğu çok sayıda bilgi başlığı ile sonuçlanmasına rağmen gerçekte; arama motorları Web de bulunan  bilginin azınlıkta bir bölümünü indeksleyebilmektedir. Özellikle ilk ondan sonra sıralanan bilgi kayıtları büyük ölçüde arama istemiyle hiç de örtüşmeyen bilgileri kapsamaktadır. Yapılan bir çalışmaya göre sadece % 42’ini (Searchenginewatch 1999) , bir başka çalışmaya göre ise ancak %20’ni  indexlemektedir (Lawrence ve Giles 1999). Bu tür araştırmalarda birbirinden farklı yöntemlerin kullanılması farklı sonuçlara ulaşılmasını etkilemekle beraber bu değerler sonucu büyük oranlarda değiştirmemektedir.  

White ve Iivonen, üniversite öğrencileri üzerinde yürüttükleri bir kullanıcı araştırması ile ancak basit araştırma sorgulamaları ile yapılan aramalara yönelik gereksinimlerin tam olarak karşılanabildiğini ortaya koymuşlardır (2002). Web ortamında basit sorgulama ile anlaşılması gereken yalın kavramsal ya da bibliyografik sorgulamalar olmalıdır. Karmaşık aramalarda diğer bir deyişle çok yönlü  kavramsal ilişkileri aramaya yönelik sorgulamalarda bir yandan kullanıcının hata yapma olasılığı yükselirken diğer yandan da arama motoru tarafından aranan bilgiye doğrudan erişim olasılığı düşmekte ve aranan bilgi ile ulaşılan bilgi arasında kurulması beklenen ilişki düzeyi tam olarak sağlanamayabilmektedir.   

Çevrimiçi bibliyografik taramaların tüm dünyada yaygın kullanım alanı bulmaya başladığı yıllarda Saracevic’in bilgi erişim için belirlediği tipik arama/sorgulama hataları günümüzde web ortamında çok daha yaygın olarak karşımıza çıkmaktadır. Çünkü web ortamının bilgi depolama ve erişim nitelikleri bu hataların doğal olarak gerçekleşmesine oldukça elverişlidir. Saracevic, sözkonusu arama hatalarını semantic, sentaktik ve pragmatik sorunlar olarak sınıflandırmıştır (Saracevic 1980 ; Rich ve Knight 1991). Çok genel bir tanımlama ile, semantik sorunlar sorgulama diline yönelik olarak arama sorusunun ifade edilmesinden kaynaklanan sorunları tanımlamaktadır. Sentaktik sorunlar ise, arama stratejisine yönelik hataları ve pragmatik sorunlar ise bilgi eksikliğinden kaynaklanan hataları kapsamaktadır. Web ortamında sunulan bilgilere erişim süreci, burada başlıklar halinde sıralanan hataları büyük ölçüde kapsamaktadır. Öte yandan web ortamında indekslenen bilgileri içeren bir  thesarus yani kavramsal dizinin  olmayışı da bilginin denetimli bir dille erişimine olanak tanımamaktadır.  Bu bakımdan arama motorlarında sorgulama yaparken  doğal dil kullanılması geniş halk kitleleri tarafından yaygın ve kolay erişim olanağını sunuyor gibi görünmesine karşın istenmeyen sonuçları da beraber getirmektedir. Doğal dil sorgulamalarıyla asıl erişilmesi beklenen ve konuyla doğrudan ilişkili  bilgiye erişimin sağlanamadığı, yapılan deneylerle doğrulanmaktadır (Tylor, 1999). Ancak kütüphanelerde uygulanan standart sistemler uyarınca düzenlenen bilginin, otorite dizinleri ile yine bir standart erişim ögesi altında denetimi sağlanabilmektedir. Aynı biçimde özel (ticari) veri tabanları ile yapılan taramalarda da kavramsal dizin (thesaurus)  kullanımı ile o veri tabanı tarafından belirli bir bilginin hangi kelime dizilişi altında yer alacağı denetim altına alınmaktadır. Oysa arama motorlarının pek çoğunda yürütülen sorgulamalarda aranan konuyla doğrudan ilişkili bilgiye erişmek için, seçilen sorgulama terimlerinin yazarın metninde kullandığı terimlerle  örtüşmesi gerekmektedir; çünkü belirli bir ihtiyacı dile getirmenin çok çeşitli ifade biçimleri bulunmaktadır. Arama motorları içinde en yaygın kullanılan Google  arama motoru 2003 yılından itibaren ~ işleci ile eşanlamlı terimleri de tarama kapsamına alma olanağı sağlamaktadır.

Ayrıca, arama motorlarında yürütülen taramaların araştırıcının isteğinden fazlası ile sonuçlansa bile talep edilen bilgiye erişimin sağlanamadığı durumlar söz konusu olmaktadır. Yahoo ’nun araştırma labaratuvarları sorumlusu Gary Flake, bu tür durumlar için, araştırıcıların genellikle ne aradıklarını tam bilemediklerini vurgulamaktadır. Flake, tarama sorgulamalarının yeniden formüle edilerek nasıl şekillendirilmesi gerektiği konusunda danışma kütüphanecilerinden yararlanılması gerektiğini vurgulamaktadır ( Price, 7 July 2004).

Öte yandan, bazı çoklu arama motorları (meta search engines)  ile Google ve TEOMA gibi arama motorları da birbiriyle ilişkili ya da erişilenin benzeri olan diğer web sitelerine erişime olanak tanıyan gelişmiş sorgulama (ilişkili aramalar) seçeneği sunmaktadırlar.  Tüm Bool işlemcilerini kullanarak sorgulama seçeneği sunan arama motorlarının yanısıra Webcrawler ve Infoseek gibi  bazı arama motorları doğal dil üzerinde aranan kelimelerin dizilişinde tamlama gibi ardışıklık (phrase ) ve/veya birbirine yakınlık (nearby words) seçeneklerinin  belirlendiği sorgulamaları (proximity) uygulasalar da taşıdıkları veriler arasında temsil edilen ilişki, metadata ve sınıfladırma standartlarının oluşturduğu gibi  bir ilişkisel veri yapılanmasını  sağlayamamamaktadır.

 

 

Kataloglama ve sınıflama gereksinimi

 

Arama motorlarının temel bir bilgi erişim aracı olarak tercih edilmesinin nedenleri sorgulanırken bu ortamların İnternet üzerinde ne kadar bilgi kapsadığından çok belki de, kapsadığı bilgiye erişimi sağlamak için kullandığı yöntemlerin  incelenmesi daha yerinde olacaktır. 

Arama motorlarının bilgi erişimde optimum performans  gösterebilmesi için iki temel işlemciye gereksinim vardır. Birincisi algoritma temeline göre çalışan bir yazılım gereksinimidir. Algoritmalar kesinlik kazanmayan tahmin geliştirmeye dayalı sıralama yapan işlemcilerdir.  Bu yönteme göre her web sayfası diğer sayfaların  bu sayfaya yaptığı bağlantı sayısına göre bir sıralama içinde yerini almaktadır. Öte yandan Google bu algoritmayı kullanırken ayrıca kullanıcı tarafından seçilen sorgulama terimlerini içeren web sayfalarına göre de bir sıralama yapmaktadır.

Yahoo ve Google arama motorlarında olduğu kütüphanecilerin oluşturduğu hiyerarşik dizinlerin yanısıra yukarıda sözü edilen biçimde bir matematiksel tahmin yöntemini  de geliştiren arama motorları, kelime ve dilleri anlamaktan uzak olduğu için sadece sayısal algoritmaların yürütüldüğü bir programla çalışmaktadır. Bu nedenle bir arama motoru algoritma yöntemini kulanarak kullanıcının istek ve ihtiyaçlarına yönelik eğilimleri ve kullanıcı davranışları üzerine tahmin yürütememektedir. Gerekli ve gereksiz bilgi içereme özelliklerine göre sayfalar ayıklanamadığı için kullanıcının arama sonrasında bulguları tek tek kendisinin gözden geçirmesini gerktiriyor. Bu tür bir analizin yapılabilmesi için veri madenciliği ve yapay zeka uygulamalarından daha somut sonuçlar alınabilmesi gerekmektedir. Google arama motoru veri madenciliği tekniklerini kullanarak kullanıcıların daha önceki sorgulamalarını izleyip  web sitesi tercihlerini analiz ederek geleceğe yönelik tahminler yürütebilecektir. Böylelikle kullanıcının daha önceki ilgi alanları ve arama sözcüklerini hesap ederek en uygun alternatifleri verebileceği ifade edilmektedir (Teknoloji haber İnternet Güvenlik,  2003)

 Yapay zeka uygulamaları başarıya ulaştığında ise, teoride  tek doğru cevabı olan sorgulamalar için yazılım bu doğru cevabı bileceği için kullanıcı istemine karşılık gelecek cevabın tahmin edilmesinin çok üzerinde bir performans alınması beklenir.

Web ortamında bilgi erişimin performansını iyileştirme yönünde geliştirilmesi gereken adımlar iki yönlü olabilir: Birincisi makina merkezli yapılandırılmış yani kodlanmış bir sitem uyarınca ve/veya ikinci olarak ise makina destekli ancak insangücü merkezli yapılandırılan bir sistem uyarınca verilerin organize edilmeleridir. Diğer bir deyişle web ortamı için geliştirilen kataloglama,  sınıflama ve/veya dizinleme modelleri kullanılarak internet bilgi erişim araçları nın yeniden düzenlenmesi bile sözkonusu olabilir.  Bugün bu kapsamda önerilen farklı modellerin her  biri , Web ortamındaki bağımsız verilerin işlenmesinde farklı yönleriyle bilgi erişimi sağlamada kuşkusuz yararlı olacak; ancak bu sistemlerden  kolay kullanılır olanı ve güncellemeye en hızlı izin vereni  daha kalıcı olacaktır.

O halde  Web ortamında yüklenmiş bilgi kayıtları  arasında yapısal veri ilişkilerinin kurulması, bugün ve gelecek için dijital bilginin denetiminin sürdürülmesi yönünden çok önemli bir gereksinim olmaktadır. Bu yönde kütüphanecilerin yaygın tercihi, İnternette üretilen ve paylaşılan veri kayıtlarının da  kütüphanelerde bulunan bilgi kaynakları gibi kataloglanması ve sınıflandırılması ile standart bir bilgi erişim sisteminin sürdürülmesidir.

Dijital kütüphane katalogları, konu dizinleri ile birlikte kavramsal dizin (thesarus)lerde de veriler bu amaçla organize edilmektedir.  Yine aynı  amaca hizmet etmesi bakımından Yahoo arama motoru bu yöndeki çalışmalarını geliştirerek Library of Congress ve Northwestern, UCLA  ve University of Michigan ile yürütmeye başlamıştır. Böylelikle bu kuruluşların yapısal verilerini daha geniş kitlelere ulaştırmayı hedeflemektedir (Price, June 29, 2004). Burada başlatılacak deneyim biraz daha genişletilerek kütüphaneciler ile web bilgi araçları tasarımcılarının ortak bir paydada net kaynaklarının dizinlenemsi için çalışmaları mümkün olabilir. Böylece kütüphaneler metadata standartlarına uyarlanmış kayıtlarını çoklu arama motorlarında olduğu gibi kullanıcıya sunabilirler.

Bu durumda İnternette dijital bilgi erişiminin yapılandırılarak iyileştirilmesi çabalarında kütüphaneciler iki temel konuda işbirliğine yönelmelidir:  Birincisi, kütüphaneciler, kaynaklarını dijital ortama geçirerek web bilgi erişim araçları ile aynı ortamda bilgilerini paylaşıma açabilirler.  İkincisi ise, internet kaynaklarının kataloglanması ve sınıflandırılması ile dijital bilginin organizasyonunu sağlayarak web arşivi oluşturma yönünde çalışmalar üstlenebilirler. Bu anlamda, OCLC bünyesinde gönüllü kütüphanelerin katılımıyla oluşturulan İnterCAT projesi ile önemli bir adım atılmıştır:  Kütüphanecilerin yürütücü konumunda olduğu bu proje ile İnternet kaynaklarının bir bölümünün kataloglanarak aynı zamanda oluşturulan metadata kayıtlarının üzerinde sorgulama aşamasında ne ölçüde işlerlik sağlanacağı yönünde çalışmaların yürütülmesi de planlanmaktadır (İnterCAT , 2004)

Web ‘in yapılandırılmasına yönelik diğer bir açılım olarak, yapısal veri ve bilgi standardının kurulmasında özellikle doksanlı yıllardan itibaren alfabetik indekleme yapısının sistematik ve karmaşık sınıflama sistemlerine tercih edildiği gözlenmektedir. Ayrınıtılı sınıflama sistemlerinin kuramsal  ve pratik olarak  değer kaybetme gerekçelerini irdelediği çalışmasında Weinberg,  karmaşık sınıflandırma sistemlerinde yeni disiplinlerin çok sıklıkla güncellenemediği sorununa dikkati çekmektedir. Bir yandan da bu sistemlerin uygulanmasında sözkonusu alanda yetişmiş insangücüne gereksinimi arttıracağı için bu sistemlerin giderek daha az tercih edilir olduğunu vurgulamakta ve bu nedenle İnternet kaynaklarının tıpkı basit bir kitap dizini  gibi dizinlenebileceğini savunmaktadır (Weinberg  1996).

Web ortamında yer alan bilgi kayıtlarının sınıflandırılması yönündeki bazı uygulama ve yeni olarak tanımlanan yaklaşımlar ise gerçekte 1930 yılında Ranganathan’ın kütüphanedeki kaynakların sınıflandırılması için  kuramsal temellerini ortaya koyduğu “ Facet ” analizi yaklaşımından daha yeni ve farklı bir ilke ortaya koymamaktadır. Ranganathan’ın bilgiyi sınıflandırmak için kullandığı yöntem, kavramları ve terimler, karakteristik özelliklerine göre ait oldukları en spesifik başlık altında sınıflandırma yaklaşımıdır. Bu anlamda karmaşık konuları  “facets” olarak adlandırdığı basit kavramlar altında gruplandırmaktadır. Bağlantılı konular ise  birden fazla “facet” kullanılarak  konuyla doğrudan ilişkili en spesifik başlıkların sentezi  ile sınıflandırılmaktadır. Ranganathan, çalışmasında, tıp alanında örneklediği 48 spesifik konuyu standart üç farklı yaklaşıma göre oluşturduğu iskelet başlıklar altında analiz etmiştir. Kendisinin oluşturduğu Colon sınıflama sisteminde temsil edilen  konular önceden belirlenen  üç temel yaklaşım altında analiz edilerek Dewey Onlu ve Colon Sınıflama Sistemlerine göre temsil edildikleri biçimleri de karşılarında gösterilmiştir.    (Ranganathan, 1959: 56 – 66). Böylelikle birbiriyle ilişkili konuların biraraya getirildiği sistematik ve sentaks(söz dizimi) merkezli bir düzenleme ile karmaşık bir konu, farklı  yönleriyle ele alınmış başlıklarla temsil edilebilmektedir. Geniş konu kümelerinin farklı hiyeraraşik ve semantik bir ağ yapısı içinde dizinlenmesi “facet” kuramının temelini oluşturmaktadır. Bu kuramın gerektiğinde Colon ya da Dewey Sınıflandırma Sistemlerinde veya bibliyografik sınıflama sistemlerinde olduğu gibi atıf kronolojisi  merkezli sistemlerine de hizmet edebilmektedir. (Broughton, 2002 ; Chan, 2000)  “Facet” analizi yaklaşımı dijital bilginin nitelenmesinde ayrıntılı sınıflama sistemlerinden bağımsız olarak kullanılabilmektedir. Bu yaklaşımın bugün internet üzerinde web sitelerinin sınıflandırılmalarında ve bazı  arama motorlarının konu dizinlerinde de benimsendiğini görüyoruz.

Hypertext veri yapılarının geniş konu başlıkları altında alt temaları ifade eden ve doğrudan eldeki metinden çekilmiş temaların sıralanması  ile belirlenen ve standart olmayan ancak yapılandırılmış bir sözdizini oluşacaktır. Bu tür bir alt bölümleme ile oluşan konu başlıkları dizininin hiyerarşik ya da sayısal sınıflama sistemlerine göre daha sentetik ve kullanımın daha kolay olabileceği; diğerlerine göre ise daha az yer kaplayacağı düşünülebilir (Aluri, Kemp, Boll 1991 ; Denton, 2003). Ancak bu biçimde bilgi  öbeklerine taşıdıkları bilginin içerik özelliklerine göre spesifik anahtar kelimeler vermek standart konu başlıklarıyla örtüşmeyeceği gibi bir tartışmayı da doğuracaktır. Bu noktada , “facet” analizinin özellikle birden çok konu için oluşturulabilecek bir web dizini için spesifik bilgilerin temsil edilmesinde  hiyerarşik bir kavramsal dizin (thesaurus) biçiminde kullanılmasının özellikle web sorgulamaları için yararlı olacağını düşünmekteyiz. Bu durumda doküman ya da bilgi için “facet” analizi ile önce ayrı ayrı oluşturulan terimlerin sonradan  birleştirilerek hiyerarşik bir konu başlığı gibi ifade edilmesine gerek kalmayacaktır. Örneğin, İndiana Üniveristesi tarafından bilişim terimleri için geliştirilen bilgi erişim sisteminde “facet” teorisi uygulanmıştır (Pollitt, 16 -19 June 1997).

Farklı bir tercih olarak, daha önce sözünü ettiğimiz tıpkı kitaplarda olduğu gibi alfabetik indeksleme yönteminin internet kaynakları üzerinde uygulanması durumu daha çok makina merkezli gerçekleştirilebilirken facet modeli en azından bugün için makina merkezli yapılandırmalardan yani kodlamalardan daha çok insangücü desteğine bağımlı  işleyebilecek bir sistem olarak düşünülmelidir.  Her iki durum için de doğal dil kullanımı kavramsal bir dizin(thesaurus) oluşturularak denetim altına alınabilecektir.

 

 

Sonuç

 

İnternetin merkezi olmayan bağımsız gelişimi dijital bilginin organizasyonunda hem bibliyografik, hem de içerik bakımından denetim mekanızmasının sağlanmasını güçleştirmektedir. Dijital  bilginin denetim altına alınması için çok çeşitli yöntemler uygulanabilir; ancak bu yöntemlerden sadece birinin seçilerek İnternet genelinde bir standarda dönüştürülmesi kısa vadede olanaklı görünmemektedir. Buna rağmen zaman içinde Web bilgilerinin sınıflandırılmasında ve sorgulama yoluyla erişimin sağlanmasında kütüphanelerde uygulanan bibliyografik  ve/veya  hiyerarşik sınıflama sistemlerindeki ayrıntılı yaklaşım tercih edilmese bile bilgilerin sistematik ve semantik bir temelde düzenlenmiş veri kayıtlarına dönüştürülerek birbirleri arasında etkin ilişki zincirinin kurulması kaçınılmazdır.

İnternetteki kaynakların tümünü ve hatta kütüphane kayıtlarının pek çoğunu kapsamadığı  halde Web ortamında bilgiye erişim çekiciliğini sürdürecek gibi görünmektedir. Web bilgi erişim araçlarının kullanım kolaylığını hayli benimsemiş olan kullanıcıların,  ayrınıtılı sınıflama sistemlerinin kullanımını bilgi arama davranışı olarak tercih etmeyecekleri düşünülmektedir. Öte yandan bu tür sınıflama sistemlerini uygulayacak insangücünün profesyonel bilgi uzmanları ile aynı mesleki formasyona sahip olmaları gerekmektedir. Dublin Core gibi metadata standartlarının benimsenmesinin bile temel nedenleri kütüphanecilik okullarından yetişmiş kataloglama bilgi ve becerisine sahip olan insangücüne bağımlı kalmama ve MARC 856 gibi ayrınıtlı bir standardı uygulamamama tercihinden kaynaklanmaktadır. Bilginin sınıflandırılmasında da karmaşık sınıflama tekniklerinin terk edilebileceği gözlenmekle beraber bu yönde kütüphanecilik bilimine temel oluşturan  kuramsal yaklaşımlar benimsenerek konu analizlerine yönelinmektedir. Örneğin, Ranganathan’ın bilgiyi sınıflandırma yaklaşımı günümüzde web ortamındaki bilgilerin sınıflandırılması ve  dizinlenmesinde kolay uygulanabilir bir sistem olarak yaygınlık kazanabilecektir. Ancak bu tür sistemler, dijital bilgilerin ayrıntılı hiyerarşik kümeler altında dizinlenerek doğal dilin işlenmesini gerektirmektedir. Zaman içinde İnternet ortamında yaygınlaşacağı beklenen “facet” li ya da “facet”siz çok sayıda ve  farklı yapılardaki web dizinleri içerisinde kütüphanelerin de kayıtlı bilgilerin de kodlanarak  web bilgi erişim  araçlarıyla bütünleşmesi  kaçınılmazdır. Çünkü web kaynaklarının yapılandırılmış bir  dizin gereksiminden söz edebilsek de kısa vadede  tek ve mutlak bir  web dizini oluşturulması  ve bu dizinle bütün kütüphane kaynaklarına ulaşabilmek şimdilik sınanabilir bir varsayım olarak görünmeyebilir. Farklı konu alanlarını kapsayan konu dizinlerinin olması  farklı modellerin sınanmasına da olanak tanıyacağı için endişe yaratmamalıdır. Öte yandan sayıları giderek artan web dizinlerini biraraya getiren “ web dizinleri için dizin” gibi  çabalara şimdiden tanık olmaktayız.

            Bütün bu gelişmelerle beraber, uzun vadede, İnternet üzerinde “açık semantik web ” gibi bütünleşik bir web dizini için otomatik olarak bütün dilleri içeren bir kavramsal dizin(thesaurus)  oluşturma  ya da  internet kaynaklarını kataloglayan kütüphane projeleri sayesinde web arşivi oluşturma yönündeki çalışmalar, Web’in yeni bir kütüphane modeli olarak biçimlenmesine rehberlik edebilecek uygulamalardır.

 

 

 

 

 

Kaynaklar

 

Aluri, Rao, D. Alasdair Kemp ve John J. Boll .(1991). Subject Analysis in Online Catalogs.

Englewood, Colo. : Libraries Unlimited, 132 – 133.

Arms, William Y. (2000). Digital Libraries. Cambridge: The MIT Press.

Broughton. V. (2002). "Faceted classification as a basis for knowledge organization in a

digital environment; the Bliss Bibliographic Classification as a model for vocabulary management and the creation of multidimensional knowledge structures" The Seventh International ISKO Conference,  [Çevrimiçi] Elektronik adres: http://is.gseis.ucla.edu/orgs/isko/news.html#2002. [10.6.2004]Basılı metin için bkz: "Challenges in Knowledge Representation and Organization for the 21st Century: Integration of Knowledge across Boundaries" (proceedings of the Seveth International ISKO Conference) Granada, Spain, on July 10-13, 2002).

Burton, R.E.  ve R.W. Kebler .(1960). “The half-life of some scientific and technical

literature”, American Documentation. 11 (1), 18 -22. 

Chan,  V. (2000) “Ranganathan Ahead of His Century” [Çevrimiçi] Elektronik adres:

http://www.slais.ubc.ca/courses/libr517/winter2000/Group7/ (coursework at School of Library and Archival Studies University of British Columbia )

Denton, Williams (October 2003). “Putting facets on the web: an annotated bibliography ”

[Çevrimiçi]       Elektronik adres: http://www.miskatonic.org/library/facet-biblio.html.

[20 6.2004]

Eysenbach, Gunther et al. (2001). “Evaluation of the usefulness of Internet searches to

identify unpublished clinical trials for systemeatic reviews ” Medical Informatics & the Internet in Medicine, 26 (3) July, 203-218.

Global Reach .(2004). Global Internet Statistics. [Çevrimiçi] Elektronik adres:

            http://global-reach.biz/globstats [22.5.2004]

Gordon, Michael ve Praveen Pathak .(1999). “Finding information on the world wide web:

The retrieval effectiveness of search engines. Information Processing and Management, 35 (2) 141 – 180.

Gümüş, Çetin. (2003). İnternet Kafelerin (Dijital Kütüphaneler) Denetlenmesi ve Eğitim

Amaçlı Kullanımının Teşviki(Yayımlanmamış Doktora Tezi). Fırat Üniversitesi Sosyal Bilimler Enstitüsü.         

Hafner,  Katie. (June 21, 2004) . “ Old search engine, the library, tries to fit into a google

world” New York Times [Çevrimiçi] Elektronik adres: http://tinyurl.com/2olwo [22 5.

2004]

InterCAT Project . OCLC Online Computer Library Project .(19 January 2004)..[Çevrimiçi]

Elektronik adres: http://www.oclc.org/research/projects/archive/intercat.htm [4 .6. 2004]

Koehler, Wallace. (1999). “Digital libraries and World Wide Web sites and page persistence”.

Information Research  July (4).

______________. (2000). Web Document Management.[Çevrimiçi] Elektronik adres:

http://www.ou.edu/cas/slis/courses/LIS5990A/slis5990/WebasLibrary.htm [10.4.2004]

Lancaster,  F.W. (1999) “Second thoughts on the paperless society ” Library Journal  124 (15 September)  : 1548- 50.

Lawrence, S. ve Giles , C.L. (1999). “Accessibility of Information on the Web” Nature

(6740),  400 (8) July  107 – 109.

Pollitt, A. Steven. (16 – 19 June 1997). “ Interactive information retrieval based on faceted

classification using views” Center for Database Access Research , University of

Huddersfield, England. [Çevrimiçi] Elektronik adres: http://scom.hud.ac.uk/external/research/groups/cedar/dorking.htm [10 Nisan 2004]

Price, Gary. (June 29, 2004). “ Behind the scenes at Yahoo Labs , part 2” [Çevrimiçi]

Elektronik adres: http://searchenginewatch.com [ 29.6.2004].

_________ .(7 July 2004) . “ Behind the scenes at Yahoo Labs , part 3” [Çevrimiçi]

Elektronik adres: http://searchenginewatch.com [ 20.7.2004].

Ranganathan (1959).  S.R. Elements of Library Classification. London : The Association of

Assistant Librarians.

Rich, Elaine ve Kevin Knight (1991).  Artificaial Intelligence, 2nd edt. New York: Mc Graw

Hill 377 – 379.

Saracevic, Tefko (1980). “ A research project on classification of questions in information

retrieval” Proceedings of the 43rd ASIS Annual Meeting of the American Society for Information Science  içinde ; edited by Alan R. Benenfeld and Edward J. Kazkauskas, 146 -149. White Plains, N.Y.: Knowledge Industry Publications.

The Search Engine Reports 1999. (2 August 1999). Searchenginewatch. [Çevrimiçi]

Elektronik adres: http://searchenginewatch.com/sereport/article.php/2167411. [ 10.5. 2004].

Taylor, Arlene G. (2003).  Organization of Information.  Englewood, CO :  Libraries

Unlimited 163 – 164.

Teknoloji haber İnternet Güvenlik ( 2003). “Arama motorları hız arttırıyor” [Çevrimiçi]

Elektronik adres: http://www.netkonomi.com/content/view/386/2. [ 7.6. 2004]

Tillotson, Joy .(2002 – 2003).  “A portrait of the audience for instruction in Web searching:

Results of a survey conducted at two Canadian Universities ” The Canadian Journal of  Information and Library Science 27 (1).

Weinberg, Bella Hass .(1996). “Complexity in İndexing Systems – Ababdonment and Failure:

Implications for Organizing The Internet ” ASIS  1996 Annual Conference Proceedings ( October 19 – 24 1996). [Çevrimiçi] Elektronik adres:

http://www.asis.org/annual-96/EelectronicProceedings/weinberg.html. [ 10 .5. 2004]

White, Marilyn Domas ve  Mirja Iivonen .(2002). Accessing level of difficulty in web search

questions. Library Quarterly, 72 (2) 205 – 233.

Wukovitz, Laura Dassler .(2001).  “Using internet search engines and library catalogs to

locate toxicology information” Toxicology 157 : 121 – 139.



[*] Yarı- ömür  ilkesi R.E. Burton ve R.W. Kebler tarafından yazılan bir makalede kanıtlanmış ve daha sonra bibliyometrik bir kuram olarak kabul edilmiştir: Adı geçen makalenin bibliyografik tanıtımı bölüm sonu dipnotlarında yer almaktadır.  Bu kurama göre pratikte yarı-ömrün 5-6 katı kadar sürede bilgi, güncelliğini yitirmektedir. İnternet ortamında bu süreç çok daha hızlı işlemektedir.