APACHE HADOOP VE DAĞITIK SİSTEMLER ÜZERİNDEKİ ROLÜ
Öz
Dağıtık sistemler, kaynakları paylaşmaya duyulan gereklilik neticesinde
ortaya çıkmıştır. Kaynak paylaşımı donanımsal bileşenler ve yazılımsal
varlıklar olabilir. Özellikle büyük çaplı verilerin güvenli, hızlı, tutarlı ve
ölçeklenebilir bir şekilde işlenebilmesi için dağıtık sistemlerin
kullanılabilir olduğu görülmüştür. Bu amaçla Apache Hadoop, dağıtık sistemlerde
özellikle son yıllarda çokça kullanılmaya başlayan bir yazılım haline
gelmiştir. Amacı Google Dosya
Sistemi teknolojisi olan MapReduce algoritmasını birçok bilgisayara dağıtarak
uygulamayı sağlamaktır.
Google dosya sisteminin benzerini kullanarak çok büyük karmaşık verileri
ölçeklendirebilme imkânı sağlar. Bu imkânla Hadoop’un kullanılabilirliği
giderek artmaktadır. Bu çalışmada, mapreduce açık kaynak gerçeklenmiş hali
hadoop çatısı incelenmiştir. Üç makineye kurulumu yapılıp, küçük bir küme
oluşturulmuştur. Hadoop çatısı, küme üzerinde çalışması incelenmiştir.
Anahtar Kelimeler
Kaynakça
- [1] Apache Hadoop, http://hadoop.apache.org/
- [2] Apache HBase, http://hbase.apache.org/
- [3] Apache Pig, http://hadoop.apache.org/pig/
- [4] Apache Hive, http://hadoop.apache.org/hive/
- [5] Apache Zookeeper, http://hadoop.apache.org/zookeeper/
- [6] A. Silberschatz, P. B. Galvin,Greg Gagne, “Operating System Concepts 7th Ed”, John Wiley&Sons,611,(2004)
- [7] J. WU, “Distrubuted System Design”, CRC-Press, (1998)
- [8 ] İnternet: İşletim Sistemleri Dağıtık Sistemler (Çevrimiçi – “www.pinarsahin.net/dosyalar/isl1.ppt”)
Ayrıntılar
Birincil Dil
Türkçe
Konular
Mühendislik
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
16 Nisan 2012
Gönderilme Tarihi
22 Kasım 2010
Kabul Tarihi
11 Ekim 2011
Yayımlandığı Sayı
Yıl 2012 Sayı: 027