APACHE HADOOP VE DAĞITIK SİSTEMLER ÜZERİNDEKİ ROLÜ
Abstract
Dağıtık sistemler, kaynakları paylaşmaya duyulan gereklilik neticesinde
ortaya çıkmıştır. Kaynak paylaşımı donanımsal bileşenler ve yazılımsal
varlıklar olabilir. Özellikle büyük çaplı verilerin güvenli, hızlı, tutarlı ve
ölçeklenebilir bir şekilde işlenebilmesi için dağıtık sistemlerin
kullanılabilir olduğu görülmüştür. Bu amaçla Apache Hadoop, dağıtık sistemlerde
özellikle son yıllarda çokça kullanılmaya başlayan bir yazılım haline
gelmiştir. Amacı Google Dosya
Sistemi teknolojisi olan MapReduce algoritmasını birçok bilgisayara dağıtarak
uygulamayı sağlamaktır.
Google dosya sisteminin benzerini kullanarak çok büyük karmaşık verileri
ölçeklendirebilme imkânı sağlar. Bu imkânla Hadoop’un kullanılabilirliği
giderek artmaktadır. Bu çalışmada, mapreduce açık kaynak gerçeklenmiş hali
hadoop çatısı incelenmiştir. Üç makineye kurulumu yapılıp, küçük bir küme
oluşturulmuştur. Hadoop çatısı, küme üzerinde çalışması incelenmiştir.
Keywords
References
- [1] Apache Hadoop, http://hadoop.apache.org/
- [2] Apache HBase, http://hbase.apache.org/
- [3] Apache Pig, http://hadoop.apache.org/pig/
- [4] Apache Hive, http://hadoop.apache.org/hive/
- [5] Apache Zookeeper, http://hadoop.apache.org/zookeeper/
- [6] A. Silberschatz, P. B. Galvin,Greg Gagne, “Operating System Concepts 7th Ed”, John Wiley&Sons,611,(2004)
- [7] J. WU, “Distrubuted System Design”, CRC-Press, (1998)
- [8 ] İnternet: İşletim Sistemleri Dağıtık Sistemler (Çevrimiçi – “www.pinarsahin.net/dosyalar/isl1.ppt”)
Details
Primary Language
Turkish
Subjects
Engineering
Journal Section
Research Article
Publication Date
April 16, 2012
Submission Date
November 22, 2010
Acceptance Date
October 11, 2011
Published in Issue
Year 2012 Number: 027