Distributed systems have emerged because of the need
for sharing of sources. Sharing of sources can be hardware component and
software properties. Especially distributed systems can be useful for safe,
fast and scalable process for a large amount of data. For this reason, Apache Hadoop software is
being started to be mostly used especially in distributed systems recent years.
Its purpose is distributing MapReduce algorithm which refers to Google
File System technology to a lot of computer. It allows scaling a large amount of complicated data
with Google File System
similar. For
this possibility availability of Hadoop is increasing. İn this work, one of the
MapReduce open sourced implementation hadoop is examined which is installed to three machine in the small
cluster.
Dağıtık sistemler, kaynakları paylaşmaya duyulan gereklilik neticesinde
ortaya çıkmıştır. Kaynak paylaşımı donanımsal bileşenler ve yazılımsal
varlıklar olabilir. Özellikle büyük çaplı verilerin güvenli, hızlı, tutarlı ve
ölçeklenebilir bir şekilde işlenebilmesi için dağıtık sistemlerin
kullanılabilir olduğu görülmüştür. Bu amaçla Apache Hadoop, dağıtık sistemlerde
özellikle son yıllarda çokça kullanılmaya başlayan bir yazılım haline
gelmiştir. Amacı Google Dosya
Sistemi teknolojisi olan MapReduce algoritmasını birçok bilgisayara dağıtarak
uygulamayı sağlamaktır.
Google dosya sisteminin benzerini kullanarak çok büyük karmaşık verileri
ölçeklendirebilme imkânı sağlar. Bu imkânla Hadoop’un kullanılabilirliği
giderek artmaktadır. Bu çalışmada, mapreduce açık kaynak gerçeklenmiş hali
hadoop çatısı incelenmiştir. Üç makineye kurulumu yapılıp, küçük bir küme
oluşturulmuştur. Hadoop çatısı, küme üzerinde çalışması incelenmiştir.
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 16 Nisan 2012 |
Yayımlandığı Sayı | Yıl 2012 Sayı: 027 |