Veri demetleme algoritmaları, arama; spam, saldırı tespiti; hücre, gen, doküman analizi; moleküler dinamik simülasyonlarının biçimlerinin analizi gibi uygulamalar için oldukça önemlidirler. Veri demetleme algoritmaları için birçok araç geliştirilmiştir; ancak günümüzde teknolojinin hızla gelişmesiyle toplanan veri miktarı git gide artmaktadır. Veri miktarının artması, analizin neticesini olumlu etkilese de mevcut veri demetleme araçları, büyük-ölçekli veri kümeleriyle çalışan uygulamaların gereksinimlerini hız bakımından karşılayamaz hale gelmişlerdir. Veri demetlemede hızın rolü, veri madenciliği araştırma topluluğunun bir süredir ilgi alanındadır. Araştırmacılar, çeşitli optimizasyon tekniklerinden, veri yapısı tasarımlarından, CPU'da paralelleştirme tekniklerinden ve PC küme sistemi kullanımı gibi yöntemlerden yararlanmaktadırlar. Fakat son zamanlarda düşük maliyet ile yüksek performans sunan yeni bir yaklaşım tüm ilgiyi üzerine çekmiştir: Genel Amaçlı GPU Programlama GPGPU . GPU’ların yüksek paralel hesaplama gücü ve grafik kartlarındaki gelişimin CPU’ya oranla daha hızlı hızlanması, aslında grafik canlandırma ve oyunlar için yoğun matematiksel hesaplamalar yapmak üzere tasarlanan grafik kartlarından genel amaçlı programlar için de yararlanmayı söz konusu hale getirmiştir. Bu makalede, GPGPU yaklaşımıyla veri demetleme algoritmalarının performansını artıran çalışmalar incelenmiş, özetlenmiş, avantajlarından ve eksik yanlarından bahsedilmiştir. Sonuç olarak, bu yaklaşımının üstünlüğü göz önünde bulundurularak konuyla ilgili bilime katkı sağlanabilecek açık alanlar verilmiş ve incelenen çalışmalardan elde edilen GPGPU yaklaşımıyla uygulama geliştirirken dikkat edilmesi gereken hususlar ortaya konulmuştur
CUDA hızlandırma için GPU genel amaçlı gpu programlama GPGPU grafik işlemci birimi GPU paralel hesaplama veri demetleme
Data clustering algorithms are quite important for applications such as search; spam, attack detection; cell, gene, document analysis; analysis of conformations of molecular dynamics simulations. Many tools are developed for data clustering algorithms. However, today technology is improving rapidly so that collected data amount grows more and more. Although increased data amount affects the result of analysis positively, when current data clustering tools work with large scale datasets, they don't meet the requirements of such that applications in terms of speed. Data mining research community is interested in the rol of speed on data clustering for a while. Researchers take advantage of methods such as various optimization techniques, data structure designs, parallel techniques on CPU, using PC cluster systems. However, recently a new approach which offers low cost and high performance, attracts all attention: General Purpose GPU Programming: GPGPU . Through high parallel computing power of GPUs and more rapid development of graphics carts than CPUs, it has become to benefit graphics carts, which design to do intensive mathematical computations, for general purpose programs. In this paper, we investigate works that increase performance of data clustering algorithms with GPGPU approach, summarize them, mention advantages and disadvantages of these works. In conclusion, considering the advantages of this approach, prospected areas in this matter that could contribute to the science are given and particular points in developing the application by GPGPU approach were exhibited from the outcomes of verified practices
CUDA GPU for acceleration general purpose programming GPGPU graphic processor unit GPU parallel computing data clustering
Birincil Dil | Türkçe |
---|---|
Bölüm | Research Article |
Yazarlar | |
Yayımlanma Tarihi | 1 Nisan 2013 |
Gönderilme Tarihi | 1 Nisan 2013 |
Yayımlandığı Sayı | Yıl 2013 Cilt: 4 Sayı: 11 |
0216 355 56 19 WhatsApp numarasıyla iletişime geçebilirsiniz.
Bu dergideki makaleler Creative Commons Atıf-AynıLisanslaPaylaş 4.0 Uluslararası Lisansı ile lisanslanmıştır.