Bu büyük veri çağında, büyük miktarda verinin akışı, depolanması ve analizi çeşitli zorluklar ortaya çıkarır. Yararlı bilgilere ulaşmak için yoğun veri kullanan sistemlerin tasarımcıları tarafından çeşitli zorluklar ele alınmalıdır. Verilerin toplanması, saklanması ve analiz edilmesi, anlamlı öngörüler elde etmek için uygun veri işleme ve analitik teknolojilerinden oluşan bir toplama ve analiz platformu gerektirir. Bu çalışmada, Twitter'ın Streaming API'sini kullanarak kullanıcı tarafından girilen anahtar kelimelere dayalı olarak tweet'leri toplayan, akış verileri üzerinde gerçek zamanlı analitik için bir ortam sağlayan ve gelecekteki toplu iş odaklı görevleri yerine getirmek için verileri bir Apache Cassandra NoSQL veri deposunda kalıcı olarak depolayan TweetCASP (Tweet toplama, analiz ve depolama platformu) sistemini sunuyoruz. Ayrıca, TweetCASP, yazılım geliştiriciler, tasarımcılar ve bu alandaki araştırmacılar için veri toplama ve analiz için kullanılan veri yoğunluklu bir sistem örneği sunar.
Büyük veri veri yoğunluklu sistemler gerçek zamanlı analiz akış analitiği NoSQL.
In this era of big data, the streaming, storage, and analysis of large amounts of data present a variety of challenges. Several challenges must be addressed by designers of data-intensive systems in order to retrieve useful information. Collecting, storing, and analyzing data requires a collection and analytics platform comprised of an appropriate choice of data processing and analytics technologies in order to acquire meaningful insight. In this paper, we report on TweetCASP (Tweet Collection, Analytics and Storage Platfrom), which gathers tweets based on user-entered keywords using Twitter's Streaming API, providing an environment for real-time analytics on streaming data and permanently storing data in an Apache Cassandra NoSQL datastore to fulfill future batch-oriented data processing requirements. Moreover, The TweetCASP presents an example of a data-intensive system used by software developers, designers, and researchers for data collecting and analytics.
Big data data-intensive systems real-time analytics streaming analytics NoSQL.
Birincil Dil | İngilizce |
---|---|
Konular | Bilgisayar Yazılımı |
Bölüm | PAPERS |
Yazarlar | |
Yayımlanma Tarihi | 18 Ekim 2023 |
Gönderilme Tarihi | 16 Ağustos 2023 |
Kabul Tarihi | 27 Ağustos 2023 |
Yayımlandığı Sayı | Yıl 2023 Cilt: IDAP-2023 : International Artificial Intelligence and Data Processing Symposium Sayı: IDAP-2023 |
The Creative Commons Attribution 4.0 International License is applied to all research papers published by JCS and
a Digital Object Identifier (DOI) is assigned for each published paper.