Background: The rapid development of generative artificial intelligence (AI) has had a significant impact on the music industry, particularly Chinese popular music (C-pop), which presents unique difficulties due to its distinctive melodic structures and emotional depth. While AI can boost efficiency and inspire composers, current models are ineffective in feature selection and prediction accuracy, leading to compositions without stylistic integrity and commercial viability. Problem Statement: Current AI-generated melodies often lack the stylistic depth of human compositions and fail to predict market success accurately. These challenges highlight the need for a more effective AI framework capable of generating high-quality melodies. Objectives: This study introduces the GenAI Melody-LSTM algorithm. This generative AI-driven technique uses Long Short-Term Memory (LSTM) networks to create melodies inspired by Chinese pop songs and forecasts their success. The main goals are to build an AI pipeline for music preprocessing, improve feature selection, train a deep learning model for stylistically consistent melodies, and compare its effectiveness to other methods. Methodology: The methodology utilises a GenAI Melody-LSTM algorithm, which contains data preprocessing techniques such as mode and mean imputation, label encoding, and Min-Max scaling. Feature selection is improved using the Hybrid Filter-Wrapper Ensemble (HFWE) method, which combines Mutual Information, Chi-Square Test, ANOVA F-Test, and Recursive Feature Elimination (RFE) with Support Vector Machine (SVM), Random Forest, and Gradient Boosting Machine (GBM), with the final subset determined by majority voting. The selected features, like melody structure, key signature, tempo, rhythm complexity, instrumentation, and emotion, are used as inputs for an LSTM-based deep learning model that comprises multiple LSTM layers, dropout layers to prevent overfitting, and a dense output layer to create melodies and forecast their commercial success. Results: Performance evaluation using accuracy, precision, recall, F1-score, and Matthew’s correlation coefficient (MCC) provides better results with the GenAI Melody-LSTM algorithm, with 89.7% accuracy, 87.5% precision, 88.2% recall, an F1-score of 87.8%, and an MCC of 0.82. Conclusion: This research demonstrates that integrating generative AI, optimal feature selection, and deep learning significantly enhances Chinese pop music compositions. The LSTM-based model generates melodies and predicts their commercial viability, enabling composers to fine-tune AI-generated music for improved quality and market appeal.
Generative AI Chinese pop music LSTM networks feature selection melody prediction
Arka Plan: Üretken yapay zekanın (YZ) hızla gelişmesi, özellikle kendine özgü melodik yapıları ve duygusal derinliği nedeniyle benzersiz zorluklar sunan Çin popüler müziği (C-pop) olmak üzere müzik endüstrisi üzerinde önemli bir etkiye sahip olmuştur. Yapay zeka verimliliği artırabilir ve bestecilere ilham verebilirken, mevcut modeller özellik seçimi ve tahmin doğruluğu konusunda etkisizdir ve bu da stilistik bütünlük ve ticari uygulanabilirliği olmayan bestelere yol açmaktadır. Sorun Bildirimi: Mevcut YZ tarafından üretilen melodiler genellikle insan bestelerinin stilistik derinliğinden yoksundur ve pazar başarısını doğru bir şekilde tahmin edememektedir. Bu zorluklar, yüksek kaliteli melodiler üretebilen daha etkili bir YZ çerçevesine olan ihtiyacı vurgulamaktadır. Amaçlar: Bu çalışma, Çin pop şarkılarından esinlenerek melodiler oluşturmak ve bunların başarısını tahmin etmek için Uzun Kısa Süreli Bellek (LSTM) ağlarını kullanan üretken bir YZ odaklı teknik olan GenAI Melody-LSTM algoritmasını tanıtmaktadır. Ana hedefler, müzik ön işleme için bir YZ boru hattı oluşturmak, özellik seçimini iyileştirmek, stilistik olarak tutarlı melodiler için derin öğrenme modeli eğitmek ve etkinliğini diğer yöntemlerle karşılaştırmaktır. Metodoloji: Metodoloji, mod ve ortalama hesaplama, etiket kodlama ve Min-Max ölçekleme gibi veri ön işleme tekniklerini içeren bir GenAI Melody-LSTM algoritmasını kullanır. Özellik seçimi, Karşılıklı Bilgi, Ki-Kare Testi, ANOVA F Testi ve Destek Vektör Makinesi (SVM), Rastgele Orman ve Gradyan Artırma Makinesi (GBM) ile Yinelemeli Özellik Eleme (RFE)’yi birleştiren Hibrit Filtre-Sarmalayıcı Topluluğu (HFWE) yöntemi kullanılarak iyileştirilir ve son alt küme çoğunluk oyu ile belirlenir. Melodi yapısı, anahtar imzası, tempo, ritim karmaşıklığı, enstrümantasyon ve duygu gibi seçilen özellikler, birden fazla LSTM katmanı, aşırı uyumu önlemek için bırakma katmanları ve melodiler oluşturmak ve ticari başarılarını tahmin etmek için yoğun bir çıktı katmanı içeren LSTM tabanlı bir derin öğrenme modeli için girdi olarak kullanılır. Sonuçlar: Doğruluk, kesinlik, geri çağırma, F1 puanı ve Matthew’nun korelasyon katsayısı (MCC) kullanılarak yapılan performans değerlendirmesi, %89,7 doğruluk, %87,5 kesinlik, %88,2 geri çağırma, %87,8’lik bir F1 puanı ve 0,82’lik bir MCC ile GenAI Melody-LSTM algoritmasıyla daha iyi sonuçlar sağlar. Sonuç: Bu araştırma, üretken AI, optimum özellik seçimi ve derin öğrenmenin entegre edilmesinin Çin pop müziği bestelerini önemli ölçüde geliştirdiğini göstermektedir. LSTM tabanlı model melodiler üretir ve bunların ticari uygulanabilirliğini tahmin ederek bestecilerin AI tarafından üretilen müziği gelişmiş kalite ve pazar çekiciliği için ince ayar yapmalarını sağlar.
Üretken yapay zeka Çin pop müziği LSTM ağları özellik seçimi melodi tahmini
| Birincil Dil | İngilizce |
|---|---|
| Konular | Müzik Eğitimi, Müzik Teknolojisi ve Kayıt |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 30 Mart 2025 |
| Kabul Tarihi | 2 Temmuz 2025 |
| Yayımlanma Tarihi | 29 Ekim 2025 |
| Yayımlandığı Sayı | Yıl 2025 Cilt: 10 Sayı: 4 |