The growth rate of data is increasing rapidly every passing day. In addition to this structurally growing data, unstructured data is now also a part of the data world. Today, while many different types of devices produce and transfer data, data is now an asset and value for institutions. However, at a point where data grows and diversifies so rapidly, managing the data itself and the metadata containing the data of the data, benefiting from this, and ensuring data-driven business transformations are even more difficult areas. In this study, a system is presented to companies to solve management problems in the field of metadata, where they can track data and digital assets that are rapidly expanding with the age of digitalization end-to-end. In addition, this system aims to group data with the support of large language models, classify data baskets with machine learning methods, comply with data security policies required by KVKK with natural language processing methods, and create a platform where companies can analyze their own metadata. With this platform, the design phase of which has been completed, using machine learning methods including natural language processing and quality assessment methods, data profiling, increasing data quality, and grouping related data will enable institutions to use the full potential of their data in decision-making. In addition, institutions will be able to manage data lines on the same platform without the need for other tools.
3220241
Verilerin büyüme hızı her geçen gün ivmeli bir şekilde artmaktadır. Yapısal olarak büyüyen bu verilerin yanı sıra artık yapısal olmayan veriler de veri dünyasının bir parçası olmaktadır. Günümüzde artık çok farklı tipteki cihazlar veri üretip, aktarırken veri artık kurumlar için bir varlık ve değer anlamına gelmektedir. Fakat verilerin bu kadar hızlı büyüdüğü ve çeşitlendiği noktada verinin kendisini ve de verinin verisini içeren metadata yönetmek bundan fayda sağlamak, veri güdümlü iş dönüşümlerini sağlamak daha da güçlük yaşanan bir alandır. Metaveri alanındaki yönetim problemlerini çözmek için bu çalışmada, kurumlara dijitalleşme çağıyla birlikte hızla genişleyen veri ve dijital varlıklarını uçtan uca takip edebilecekler, büyük dil modellerinin desteği ile verinin gruplanması, doğal dil işleme yöntemler ile KVKK gereği oluşan veri güvenliği politikalarına uyum sağlayabilecekleri, ayrıca kendi verileriyle analiz yapabilecekleri bir platform oluşturulması amaçlanmaktadır. Tasarım aşaması gerçekleştirilen bu platform ile birlikte doğal dil işleme ve nitelik değerlendirme yöntemlerini içeren makine öğrenmesi yöntemlerinin kullanılmasıyla veri profillemesi, veri kalitesinin arttırılması, ilişkili verileri gruplama gibi özellikleriyle kurumların karar almasında sahip oldukları verinin tam potansiyelini kullanması sağlanacaktır. Ayrıca, kurumların diğer araçlara gerek duymadan aynı platform üzerinde veri hatlarında veriyi yönetebilmeleri sağlanacaktır.
yok
Tubitak
3220241
Bu çalışma DIP Bilgisayar Yazılım Ticaret Anonim Şirketi'nin Tubitak TEYDEB Programı kapsamında kabul edilen 3220241 kodlu Yapay Zeka ve Makina Öğrenmesi Destekli Veri ve MetaVeri Yönetim Platformu Programı başlıklı projesi kapsamında desteklenmiştir. Destekleri için Tubitak'a teşekkürlerimizi sunarız.
| Birincil Dil | İngilizce |
|---|---|
| Konular | Bilgisayar Yazılımı |
| Bölüm | Research Article |
| Yazarlar | |
| Proje Numarası | 3220241 |
| Yayımlanma Tarihi | 26 Ağustos 2025 |
| Gönderilme Tarihi | 8 Ekim 2024 |
| Kabul Tarihi | 12 Aralık 2024 |
| Yayımlandığı Sayı | Yıl 2025 Cilt: 8 Sayı: 1 |