Data
mining is a statistical process to extract useful information, unknown patterns
and interesting relationships in large databases. In this process, many
statistical methods are used. Two of these methods are Bayesian networks and
association analysis. Bayesian networks are probabilistic graphical models that
encode relationships among a set of random variables in a database. Since they
have both causal and probabilistic aspects, data information and expert
knowledge can easily be combined by them. Bayesian networks can also represent
knowledge about uncertain domain and make strong inferences. Association
analysis is a useful technique to detect hidden associations and rules in large
databases, and it extracts previously unknown and surprising patterns from
already known information. A drawback of association analysis is that many
patterns are generated even if the data set is very small. Hence, suitable
interestingnes measures must be performed to eliminate uninteresting patterns.
Bayesian networks and association
analysis can be used together in knowledge discovery. As association rules are
used to create Bayesian networks, interestingness measures to determine
interesting patterns can be established by Bayesian networks. In this study,
this mutual utilization between Bayesian Netwoks and association analysis is
explained and an illustration over a real life problem is presented.
Bayesian networks association analysis interestingness measures frequent itemsets
Veri madenciliği, büyük veri kümelerinden yararlı bilginin, bilinmeyen örüntülerin ve ilginç ilişkilerin ortaya çıkartıldığı istatistiksel bir süreçtir. Bu süreçte, pek çok istatistiksel yöntem kullanılabilir. Bu yöntemlerden ikisi Bayesci ağlar ve birliktelik analizidir. Bayesci ağlar, bir veri tabanında yer alan raslantı değişkenlerinin bir kümesindeki olasılıksal ilişkileri kodlayan grafiksel modellerdir. Hem nedensel hem de olasılıksal özelliklere sahip olduğundan Bayesci ağlar ile veri ve uzman bilgisi kolaylıkla birleştirilebilir. Bayesci ağlar ayrıca, ilgilenilen problemin kesin olmayan tanım kümesi hakkındaki bilgiyi temsil etmek için kullanılır ve güçlü çıkarsamaların yapılmasını sağlar. Birliktelik analizi, büyük veri tabanlarındaki gizli birlikteliklerin, yararlı kuralların ve şaşırtıcı örüntülerin ortaya çıkartılmasını sağlayan bir yöntemdir.Birliktelik analizinin bir kusuru, veri kümesi çok küçük olsa dahi çok sayıda örüntünün ortaya çıkartılmasıdır.Bu nedenle, bu örüntülerden ilginç olmayanların elenmesi için ilginçlik ölçümleri kullanılmalıdır
bayesci ağlar birliktelik analizi ilginçlik ölçümleri sık gözlenen nesne kümeler
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 1 Haziran 2012 |
Yayımlandığı Sayı | Yıl 2012 Cilt: 5 Sayı: 2 |