Yaşadığımız dünya ve bizim hakkımızda bilgiye (insanlar neyi sever/sevmez, ister/istemez?, insanlar/nesneler nerelerde bulunur?, hangi eylemler nerede/hangi amaçla yapılır? vb.) sahip bilgisayarlar, hayatlarımızı daha fazla kolaylaştıracaklardır. Örneğin böyle sisteme, kullanıcısı kedisinin hasta olduğunu söylediğinde sistem ona en yakındaki veterinerin telefonunu verecek, bilgisayarlara yapacakları her şeyi en ince ayrıntılarına kadar anlatma gereksinimimiz ortadan kalkacaktır. Ancak böyle uygulamaları mümkün kılacak anlamsal veritabanlarının elle oluşturulması oldukça zor ve zaman alıcı bir süreçtir. Bu tür bilgilerin Türkçe toplanması için başlattığımız projede birçok metin koleksiyonundan ve birçok otomatik bilgi çıkarımı yönteminden yararlanılması düşünülmektedir. Bu çalışmada, bu tür bilgilerin tümcelerin öğe ikililerinden üretilebileceği fikri ve bunun uygulaması sunulmuştur. Çok sayıda tümcenin öğe çözümlemelerinden bu tür bilgiler (hayat bilgisi) otomatik olarak üretilmiştir. Örneğin özne - dolaylı tümleç öğe ikililerinden bir şeyin nerelerde bulunduğu, özne-yüklem öğe ikililerinden bir şeyin yapabildiği şeylerin neler olduğu bilgileri çıkarılmıştır. Yapılan çalışma sayesinde Türkçe için oluşturduğumuz hayat bilgisi veri tabanı için 13 farklı ilişki türüne ait 26.877 adet kavram ikilisi bulunmuştur.
Otomatik Bilgi Çıkarımı Hayat Bilgisi Veri Tabanları Tümce Çözümleme Tümcelerin Öğelerıne Ayrılması
Computers having commonsense knowledge (What do people like/dislike, want /not want?, Where do you find people/objects?, What are the causes of our action? etc.) facilitate our lives more. Such a system, when the user says that his/her cat is ill, responses the contact information of the nearest veterinarian. However, the manually creation of such semantic databases is very difficult and time consuming process. We initiated a project for collecting Turkish commonsense knowledge from several corpus by several automatic information extraction methods. In this study, the idea of such information can be extracted from the pairs of sentence elements is presented and implemented. For example, “subject-indirect object” pairs says a place where the subject can be found. “subject-verb” pairs says what can a subject do. A commonsense knowledge base were constructed consist of 26.877 knowledge triple of 13 relation types.
Commonsene Knowledge Acquisition Commonsense Databases Sentence Analysis Automatic Information Extraction
Diğer ID | JA37JZ62VY |
---|---|
Bölüm | Makaleler(Araştırma) |
Yazarlar | |
Yayımlanma Tarihi | 24 Haziran 2016 |
Yayımlandığı Sayı | Yıl 2012 Cilt: 5 Sayı: 2 - Cilt: 5 Sayı: 2 |
https://i.creativecommons.org/l/by-nc/4.0Makale Kabulü | |
Çevrimiçi makale yüklemesi yapmak için kullanıcı kayıt/girişini kullanınız. Dergiye gönderilen makalelerin kabul süreci şu aşamalardan oluşmaktadır: 1. Gönderilen her makale ilk aşamada en az iki hakeme gönderilmektedir. 2. Hakem ataması, dergi editörleri tarafından yapılmaktadır. Derginin hakem havuzunda yaklaşık 200 hakem bulunmaktadır ve bu hakemler ilgi alanlarına göre sınıflandırılmıştır. Her hakeme ilgilendiği konuda makale gönderilmektedir. Hakem seçimi menfaat çatışmasına neden olmayacak biçimde yapılmaktadır. 3. Hakemlere gönderilen makalelerde yazar adları kapatılmaktadır. 4. Hakemlere bir makalenin nasıl değerlendirileceği açıklanmaktadır ve aşağıda görülen değerlendirme formunu doldurmaları istenmektedir. 5. İki hakemin olumlu görüş bildirdiği makaleler editörler tarafından benzerlik incelemesinden geçirilir. Makalelerdeki benzerliğin %25’ten küçük olması beklenir. 6. Tüm aşamaları geçmiş olan bir bildiri dil ve sunuş açısından editör tarafından incelenir ve gerekli düzeltme ve iyileştirmeler yapılır. Gerekirse yazarlara durum bildirilir.
Bu eser Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı ile lisanslanmıştır. |