BibTex RIS Cite

Tümce Öğelerinden Hayat Bilgisi Çıkarımı

Year 2012, Volume: 5 Issue: 2 - Volume: 5 Issue: 2, - , 24.06.2016

Abstract

Yaşadığımız dünya ve bizim hakkımızda bilgiye (insanlar neyi sever/sevmez, ister/istemez?, insanlar/nesneler nerelerde bulunur?, hangi eylemler nerede/hangi amaçla yapılır? vb.) sahip bilgisayarlar, hayatlarımızı daha fazla kolaylaştıracaklardır. Örneğin böyle sisteme, kullanıcısı kedisinin hasta olduğunu söylediğinde sistem ona en yakındaki veterinerin telefonunu verecek, bilgisayarlara yapacakları her şeyi en ince ayrıntılarına kadar anlatma gereksinimimiz ortadan kalkacaktır. Ancak böyle uygulamaları mümkün kılacak anlamsal veritabanlarının elle oluşturulması oldukça zor ve zaman alıcı bir süreçtir. Bu tür bilgilerin Türkçe toplanması için başlattığımız projede birçok metin koleksiyonundan ve birçok otomatik bilgi çıkarımı yönteminden yararlanılması düşünülmektedir. Bu çalışmada, bu tür bilgilerin tümcelerin öğe ikililerinden üretilebileceği fikri ve bunun uygulaması sunulmuştur. Çok sayıda tümcenin öğe çözümlemelerinden bu tür bilgiler (hayat bilgisi) otomatik olarak üretilmiştir. Örneğin özne - dolaylı tümleç öğe ikililerinden bir şeyin nerelerde bulunduğu, özne-yüklem öğe ikililerinden bir şeyin yapabildiği şeylerin neler olduğu bilgileri çıkarılmıştır. Yapılan çalışma sayesinde Türkçe için oluşturduğumuz hayat bilgisi veri tabanı için 13 farklı ilişki türüne ait 26.877 adet kavram ikilisi bulunmuştur.

References

  • [1] Lenat., D.B., 1995. "Cyc: A Large-Scale Investment in Knowledge Infrastructure", The Communications of the ACM, 38(11):33-38.
  • [2] Singh, P., Lin, T., Mueller, E.T., Lim, G., Perkins, T. ve Zhu, W.L., 2002. "Open Mind Common Sense: Knowledge acquisition from the general public", Proceedings of the First International Conference on Ontologies, Databases, and Applications of Semantics for Large Scale Information Systems, Irvine, CA.
  • [3] Bilgin O., Çetinoğlu Ö. ve Oflazer K., 2004. "Building a Wordnet for Turkish", Romanian Journal of Information Science and Technology, cilt 7, 1-2.
  • [4] Güngör, O. ve Güngör, T., 2005. " Türkçe için Bilgisayarla İşlenebilir Sözlük Kullanarak Kavramlar Arasındaki İlişkilerin Belirlenmesi", Akademik Bilişim Konferansı, 2007.
  • [5] Amasyalı M.F., "Türkçe Wordnet'in Otomatik Olarak Oluşturulması", Sinyal İşleme ve Uygulamaları Sempozyumu.
  • [6] Amasyalı, M.F., İnak, B. ve Ersen, M.Z., 2010. “Türkçe Hayat Bilgisi Veri Tabanının Oluşturulması", Akademik Bilişim Sempozyumu.
  • [7] Can, F., Koçberber, S., Bağlıoğlu, O., Kardaş, S., Öcalan, H.C., Uyar, E., 2009. "Türkçe haberlerde yeni olay bulma ve izleme: Bir deney derleminin oluşturulması", Akademik Bilişim Sempozyumu.
  • [8] http://code.google.com/p/zemberek/
  • [9] Kemal Oflazer, Bilge Say, Dilek Zeynep Hakkani-Tür, Gökhan Tür, 2003. Building a Turkish Treebank, Invited chapter in Building and Exploiting Syntactically-annotated Corpora, Anne Abeille Editor, Kluwer Academic Publishers.
  • [10] Haşim Sak, Tunga Güngör, Murat Saraçlar, 2007. Morphological Disambiguation of Turkish Text with Perceptron Algorithm, CICLing 2007, LNCS 4394, 107–118.

Commonsense Knowledge Acquisition by Sentence Analysis

Year 2012, Volume: 5 Issue: 2 - Volume: 5 Issue: 2, - , 24.06.2016

Abstract

Computers having commonsense knowledge (What do people like/dislike, want /not want?, Where do you find people/objects?, What are the causes of our action? etc.) facilitate our lives more. Such a system, when the user says that his/her cat is ill, responses the contact information of the nearest veterinarian. However, the manually creation of such semantic databases is very difficult and time consuming process. We initiated a project for collecting Turkish commonsense knowledge from several corpus by several automatic information extraction methods. In this study, the idea of such information can be extracted from the pairs of sentence elements is presented and implemented. For example, “subject-indirect object” pairs says a place where the subject can be found. “subject-verb” pairs says what can a subject do. A commonsense knowledge base were constructed consist of 26.877 knowledge triple of 13 relation types.

References

  • [1] Lenat., D.B., 1995. "Cyc: A Large-Scale Investment in Knowledge Infrastructure", The Communications of the ACM, 38(11):33-38.
  • [2] Singh, P., Lin, T., Mueller, E.T., Lim, G., Perkins, T. ve Zhu, W.L., 2002. "Open Mind Common Sense: Knowledge acquisition from the general public", Proceedings of the First International Conference on Ontologies, Databases, and Applications of Semantics for Large Scale Information Systems, Irvine, CA.
  • [3] Bilgin O., Çetinoğlu Ö. ve Oflazer K., 2004. "Building a Wordnet for Turkish", Romanian Journal of Information Science and Technology, cilt 7, 1-2.
  • [4] Güngör, O. ve Güngör, T., 2005. " Türkçe için Bilgisayarla İşlenebilir Sözlük Kullanarak Kavramlar Arasındaki İlişkilerin Belirlenmesi", Akademik Bilişim Konferansı, 2007.
  • [5] Amasyalı M.F., "Türkçe Wordnet'in Otomatik Olarak Oluşturulması", Sinyal İşleme ve Uygulamaları Sempozyumu.
  • [6] Amasyalı, M.F., İnak, B. ve Ersen, M.Z., 2010. “Türkçe Hayat Bilgisi Veri Tabanının Oluşturulması", Akademik Bilişim Sempozyumu.
  • [7] Can, F., Koçberber, S., Bağlıoğlu, O., Kardaş, S., Öcalan, H.C., Uyar, E., 2009. "Türkçe haberlerde yeni olay bulma ve izleme: Bir deney derleminin oluşturulması", Akademik Bilişim Sempozyumu.
  • [8] http://code.google.com/p/zemberek/
  • [9] Kemal Oflazer, Bilge Say, Dilek Zeynep Hakkani-Tür, Gökhan Tür, 2003. Building a Turkish Treebank, Invited chapter in Building and Exploiting Syntactically-annotated Corpora, Anne Abeille Editor, Kluwer Academic Publishers.
  • [10] Haşim Sak, Tunga Güngör, Murat Saraçlar, 2007. Morphological Disambiguation of Turkish Text with Perceptron Algorithm, CICLing 2007, LNCS 4394, 107–118.
There are 10 citations in total.

Details

Other ID JA37JZ62VY
Journal Section Makaleler(Araştırma)
Authors

Cihan Özköse This is me

Mehmet Fatih Amasyalı This is me

Publication Date June 24, 2016
Published in Issue Year 2012 Volume: 5 Issue: 2 - Volume: 5 Issue: 2

Cite

APA Özköse, C., & Amasyalı, M. F. (2016). Tümce Öğelerinden Hayat Bilgisi Çıkarımı. Türkiye Bilişim Vakfı Bilgisayar Bilimleri Ve Mühendisliği Dergisi, 5(2).
AMA Özköse C, Amasyalı MF. Tümce Öğelerinden Hayat Bilgisi Çıkarımı. TBV-BBMD. June 2016;5(2).
Chicago Özköse, Cihan, and Mehmet Fatih Amasyalı. “Tümce Öğelerinden Hayat Bilgisi Çıkarımı”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri Ve Mühendisliği Dergisi 5, no. 2 (June 2016).
EndNote Özköse C, Amasyalı MF (June 1, 2016) Tümce Öğelerinden Hayat Bilgisi Çıkarımı. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 5 2
IEEE C. Özköse and M. F. Amasyalı, “Tümce Öğelerinden Hayat Bilgisi Çıkarımı”, TBV-BBMD, vol. 5, no. 2, 2016.
ISNAD Özköse, Cihan - Amasyalı, Mehmet Fatih. “Tümce Öğelerinden Hayat Bilgisi Çıkarımı”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 5/2 (June 2016).
JAMA Özköse C, Amasyalı MF. Tümce Öğelerinden Hayat Bilgisi Çıkarımı. TBV-BBMD. 2016;5.
MLA Özköse, Cihan and Mehmet Fatih Amasyalı. “Tümce Öğelerinden Hayat Bilgisi Çıkarımı”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri Ve Mühendisliği Dergisi, vol. 5, no. 2, 2016.
Vancouver Özköse C, Amasyalı MF. Tümce Öğelerinden Hayat Bilgisi Çıkarımı. TBV-BBMD. 2016;5(2).

https://i.creativecommons.org/l/by-nc/4.0Makale Kabulü

 

Çevrimiçi makale yüklemesi yapmak için kullanıcı kayıt/girişini kullanınız.

Dergiye gönderilen makalelerin kabul süreci şu aşamalardan oluşmaktadır:

1.       Gönderilen her makale ilk aşamada en az iki hakeme gönderilmektedir.

2.       Hakem ataması, dergi editörleri tarafından yapılmaktadır. Derginin hakem havuzunda yaklaşık 200 hakem bulunmaktadır ve bu hakemler ilgi alanlarına göre sınıflandırılmıştır. Her hakeme ilgilendiği konuda makale gönderilmektedir. Hakem seçimi menfaat çatışmasına neden olmayacak biçimde yapılmaktadır.

3.       Hakemlere gönderilen makalelerde yazar adları kapatılmaktadır.

4.       Hakemlere bir makalenin nasıl değerlendirileceği açıklanmaktadır ve aşağıda görülen değerlendirme formunu doldurmaları istenmektedir.

5.       İki hakemin olumlu görüş bildirdiği makaleler editörler tarafından benzerlik incelemesinden geçirilir. Makalelerdeki benzerliğin %25’ten küçük olması beklenir.

6.       Tüm aşamaları geçmiş olan bir bildiri dil ve sunuş açısından editör tarafından incelenir ve gerekli düzeltme ve iyileştirmeler yapılır. Gerekirse yazarlara durum bildirilir.

 88x31.png   Bu eser Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı ile lisanslanmıştır.