Research Article
BibTex RIS Cite

GPT3: DALL-E AND JL2P ON AXIS OF DATA VISUALIZATION AND MOTION A REVIEW ON

Year 2021, , 253 - 280, 20.04.2021
https://doi.org/10.47994/usbad.871726

Abstract

Artificial intelligence, one of the powerful symbols of technological evolution, progresses rapidly in line with current developments in the field of deep learning. One of the concrete outputs of this progress, the GPT3 system (producer pre-trained converter-generative pre-trained transformer3) is rapidly developing in the field of data visualization, depending on the deep learning language model. Dall-e, a product of GPT3 developed by OpenAI, is an artificial neural network that converts texts expressed in natural language into images. By recognizing the meaning of around 12 billion parameters to Dall, it can transform the sentences given to Dall into visuals that have never been done before. Another system that works similar to the Dall-e system is the natural language-based pose prediction study called JL2P (Joint Language to Pose). In the JL2P application, there is a text-based action just like Dall-e. According to the verbal input given in this system, the relevant character can perform the desired movement visually. This situation shows that character visualizations and movements can be easily done only through verbal expressions in the field of animation and game design. This article aims to convey to the reader the current developments brought about by the data visualization and activation skills of artificial intelligence with an interdisciplinary perspective. Studies in the field of artificial intelligence and data visualization open the door to a system that can inspire designers while creating storyboards or brainstorming. Research in this field is important for evaluating the relationship between designer and artificial intelligence through concepts such as creativity, productivity, and speed.

References

  • Ahuja, C. & Morency, L. P. (2018). Language2Pose: Natural Language Grounded Pose Forecasting. Cornell University, Erişim Adresi: https://arxiv.org/abs/1907.01108.
  • Friendly, M. & Brief, A. (2006). History of Data Visualization: Handbook of Computational Statistics. Toronto: Canada
  • Güler, T. (2008). Bilgilendirme Tasarımı. Grafik Tasarım Dergisi 21, 28.
  • Koh, Y. J., Baldridge, J., Lee, H. & Yang Y. (2020). Text-to-Image Generation Grounded by Fine-Grained User Attention. Google Research. Erişim Adresi: https://arxiv.org/pdf/1711.10485.pdf
  • Schwab, K. (2017). Dördüncü Sanayi Devrimi. İstanbul: Optimist Yayınları.
  • Mohri, M., Rostamizadeh, A. & Talwalkar, A. (2012). Foundations of Machine Learning. Cambridge: The MIT Press.
  • Mitchell, T. M. (1997). Machine Learning. 1st Edition, New York: McGraw-Hill.
  • Najafabadi, M. M., Villanustre, F., Khoshgoftaar, T. M., Seliya, N., Wald, R. & Muharemagic, E. (2015). Deep Learning Applications and Challenges in Big Data Analytics. Journal of Big Data 2(1), 1–21.
  • Zhang, Y., Tsipidi, E., Schriber, S., Kapadia, M., Gross, M. & Modi, A. (2019). Generating Animation from Screenplays. Disney Research&Rutgers University. Erişim Adresi: https://arxiv.org/pdf/1904.05440.pdf.
  • Zicari, V. R. (2018). Explorations in Artificial Intelligence and Machine Learning. Florida: CRC Press.
  • OpenAİ. (2021). Erişim Adresi: https://openai.com/blog/organizational-update/ Erişim Tarihi: 14.01.2021.
  • Openai. (2021). Erişim Adresi: https://youtu.be/zfllpcBlAVI, Erişim Tarihi: 15.01.2021.
  • Görsel 1: Veri görselleştirme üzerine temsil görsel. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 2: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 3: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 4: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 5: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 6: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 7: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 8: Yapay zekâ tarafından oluşturulan renk tanıma çalışmaları. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 9: Yapay zekâ tarafından stil, ışık/gölge ve iklime göre oluşturulan görseller. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 10: Yapay zekâ tarafından stil, ışık/gölge ve iklime göre oluşturulan görseller. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 11: Yapay zekâ tarafından oluşturulan stil ve kompozisyon görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 12: Yapay zekâ tarafından oluşturulan mevsime göre değişen kompozisyon görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 13: Yapay zekâ tarafından oluşturulan mevsime göre değişen kompozisyon görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 14: Yapay zekâ tarafından oluşturulan vitray görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 15: Yapay zekâ tarafından oluşturulan vitray görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 16: Yapay zekâ tarafından oluşturulan hayvan kombinasyonları. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 17: Yapay zekâ tarafından oluşturulan robot görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 18: Yapay zekâ tarafından oluşturulan robot görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 19: Yapay zekâ tarafından oluşturulan emoji örnekleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 20: Yapay zekâ tarafından oluşturulan emoji örnekleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 21: Doğal dile dayalı poz animasyonu temsili görseli. (2019). Erişim adresi: https://arxiv.org/pdf/1907.01108.pdf
  • Görsel 22: Yön kavramına göre yapılan poz tahmini animasyonu. (2019). Erişim adresi: https://arxiv.org/pdf/1907.01108.pdf
  • Görsel 23: Hız kavramına göre yapılan poz tahmini animasyonu. (2019). Erişim adresi: https://arxiv.org/pdf/1907.01108.pdf
  • Görsel 24: Hareket kavramına göre yapılan poz tahmini animasyonu. (2019). Erişim adresi: https://arxiv.org/pdf/1907.01108.pdf
  • Görsel 25: Microsoft ObjGAN veri görselleştirme sistemi. (2019). Erişim adresi: https://medium.com/syncedreview/microsoft-obj-gan-turns-words-into-complex-scenes-5c6024f0f91d<.
  • Görsel 26: Disney veri görselleştirme sistemi. (2019). Erişim adresi: https://studios.disneyresearch.com/wp-content/uploads/2019/08/Generating-Animations-from-Screenplays.pdf

GPT3: DALL-E VE JL2P EKSENİNDE VERİ GÖRSELLEŞTİRME VE HAREKETLENDİRME ÜZERİNE BİR İNCELEME

Year 2021, , 253 - 280, 20.04.2021
https://doi.org/10.47994/usbad.871726

Abstract

Teknolojik evrimin güçlü sembollerinden biri olan yapay zekâ, derin öğrenme alanındaki güncel gelişmeler doğrultusunda hızla ilerleme kaydetmektedir. Bu ilerlemenin somut çıktılarından biri olan GPT3 sistemi (üretici ön-eğitimli dönüştürücü-generative pre-trained transformer3) derin öğrenme dil modeline bağlı olarak, veri görselleştirme alanında hızla gelişmektedir. OpenAI tarafından geliştirilen GPT3'ün bir ürünü olan Dall-e, doğal dilde ifade edilen metinleri görüntüye dönüştüren yapay bir sinir ağıdır. Dall'e 12 milyar civarında parametrenin anlamını tanıyarak kendisine verilen cümleleri daha önce hiç yapılmamış görsellere dönüştürebilmektedir. Dall-e sistemine benzer bir şekilde çalışan bir diğer sistem ise, JL2P (Joint Language to Pose) olarak adlandırılan doğal dile dayalı poz tahmini çalışmasıdır. JL2P uygulamasında tıpkı Dall-e de olduğu gibi yazı temelli bir aksiyon söz konusudur. Bu sistemde verilen sözel girdiye göre ilgili karakter, kendisinden istenen hareketi görsel olarak gerçekleştirebilmektedir. Bu durum animasyon ve oyun tasarımı alanında sadece sözel ifadeler üzerinden karakter görselleştirmelerinin ve hareketlerinin kolaylıkla yapılabileceğini göstermektedir. Bu makale, yapay zekânın veri görselleştirme ve hareketlendirme becerilerinin getirmiş olduğu güncel gelişmeleri, disiplinler arası bir bakış açısıyla okuyucuya aktarmayı amaçlamaktadır. Yapay zekâ ve veri görselleştirme alanındaki çalışmalar, tasarımcıların hikaye panosu (storyboard) oluştururken ya da beyin fırtınası (brainstorming) yaparken ilham almalarını sağlayabilecek bir sistemin kapılarını aralamaktadır. Bu alanda yapılan araştırmalar, tasarımcı ve yapay zekâ ilişkisinin yaratıcılık, üretkenlik, hız gibi kavramlar üzerinden değerlendirilmesi adına önemlidir. 

References

  • Ahuja, C. & Morency, L. P. (2018). Language2Pose: Natural Language Grounded Pose Forecasting. Cornell University, Erişim Adresi: https://arxiv.org/abs/1907.01108.
  • Friendly, M. & Brief, A. (2006). History of Data Visualization: Handbook of Computational Statistics. Toronto: Canada
  • Güler, T. (2008). Bilgilendirme Tasarımı. Grafik Tasarım Dergisi 21, 28.
  • Koh, Y. J., Baldridge, J., Lee, H. & Yang Y. (2020). Text-to-Image Generation Grounded by Fine-Grained User Attention. Google Research. Erişim Adresi: https://arxiv.org/pdf/1711.10485.pdf
  • Schwab, K. (2017). Dördüncü Sanayi Devrimi. İstanbul: Optimist Yayınları.
  • Mohri, M., Rostamizadeh, A. & Talwalkar, A. (2012). Foundations of Machine Learning. Cambridge: The MIT Press.
  • Mitchell, T. M. (1997). Machine Learning. 1st Edition, New York: McGraw-Hill.
  • Najafabadi, M. M., Villanustre, F., Khoshgoftaar, T. M., Seliya, N., Wald, R. & Muharemagic, E. (2015). Deep Learning Applications and Challenges in Big Data Analytics. Journal of Big Data 2(1), 1–21.
  • Zhang, Y., Tsipidi, E., Schriber, S., Kapadia, M., Gross, M. & Modi, A. (2019). Generating Animation from Screenplays. Disney Research&Rutgers University. Erişim Adresi: https://arxiv.org/pdf/1904.05440.pdf.
  • Zicari, V. R. (2018). Explorations in Artificial Intelligence and Machine Learning. Florida: CRC Press.
  • OpenAİ. (2021). Erişim Adresi: https://openai.com/blog/organizational-update/ Erişim Tarihi: 14.01.2021.
  • Openai. (2021). Erişim Adresi: https://youtu.be/zfllpcBlAVI, Erişim Tarihi: 15.01.2021.
  • Görsel 1: Veri görselleştirme üzerine temsil görsel. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 2: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 3: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 4: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 5: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 6: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 7: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 8: Yapay zekâ tarafından oluşturulan renk tanıma çalışmaları. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 9: Yapay zekâ tarafından stil, ışık/gölge ve iklime göre oluşturulan görseller. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 10: Yapay zekâ tarafından stil, ışık/gölge ve iklime göre oluşturulan görseller. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 11: Yapay zekâ tarafından oluşturulan stil ve kompozisyon görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 12: Yapay zekâ tarafından oluşturulan mevsime göre değişen kompozisyon görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 13: Yapay zekâ tarafından oluşturulan mevsime göre değişen kompozisyon görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 14: Yapay zekâ tarafından oluşturulan vitray görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 15: Yapay zekâ tarafından oluşturulan vitray görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 16: Yapay zekâ tarafından oluşturulan hayvan kombinasyonları. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 17: Yapay zekâ tarafından oluşturulan robot görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 18: Yapay zekâ tarafından oluşturulan robot görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 19: Yapay zekâ tarafından oluşturulan emoji örnekleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 20: Yapay zekâ tarafından oluşturulan emoji örnekleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
  • Görsel 21: Doğal dile dayalı poz animasyonu temsili görseli. (2019). Erişim adresi: https://arxiv.org/pdf/1907.01108.pdf
  • Görsel 22: Yön kavramına göre yapılan poz tahmini animasyonu. (2019). Erişim adresi: https://arxiv.org/pdf/1907.01108.pdf
  • Görsel 23: Hız kavramına göre yapılan poz tahmini animasyonu. (2019). Erişim adresi: https://arxiv.org/pdf/1907.01108.pdf
  • Görsel 24: Hareket kavramına göre yapılan poz tahmini animasyonu. (2019). Erişim adresi: https://arxiv.org/pdf/1907.01108.pdf
  • Görsel 25: Microsoft ObjGAN veri görselleştirme sistemi. (2019). Erişim adresi: https://medium.com/syncedreview/microsoft-obj-gan-turns-words-into-complex-scenes-5c6024f0f91d<.
  • Görsel 26: Disney veri görselleştirme sistemi. (2019). Erişim adresi: https://studios.disneyresearch.com/wp-content/uploads/2019/08/Generating-Animations-from-Screenplays.pdf
There are 38 citations in total.

Details

Primary Language Turkish
Journal Section Research Articles
Authors

Ezgi Şen 0000-0003-2886-7098

Publication Date April 20, 2021
Acceptance Date February 17, 2021
Published in Issue Year 2021

Cite

APA Şen, E. (2021). GPT3: DALL-E VE JL2P EKSENİNDE VERİ GÖRSELLEŞTİRME VE HAREKETLENDİRME ÜZERİNE BİR İNCELEME. Uluslararası Sosyal Bilimler Akademi Dergisi(5), 253-280. https://doi.org/10.47994/usbad.871726

16494  16495  16496  16503  16570 16633   16823 

 16824 17564  19288 22730 22803 

 23495     

   25002    30847    

             Uluslararası Sosyal Bilimler Akademi Dergisi (USBAD), İnönü Üniversitesi Eğitim Fakültesi Türkçe ve Sosyal Bilimler Eğitimi Bölümü Yerleşke / Malatya 

Telefon: 0533 5438933, https://dergipark.org.tr/tr/pub/usbad -- sdurukoglu@gmail.com -- usbaddergi@gmail.com 18414