GPT3: DALL-E VE JL2P EKSENİNDE VERİ GÖRSELLEŞTİRME VE HAREKETLENDİRME ÜZERİNE BİR İNCELEME

Ezgi Şen

doi:10.47994/usbad.871726

EN TR

GPT3: DALL-E AND JL2P ON AXIS OF DATA VISUALIZATION AND MOTION A REVIEW ON

Öz

Artificial intelligence, one of the powerful symbols of technological evolution, progresses rapidly in line with current developments in the field of deep learning. One of the concrete outputs of this progress, the GPT3 system (producer pre-trained converter-generative pre-trained transformer3) is rapidly developing in the field of data visualization, depending on the deep learning language model. Dall-e, a product of GPT3 developed by OpenAI, is an artificial neural network that converts texts expressed in natural language into images. By recognizing the meaning of around 12 billion parameters to Dall, it can transform the sentences given to Dall into visuals that have never been done before. Another system that works similar to the Dall-e system is the natural language-based pose prediction study called JL2P (Joint Language to Pose). In the JL2P application, there is a text-based action just like Dall-e. According to the verbal input given in this system, the relevant character can perform the desired movement visually. This situation shows that character visualizations and movements can be easily done only through verbal expressions in the field of animation and game design. This article aims to convey to the reader the current developments brought about by the data visualization and activation skills of artificial intelligence with an interdisciplinary perspective. Studies in the field of artificial intelligence and data visualization open the door to a system that can inspire designers while creating storyboards or brainstorming. Research in this field is important for evaluating the relationship between designer and artificial intelligence through concepts such as creativity, productivity, and speed.

Anahtar Kelimeler

GPT3: DALL-E VE JL2P EKSENİNDE VERİ GÖRSELLEŞTİRME VE HAREKETLENDİRME ÜZERİNE BİR İNCELEME

Öz

Teknolojik evrimin güçlü sembollerinden biri olan yapay zekâ, derin öğrenme alanındaki güncel gelişmeler doğrultusunda hızla ilerleme kaydetmektedir. Bu ilerlemenin somut çıktılarından biri olan GPT3 sistemi (üretici ön-eğitimli dönüştürücü-generative pre-trained transformer3) derin öğrenme dil modeline bağlı olarak, veri görselleştirme alanında hızla gelişmektedir. OpenAI tarafından geliştirilen GPT3'ün bir ürünü olan Dall-e, doğal dilde ifade edilen metinleri görüntüye dönüştüren yapay bir sinir ağıdır. Dall'e 12 milyar civarında parametrenin anlamını tanıyarak kendisine verilen cümleleri daha önce hiç yapılmamış görsellere dönüştürebilmektedir. Dall-e sistemine benzer bir şekilde çalışan bir diğer sistem ise, JL2P (Joint Language to Pose) olarak adlandırılan doğal dile dayalı poz tahmini çalışmasıdır. JL2P uygulamasında tıpkı Dall-e de olduğu gibi yazı temelli bir aksiyon söz konusudur. Bu sistemde verilen sözel girdiye göre ilgili karakter, kendisinden istenen hareketi görsel olarak gerçekleştirebilmektedir. Bu durum animasyon ve oyun tasarımı alanında sadece sözel ifadeler üzerinden karakter görselleştirmelerinin ve hareketlerinin kolaylıkla yapılabileceğini göstermektedir. Bu makale, yapay zekânın veri görselleştirme ve hareketlendirme becerilerinin getirmiş olduğu güncel gelişmeleri, disiplinler arası bir bakış açısıyla okuyucuya aktarmayı amaçlamaktadır. Yapay zekâ ve veri görselleştirme alanındaki çalışmalar, tasarımcıların hikaye panosu (storyboard) oluştururken ya da beyin fırtınası (brainstorming) yaparken ilham almalarını sağlayabilecek bir sistemin kapılarını aralamaktadır. Bu alanda yapılan araştırmalar, tasarımcı ve yapay zekâ ilişkisinin yaratıcılık, üretkenlik, hız gibi kavramlar üzerinden değerlendirilmesi adına önemlidir.

Anahtar Kelimeler

Kaynakça

Ahuja, C. & Morency, L. P. (2018). Language2Pose: Natural Language Grounded Pose Forecasting. Cornell University, Erişim Adresi: https://arxiv.org/abs/1907.01108.
Friendly, M. & Brief, A. (2006). History of Data Visualization: Handbook of Computational Statistics. Toronto: Canada
Güler, T. (2008). Bilgilendirme Tasarımı. Grafik Tasarım Dergisi 21, 28.
Koh, Y. J., Baldridge, J., Lee, H. & Yang Y. (2020). Text-to-Image Generation Grounded by Fine-Grained User Attention. Google Research. Erişim Adresi: https://arxiv.org/pdf/1711.10485.pdf
Schwab, K. (2017). Dördüncü Sanayi Devrimi. İstanbul: Optimist Yayınları.
Mohri, M., Rostamizadeh, A. & Talwalkar, A. (2012). Foundations of Machine Learning. Cambridge: The MIT Press.
Mitchell, T. M. (1997). Machine Learning. 1st Edition, New York: McGraw-Hill.
Najafabadi, M. M., Villanustre, F., Khoshgoftaar, T. M., Seliya, N., Wald, R. & Muharemagic, E. (2015). Deep Learning Applications and Challenges in Big Data Analytics. Journal of Big Data 2(1), 1–21.

Zhang, Y., Tsipidi, E., Schriber, S., Kapadia, M., Gross, M. & Modi, A. (2019). Generating Animation from Screenplays. Disney Research&Rutgers University. Erişim Adresi: https://arxiv.org/pdf/1904.05440.pdf.
Zicari, V. R. (2018). Explorations in Artificial Intelligence and Machine Learning. Florida: CRC Press.
OpenAİ. (2021). Erişim Adresi: https://openai.com/blog/organizational-update/ Erişim Tarihi: 14.01.2021.
Openai. (2021). Erişim Adresi: https://youtu.be/zfllpcBlAVI, Erişim Tarihi: 15.01.2021.
Görsel 1: Veri görselleştirme üzerine temsil görsel. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 2: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 3: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 4: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 5: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 6: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 7: Yapay zekâ tarafından oluşturulan illüstrasyonlar. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 8: Yapay zekâ tarafından oluşturulan renk tanıma çalışmaları. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 9: Yapay zekâ tarafından stil, ışık/gölge ve iklime göre oluşturulan görseller. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 10: Yapay zekâ tarafından stil, ışık/gölge ve iklime göre oluşturulan görseller. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 11: Yapay zekâ tarafından oluşturulan stil ve kompozisyon görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 12: Yapay zekâ tarafından oluşturulan mevsime göre değişen kompozisyon görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 13: Yapay zekâ tarafından oluşturulan mevsime göre değişen kompozisyon görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 14: Yapay zekâ tarafından oluşturulan vitray görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 15: Yapay zekâ tarafından oluşturulan vitray görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 16: Yapay zekâ tarafından oluşturulan hayvan kombinasyonları. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 17: Yapay zekâ tarafından oluşturulan robot görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 18: Yapay zekâ tarafından oluşturulan robot görselleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 19: Yapay zekâ tarafından oluşturulan emoji örnekleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 20: Yapay zekâ tarafından oluşturulan emoji örnekleri. (2021). Erişim adresi: https://openai.com/blog/dall-e/
Görsel 21: Doğal dile dayalı poz animasyonu temsili görseli. (2019). Erişim adresi: https://arxiv.org/pdf/1907.01108.pdf
Görsel 22: Yön kavramına göre yapılan poz tahmini animasyonu. (2019). Erişim adresi: https://arxiv.org/pdf/1907.01108.pdf
Görsel 23: Hız kavramına göre yapılan poz tahmini animasyonu. (2019). Erişim adresi: https://arxiv.org/pdf/1907.01108.pdf
Görsel 24: Hareket kavramına göre yapılan poz tahmini animasyonu. (2019). Erişim adresi: https://arxiv.org/pdf/1907.01108.pdf
Görsel 25: Microsoft ObjGAN veri görselleştirme sistemi. (2019). Erişim adresi: https://medium.com/syncedreview/microsoft-obj-gan-turns-words-into-complex-scenes-5c6024f0f91d<.
Görsel 26: Disney veri görselleştirme sistemi. (2019). Erişim adresi: https://studios.disneyresearch.com/wp-content/uploads/2019/08/Generating-Animations-from-Screenplays.pdf

Ayrıntılar

Birincil Dil

Türkçe

Konular

-

Bölüm

Araştırma Makalesi

Yazarlar

Ezgi Şen ^*
0000-0003-2886-7098
Türkiye

Yayımlanma Tarihi

20 Nisan 2021

Gönderilme Tarihi

31 Ocak 2021

Kabul Tarihi

17 Şubat 2021

Yayımlandığı Sayı

Yıl 2021 Sayı: 5

DOI

https://doi.org/10.47994/usbad.871726

IZ

https://izlik.org/JA92MW87HP

Kaynak Göster

RIS / Bibtex

APA

Şen, E. (2021). GPT3: DALL-E VE JL2P EKSENİNDE VERİ GÖRSELLEŞTİRME VE HAREKETLENDİRME ÜZERİNE BİR İNCELEME. Uluslararası Sosyal Bilimler Akademi Dergisi, 5, 253-280. https://doi.org/10.47994/usbad.871726

AMA

1.Şen E. GPT3: DALL-E VE JL2P EKSENİNDE VERİ GÖRSELLEŞTİRME VE HAREKETLENDİRME ÜZERİNE BİR İNCELEME. USBAD. 2021;(5):253-280. doi:10.47994/usbad.871726

Chicago

Şen, Ezgi. 2021. “GPT3: DALL-E VE JL2P EKSENİNDE VERİ GÖRSELLEŞTİRME VE HAREKETLENDİRME ÜZERİNE BİR İNCELEME”. Uluslararası Sosyal Bilimler Akademi Dergisi, sy 5: 253-80. https://doi.org/10.47994/usbad.871726.

EndNote

Şen E (01 Nisan 2021) GPT3: DALL-E VE JL2P EKSENİNDE VERİ GÖRSELLEŞTİRME VE HAREKETLENDİRME ÜZERİNE BİR İNCELEME. Uluslararası Sosyal Bilimler Akademi Dergisi 5 253–280.

IEEE

[1]E. Şen, “GPT3: DALL-E VE JL2P EKSENİNDE VERİ GÖRSELLEŞTİRME VE HAREKETLENDİRME ÜZERİNE BİR İNCELEME”, USBAD, sy 5, ss. 253–280, Nis. 2021, doi: 10.47994/usbad.871726.

ISNAD

Şen, Ezgi. “GPT3: DALL-E VE JL2P EKSENİNDE VERİ GÖRSELLEŞTİRME VE HAREKETLENDİRME ÜZERİNE BİR İNCELEME”. Uluslararası Sosyal Bilimler Akademi Dergisi. 5 (01 Nisan 2021): 253-280. https://doi.org/10.47994/usbad.871726.

JAMA

1.Şen E. GPT3: DALL-E VE JL2P EKSENİNDE VERİ GÖRSELLEŞTİRME VE HAREKETLENDİRME ÜZERİNE BİR İNCELEME. USBAD. 2021;:253–280.

MLA

Şen, Ezgi. “GPT3: DALL-E VE JL2P EKSENİNDE VERİ GÖRSELLEŞTİRME VE HAREKETLENDİRME ÜZERİNE BİR İNCELEME”. Uluslararası Sosyal Bilimler Akademi Dergisi, sy 5, Nisan 2021, ss. 253-80, doi:10.47994/usbad.871726.

Vancouver

1.Ezgi Şen. GPT3: DALL-E VE JL2P EKSENİNDE VERİ GÖRSELLEŞTİRME VE HAREKETLENDİRME ÜZERİNE BİR İNCELEME. USBAD. 01 Nisan 2021;(5):253-80. doi:10.47994/usbad.871726

ARTIFICIAL INTELLIGENCE AND COMPARATIVE ANALYSIS OF ART MOVEMENTS: A STUDY ON RENAISSANCE, BAROQUE, IMPRESSIONISM, AND EXPRESSIONISM

Sanat ve Tasarım Dergisi

https://doi.org/10.20488/sanattasarim.1804847

GPT3: DALL-E VE JL2P EKSENİNDE VERİ GÖRSELLEŞTİRME VE HAREKETLENDİRME ÜZERİNE BİR İNCELEME

GPT3: DALL-E AND JL2P ON AXIS OF DATA VISUALIZATION AND MOTION A REVIEW ON

Öz

Anahtar Kelimeler

GPT3: DALL-E VE JL2P EKSENİNDE VERİ GÖRSELLEŞTİRME VE HAREKETLENDİRME ÜZERİNE BİR İNCELEME

Öz

Anahtar Kelimeler

Kaynakça

Ayrıntılar

Birincil Dil

Konular

Bölüm

Yazarlar

Yayımlanma Tarihi

Gönderilme Tarihi

Kabul Tarihi

Yayımlandığı Sayı

DOI

IZ

Kaynak Göster

Cited By

Analysis of Text-to-Image Artificial Intelligence Systems in Terms of Contribution to Interior Coloring

THE IMPACT OF ARTIFICIAL INTELLIGENCE ON DESIGN: THE EXAMPLE OF DALL-E

ENDÜSTRİYEL KARO TASARIMINDA YENİ BİR ASİSTAN OLARAK: YAPAY ZEKÂ

Yapay zekâ ile kültürel etkileşim: Minyatür ve Ukıyo-E örnekleri

2000-2024 Yılları Arasında Eğitim Alanında Yapılan Yapay Zekâ Konulu Lisansüstü Çalışmaların İncelenmesi

Üretken Yapay Zekâ Araçları ile Sosyal Bilgiler Öğretimi: Avantajlar ve Dezavantajlar

ARTIFICIAL INTELLIGENCE AND COMPARATIVE ANALYSIS OF ART MOVEMENTS: A STUDY ON RENAISSANCE, BAROQUE, IMPRESSIONISM, AND EXPRESSIONISM