Yılın Hava Fotoğrafçısı yarışmasını yürüten Kraliyet Meteoroloji Derneği merak uyandıran bir soru sordu: Yapay zeka (AI) bir fotoğraf yarışmasını kazanabilir mi?
Bunu yanıtlamak için Society, izleyicinin hangisinin yapay zeka görüntüsü ve hangisinin ödüllü gerçek bir fotoğraf olduğunu tahmin etmeye davet edildiği bir Turing testi hazırladı.
Alan Turing tarafından 1950’de oluşturulan Turing testi, bir makinenin insandan ayırt edilemeyecek akıllı davranışlar sergileme yeteneğini test eden bir testtir.
Aşağıdaki resimlerden beşi, 2021 Yılın Hava Fotoğrafçısı yarışmasında finalist olan gerçek fotoğraflardır. Diğer 11 tanesi DALL-E, Midjourney veya Stable Difüzyondan üretilir. Cevaplar makalenin altında.
AI ile Fotoğrafları Yeniden Oluşturma
Kraliyet Meteoroloji Topluluğu, yapay zeka ile düzenlediği hava fotoğrafçılığı yarışmasında kazanan fotoğrafları yeniden yaratmaya çalıştı. 2021 yarışmasından üç kazanan aldı ve önde gelen üç yapay zeka görüntü oluşturucuyu kullanarak yapay olarak kopyalamaya çalıştı.
Yukarıdaki resimler, yapay zekanın 2021’in genel galibini yeniden yaratmaya çalıştığını, kuzey İtalya’da sisli bir sonbahar sabahının tepedeki bir kiliseden çekilmiş bir fotoğrafını gösteriyor.
“İstem, bir kiliseyi bakış açısı olarak açıkça tanımlamak yerine yalnızca işin içinde olduğundan bahsediyor ve bu belirsizlik, Midjourney ve Stable Diffusion’ın sabah sisiyle çevrili İtalyan tarzı bir kırsal kilisenin fotoğraflarını üretmesine yol açıyor. DALLE-2, alçak bir sabah güneşi tarafından aydınlatılan sisli bir vadiyi (bir kilise kulesi içermesine rağmen) yakalayarak, kazanana çok daha yakın bir görüntü üretiyor” diye yazıyor .
İstemler, yapay zekaya hangi resmin üretileceğini bildiren insan operatörler tarafından yazılan metinleri ifade eder.
Society, “Bu sonuçlar, doğru istemi ve doğru temayı doğru AI sanatçısıyla kullanmanın önemini vurguluyor ve bu tür doğrudan karşılaştırmanın muhtemelen adil bir rekabet olmadığını gösteriyor” diye ekliyor.
Yapay zekanın, insanları gerçek fotoğraflar olduklarına inandırabilecek rekabete uygun görüntüler üretmesini sağlamak için Society, “ödüllü”, “4K” gibi ifadeleri içerecek ve gerçek yerleri ve olayları açıklayan bilgi istemlerini ayarladı.
Dört temaya ayrılan izleyiciler, farklı AI görüntü oluşturucuların nasıl performans gösterdiği hakkında fikir edinebilir. Society, DALL-E’yi “fiziği ve yapısal özellikleri yakalamada mükemmel”, Midjourney’i “istemlerde en yaratıcı ve belki de en iyi aydınlatmaya sahip” ve Stable Diffusion’ı “kompozisyon”da mükemmel olarak tanımlıyor.
Dernek şu sonuca varıyor: “Metin istemlerini hayal etmek, oluşturulan görüntüleri daha uygun hale getirmek için onları iyileştirmek ve ileriye götürmek için üretilen görüntülerden en iyi görüntüleri seçmek için hala makul derecede insan yaratıcılığı gerekiyor.
“Oluşturulan birçok görüntü, onları hemen sahte olarak ele veren eserler içeriyor ve yine de fotogerçekçi görüntülerden sanatsal stilizasyonlar yaratmada çok daha iyi. Ancak bu boşluklar, her yeni donanım ve yazılım geliştirmesiyle azalıyor.”
Turing Testi Sonuçları
Turing testine gelince, görüntüler küçük ve düşük çözünürlüklüdür, bu da onları ayırt etmeyi zorlaştırır, ancak beş gerçek fotoğraf (b), (d), (i), (l) ve (n)’dir. Dünya körünün bir anagramı.