Amazon’un yakın zamanda duyurduğu Titan üretken yapay zekası, Dall-E ve Midjourney gibi tüketiciye yönelik görüntü oluşturucularla tam olarak aynı değil, ancak Titan Görüntü Oluşturucu, kurumsal müşterilerle çalışan profesyonel fotoğrafçılar için bazı çıkarımlar taşıyabilir.
Amazon’un yakın zamanda duyurduğu Titan üretken yapay zekası, Dall-E ve Midjourney gibi tüketiciye yönelik görüntü oluşturucularla tam olarak aynı değil, ancak Titan Görüntü Oluşturucu, kurumsal müşterilerle çalışan profesyonel fotoğrafçılar için bazı çıkarımlar taşıyabilir.
Bunu kullanan işletmeler, kendi ürünlerinin görüntülerini alabilir ve istemler aracılığıyla üretken yapay zekanın ayarları, arka planları veya tamamlayıcı görsel öğeleri değiştirmesini sağlayabilir. Ayrıca tamamen orijinal görüntüler üretebilir.
Amazon, fotoğrafçıların korkacak hiçbir şeyi olmadığını ve Titan Image Generator’ın, fotoğrafçıların ve yaratıcı dijital sanatçıların müşterileri için ürettikleri orijinal içeriğin yerine geçmek yerine onları tamamlayacağını söylüyor.
“[Titan Image Generator] gerçekten de fotoğrafçıların her zaman yaptığı şeyi geliştirmeyi amaçlıyor çünkü gözlemlerime ve kurumsal düzeyde gördüklerime göre çoğu insan, özellikle de yeni ve orijinal içerik istiyor. Yeni etkinliklerin veya yeni insanların fotoğrafını çekmeye bakıyorum. AWS’nin Üretken Yapay Zeka Hizmetleri Organizasyonu Uygulamalı Bilimler Direktörü Sherry Marcus, yaptığı özel röportajda hâlâ fotoğrafçılara ihtiyaç duyacaklarını söylüyor .
Bu aynı zamanda markaların veya şirketlerin aradığı fotoğraf türüne de bağlı olabilir. Marcus, reklamcılıkta içerik oluşturmayı şu anda en büyük kullanım örneği olarak görüyor; reklamlara “en fazla ilgi duyan” sektörler, Titan’ın çok modlu yapay zekasının kendi varlıklarını tamamlayan görseller oluşturmak için nasıl çalıştığıyla ilgilenecektir. Görselleri nereye yerleştireceğini bulmaya çalışan bir marka, söz konusu görselleri örneğin web sitesinde neler olduğuna, kullanıcı tercihlerinin neler olduğuna ve ayrıca bölgesel veya mevsimsel zorunluluklara göre uyarlayabilir.
Yapay Zekaya İpleri Öğretmek
Çok modlu, üretken bir yapay zeka platformu olan Amazon, benzer görüntüleri öğrenip tespit etmek ve sonuçları sunmada daha hassas olmak için Titan Image Generator’a hem görüntülerden hem de metinlerden çok sayıda veri öğretiyor. “Gizli sos”, modeldeki sonraki kelimelerin veya resimlerin ne olması gerektiğini tahmin etmeye çalışmaktır; bu, yapay zekanın nasıl eğitildiğinin önemli bir unsurudur. İnsanlar, temel olarak soru ve cevaplardan oluşan ince ayarı denetler. Yani, örneğin, eğer talep Hawaii’de bir sörf tahtası üzerinde bir penguen resmi ise, talebe çok özel varyasyonlar görünmelidir.
“Doğal dilde bir şey aradığınızda, içeriği hem metin hem de görsel olarak kodluyoruz; bu, doğru cevabı alma ve tüm bu bileşenleri oluşturma açısından çok güçlü” diyor. “İstemde konuyu daha spesifik hale getirebilir ve ‘Güneş X açısından parlıyor’ veya ‘Bana akşam karanlığında veya akşam 5’te bir fotoğraf ver’ diyebilirsiniz. Metne bakacak ve akşam karanlığı ile akşam 5’in aynı şeyler olabileceğini anlayacak ve ardından bununla ilgili görsellere bakacak.”
Reklamverenler için, birden fazla fotoğraf çekimi ayarlamadan bu tür bir ayrıntı düzeyi, bir kampanyayı farklı pazarlara uyarlamanın uygun maliyetli bir yolu olabilir. Bunun nedeni, en azından kısmen, markaların çok modlu görüntü oluşturucuyu, her zaman ayrı bir fotoğraf oluşturmayı gerektirmeyen, mevcut bir ürün fotoğrafını benzersiz bir arka plan, sahne, karakter veya görsel tamamlayıcıyla harmanlamak gibi kendi varlıklarıyla kullanabilmesidir. benzer sonuçlar elde etmek için çekim yapın.
Marcus ayrıca telif hakkı ihlali ve görünmez filigranlar içeren uygunsuz içerikle başa çıkmak için koruma önlemlerinin bulunduğunu da belirtiyor. Bunlar, görüntülerin yapay zeka tarafından oluşturulduğunu doğrulayacak ve görüntü oluşturucu, iki kullanıcı aynı istemi kullandığında farklı görüntüler oluşturmaya çalışacak.
“Bu anlamda, yine de fotoğrafları çekecek birine ihtiyacınız olabilir, ancak fotoğrafları mutlaka belirli bir yere koymanıza gerek yok” diyor.
“Markalar özgünlük istiyor ama aynı zamanda işleri hızlı bir şekilde yapabilmeyi de istiyorlar. Üretken yapay zekanın, rötuşların çok daha hızlı yapılabilmesi için bu yeteneği sağladığını düşünüyorum, ancak markaların, canlı fotoğrafçılık yaparken elde ettiğiniz o özgünlükten, o gerçekçilikten, o anın ruhundan gerçekten kurtulmak istediğini düşünmüyorum.”
Bir ‘Hızlandırıcı’ ve Yedek Değil
Başka bir deyişle, bir stüdyoda fotoğraf çekimleri ayarlamak ve ardından Titan Image Generator gibi araçları kullanarak görüntünün içindeki görsel öğeler üzerinde çalışmak mümkün olacaktır. Amazon’un bulut ve yapay zeka geliştirme hizmetlerini kullanan şirketlerden bu tür geri bildirimler alıp almadığı belli değil, ancak maliyetleri düşürmek genellikle yeni teknolojiler ortaya çıktığında kurumsal taktik kitabındaki bir sayfadır.
Amazon, görüntü oluşturucunun, kurumsal düzeydeki tüm kullanıcıların, “bireylerin işlerini elinden almadan” iş hedeflerini hızlandırmak için bu özelliği daha güvenli ve güvenli bir şekilde kullanmalarına yardımcı olacağına inanıyor. Bunun onları daha üretken ve becerikli hale getirecek bir “hızlandırıcı” olduğunu ekliyor.
Ayrıca ürün fotoğrafçılığı ile etkinlik fotoğrafçılığı arasında yapay zekanın yapabileceklerinin sınırlarını gösteren farklılıklar var. Katılanlar da dahil olmak üzere hakkında hiçbir şey bilmediği canlı bir etkinlik hakkında görüntüler oluşturamaz; bunu sahadaki bir fotoğrafçının yapabileceği gibi gerçek zamanlı olarak yapamaz. Bir marka yapay zekayı kendi görsellerini tamamlamak için kullanabilirken Titan, bu şekilde bir şey yaratmak için markanın kendi imajından ve ürün kaynaklarından yararlanamaz. Telif hakkıyla korunan markalar, logolar, benzerlikler ve varlıklar bu şekilde dokunulmazdır. İlk önce orijinal görüntüyü alırsınız ve ardından onunla çalışmak için yapay zekayı bağlarsınız.
Marcus, “Deneyimlerime göre markalar yine de ürünlerinin ve etkinliklerinin canlı fotoğraflarını farklı şekillerde, çok gerçekçi bir formatta çekebilmek isteyecekler” diyor. “Birçok multimedya şirketi, içerik oluşturmayla ilgili kendi markalarına sahip olabilmek istiyor, bu nedenle bu, araç kutusundaki bir geliştirme görevi görecek başka bir araçtır.”
Titan Image Generator şu anda Amerika Birleşik Devletleri’nde ön izleme olarak ve yalnızca İngilizce olarak mevcuttur, ancak Amazon ayrıca kullanılabilirliği ileriye dönük olarak diğer pazarlara ve dillere genişletmeyi düşündüğünü de duyurdu.