Önde gelen yapay zeka görüntü oluşturucu Stable Diffusion, Stable Diffusion Version 2‘nin açık kaynaklı sürümünü duyurdu ve belirli sanatçıların stilini kopyalama özelliğini kaldırarak bazı kullanıcıları rahatsız etti.
Yeni yapay zekalı (AI) model, daha büyük görüntülerin oluşturulmasına olanak tanır ve kullanıcıların 2048×2048 veya daha yüksek görüntüler oluşturmasına olanak tanıyan ek bir “yukarı ölçekleyici difüzyon” modeline sahiptir. Tipik olarak, metinden resme oluşturucular yalnızca 512×512 boyutunda görüntüler üretir.
Stable Diffusion’ın ana şirketi Stability AI, yeni sürümün, oluşturulan görüntülerin kalitesini ilk sürüme kıyasla “büyük ölçüde artırdığını” söylüyor ve bazı etkileyici örnekler sağladı.
Anlaşmazlık
Bununla birlikte, yeni güncelleme, yeni sürümün belirli sanatçıların tarzında resimler oluşturma yeteneğini kaldırdığını belirten kullanıcı tabanı arasında bir miktar şaşkınlık yarattı.
Stability AI yaptığı basın açıklamasında , yazılıma yerleştirilen yeni bir yetişkin içerik filtresi sayesinde NSFW görüntüleri oluşturma yeteneğini kaldırdığını söylüyor, ancak metin istemlerinde belirli sanatçıların kaldırılması hakkında doğrudan yorum yapmıyor.
Muhtemelen AI görüntüleri oluşturmak için kullanılan en popüler sanatçı, adı fevkalade yüksek kaliteli görüntüler üretmenin kısaltması haline gelen Greg Rutkowski’dir.
The Verge tarafından bildirildiği üzere , kullanıcılar Reddit’te “modeli sinirlendirdiklerinden” şikayet ettiler.
Bir kullanıcı, “Greg’e ne yaptın?” diye yorum yaptı. Stable Diffusion’ın resmi Discord sunucusunda “Bu biraz hoş olmayan bir sürpriz,” diye ekledi.
Bununla birlikte, Rutkowski, Forbes’a kendi adı kullanılarak çalkalanan iş miktarını “korkunç” bulduğunu söyledikten sonra muhtemelen en son gelişmeden memnun .
“Şu anda, adımı yazdığınızda, kendi yaptığım işlerden çok yapay zekanın yaptığı işleri görüyorsunuz ki bu benim için ürkütücü. Yapay zekanın sonuçlarımı doldurması ve çalışmalarımdan ayırt edilemez hale gelmesi ne kadar sürer? dedi.
Stability AI’nin kurucusu Emad Mostaque, The Verge’e eğitim verilerinden sanatçıların resimlerini çıkarmadığını, bunun yerine programın verileri kodlama ve alma şeklini değiştirdiğini söylüyor.
Mostaque, “Burada sanatçılar için belirli bir filtreleme yapılmadı” diyor.
Bazı kullanıcıların yeni sürümün “komutları yorumlamada ve tutarlı fotoğrafik görüntüler oluşturmada daha iyi” olduğunu belirtmesiyle tüm geri bildirimler kötü olmadı.
Ayrıca, kullanıcılara mevcut bir görüntünün derinliğine uygun içerik üretme olanağı sağlayan yeni bir özellik de bulunuyor.
“Görüntüye Derinlik” adı verilen bu sistem, orijinalinden radikal bir şekilde farklı görünen ancak yine de orijinal görüntünün tutarlılığını ve derinliğini koruyan dönüşümler sunabilir.
Lider Görüntü Oluşturucu
Stable Diffusion, geliştiricilerin ürünlerine ücretsiz olarak entegre etmelerine izin veren açık kaynak olduğundan, önemli bir AI görüntü oluşturucudur.
Şirket, müşteriler için özel modeller eğiterek ve genel bir altyapı katmanı görevi görerek para kazanmayı planlıyor.
Örneğin, şecere web sitesi MyHeritage bu ay , kullanıcıların Stable Diffusion’ın teknolojisini kullanarak tarih boyunca farklı dönemlerdeki bir kişinin görüntülerini oluşturmasına olanak tanıyan bir AI Time Machine aracını duyurdu.
Yeni Stable Diffusion sürümünün bir demosu burada denenebilir .