Midjourney v6 artık mevcut ve yükseltilmiş model, gelişmiş gerçekçilik, bir görüntü üzerinde ikna edici metin oluşturma yeteneği, istemlerde daha fazla spesifiklik ve daha fazlasını vaat ediyor.
Midjourney‘in en son sürümü Discord’da mevcuttur ve şu anda “alfa” aşamasındadır. Bununla birlikte, ilk testler, gözle görülür şekilde yavaşlayan hız dışında, genel olarak dramatik bir iyileşme olduğunu gösteriyor.
Kullanıcılar Midjourney v6’yı test etmeye başladıkça popüler yapay zeka görüntü oluşturma platformunda yeni değişiklikler keşfediyorlar. Ağır bir şekilde yapay zeka teknolojisine odaklanan bir topluluk olan Reddit’in r/singularity alt dizisinde kullanıcılar, daha uzun istemler, bir görüntüdeki renkleri ve diğer ayrıntıları belirleme yeteneği, doğal dil kullanılarak kontrol edilen kompozisyon dahil olmak üzere şimdiye kadar buldukları değişikliklerin bir listesini derliyorlar. metin ekleme, dilbilgisi nüanslarının daha iyi anlaşılması, açıklayıcı metin aracılığıyla resimlere çerçeve ve kenarlık ekleme yeteneği ve daha fazlası.
Tom’s Guide, Midjourney v6 ile de çalışıyor ve kullanıcıların artık Midjourney ile daha çok ChatGPT’ye benzer şekilde etkileşim kurabileceklerini ve konuşma yoluyla görüntülerine ince ayar yapabileceklerini belirledi. Ve dünyanın her yerindeki noktalama işareti hayranlarını sevindirecek şekilde, Midjourney’in artık ünlü “Yiyor, vuruyor ve ayrılıyor” bilmecesini anlayabildiği bildiriliyor.
Sonuçlara gelince, Midjourney v6, alfa durumunda bile şüphesiz en son sürüm olan v5.2’den daha iyidir. Tom’s Guide’ın kaydettiği iyileştirmelerden biri de Midjourney’in gerçek insanların görüntülerini oluşturmada daha iyi olmasıdır. Bunun iyi olup olmadığı şimdilik konu dışı, ancak SanalSergi’nin sınırlı testlerine göre iddia doğru görünüyor.
Aşağıdaki “Albert Einstein’ın bilim deneyi yapması” görsellerini düşünün. İlk görülen v5.2 görüntüleri, özellikle Einstein’ın ikonik saçıyla ilgili olarak karışık bir çanta.
v6’ya gelince, Einstein, özellikle ünlü bilim insanının insanların gördüğü birçok görseliyle karşılaştırıldığında, Einstein’a daha çok benziyor. Saçları daha incelikli, cildi daha doğal görünüyor ve her görüntüdeki ışıklandırma çok daha gerçekçi. Ayrıca sahnenin bir bütün olarak Midjourney v5.2 tarafından oluşturulan karikatürize “bilim deneyleri” yerine çok daha gerçekçi görünmesi de dikkate değer.
Bilim temasını koruyarak Midjourney nasıl “Marie Curie’nin laboratuvarındaki portresini” oluşturuyor?
V6 sonuçları muhteşem. Her görüntüde muazzam miktarda ayrıntı var, ancak yine de ışıklandırma mükemmel. V5.2 sonuçlarının mutlaka kötü olduğu söylenemez, ancak hepsi çok stilize edilmiş ve hiçbiri gerçekten gerçekçi görünen bir Curie veya bilimsel laboratuvar ortamı sergilemiyor. V6’daki sahnenin göreceli karmaşıklığı gerçekten etkileyici.
Diğer istemlerde gerçekçilikte bir gelişme görülüyor. “Büyüteçle bir böceğe bakan bir çocuğu” düşünün. Her iki versiyon da iyi görünüyor ve benzer şekillerde mücadele ediyor. Önemli bir sorun, ister v5.2 ister v6 olsun Midjourney’in insanların büyüteçleri nasıl kullandıklarına dair bir anlayıştan yoksun görünmesidir.
Metin eklemek v6’da büyük bir çekiciliktir. Sonuçlar öyle, ancak metin konusunda beceriksiz olan v5.2’ye göre çarpıcı bir gelişme.
Üretken yapay zekanın üstesinden gelmesi gereken pek çok genel sorunu var ve bunların en önemlisi dikkate değer önyargılardır. “İşyerinde bir kadın” imajı oluşturmakla görevlendirilen Midjourney v5.2, yalnızca zayıf, genç beyaz kadınlar oluşturmaya karar verdi ve bunlardan ikisi dikiş makinesinde çalışıyor. Hepsinin de dağınık çalışma alanları var, bu da biraz ilginç.
Midjourney v6 yaygınlaşarak aynı kumaştan kesilmeyen bir kadın yaratacak mı? Pek öyle değil, gerçi kadınlar daha gerçekçi görünüyor. Elbette gelişmiş yönlendirmeyle kullanıcı sonuçlarına ince ayar yapabilir, ancak ilginç bir şekilde varsayılan değer neredeyse her zaman aynıdır.
Elbette bu tam olarak Midjourney’in hatası değil. Görüntü oluşturucu, diğerleri gibi, mevcut görüntüler üzerinde eğitilmiştir. Eğitim setinde önyargılar varsa, bunlar son oluşturucuya kadar çoğalacaktır. Ayrıca, bu önyargıların sürecin çeşitli noktalarında dikkatli bir şekilde düzeltilmediğini ve platformun nihai olarak halka açık hale getirilmediğini varsayalım. Bu durumda kullanıcılar tarafından oluşturulan birçok görselde mevcut olacaklardır. Peki bu görüntülerin bazıları nereye varıyor? Elbette eğitim setine geri dönelim.
Şu ana kadar Midjourney v6, birçok durumda zaten etkileyici olan Midjourney v5.2’den önemli bir adım daha atmış gibi görünüyor. Özellikle yeni metin işleviyle birlikte hâlâ geliştirilecek çok yer varken, popüler yapay zeka görüntü oluşturucu hızla gelişmeye devam ediyor.
Açıklama: Bu makaledeki tüm görseller, üretken bir yapay zeka platformu olan Midjourney kullanılarak oluşturulmuştur.