Adobe, 2016 yılında en iyi şekilde “Ses için Photoshop” olarak tanımlanabilecek bir teknoloji geliştirdi. Sadece yeni kelimeler yazarak seslendirmedeki kelimeleri değiştirebilecek. Kulağa korkutucu geliyor, değil mi? Öyleydi ve Adobe bunu hiçbir zaman yayınlamadı; bunun iyi bir nedeni var.
VoCo projesi olarak adlandırılan teknoloji, Adobe’nin yıllık MAX konferansındaki “Sneaks” etkinliği sırasında sergilendi ve hemen dikkatleri üzerine çekti. MAX’tan sonra VoCo ile ilgili geri bildirimler o kadar önemliydi ki Adobe, bunu savunmak için onun hakkında tam bir blog yazısı yayınlama ihtiyacı hissetti.
“Bu, herkesin videolar veya sesli podcast’ler için seslendirmeyi düzenlemesini kolaylaştıran, birçok ilgi çekici kullanım senaryosuna sahip bir teknoloji. Ve eğer birisinin konuştuğunun 20 dakikalık, yüksek kaliteli bir örneğine sahipseniz, ek kayıtlar için geri aramanıza gerek kalmadan onun sesine bazı yeni kelimeler ve ifadeler bile ekleyebilirsiniz,” diye yazdı Mark Randall. teknolojinin olumlu yönleri.
“Bu, radyo reklamları, podcast’ler, sesli kitaplar, sesli anlatım ve sayısız başka uygulama üreten meşgul ses editörleri için zamandan ve paradan tasarruf sağlıyor. Ancak bazı durumlarda, birinin aslında hiç söylemediği bir dizi kelimeyi konuşmasının gerçekçi görünen bir düzenlemesini oluşturmayı da kolaylaştırabilir.”
Randall, bunun gibi yeni teknolojilerin tartışmalı veya korkutucu olmasına rağmen birçok olumlu etkiye de sahip olduğunu iddia etmeye devam edecek. “Vicdansız insanların onu kötü amaçlarla çarpıtabileceğini” kabul ederken, teknolojinin yapabileceği faydalardan dolayı geliştirilmesini savunuyor.
“Konuşma hecelerini kesip kelimelere yapıştırmak ve doğal görünmesi için konuşmanın perdesini değiştirmek ve karıştırmak için araçlar mevcut (Adobe Audition da bunlardan biri)” diye savundu.
“Project VoCo mümkün olanı değiştirmiyor; yalnızca onu daha kolay ve daha fazla insan için daha erişilebilir hale getiriyor. Kendisinden önceki matbaa ve fotoğraf gibi, bu da ses düzenlemeyi demokratikleştirme potansiyeline sahip, bu da kültürel beklentilerimizi zorluyor ve duyduklarımızın gerçekliği hakkında tartışmayı ateşliyor. Bu harika bir şey.”
Adobe başlangıçta bu tutumu benimsemiş olsa da VoCo hiçbir zaman gün yüzü görmedi. Açıkçası Adobe, VoCo’nun yapabileceği risklerin faydalardan daha ağır basacağını fark etti. Ya da belki daha büyük bir olasılıkla, Adobe’nin hukuk departmanı, teknoloji bir dünya liderinin ağzına uygunsuz sözler söylemek için kullanıldığında şirketi savunmaya çalışma fikrini kaldıramadı.
VoCo Bir Riskse Sora Nedir?
Kalabalığın arasında oturup VoCo sunumunu izlediğimi ve şunu düşündüğümü canlı bir şekilde hatırlıyorum: “Bu ortaya konamaz. Yapabileceği herhangi bir fayda, neden olabileceği zarardan çok daha ağır basacaktır.”
Adobe’yi etik ve ahlakın parlak bir örneği olarak göstereceğimi hiç düşünmezdim ama işte buradayız. Adobe kabul etti ve VoCo bir daha gün ışığına çıkamadı.
Ancak OpenAI’deki insanlar aynı ahlak anlayışına sahip görünmüyor ya da en azından potansiyel yasal yansımalardan korkmuyorlar. Belki de şirket kodlama yoluyla bu sorunlardan herhangi birinin üstesinden gelinebileceğini düşündüğü içindir, ancak kendimi etik yazılım geliştirmeye ne olduğunu merak ederken buluyorum.
Yepyeni bir metinden videoya yapay zeka yazılımı olan Sora‘nın yaratılışının hiçbir noktasında OpenAI’den birinin bu teknolojinin ne gibi sonuçlara yol açabileceği konusunda endişe duyarak elini kaldırmadığına inanmakta zorlanıyorum. Buna rağmen şirket, bu endişeleri göz ardı etme yönünde aktif bir seçim yaparak ilerlemeye devam etti.
Bak, Sora büyüleyici. Henüz emekleme aşamasında olan bu yazılımın yetenekleri şimdiden hayret verici, ancak yine de bir korku ve önsezi duygusuyla dolmadan edemiyorum.
VoCo’nun çok fazla risk taşıdığı düşünülüyorsa Sora nasıl değildir? Bir şeyi yapabiliyor olmanız, yapmanız gerektiği anlamına gelmez.
2016 yılında VoCo bana çok şey hissettirmişti. Daha önce gördüğümüz her şeyden çok daha gelişmişti. Şok ediciydi. Ancak şimdi 2024’te, yapay zeka günlük yaşamın pek çok alanına sızmış durumda ve yapay zeka görüntü oluşturucuların bir yılı aşkın bir süredir kullanılmasından sonra, belki de insanlar gerçekten ne olduğunun farkında değil. Haşlandığını bilmeyen bir kurbağayız biz.