Panasonic, Süper Hassas Kamera İçi Konu Tanıma AI Geliştirdi

Panasonic Made a New Super Accurate In Camera Subject Recognition AI

Panasonic, geleneksel yöntemlerden daha doğru olan yeni bir “sınıflandırma algoritmasına” sahip yeni bir görüntü tanıma AI (yapay zekası) geliştirdiğini duyurdu.

Çoğu kamera üreticisinin nesne tanıma teknolojisi oldukça iyi hale gelmiş olsa da hâlâ geliştirilecek noktalar var. Örneğin Panasonic, yapay zekanın nesneleri görünüşlerine göre kategorilere ayırabildiğini ancak bu kategoriler içerisinde spesifik olma konusunda pek iyi bir iş çıkaramadığını belirtiyor.

Bir kamera örneğin bir “tren” veya bir “köpek” görebilirken, bu bulguları mutlaka belirli bir tren türü veya modeline göre alt kategorilere ayırma yeteneğine sahip değildir. Ayrıca birbirine benzeyen ancak gerçekte farklı olan konular arasındaki farkı da anlayamayabilir.

Panasonic, “Ayrıca, yön, hava durumu, aydınlatma veya arka plan gibi çekim koşullarındaki farklılıklar nedeniyle aynı nesnenin farklı görünebileceği birçok durum var” diyor.

“Görünüşteki bu çeşitlilikle en iyi nasıl başa çıkılacağını düşünmek önemlidir. Görüntü tanımanın doğruluğunu artırmak için, çeşitlilikten etkilenmeyen sağlam görüntü tanıma elde etmek amacıyla bu noktaya kadar araştırmalar yürütülmüş ve alt kategorilerdeki benzerlikleri ve nesnelere özgü ortak özellikleri bulmak için sınıflandırma algoritmaları geliştirilmiştir. belirli bir kategori.”

Şirket, geleneksel yöntemlerle, mevcut nesne tanıma araçlarının yeteneği, yapabileceklerinin sınırına ulaştı ve yapay zeka, nesneleri ve nesneleri aynı kategoride başarıyla tanımakta sıklıkla sorun yaşıyor; Panasonic, bunun tanıma doğruluğunda bir azalmaya yol açtığını söylüyor.

Bu amaçla görünümdeki farklılıklardan yararlanan yeni bir teknoloji geliştirdi ve bunun sonucunda REAL-AI adı verilen yeni bir eğitim programı ortaya çıktı.

Mevcut derin öğrenme çerçeveleriyle yapay zeka modelleri, esasen benzer görünen şeylerin aynı kategorilere ait olduğunu öğreniyor. Yararlı olsa da mutlaka doğru değildir. Ancak yapay zekanın ilerlemesiyle birlikte, eğitim süreci sırasında öğretilebilecek varyasyonların sayısını önemli ölçüde artırmak artık mümkün hale geldi.

Sonuç olarak, artık bir yapay zekaya, konunun kendisinden dolayı önemli ölçüde farklı görünümlere sahip olsalar (farklı köpek türlerinin nasıl görünebileceğini düşünün) veya görünümler nedeniyle görünümler değişse bile belirli nesnelerin veya nesnelerin aynı kategoriye ait olduğunu öğretmek mümkün. kameranın yönüne, sahnedeki aydınlatmaya veya arka plana bağlıdır.

“Bir kategorideki görünümlerin dağılımı aslında tekdüze değil. Aynı kategori içerisinde, görünüşte birden fazla farklı eğilime sahip birden fazla alt kategori vardır (multimodal dağılım). Örneğin, Şekil 1’de (aşağıda) gösterilen ‘Kuşlar’ kategorisinde, aynı kuşun ‘gökte uçan kuşlar’, ‘otlaktaki kuşlar’, ‘tüneyen kuşlar’ gibi farklı eğilimlere sahip görüntü grupları bulunmaktadır. Panasonic, “ağaçlarda” ve “kuş kafalarında” diye açıklıyor.

Panasonic, Süper Hassas Kamera İçi Konu Tanıma AI Geliştirdi — Şekil 1, bu yöntemin kullanıldığı görüntü sınıflandırma sonuçlarını ve görüntü varyasyonlarını ifade edebilen ağırlık matrisini göstermektedir.
“Soldaki şekilde yeşil renkle gösterilen ‘Kuşlar’ kategorisi için, yapay zeka modelinin ağırlık matrisinin her bir bileşenine benzer görüntüler tanınıyor ve sağdaki şekilde farklı renklerle gösteriliyor.
Ağırlık vektörünün her satırı, üstten başlayarak, kategorideki çok modlu bir zirveye karşılık gelen bir öğeyi temsil eder: uçan kuşlar, çayır kuşları, ağaç kuşları ve kuş başları.
Buradan sınıflandırma modelinin aynı kuş kategorisinin farklı varyasyonlarını yakalayacak şekilde başarıyla eğitildiği söylenebilir.” | © 2024 IEEE, Panasonic

“Bu görüntülerin her biri nesneye ilişkin zengin bilgiler içeriyor. Temel özelliklere odaklanırsak, görsellerin içerdiği çeşitli bilgileri çöpe atmış oluruz. Bu nedenle, yapay zeka için zor olan, çok modlu dağılıma sahip görüntüleri tanıma yeteneğini geliştirmek için nesnelerin görünme biçimleri hakkındaki bilgileri aktif olarak kullanan bir algoritma geliştirdik. Özelliklerin dağılımını sürekli olarak yakalamak için, geleneksel olarak yalnızca tek boyutlu bir vektör olan sınıflandırma modelinin ağırlık vektörünü iki boyutlu bir ortonormal matrise genişlettik. Bu, ağırlık matrisinin her bir öğesinin görüntünün bir varyasyonunu (farklı arka plan renkleri, nesne yönelimi vb.) temsil etmesine olanak tanır.

Panasonic ayrıca aşağıdaki şekilde, benzer görünümleri nedeniyle mevcut yapay zekanın “otobüs” ile “tramvay” arasındaki farkı anlamakta zorlandığını açıklıyor. Ancak şirket, yeni algoritmasını kullanarak yapay zekanın farkı anlayabildiğini ve bunları alt kategorilere ayırabildiğini söylüyor (aşağıdaki Şekil 2’de görülmektedir).

Panasonic Yeni Super Hassas Kamera Ici Nesne Tanima Yapay Zekasini Gelistirdi 001 — Şekil 2, aynı kategorideki görüntüleri sorgulama görevinde geleneksel yöntem DNC*3’ün (solda) ve önerilen yöntemin (sağda) tanıma sonuçlarını göstermektedir.
İlk satır bir otobüs görüntüsü için sorgulama görevidir, ikinci satır bir tren içindir ve üçüncü satır bir tramvay içindir.
Geleneksel yöntem görünüş olarak benzer olan diğer araçları bulmayı başarırken, önerilen yöntem aynı kategoriden zengin görünüm çeşitliliğine sahip görseller bulabilmektedir. | © 2024 IEEE, Panasonic

Güvenilirlik ve doğruluktaki bu artışa rağmen Panasonic, yeni algoritmasının pratik kullanım durumlarında bellek kullanım ihtiyaçlarını yalnızca %0,1 oranında artırdığını, bunun da kameralara entegrasyonun minimum düzeyde donanım iyileştirmesi gerektireceği anlamına geldiğini söylüyor.

Panasonic gelecekte de pratik uygulamalar için bu yeni yapay zekayı geliştirmeye devam edecek. Geliştirmeye ilişkin araştırma makalesinin tamamı kamuya açık bir web sayfasında mevcuttur.

Etiketler