Manzaralı görüşmelerdeki sorunu bitirecek teknoloji: Nvidia Maxine

Maxine nedir? 

Maxine, görüntü konferans hizmetlerinin geliştiricileri için tasarlanmış bulut tabanlı, yapay zekâ ile güçlendirilmiş bir yazılım geliştirme kitidir. Bu yeni sistemle, görüntü konferans görüşmelerinde görüntü için kullanılan bant genişliğinin kullanımının 1/10’e ineceği söyleniyor. Bu elbette maliyetlerin de aşağı çekilmesi manasına geliyor. Bilhassa, internet kotalarının hudutlu olduğu durumlar düşünüldüğünde son kullanıcılara epey kıymetli bir tasarruf imkânı sunuyor. Bu özellik, tasarruf sağlamasının yanında düşük bant genişliklerinde yüksek çözünürlük sunması açısından da kıymetli bir gelişme. Bu sistemin arkasındaki düzenek aslında kolay bir halde işliyor. Öteki görüntü konferans sistemlerinde olduğu üzere birinci başta bir referans manzara karşı tarafa gönderiliyor (bunu yalnızca bir fotoğraf göndermek üzere düşünebilirsiniz). Bundan sonra, manzara piksellerinin gönderilmesindense (asıl bant genişliğinin birçoklarını kullanan kısım) yüz tabirinin temel hareketleri algılanıp karşı tarafa gönderildikten sonra birinci başta gönderilen referans imgesinin canlandırılması yapılıyor. Aslında, çekilen fotoğrafınız ile yeni bir animasyon oluşturuluyor diyebilir. Aşağıdaki biçimde ise sistemin temel çalışma prensibi kolay bir biçimde anlatılmakta. 

Bant genişliği sorununa karşı üretilen bir öbür tahlil ise düşük kalitede gönderilen görüntülerin yapay zekâ ile çözünürlüklerinin artırılması. Örneğin, internet süratiniz düzgün olmadığı için görüntü konferans görüşmenizde sizin gönderebildiğiniz azamî çözünürlük 360p olsun. Bu imaj karşı tarafa ulaştırılırken bulut tabanlı çalışan yapay zekâ 720p’ye yükselterek daha kaliteli bir manzara sunma imkânı tanıyor. Çok süratli bir internetiniz olmasa da eskisine nazaran çok daha kaliteli imaj sunmuş olacaksınız. 

Görüntü konferans görüşmelerinde karşılaştığımız bir öbür sorun ise göz teması kuramama. Hem öbür iştirakçiler hem de sunular ekranda yer aldığı için kameradan çok ekrana baktığınızda gözünüz ve istikametiniz çoğunlukla kamera ile eşleşmiyor. Yani, karşımızdaki bireylere değil de uzaklara, üste, aşağıya bakıyor üzere oluyoruz. Dahili kameraların kullanılmadığı durumlarda bu ayrım daha da dikkat cazibeli hale geliyor. Bu sorun için sunulan özellik ise yüzünüz yapay zekâ algoritması ile döndürülerek karşınızdaki bireylere bakıyormuş üzere gösterilmesi. Aşağıdaki imgede, soldaki orjinal bakış açısı yapay zeka algoritması kullanılarak sağdaki hale anlık olarak dönüştürülüyor. 

Sunulan bir öteki özellik ise art plan sesinin kısılması. Bu yeni bir özellik olmamakla birlikte epey düzgünleştirilmiş bir örneğini bulacaksınız. Bu özelliği test etmek için yazının sonunda bütün özelliklerin tanıtıldığı görüntü kontağına tıklamanız kâfi olacaktır. 

Bu eser şimdi piyasaya çıkmadı. Bu eser ve daha güzellerinin bir an evvel çıkması eğitimde bizim işimizi bir nebze de olsa kolaylaştıracaktır. İrtibatta yaşanan uzakta olma problemine görüntü ve ses kalitesindeki düşüklük, çizgiden düşme üzere meseleler da eklenince bizler için çözülmesi çok daha güç hale geliyordu. Önümüzdeki teknik problemlerin azalması ve ortadan kalkması bize temel sorunlara daha fazla eğilebilme imkânı sunacaktır. 

Doç. Dr. Serkan Özel
Boğaziçi Üniversitesi
@serkanozeltx