Robotlar hayvanları eğitecek

Boğaziçi Üniversitesi Davranışsal Sinirbilim Laboratuvarı Direktörü ve projenin yürütücüsü Dr. Öğr. Üyesi Güneş Ünal, Bilgisayar Mühendisliği Bölümü’nden Dr. Öğr. Üyesi Emre Uğur ve Bilişsel Bilim Yüksek Lisans öğrencisi Oğuzcan Nas yeni yapay zeka modeliyle hayvan ve robotların birbirinden öğrenmesini sağlayacak proje için çalışıyorlar. Oluşturdukları çok disiplinli proje, edimsel şartlanma paradigmaları ile yapay zeka algoritmalarını birleştirerek robotlar ve hayvanlar ortasında “karşılıklı öğrenmeyi” mümkün hale getirecek. Bu sayede robotlar tarafından eğitilen hayvanların arama-kurtarma ve mayın paklığı üzere vazifelerde daha tesirli biçimde misyon almaları sağlanabilecek. Dr. Öğr. Üyesi Güneş Ünal, Dr. Öğr. Üyesi Emre Uğur ve Oğuzcan Nas ile yaptıkları çalışmayı “Sıçanlar ve robotlar birebir anda hem öğretmen hem öğrenci olacak” diyerek şöyle anlatıyor:

ROBOT İLE DENEY HAYVANI BIRINCI KEZ ETKİLEŞİM İÇİNDE

Yaptığımız çalışma en genel tarifiyle bir robot-hayvan etkileşim çalışması. Yaklaşık iki yıl sürmesini bekliyoruz. Mevcut literatürde bu hususta çalışmalar var. Örneğin robotların laboratuvar hayvanlarına (sıçanlara) bir misyonu yapmayı öğrettiği ya da onlarla toplumsallaştığı çalışmalar mevcut; ama bu klasik çalışmalar daima tek taraflı. Ya robotlar hayvanlara bir işi öğretiyor ya da robotlar hayvanları gözlemleyerek kendileri öğreniyor, yani “makine öğrenmesi” oluşuyor. Bu çalışmaların hiçbirinde robot ile deney hayvanı birbiriyle etkileşime geçerek tıpkı anda birbirlerinin hem öğretmeni hem de öğrencisi olmuyor.

“SIÇAN VE ROBOTLAR HEM ÖĞRETMEN HEM DE ÖĞRENCİ OLACAK”

Birinci kere bir edimsel şartlanma düzeneğinde, sıçanlar ve robotların tıpkı anda hem “öğretmen” hem de “öğrenci” olacağı bir ortam oluşturacağız. Bu çalışma, hem psikolojideki öğrenme literatürüne değerli bir katkı sunacak hem de çeşitli makine öğrenmesi algoritmalarının sınanması için yeni bir platform oluşturacak. Daha da kıymetlisi, tüm bu uğraşların sonunda hayvan ve robot etkileşimi kullanan farklı uygulamalarda kullanılabilecek bir “karşılıklı öğrenme” modeli geliştirilecek.

“ROBOT ARKADAŞ OLMAK İSTİYOR”

Deney düzeneğine bir robot ve bir sıçan birebir anda konuluyor. İkisinin de ulaşmak istedikleri farklı hedefler var. Sıçanın motivasyonu sevdiği bir yemeği ödül olarak almak. Bu doğal bir “yemek arama davranışı” yaratıyor. Robotun emeli ise hayvanla arkadaş olmak. Robot için sıçanla arkadaş olmayı, sıçanı mümkün olduğunca kendi etrafında tutmak olarak belirliyoruz. Genel olarak, robotun verdiği iki sinyal var. Bunlardan biri “ödül sinyali.” Robot bu sinyali verdiğinde -örneğin sol kolunu havaya kaldırdığında- şayet sıçan kendisine yaklaşırsa, deney düzeneğinin ödül köşesinde hayvanın sevdiği yiyecek beliriyor. Yani robot belli bir sinyal verdiğinde ve sıçan bu sinyali anlayıp robota yaklaştığında, robotumuz deney kutusunun uzak bir noktasında sıçana ödül vermiş oluyor. Alışılmış sıçanın mükafatı almak için bu olumlu sinyalin manasını ve mükafatın verildiği noktayı vakit içinde öğrenip, o köşeye gitmesi gerekiyor.

“ROBOT DA ÖĞRENİYOR”

Buraya kadar anlattıklarımız kendi başına kolay bir edimsel şartlanma deneyidir. Lakin robot yalnızca ödül vermiyor, bazen de olumsuz bir sinyal ile bir çeşit ceza veriyor. Örneğin sol değil, sağ kolunu kaldırdığında ödül köşesinden yem gelmiyor. Sıçanın bu olumsuz sinyali, olumlu sinyalden ayırt etmesi gerekiyor. Sıçan bunu da öğreniyor. İşin farklı tarafı bu süreçte, robot da kendi verdiği sinyallerin ne işi yaradığını öğreniyor. Robot deneye olumlu ve olumsuz sinyalleri rastgele vererek başlıyor. Ödül sinyalinin özelliği sıçanı robota yaklaştırması. Robot yalnızca bu sinyali verdiğinde sıçan kendisine yaklaşırsa, ödül köşesinden sıçan yemi geliyor. Robot olumsuz sinyal verdiğinde sıçan robota yaklaşsa da rastgele bir ödül alamıyor. Robotun motivasyonu sıçanın kendisine yaklaşması (sıçanla arkadaş olmak) olarak tanımlandığı için, robot da vakit içinde yalnızca bir sinyalin sıçanı kendisine yaklaştırdığını öğreniyor. Sonuçta, vakit içinde “mükemmel karşılıklı öğrenme” gerçekleşiyor. Velhasıl deney iki taraf için de memnun sonla bitiyor.

“ROBOTLARIN EĞİTTİĞİ HAYVANLAR HAYAT KURTARABİLİR”

Bu projeyle hayvan-robot etkileşiminin artırılması hedefleniyor. Bu bilişsel ve davranışsal etkileşim daha üst bir seviyeye taşındığında, robotların eğittiği hayvanları arama-kurtarma çalışmaları ve mayın paklığı üzere kıymetli misyonlarda daha aktif olarak kullanmak mümkün hale gelebilecek.

Üstte özetlenen bu sisteme farklı modüller eklenerek, robot-hayvan etkileşimini çeşitlendirilecek ve böylelikle farklı modellerin hayvanın ve robotun öğrenmesini nasıl etkilediğini araştırılacak. Robotlar aracılığıyla hayvanlara öğretilebilecek şeylerin hududu, hayvanların nöronal kapasiteleri ile hudutlu. Uygun yol ile bir robot, insan dâhil rastgele bir hayvana birçok şey öğretebilir. Robot-hayvan-insan bağı, genel manada makine-hayvan-insan etkileşimine nazaran kıymetli bir avantaja da sahip. Bu avantaj robotların bize yahut sıçanlara, yani etkileşim içinde oldukları cinse fizikî ve davranışsal olarak benzeyebilmelerinden geliyor. Antropomorfik robotların bilimkurgu alanındaki muvaffakiyetini ve popülaritesini düşünün! Sıçana benzeyen bir robot, karmaşık bir labirentte sıçanlara kılavuzluk edebilir. Onlara kendi başlarına, hatta bir simülatör yardımı ile çok uzun müddette öğrenecekleri bir haritayı, çok daha kolay öğretebilir. Eğitilmiş hayvanlar hâlihazırda arama kurtarma ve mayın paklığı üzere kıymetli alanlarda kullanılıyor. Bu tip eğitim süreçlerinin robotlar aracılığıyla kolaylaştırılması ve hızlandırılması büyük ehemmiyet taşıyor.