Boğaziçi Üniversitesi Davranışsal Sinirbilim Laboratuvarı Direktörü ve projenin yürütücüsü Dr. Öğr. Üyesi Güneş Ünal, Bilgisayar Mühendisliği Bölümü’nden Dr. Öğr. Üyesi Emre Uğur ve Bilişsel Bilim Yüksek Lisans öğrencisi Oğuzcan Nas yeni yapay zeka modeliyle hayvan ve robotların birbirinden öğrenmesini sağlayacak proje için çalışıyorlar. Oluşturdukları çok disiplinli proje, edimsel şartlanma paradigmaları ile yapay zeka algoritmalarını birleştirerek robotlar ve hayvanlar ortasında “karşılıklı öğrenmeyi” mümkün hale getirecek. Bu sayede robotlar tarafından eğitilen hayvanların arama-kurtarma ve mayın paklığı üzere vazifelerde daha tesirli biçimde misyon almaları sağlanabilecek. Dr. Öğr. Üyesi Güneş Ünal, Dr. Öğr. Üyesi Emre Uğur ve Oğuzcan Nas ile yaptıkları çalışmayı “Sıçanlar ve robotlar tıpkı anda hem öğretmen hem öğrenci olacak” diyerek şöyle anlatıyor:
ROBOT İLE DENEY HAYVANI BIRINCI KEZ ETKİLEŞİM İÇİNDE
Yaptığımız çalışma en genel tarifiyle bir robot-hayvan etkileşim çalışması. Yaklaşık iki yıl sürmesini bekliyoruz. Mevcut literatürde bu hususta çalışmalar var. Örneğin robotların laboratuvar hayvanlarına (sıçanlara) bir misyonu yapmayı öğrettiği ya da onlarla toplumsallaştığı çalışmalar mevcut; lakin bu klasik çalışmalar daima tek istikametli. Ya robotlar hayvanlara bir işi öğretiyor ya da robotlar hayvanları gözlemleyerek kendileri öğreniyor, yani “makine öğrenmesi” oluşuyor. Bu çalışmaların hiçbirinde robot ile deney hayvanı birbiriyle etkileşime geçerek tıpkı anda birbirlerinin hem öğretmeni hem de öğrencisi olmuyor.
“SIÇAN VE ROBOTLAR HEM ÖĞRETMEN HEM DE ÖĞRENCİ OLACAK”
Birinci sefer bir edimsel şartlanma düzeneğinde, sıçanlar ve robotların birebir anda hem “öğretmen” hem de “öğrenci” olacağı bir ortam oluşturacağız. Bu çalışma, hem psikolojideki öğrenme literatürüne kıymetli bir katkı sunacak hem de çeşitli makine öğrenmesi algoritmalarının sınanması için yeni bir platform oluşturacak. Daha da değerlisi, tüm bu gayretlerin sonunda hayvan ve robot etkileşimi kullanan farklı uygulamalarda kullanılabilecek bir “karşılıklı öğrenme” modeli geliştirilecek.
“ROBOT ARKADAŞ OLMAK İSTİYOR”
Deney düzeneğine bir robot ve bir sıçan tıpkı anda konuluyor. İkisinin de ulaşmak istedikleri farklı gayeler var. Sıçanın motivasyonu sevdiği bir yemeği ödül olarak almak. Bu doğal bir “yemek arama davranışı” yaratıyor. Robotun maksadı ise hayvanla arkadaş olmak. Robot için sıçanla arkadaş olmayı, sıçanı mümkün olduğunca kendi etrafında tutmak olarak belirliyoruz. Genel olarak, robotun verdiği iki sinyal var. Bunlardan biri “ödül sinyali.” Robot bu sinyali verdiğinde -örneğin sol kolunu havaya kaldırdığında- şayet sıçan kendisine yaklaşırsa, deney düzeneğinin ödül köşesinde hayvanın sevdiği yiyecek beliriyor. Yani robot muhakkak bir sinyal verdiğinde ve sıçan bu sinyali anlayıp robota yaklaştığında, robotumuz deney kutusunun uzak bir noktasında sıçana ödül vermiş oluyor. Olağan sıçanın mükafatı almak için bu olumlu sinyalin manasını ve mükafatın verildiği noktayı vakit içinde öğrenip, o köşeye gitmesi gerekiyor.
“ROBOT DA ÖĞRENİYOR”
Buraya kadar anlattıklarımız kendi başına kolay bir edimsel şartlanma deneyidir. Lakin robot yalnızca ödül vermiyor, bazen de olumsuz bir sinyal ile bir çeşit ceza veriyor. Örneğin sol değil, sağ kolunu kaldırdığında ödül köşesinden yem gelmiyor. Sıçanın bu olumsuz sinyali, olumlu sinyalden ayırt etmesi gerekiyor. Sıçan bunu da öğreniyor. İşin değişik tarafı bu süreçte, robot da kendi verdiği sinyallerin ne işi yaradığını öğreniyor. Robot deneye olumlu ve olumsuz sinyalleri rastgele vererek başlıyor. Ödül sinyalinin özelliği sıçanı robota yaklaştırması. Robot yalnızca bu sinyali verdiğinde sıçan kendisine yaklaşırsa, ödül köşesinden sıçan yemi geliyor. Robot olumsuz sinyal verdiğinde sıçan robota yaklaşsa da rastgele bir ödül alamıyor. Robotun motivasyonu sıçanın kendisine yaklaşması (sıçanla arkadaş olmak) olarak tanımlandığı için, robot da vakit içinde yalnızca bir sinyalin sıçanı kendisine yaklaştırdığını öğreniyor. Sonuçta, vakit içinde “mükemmel karşılıklı öğrenme” gerçekleşiyor. Elhasıl deney iki taraf için de keyifli sonla bitiyor.
“ROBOTLARIN EĞİTTİĞİ HAYVANLAR HAYAT KURTARABİLİR”
Bu projeyle hayvan-robot etkileşiminin artırılması hedefleniyor. Bu bilişsel ve davranışsal etkileşim daha üst bir seviyeye taşındığında, robotların eğittiği hayvanları arama-kurtarma çalışmaları ve mayın paklığı üzere değerli misyonlarda daha aktif olarak kullanmak mümkün hale gelebilecek.
Üstte özetlenen bu sisteme farklı modüller eklenerek, robot-hayvan etkileşimini çeşitlendirilecek ve böylelikle farklı modellerin hayvanın ve robotun öğrenmesini nasıl etkilediğini araştırılacak. Robotlar aracılığıyla hayvanlara öğretilebilecek şeylerin hududu, hayvanların nöronal kapasiteleri ile sonlu. Uygun prosedür ile bir robot, insan dâhil rastgele bir hayvana birçok şey öğretebilir. Robot-hayvan-insan bağı, genel manada makine-hayvan-insan etkileşimine nazaran kıymetli bir avantaja da sahip. Bu avantaj robotların bize yahut sıçanlara, yani etkileşim içinde oldukları cinse fizikî ve davranışsal olarak benzeyebilmelerinden geliyor. Antropomorfik robotların bilimkurgu alanındaki muvaffakiyetini ve popülaritesini düşünün! Sıçana benzeyen bir robot, karmaşık bir labirentte sıçanlara kılavuzluk edebilir. Onlara kendi başlarına, hatta bir simülatör yardımı ile çok uzun müddette öğrenecekleri bir haritayı, çok daha kolay öğretebilir. Eğitilmiş hayvanlar hâlihazırda arama kurtarma ve mayın paklığı üzere kıymetli alanlarda kullanılıyor. Bu tip eğitim süreçlerinin robotlar aracılığıyla kolaylaştırılması ve hızlandırılması büyük kıymet taşıyor.
Hürriyet