Derin öğrenme, temelde gelişen teknoloji, anlamlı veri miktarlarındaki artış ve yeni keşfedilen öğrenme yöntemleri sayesinde, insan performansının geçilemeyeceği düşünülen pek çok zor problemde insan performansını geçmiş, diğer problemlerde ise mevcut yöntemlere göre şaşırtıcı derecede üstün performanslar üretmiş; bilgisayarlı görü ve örüntü tanıma başta olmak üzere, dil işleme, ses tanıma, ses üretme, planlama / kontrol vb. pek çok alanda baskın yöntem haline gelmiştir. Bu konuşmada, derin öğrenme yöntemlerini anlamaya ve kullanmaya temel oluşturmak üzere; kısa bir derin öğrenme tarihinden ve derin öğrenme yöntemlerinin özellikleri, yetenekleri ve zorluklarının tartışılmasından sonra genel olarak makine öğrenme ve yapay sinir ağları ile devam edilecek ve temel derin öğrenme yöntemleri işlenecektir.
Sinan Kalkan, lisans ve yüksek lisans derecelerini 2001 ve 2003 yıllarında Orta Doğu Teknik Üniversitesi Bilgisayar Mühendisliği Bölümünden; doktora derecesini ise 2008 yılında Almanya'nın Göttingen Üniversitesi Enformatik Bölümünden almıştır. Dr. Kalkan, doktora çalışmalarında stereo görme ve tek bir fotoğraftan derinlik kestirimi problemleri üzerine odaklanmıştır. Doktora sonrasında Orta Doğu Teknik Üniversitesi Bilgisayar Mühendisliği Bölümüne öğretim üyesi olarak katılan Dr. Kalkan, kavramlama ve bağlam başta olmak üzere pek çok bilişsel robotbilim problemi üzerine çalışmaya başmaıştır. Dr. Kalkan, halihazırda yurtiçi ve yurtdışı kaynaklarca desteklenen projeler ile derin öğrenme, bilgisayarlı görü, örüntü tanıma ve bilişsel robotbilim alanlarında çalışmaktadır.
Bilgisayarlı görü, görebilen makineler geliştiren bilim dalıdır. Bu makineler canlılardaki görme sistemlerinden esinlenerek oluşturulur. Canlılar bir nesneyi, nesneden yansıyan ışık sinyalleri olarak parça parça algılayabilirler. Canlılardaki görme sistemleri, algılanan sinyalleri birleştirerek nesnenin bir yansımasını üretir. Yani; görme işlemi sinyallerle önce parçalanıp sonra bir araya getirilen nesnenin "gerçeğe yakın" bir yansımasını elde etmekten ibarettir. Bu konuşmada, adına piksel dediğimiz anlamsız görüntü parçalarını birleştirerek anlamlı kavramlara dönüştüren yöntemlerden bahsedeceğiz. Örneğin; birbirine benzemeyen pikselleri birleştirerek kenar kavramını oluşturacağız. Birbirine benzeyen pikselleri Gauss ya da Gabor fitreleri ile bütünleştirerek nesneye ait renk ve desen özniteliklerini tanımlayacağız. Bu öznitelikleri, fonksiyon öğrenen bir algoritma ile öznitelik uzayından kavram uzayına gönderip, bu uzayda nesnenin bir yansımasını üreteceğiz.
Fatoş T. Yarman Vural 1973’te İstanbul Teknik Üniversitesi'nden lisans, 1975’te Boğaziçi Üniversitesi’nden Yüksek Lisans ve 1982 yılında Princeton Üniversitesi’nden Elektrik Mühendisliği ve Bilgisayar Bilimleri doktorası aldı. !982-1985 yıllarında TUBİTAK-Marmara Araştırma Enstitüsünde çalıştı. 1985-1987 yıllarında Massachusets Institute of Technology ve Drexel Universitesinde öğretim üyesi olarak çalıştı. 1992’de ODTÜ Bilgisayar Mühendisliği Bölümüne giren Fatoş T. Yarman Vural, 1996-2000 yıllarında Bölüm Başkanlığı, 2000-2008 yıllarında ise Rektör Danışmanlığı yaptı. Akademik hayatı boğunca Bilgisayarlı Görü, Makine Öğrenmesi ve İnsan Beyni alanlarında 200 civarında ulusal ve uluslararası bildiri yayınladı.
In this talk, I will focus on two popular research topics in computer vision, namely large-scale human activity understanding in video and using simulated data for various computer vision applications. I will also highlight some of the recent efforts that the Image and Video Understanding Lab (IVUL) at KAUST has made in both domains, as well as, provide what I believe to be exciting avenues for future research. (1) Regarding activity understanding, I will present the main research challenges facing this booming field and emphasize our deep learning based work on handling the large-scale nature of the problem, manifested in the large number of videos to be processed, the large number of activity classes to be learned, and their distribution. For example, with properly designed deep models and a new large-scale activity dataset (ActivityNet), IVUL has shown that deep recurrent networks can be trained to detect the locations of human activities of interest in a long video in a single pass at rates exceeding 10x real-time. (2) Regarding the use of simulated data in computer vision, I will introduce our newly developed simulator (called UE4Sim), which is based on the UE4 open-source computer game engine. Because of its photo-realism, versatility, and the ease in which ground truth can be generated from it, this simulator enables a multitude of computer vision and learning based applications, ranging from self-driving to tracking, crowd analysis, and 2D/3D scene understanding. Specifically, I will describe how UE4Sim can be used to train a self-driving car and a self-racing UAV, as well as, evaluate tracking methods in near real-world scenarios.
Bernard Ghanem is currently an Assistant Professor in the CEMSE division and a member of the Visual Computing Center at King Abdullah University of Science and Technology (KAUST). Before that, he was a Senior Research Scientist at the University of Illinois Urbana-Champaign (UIUC) in Singapore, where he still holds an adjunct position. He heads projects that develop algorithms in computer vision, machine learning, and optimization geared towards real-world applications, including semantic video analysis in sports and automated surveillance, large-scale activity recognition, and 2D/3D scene understanding. He received his Bachelor’s degree in Computer and Communications Engineering from the American University of Beirut (AUB) in 2005 and his MS/PhD in Electrical and Computer Engineering from UIUC in 2010. His work has received several awards and honors, including the Henderson Graduate Award from UIUC, two consecutive CSE fellowship awards from UIUC, a Best Paper Award (CVPRW 2013), a two-year KAUST Seed Fund, a Google Faculty Research Award in 2015, and the best business plan award in the Vision Industry Entrepreneur Workshop (VIEW) at CVPR 2016. He has co-authored more than 50 peer reviewed conference and journal papers in his field, as well as, 4 patents. He is also a co-founder of AutoScout Inc. that provides automated solutions for sports video analytics. Visit ivul.kaust.edu.sa and www.bernardghanem.com for more details.
Robotbilim, makine mühendisliği, elektrik-elektronik mühendisliği, bilgisayar bilimleri gibi farklı mühendislik ve bilimleri biraraya getiren disiplinler arası bir çalışma alanı olup robotların tasarımı, yapımı, kontrolü, algısı ve zekası gibi konuları çalışmaktadır. Robotlar, yüzyıl önce yazılmış bilim kurgu kitaplarında bile insan yetenekleri ve zekası ile aynı düzeyde varlıklar olarak kurgulansa da, robotbilim araştımacıları, insan için çok basit olan ortamın algısı ve teşhisi, objelerin ve aletlerin manipülasyonu ve bacaklı sistemlerin dengesi konuları dahil olmak üzere halen en temel problemleri çözmek için yoğun olarak çalışmaktadır. Bununla birlikte, 1950'lerden beri özellikle fabrikalarda çitlerin arkasında insansız, özelleşmiş ve yinelemeli işlerde yoğun bir şekilde kullanılmakta olan robotların, yapay zeka, makine öğrenmesi ve malzeme bilimlerindeki ilerlemelerle birlikte her alanda yaşamımızın önemli bir parçası olması beklenmektedir. Bu konuşmada robotbilimin kısa bir tarihini, robotbilimin ana kavram ve problemlerini, son yıllardaki gelişmeleri ve özel olarak otonom ve öğrenen robotların fabrikalara girerek üretim süreçlerini nasıl değiştirebileceklerini tartışacağız.
Emre Uğur Boğaziçi Üniversitesi Bilgisayar Mühendisliği Bölümü'nde Yardımcı Doçent olarak görev yapmaktadır. 2003, 2007 ve 2010 yıllarında Orta Doğu Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü'nden sırasıyla lisans, yüksek lisans ve doktora derecelerini aldı. Japonya'da Advanced Telecommunication Research Institute'de 2009-2013 arasında araştırmacı ve Avusturya'da Innsbruck Üniversitesi'nde 2013-2016 arasında kıdemli araştırmacı olarak çalıştı. 2015 ve 2016 yıllarında Japonya'da Osaka Üniversitesi'ni özel atanmış Yardımcı Doçent olarak ziyaret etti. Şu anda Avrupa Birliği Ufuk 2020 programı tarafından desteklenen IMAGINE projesinin yürütücülüğünü yapmakta ve Boğaziçi Üniversitesi'nde Yapay Zeka, Makine Öğrenmesi ve Bilişsel Bilimlere Giriş derslerini vermektedir. Gelişimsel ve bilişsel robotik; akıllı ve adaptif manipulasyon konularında araştırmalar yapmaktadır.
Evrişimsel sinir ağları ve yinelemeli sinir ağları hem derin öğrenmenin yaygınlaşması ve başarısında, hem de modern bilgisayarlı görü ve doğal dil işleme araştırmalarında temel bir öneme sahiptir. Evrişimsel sinir ağlarındaki son yıllardaki gelişmeler ile, pekçok bilgisayarlı görü probleminde başarımın oldukça arttırılması mümkün olmuştur. Yinelemeli sinir ağları ise, özellikle dizisel verilerin işlenmesinde çok etkin modellerdir. Bu konuşmada, evrişimsel sinir ağları ve yinelemeli sinir ağlarının temelleri anlatılacaktır.
R. Gökberk Cinbiş, 2008 yılında Bilkent Üniversitesi'nden bilgisayar mühendisliği alanında lisans ve 2010 yılında Boston Üniversitesi'nden (ABD) bilgisayar bilimlerinde yüksek lisans derecesi aldı. 2010-2014 yılları arasında Fransa INRIA Grenoble'da doktora öğrencisi olarak çalıştı, ve 2014 yılında Grenoble Üniversitesi'nden bilgisayar bilimleri dalında doktora derecesi aldı. 2015 yılında Fransız Örüntü Tanıma Birliği'nin (AFRIF) en iyi doktora tez ödülünü aldı. Şu anda Bilkent Üniversitesi Bilgisayar Mühendisliğinde yardımcı doçent olarak görev almaktadır. İstatistiksel görüntü modelleri, derin öğrenme ve eksik gözetimli öğrenme konularında araştırmalarını yürütmektedir.
Günümüzde yapay öğrenme alanının merkezinde bulunan derin öğrenmenin model seçimi, aşırı uyum ve aşırı veri ihtiyacı gibi üç temel problemi mevcuttur. Olasılıksal yaklaşım, bu problemlerin her birisi için ilkeli çözümler sunmaktadır. Olasılıksal derin öğrenmede sinir ağırlıklarına öncül dağılımlar atanarak öğrenme süreci bir ardıl dağılım çıkarsama problemine dönüştürülür. Varyasyonel çıkarsama, Markov Zinciri Monte Carlo örneklemesi, beklenen değer saçılımı gibi ardıl dağılım çıkarsama yaklaşımlarının derin sinir ağlarına en etkin şekilde nasıl uyarlanabileceği üzerine halen yoğun olarak çalışılan bir araştırma konusudur. Bu konuşmada temel olasılıksal çıkarsama yaklaşımları tanıtılacak, bu yaklaşımların derin sinir ağlarına uygulanması örneklenecek ve olasılıksal derin öğrenme alanındaki son gelişmelerin bir derlemesi sunulacaktır.
Dr. Melih Kandemir, 2001 ve 2008 seneleri arasında Hacettepe Üniversitesi ve Bilkent Üniversitesi'nde Bilgisayar Mühendisliği eğitimi gördükten sonra Aalto Üniversitesi'ne (eski ismiyle Helsinki Teknik Üniversitesi) katıldı. 2013 senesine kadar bu okulda zihinsel durumların çıkarsamasını sağlayan yapay öğrenme modelleri üzerine doktora yaptı. 2013 ve 2016 seneleri arasında ise Heidelberg Üniversitesi'nin Heidelberg Collaboratory for Image Processing (HCI) araştırma enstitüsünde doktora sonrası araştırmacı olarak çalıştı. Dr. Kandemir halen Özyeğin Üniversitesi Bilgisayar Mühendisliği Bölümü’nde öğretim üyesi olarak görev yapmakta olup, araştırma konuları arasında olasılıksal derin öğrenme, etkin öğrenme, zayıf etiketlerle öğrenme ve tersine pekiştirmeli öğrenme bulunmaktadır.
Bilişsel robotik özellikle insanlarda varolan, zor problemleri zekice çözmek için kullanılan algı, akıl yürütme, hafıza, öğrenme gibi bilişsel süreçlerin robotlarda uygulanmasını çalışan alandır. Bilişsel robotik araştırmacıları, bir yandan insan zekasından esinlenen metodlar yardımıyla daha akıllı robotlar yapmaya çalışırken, diğer yandan insan zekasına dair hipotezleri robotları deney platformu olarak kullanarak test eder ve gelişimsel psikoloji, bilişsel bilimler, sinirbilimi gibi alanlara geri bildirimde bulunmayı amaçlar. Bu konuşmada, bilişsel robotikteki kavram ve problemleri tanıttıktan sonra insansı üst gövde robotlarımızla gerçekleştirdiğimiz insan gelişiminden ilham alan duyu-motor öğrenmesi, sağlarlık (affordance) algısı, konsept ve kategori keşfi ve keşfedilen sembollerle yüksek düzeyli akıl yürütme ve plan gerçekleştirme çalışmalarını sunacağım.
Emre Uğur Boğaziçi Üniversitesi Bilgisayar Mühendisliği Bölümü'nde Yardımcı Doçent olarak görev yapmaktadır. 2003, 2007 ve 2010 yıllarında Orta Doğu Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü'nden sırasıyla lisans, yüksek lisans ve doktora derecelerini aldı. Japonya'da Advanced Telecommunication Research Institute'de 2009-2013 arasında araştırmacı ve Avusturya'da Innsbruck Üniversitesi'nde 2013-2016 arasında kıdemli araştırmacı olarak çalıştı. 2015 ve 2016 yıllarında Japonya'da Osaka Üniversitesi'ni özel atanmış Yardımcı Doçent olarak ziyaret etti. Şu anda Avrupa Birliği Ufuk 2020 programı tarafından desteklenen IMAGINE projesinin yürütücülüğünü yapmakta ve Boğaziçi Üniversitesi'nde Yapay Zeka, Makine Öğrenmesi ve Bilişsel Bilimlere Giriş derslerini vermektedir. Gelişimsel ve bilişsel robotik; akıllı ve adaptif manipulasyon konularında araştırmalar yapmaktadır.
Bu konuşmada görsel nesne konum bulma konusundan bahsedilecektir. İlk olarak Felzenswalb v.d. tarafından önerilen ve klasik bir yöntem haline gelen Deformable Parts Model (DPM) yöntemi ile başlanılarak kök ve parça konum buluculardan bahsedilecektir. Daha sonra, son zamanlarda önerilen ve CNN öznitelikleri ile bölge önericileri kullanan yeni yöntemler anlatılacaktır. Konuşmanın büyük bir bölümünde nesne konum bulmayı hızlandırmak için son zamanlarda geliştirilen yeni bölge önericilerinden bahsedilecek olup, bu yöntemleri kullanan ve gerçek zamanlı çalışan yöntemlerin detayları verilecektir. Konuşmanın son bölümünde ise görsel nesne için tasarladığımız yeni polihedral konik sınıflandırıcılardan bahsedilecektir.
Doç. Dr. Hakan Çevikalp Eskişehir Osmangazi Üniversitesi Elektrik-Elektronik Mühendisliği Bölümünde öğretim üyesi olarak çalışmaktadır. Hakan Çevikalp doktora programını Vanderbilt Üniversitesinde örüntü tanıma alanında 2005 yılında tamamladıktan sonra Fransa'da INRIA kurumuna bağlı LEAR grubunda bir sene boyunca bilgisayarlı görü alanında doktora sonrası araştırmacı olarak çalışmıştır. Daha sonra Amerika Birleşik Devletlerinde Rowan Üniversitesinde çoğul sınıflandırıcılar konusunda doktora sonrası araştırmacı olarak çalışmalar yaptıktan sonra yurda dönerek Eskişehir Osmangazi Üniversitesinde öğretim üyesi olarak çalışmaya başlamıştır. Çalıştığı konular genellikle makine ile öğrenme be bilgisayarlı görü alandıdaki konulardır. Bu alanlarda IEEE Transactions on PAMI, IEEE Transactions on Neural Networks and Learning Systems, International Journal of Computer Vision gibi prestijli dergilerin yanında IEEE Conference on Computer Vision and Pattern Recognition and International Conference on Machine Learning gibi prestijli konferanslarda yayınlar yapmıştır.
Son yillarda bilgisayarli goru, konusma ve dil isleme alanlarinda derin ogrenme teknikleri bir cok standard isleme modellerinin yerini almistir. Ayni zamanda, derin pekistirmeli ogrenme alanindaki gelismeler sayesinde karmasik ve gercekci problemleri cozme kabiliyetine sahip sistemler ogrenebiliyoruz. Bu konusmada, derin pekistirmeli ogrenme sistemlerinin temel modelleri tanitilacak ve buyuk olcekli derin pekistirmeli ogrenme modelleri uzerinde durulacaktir. Son olarak guncel bazi modeller ve onemli arastirma problemleri tartisilacaktir.
Koray Kavukcuoglu ODTU Havacilik Muhendisligi bolumunden 1999 ve 2003 yillarinda lisans ve yuksek lisans dercelerini almistir. 1999-2003 yillari arasinda Roketsan'da muhendislik gelistirme bolumunde calismis ve bunu takiben Amerika Birlesik Devletlerinde New York Universitesinde bilgisayar bilimi bolumunden yuksek lisans ve doktora derecelerini almistir. NYU'da Yann Lecun ile yaptigi derin ogrenme konulu doktora calismalarini takiben 2010-2011 yillari arasinda NEC Labs America'da arastrimaci olarak calismistir. 2011 yilindan itibaren Londra'da DeepMind bunyesinde derin ogrenme grubu sorumlusu olarak derin ve pekistirmeli ogrenme konularinda arastirmalarina devam etmektedir.
Robotlarin gerek manipulasyon, gerekse navigasyon gorevlerini yerine getirebilmeleri icin yapacaklari hareketleri, robotun ve ortamin kinematik ve dinamik ozelliklerini dikkate alarak planlamalari gerekir. Hareket planlamaya yonelik calismalarin ana cercevesini Lozano-Perez'in 1980'lerin basinda formalize ettigi konfigurasyon uzayi belirlemistir. Bu uzayda robot, hangi turde olursa olsun, bir nokta olarak temsil edilir, ve hareket planlama problemi, verilen iki nokta arasinda bir rota bulma problemine indirgenir. Yapilan calismalar, konfigurasyo uzayi icinde rota bulmanin hesaplama karmasikliginin oldukca yuksek oldugunu gostermis ve ozellikle manipulasyon problemleri gibi yuksek boyutlu uzaylar icin olasiliksal planlama metotlarinin gelistirilmesine yol acmistir. Bu konusmada, problem ve konfigurasyon uzayi kisaca anlatildiktan sonra gelistirilen hareket planlama yontemleri hakkinda genel bir ozet verilecektir.
Erol Sahin lisans derecesini Elektrik-Elektronik Muhendisligi'nde Bilkent Universitesi'nden, yuksek lisans derecesini ODTU Bilgisayar Muhendisligi'nden ve doktorasi ise Boston University Cognitive and Neural Systems bolumunden aldi. Erol Sahin 2000 yilinda doktorasini aldiktan sonra Bruksel'de once Starlab Research Laboratory'de "Chief Scientist" olarak daha sonra da Universite Libre de Bruxelles'de Swarm-bots projesinde doktora sonrasi arastirmaci olarak calisti. 2002 yilinda ODTU Bilgisayar Muhendisligi'ne dondukten sonra KOVAN Arastirma Laboratuvari'ni kurdu. Icinde su anda 4 ogretim uyesi, 9 lisansustu ogrencinin calistigi bu laboratuvar icinde iki TUBITAK, dort Avrupa Birligi projesi (6 ve 7. CP) cercevesinde 6.500.000 TL'lik arastirma destegi aldi. Bilissel robotlar konusundaki calismalari ile RobotCub konsorsiyumuna gonderdigi projesi 31 proje arasinda 6. olarak 250,000 Euro'luk 53-serbestlik dereceli bir iCub insansi robot platformu kazandi. 07/2013-07/2015 tarihleri arasinda Carnegie Mellon University Robotics Institute'da misafir arastirmaci olarak yaptigi robotik manipulasyon uzerine calismalar Avrupa Birligi'nin Marie Curie International Outgoing Fellowship projesi cercevesinde desteklendi.
Erol Sahin'in robot suruleri ve bilissel robotlar konusundaki calismalari konusundaki onemli konferans ve dergilerde yayinlandi. Bu cercevede, 3 derginin (Autonomous Robots, Swarm Intelligence (2)) ozel sayisini, 3 (ANTS'2010, EpiRob'2010, TORK'2016 (Turkce)) konferans kitabinin ve iki kitabin (Springer) editorlugunu yapti. ANTS'2010, AAMAS'2009 ve ICDL/Epirob'2014 konferanslarin program/alan baskanliklarini yapti. 2016 yilinda 3. Turkiye Robotbilim Konferansi'nin (TORK'2016) es-genel baskani olarak gorev yapti. 2007'den Swarm Intelligence dergisinin Editorler Kurulunun uyeligini, 2009'dan beridir de Adaptive Behavior dergisinin yardimci editorlugunu yurutmektedir.
Derin öğrenme, geçtiğimiz 5 yılda görüntü sınıflandırma, nesne tespiti gibi gözetimli öğrenme gerektiren bilgisayarlı görü problemlerinin çözümünde önemli ilerlemeler sağlanmasına yol açmıştır. Derin öğrenme literatüründe son zamanlarda giderek önem kazanan bir diğer araştırma konusu da derin ağların gözetimsiz öğrenmede kullanım yollarının araştırılmasıdır. Bu konuşmada yakın tarihte önerilmiş olan derin üretici ağlara bir giriş yapılacak ve bu ağ modelleri kullanılarak doğal görünümlü gerçekçi görüntülerin nasıl üretilebileceği incelenecektir. Bu bağlamda, otoregresif üretici modeller (autoregressive generative models), değişimsel otomatik kodlayıcılar (variational autoencoders) ve çekişmeli üretici ağlar (generative adversarial networks) üzerinde durulacak, ve bilgisayarlı görünün farklı problemlerinin çözümünde derin üretici modellerin kullanımına yönelik son gelişmelere değinilecektir.
Erkut Erdem, lisans ve yüksek lisans derecelerini 2001 ve 2003 yıllarında Orta Doğu Teknik Üniversitesi Bilgisayar Mühendisliği Bölümünden almıştır. 2004 ve 2007 yıllarında kısa sureli olarak Virginia Tech ve University of California, Los Angeles'da ziyaretçi araştırmacı olarak çalışmıştır. 2008 yılında Orta Doğu Teknik Üniversitesi'nde doktora çalışmalarını tamamladıktan sonra doktora sonrası araştırmalarını 2009-2010 yılları arasında Télécom ParisTech, Ecole Nationale Supérieure des Télécommunications'da sürdürmüştür. 2010 yılında Hacettepe Üniversitesi Bilgisayar Mühendisliği Bölümü'nde öğretim görevlisi olarak çalışmaya başlamıştır ve 2014 yılından itibaren de yine aynı bölümde Yardımcı Doçent olarak görev yapmaktadır. Hacettepe Üniversitesi Bilgisayarlı Görü Laboratuvarının kurucuları arasındadır. Araştırma alanları genel olarak bilgisayarlı görü ve makine öğrenmesi olup özellikle görüntü düzenleme ve düzleştirme, görsel belirginlik kestirimi, bütünleşik dil ve görme uygulamaları konularında araştırmalar yürütmektedir.
Pek farkında olmasak da otomatik yüz analizi uygulamaları günlük hayatta sıklıkla kullanılmaktadır. Bu alandaki çoğu çalışma yalnızca statik görünümüne dayansa da, yüzlerin zamansal analizi yüz ifadelerinin ilginç karakteristiklerini ortaya çıkarmaktadır. Yeni metotlar, zamansal örüntülerden yararlanarak, yüz analizi uygulamalarını temel (yüz) ifadelerini ve kişi kimliğini tanımanın çok ötesine taşımaktadır. Yakın zamandaki araştırmalarımız, yüz ifadelerinin zamansal analizinin, akıl sağlığı değerlendirmesinden akrabalık ilişkilerinin doğrulanmasına kadar bir çok uygulama için yararlı olduğunu göstermektedir. Bu konuşmada, öncelikle, otomatik yüz analizi sistemlerinin genel özelliklerinden bahsedecek, sonra da yüz davranışlarının daha güvenilir analizi için ayırt edici zamansal karakteristikleri nasıl yakalayıp modelleyebileceğimizi tartışacağız.
Hamdi Dibeklioğlu doktora derecesini Amsterdam Üniversitesi'nden 2014 yılında almıştır. Şu anda Delft Teknoloji Üniversitesi'nde araştırmacı olarak çalışmaktadır. 2014-2015 yıllarında Delft Teknoloji Üniversitesi'ndeki pozisyonunun yanısıra Carnegie Mellon Üniversitesi, Pittsburgh Üniversitesi ve Massachusetts Teknoloji Entitüsü'nde ziyaretçi araştırmacı olarak bulunmuştur. Dr. Dibeklioğlu yüz ve davranış analizi, duyuşsal bilişim, örüntü tanıma ve bilgisayarla görme alanlarında çalışmaktadır. Şu anki araştırmaları, depresyon seviyesi ölçme ve tat beğenisinin tespiti gibi sağlık teknolojileri, nöro-pazarlama uygulamaları ve insan davranışlarının çok kipli analizi ile zamansal gösterimlerinin derin öğrenmesi üzerine yoğunlaşmaktadır.
Hizmet robotlarının yemek hazırlama, oda temizliği gibi gündelik görevlerini başarıyla yerine getirebilmeleri için ortamlarını doğru şekilde modellemeleri gerekmektedir. Bu modelleme esnasında sensörlerden gelen verilerin algılanması ve yorumlanması gerekir. Son dönemde kamera ve derinlik sensörleri donanımlarındaki gelişmelere paralel olarak etkin görüntü işleme yöntemleri geliştirilmektedir. Fakat hala sahne görüntüsünün işlenmesi için geliştirilen yöntemler gürültülü sonuçlar üretmektedir. Bu yüzden robot sistemlerinde sensör verilerini işleyen üst katman bir sahne yorumlama biriminin varlığına ihtiyaç duyulmaktadır. Bu konuşmada görüntü işleme algoritmalarının ürettiği gürültülü verilerin yorumlanması için kullanılabilecek yöntemler üzerinde durularak labortuvarımızda geliştirmiş olduğumuz sahne yorumlama sistemi tanıtılacaktır. Bu sistem hem gezgin robotlar hem de masaüstü uygulamalarda çalışan insansı robotlar için genel kullanıma açık olarak tasarlanmıştır. Sisteme farklı görüntü işleme algoritmaları girdi olarak sunularak sahnenin etkin şekilde yorumlanması mümkün olmaktadır. Konuşma, sistem tasarımında kullanılan filtreleme algoritmalarını ve sistem içinde nasıl gerçeklendiklerini kapsamaktadır.
Sanem Sarıel, lisans, yüksek lisans ve doktorasını İstanbul Teknik Üniversitesi, Bilgisayar Mühendisliği’nden, sırasıyla 1999, 2002 ve 2007 yıllarında almıştır. Doktora çalışmalarını 2004-2006 yılları arasında Georgia Institute of Technology’de yürütmüştür. Doktora tezinde çoklu robot sistemlerinde dağıtılmış görev paylaşımı üzerine bir sistem önermiştir. Şu an İstanbul Teknik Üniversitesi, Bilgisayar Mühendisliği Bölümü’nde öğretim üyesi olarak görev yapmakta ve Yapay Zeka ve Robotik Laboratuvarı’nı koordine etmektedir. Yapay zeka ve robotlarda zeka konularında lisans, yüksek lisans ve doktora dersleri vermekte ve bu konulardaki bilimsel çalışmaları yönetmektedir. Son dönemde çalışmalarını insansı robotlarda otonom algılama ve karar verme, robotlarda uyarlanır ve artımlı öğrenme ve oyunlarda yapay zeka konularında yoğunlaştırmıştır.
Bu ders sosyal etkileşimli robotlara giriş niteliğinde olup, konu hakkında alt yapısı olan ya da olmayan her alandan dinleyiciye açık şekilde düzenlenmiştir. Bu amaçla öncelikle "etkileşim" terimini tanımlayıp, yapay zekanın etkileşim uygulamalarına değineceğiz. Ardından özellikle robotik alanına olan uygulamalarını detaylandırıp, değişik tasarım yaklaşımlarını çalışacağız. Bu amaçla, konularında öne çıkan çalışmaları ve son dönemdeki bilimsel eğilimleri ana hatlarıyla ele alıp, son olarak ortak ilgi oluşturma, ve ortak hareket konularında yapılmış bir kaç çalısmayı detaylı şekilde inceleyeceğiz.
Zeynep Yücel linsans derecesini 2003 yılında Boğaziçi Üniversitesi Elektrik ve Elektronik Mühendisliği bölümünden aldı. Yüksek lisans ve Doktora çalışmalarını 2010 yılında Bilkent Üniversitesinin aynı bölümünde tamamladıktan sonra Kyoto'daki ATR laboratuarlarında doktora sonrası arastırmacı olarak calıştı. Ardından Japon Bilimi Destekleme Vakfı (JSPS) tarafından JSPS Fellowship ile ödüllendirildi ve bir süre JSPS adına araştırmalarda bulundu. Su an Okayama Üniversitesi Bilişsel Bilimler bölümünde öğretim üyesi olarak çalışmaktadır. Araştırma alanları insan davranışlarını tanıma ve anlamadır ve bu amaçla sinyal işleme, örüntü tanıma, bilgisayarli görü problemleri ile ilgilenmektedir.
Bu konuşmada, öncelikle metrik öğrenme ve temsil öğrenmenin temellerinden bahsedip, LMNN (Yüksek Paylı En Yakın Komşular) gibi temel algoritmaları anlatacağım. Bu temellerin derin öğrenme sistemlerindeki uygulanılırlığı ve geçerliliğinden bahsettikten sonra, Evrişimsel Yapay Sınır Ağları (CNN)’nin oluşturduğu uzayları geometrik açıdan inceleyip bu algoritmaların genelleştirebilme yetenekleri ile ilgili teorik sonuçlarımızından bahsedeceğim. Son olarak da bu geometrik özelliklerin aktif öğrenme ve alanlar arası transfer problemlerinde nasıl uygulanabileceğini anlatacağım.
Ozan Şener lisans ve yüksek lisans derecelerini Orta Doğu Teknik Üniversitesinden, doktora derecesini ise Cornell Üniversitesinden almıştır. Stanford Üniversitesinde doktora sonrası araştırmacı olarak çalışmalarını yürütmektedir. Makina öğrenmesi, yapay görü ve robotik konularında çalışmaktadır. Son yıllardaki çalışmaları, alanlar arası transfer ile öğrenme, eğitmensiz öğrenme ve derin öğrenmenin geometrik analizi üzerine yoğunlaşmaktadır.
İçinde yaşadığımız karmaşık dünyayı görece basit almaçlar vasıtası ile, izdüşümlerinden algılamaya çalışan varlıklarız. Olabildiğince muğlak, eksik ve gürültülü bilgi içeren bu izdüşümler, çok aşamalı işlemlerden geçerek dünya hakkında anlamlı ve faydalı bilgiye dönüşmektedir. Bu süreçte ise, muğlaklığı, eksikliği ve gürültüyü gidermek için kullandığımız en önemli araç, bağlamdır. İnsan bilişi için oldukça elzem olan bağlam, robotlar için de (benzer nedenlerden dolayı) aynı miktarda önem arz etse de, robotbilimde yeterince ilgi görmemiştir. Bu konuşmada, KOVAN Araştırma Laboratuvarında (ODTÜ) robotlarda bağlamın modellenmesi, öğrenilmesi ve kullanımı üzerine son zamanlarda yaptığımız ve özellikle enerji tabanlı derin öğrenme modelleri kullandığımız çalışmalara değinilecektir.
Sinan Kalkan, lisans ve yüksek lisans derecelerini 2001 ve 2003 yıllarında Orta Doğu Teknik Üniversitesi Bilgisayar Mühendisliği Bölümünden; doktora derecesini ise 2008 yılında Almanya'nın Göttingen Üniversitesi Enformatik Bölümünden almıştır. Dr. Kalkan, doktora çalışmalarında stereo görme ve tek bir fotoğraftan derinlik kestirimi problemleri üzerine odaklanmıştır. Doktora sonrasında Orta Doğu Teknik Üniversitesi Bilgisayar Mühendisliği Bölümüne öğretim üyesi olarak katılan Dr. Kalkan, kavramlama ve bağlam başta olmak üzere pek çok bilişsel robotbilim problemi üzerine çalışmaya başmaıştır. Dr. Kalkan, halihazırda yurtiçi ve yurtdışı kaynaklarca desteklenen projeler ile derin öğrenme, bilgisayarlı görü, örüntü tanıma ve bilişsel robotbilim alanlarında çalışmaktadır.
Bilgisayarlı görü alanındaki en temel problemlerden biri, görüntü anlamlandırma modellerinin oluşturulmasıdır. Bu modeller, verilen bir görüntüdeki sahneyi tanımak, nesneleri tespit etmek, olayları analiz etmek ve benzeri problemleri çözmeyi amaçlar. Bu alanda derin öğrenme temelli yaklaşımlar ile önemli ilerlemeler sağlanmıştır. Ancak, yaygın olarak kullanılan derin öğrenme yöntemleri öğrenme aşamasında çok sayıda örneğin toplanması ve detaylı işaretlenmesini gerektirmektedir. Bu durum, oluşturulan modelleri kapsam ve başarı yönünden kısıtlayan önemli bir faktördür. Eksik gözetimli öğrenme yaklaşımları ise, sadece kısmi olarak işaretlenmiş veya işaretlenmemiş veri kümeleri üzerinden kapsamlı görüntü anlamlandırma modellerinin oluşturulmasına imkan tanımayı hedeflemektedir. Bu konuşmada, eksik gözetimli öğrenme alanında sağlanan son yıllardaki gelişmeler üzerinde durulacaktır.
R. Gökberk Cinbiş, 2008 yılında Bilkent Üniversitesi'nden bilgisayar mühendisliği alanında lisans ve 2010 yılında Boston Üniversitesi'nden (ABD) bilgisayar bilimlerinde yüksek lisans derecesi aldı. 2010-2014 yılları arasında Fransa INRIA Grenoble'da doktora öğrencisi olarak çalıştı, ve 2014 yılında Grenoble Üniversitesi'nden bilgisayar bilimleri dalında doktora derecesi aldı. 2015 yılında Fransız Örüntü Tanıma Birliği'nin (AFRIF) en iyi doktora tez ödülünü aldı. Şu anda Bilkent Üniversitesi Bilgisayar Mühendisliğinde yardımcı doçent olarak görev almaktadır. İstatistiksel görüntü modelleri, derin öğrenme ve eksik gözetimli öğrenme konularında araştırmalarını yürütmektedir.
Yapay görme sistemlerinin genel yapısı ve pratikteki zorlukları vurgulanarak yapay görme sistemlerinin endüstride ve farklı alanlardaki uygulamalarından örnekler verilecektir. Gerek akademik hayatta yaptığımız projeler, gerekse de yapay görme alanında kurulmuş olan iki farklı girişim temelinde yapılan projeler bağlamında, yaşanan zorluklar, yapılan hatalar, alınan dersler paylaşılacaktır.
Prof. Dr. Aytül Erçil, Boğaziçi Universitesi Elektrik Mühendisliği ve Matematik Bölümlerinden 1979 yılında lisans, Brown Universitesi, uygulamalı matematik bölümünden 1980 yılında yüksek lisans, 1983 yılında ise Doktora derecesini almıştır. 5 yıl General Motors Araştırma Laboratuvarında çalıştıktan sonra 1988 - 2001 yılları arasında Boğaziçi Universitesinde öğretim üyeliği ve kurucusu olduğu BUPAM Yapay Görme Laboratuvarının direktörlüğünü yapmıştır. 2001 yılından beri ise Sabancı Üniversitesinde öğretim üyeliği ve kurucusu olduğu VPALAB yapay görme laboratuvarının direktörlüğünü yapmaktadır. Çeşitli Uluslararası projelerde (Nato, FP4, Eureka, NSF, FP6, Nedo, FP7) araştırmacı/proje yürütücüsü olarak görev yapmış olan Prof. Erçil, TÖTİAD – Türk Örüntü Tanıma ve İmge Analizi Derneğinin kurucu başkanı olup, IAPR ‘International Association of Pattern Recognition’ın yönetim kurulu üyesidir. 2006 yılında Prof. Erçil’in kurduğu Vistek ISRA Vision A.Ş. Aralık 2013’de yapay görme konusunda Avrupa’da 1 numara, dünyada 3. konumda olan Alman ISRA Vision firmasına satılmıştır. Prof. Erçil’in çalışmaları ‘Uluslararası Başarı Ödülü’, Eureka Başarı öyküsü, Endeavor girişimcisi, 2010 teknoloji ödülü finalisti, Veuve Clicquot ‘yılın en etkin kadın girişimcisi’ ödülü, Makina ve Aksesuarları Üretim Teknolojileri yarışmasında birincilik ödülü, ‘2013 Türkiye’nin kadın girişimcisi’, ‘Kristal Ağaç yılın kadın girişimcisi’, 2014 Ansiad ‘yılın kadın girişimcisi’ ödülü gibi birçok ulusal ve uluslararası ödüle layık görülmüştür. Seri girişimci olarak çalışmalarına devam eden Prof. Erçil Vispera Bilgi Teknolojileri A.Ş. ve Rebuslabs Ltd’in ortağıdır.