Amerikan Matematik Derneğinin yeni blogu “Living Proof: Stories of Resilience Along the Mathematical Journey” geçtiğimiz Ekim ayında yayına girmişti. Türkçe’ye “Yaşayan Kanıt: Matematik Yolculuğunda Yılmazlık Öyküleri” olarak tercüme edebiliriz. Dernek, hemen beraberinde aynı isimli ücretsiz bir de e-kitap yayınladı. Blogun editörleriyle yapılan röportaja buradan ulaşabilirsiniz.
Bir otomobil tasarladığımızda, aracın en yüksek hızının veya bir inşaat projesi hazırladığımızda yapının dayanabileceği maksimum deprem şiddetinin kaç olabileceği gibi detayları ön görebiliriz. Ancak söz konusu günümüz dünyasının en önemli teknolojilerinden olan yapay sinir ağları olduğunda, bu türden bir öngörü yapabilmek henüz mümkün değil.
Yapay sinir ağı geliştirirken, görüntü içeren görevler için Evrişimli Sinir Ağları (Convolutional Neural Network), doğal dil işleme konularında Özyinelemeli Sinir Ağları (Recurrent Neural Network) kullanılması gibi pratikte başarısı kanıtlanmış bazı temel kurallar olsa da hangi mimarideki sinir ağlarının tam olarak hangi görevleri başarıyla yerine getirebileceğini bilmiyoruz. Sadece mimari konusunda değil, en yüksek performansı alabilmek için sinir ağında kaç katman olması gerektiği, her katmanda kaç nöron olması gerektiği gibi önemli parametreleri de tasarım aşamasında bilemiyoruz. Dolayısıyla pratikte, bu gibi özellikler geliştiriciler tarafından birçok konfigürasyonun test edilip modellerin başarılarının karşılaştırılması ile belirleniyor. Ancak sonsuz sayıda konfigürasyon bulunduğundan, deneme yanılma yoluyla en iyi parametreleri belirlememiz mümkün değil.
Lakin bu konuda teorik çalışmalar yok değil. Aksine, yapay sinir ağları üzerine çalışan bazı matematikçiler bu konuda gün geçtikçe yol katediyorlar. Örneğin, David Rolnick ve Max Tegmark, geçtiğimiz yıl tamamladıkları çalışmalarında sinir ağındaki katman sayısı arttırıldığında ve katmanların genişliği (katmandaki nöron sayısı) azaltıldığında, sinir ağının aynı fonksiyonu üstel olarak azalan biçimde daha az nöron ile gerçekleştirebildiğini gösterdiler. Geçtiğimiz yıl Eylül ayında yayımlanan, Jesse Johnson tarafından yapılan başka bir çalışmada ise, yapay sinir ağının katmanlarının genişliği belirli bir sayının altında ise ağın derinliği ne olursa olsun belirli görevleri yerine getiremeyeceği kanıtlandı.
Şu anda yapay sinir ağları üzerine teorik olarak söyleyebildiklerimiz konunun büyüklüğüne oranla oldukça az olsa da matematikçiler, yapay sinir ağlarının tam olarak nasıl çalıştıklarını açıklayabilecek ve belirli yapılardaki sinir ağlarının belirli görevleri yerine getireceğini garanti edebilecek genel bir yapay sinir ağları teorisi oluşturabilmek için çalışmalarına devam ediyor.
Kaynak: Quanta Magazine