Derin öğrenme genellikle insan ve hayvanların beyinleriyle karşılaştırılır. Ancak geçtiğimiz yıllar, derin öğrenme modellerinde kullanılan ana bileşen olan yapay sinir ağlarının biyolojik muadillerinin verimliliğinden, esnekliğinden ve çok yönlülüğünden yoksun olduğunu kanıtladı.
Bengio, Hinton ve LeCun makalelerinde bu eksiklikleri kabul ediyor. "Denetimli öğrenme, çok çeşitli görevlerde başarılı olsa da, genellikle büyük miktarda insan etiketli veri gerektirir. Benzer şekilde, pekiştirmeli öğrenme yalnızca ödüllere dayandığında, çok sayıda etkileşim gerektirir” diye yazıyorlar.
Denetimli öğrenme, bir modelin bir resim listesi ve bunlara karşılık gelen içerik gibi etiketli örneklerle sunulduğu popüler bir makine öğrenimi algoritmaları alt kümesidir. Model, benzer etiketlere sahip örneklerde yinelenen kalıpları bulmak için eğitilmiştir. Daha sonra yeni örnekleri doğru etiketlerle ilişkilendirmek için öğrenilen kalıpları kullanır. Denetimli öğrenme, etiketli örneklerin bolca mevcut olduğu problemler için özellikle yararlıdır.
Takviyeli öğrenme, bir "aracının" bir ortamda "ödülleri" en üst düzeye çıkarmayı öğrendiği makine öğreniminin başka bir dalıdır. Bir ortam, bir AI oyuncusunun üç X veya O'yu sıraya koyduğu için ödüllendirildiği bir tic-tac-toe tahtası kadar basit veya çarpışmalardan kaçınmak, itaat etmek için kendi kendini süren bir arabanın ödüllendirildiği bir kentsel ortam kadar karmaşık olabilir. Ajan rastgele eylemler yaparak başlar. Çevresinden geri bildirim alırken, daha iyi ödüller sağlayan eylem dizileri bulur.
Her iki durumda da, bilim adamlarının da kabul ettiği gibi, makine öğrenimi modelleri büyük emek gerektirir. Özellikle halka açık, açık kaynaklı veri kümelerine sahip olmayan özel alanlarda, etiketli veri kümelerine ulaşmak zordur, bu da insan yorumlayıcıların zorlu ve pahalı emeğine ihtiyaç duydukları anlamına gelir. Ve karmaşık takviyeli öğrenme modelleri, çok sayıda eğitim bölümünü çalıştırmak için büyük hesaplama kaynakları gerektirir ve bu da onları çok zengin birkaç yapay zeka laboratuvarı ve teknoloji şirketi tarafından kullanılabilir hale getirir.
Bengio, Hinton ve LeCun ayrıca mevcut derin öğrenme sistemlerinin çözebilecekleri problemler kapsamında hâlâ sınırlı olduğunu kabul ediyor. Özel görevlerde iyi performans gösterirler, ancak “eğitim aldıkları dar alanın dışında genellikle kırılgandırlar”. Genellikle, bir görüntüdeki birkaç değiştirilmiş piksel gibi küçük değişiklikler veya ortamdaki çok küçük bir kural değişikliği, derin öğrenme sistemlerinin yanlış gitmesine neden olabilir.
Derin öğrenme sistemlerinin kırılganlığı, büyük ölçüde, gerçek dünya verilerinin eğitim verileriyle aynı dağılıma sahip olduğunu varsayan "bağımsız ve özdeş olarak dağıtılmış" iid varsayıma dayanan makine öğrenimi modellerinden kaynaklanmaktadır.İid ayrıca gözlemlerin birbirini etkilemediğini varsayar (örneğin, madeni para veya kalıp atışları birbirinden bağımsızdır).
Bilim adamları, "İlk günlerden beri, makine öğrenimi teorisyenleri iid varsayımına odaklandılar. Ne yazık ki, bu gerçek dünyada gerçekçi bir varsayım değil" diye yazıyor.
Gerçek dünya ayarları, birçoğunun nedensel modeller olmadan temsil edilmesi neredeyse imkansız olan farklı faktörler nedeniyle sürekli değişmektedir. Akıllı ajanlar sürekli olarak çevrelerini ve diğer ajanları gözlemlemeli ve onlardan öğrenmeli ve davranışlarını değişikliklere uyarlamalıdırlar.
Bilim adamları, "Günümüzün en iyi AI sistemlerinin performansı, laboratuvardan sahaya gittiklerinde bir darbe alma eğilimindedir" diye yazıyor.
İid varsayımı, ajanın yüksek entropi ortamlarıyla uğraşmak zorunda olduğu bilgisayarla görme ve doğal dil işleme gibi alanlara uygulandığında daha da kırılgan hale gelir. Şu anda, birçok araştırmacı ve şirket, daha büyük veri kümelerinin daha geniş bir dağılımı kapsayacağını ve gerçek dünyada başarısızlık olasılığını azaltacağını umarak, sinir ağlarını daha fazla veri üzerinde eğiterek derin öğrenmenin sınırlarını aşmaya çalışıyor.
Comments