Deep learning model - https://www.arcgis.com/home/item.html?id=a6857359a1cd44839781a4f113cd5934
ArcGIS Living Atlas of the World'den alınan ABD bina çıkarımı derin öğrenme modelinin yüksek çözünürlüklü uydu görüntüsünde test edilmiştir. Manuel olarak yapılırsa, bina çıkarımı işlemi karmaşık ve zaman alan bir iştir. Derin öğrenme, bu görevi önemli ölçüde optimize etmek ve otomatikleştirmek için kullanılabilir. Bu bina çıkarımı derin öğrenme modeli, yüksek çözünürlüklü uydu görüntülerinden bina çıkarımı için önceden eğitilmiş, kullanıma hazır bir derin öğrenme modelidir. Bu model olduğu gibi kullanılabilir veya kendi verilerimize / coğrafyamıza uyum sağlamak için ince ayar yapılabilir. Uygulamada yazılım olarak ArcGIS Pro kullanılmaktadır. ABD Bina çıkarımı derin öğrenme modelinde girdi olarak raster veri kümeleri, tarama ürünleri, mozaik veri kümeleri kullanılabilir. Kullanılan görüntüler optimum sonuç için 30-50 cm yüksek çözünürlüklü uydu görüntüsü, 8 bit, multispektral görüntülerden elde edilmiş ortofotolar olmalıdır. Nadir ile açısı yüksek olan görüntüler uygun sonuç vermeyecektir. Bu uygulamada çalışma alanı Amerika Birleşik Devletleri'nin Kaliforniya eyaletinde yer alan ve Riverside ilçesinde yer alan bir Lake Elsinore seçilmiştir.
ArcGIS Pro > Contents bölmesinde raster görüntüye ulaşılır, ‘‘.ımd ’’ dosyası açılır ve “Pansharpen” katmanı eklenir.
“Pansharpening” katmanına sağ tıklanıp “Edit Function Chain” seçilir burada “Function Chain” penceresi açılır, “Strech Button” düğmesine tıklanır ve özellikleri 8 bite dönüştürmek için düzenleme yapılır. “Strech Properties” aşağıdaki gibi değiştirilir ve değişiklikler uygulanır.
GitHub’ dan alınan Esri derin öğrenme ArcGIS Pro’ ya kurulduktan sonra model açılır.
Analysis > Tools > Geoprocessing > Image Analyst Tools > Detect Objects Using Deep Learning adımlarından sonra girdi olarak raster veriden “.tif” dosya çıkartılır.
Model Definition’ a ArcGIS Living Atlas of the World > Building Footprint Extraction – USA ’den indirilen “usa_building_footprints.dlpk” dosyası açılır. Model için parametreler kullanılacak olan sınırlı GPU belleğine sahip dizüstü bilgisayara göre Şekil 19’daki gibi ayarlanır. Örtüşen algılamalardan kurtulmak için de Environments > Processing Extent > As Spesified Below seçilir. Hızlı çalıştırmak istenildiği için piksel boyutu 0.3 m olarak belirlenir. Bu model CPU’ da da çalışabilir fakat GPU daha hızlı olacağı için GPU seçilir ve çalıştırılır.
Model çalıştığında bina sınırlarının çıkarımı yapılmış olur. “Map” katmanına “Buildings” katmanı eklenir.
Şekil 22’de görüldüğü gibi bina sınırları köşeli değil yuvarlatılmış şekildedir. Bu sınırların düzeltilmesi gerekir.
Geoprocessing > Regularize Building Footprint’ de düzenlenecek katman “Buildings” ve metot “Right Angles” seçilir, tolerans ve hassasiyet de ayarlandıktan sonra çıktı olarak “Buildings_RegularizeBuilding” Feature Class’ ı “Map” katmanının altında oluşacaktır.
Oluşturulan bina sınırlarının gösterimini son oluşturulan düzenlenmiş bina sınırlarının bulunduğu “Buildings_RegularizeBuilding” katmanında “Sembology” den değiştirilebilir. Burada dolgu rengi kaldırılmış ve bina sınırları kırmızı ile gösterilmiştir.
Sonuç ürün Şekil 27’de gösterilmiştir.
Model genelde sorunsuz çalışmıştır. (Şekil 28-(a), (b), (c))
Bazı bölgelerde ise bina olmayan yerleri de bina olarak algılamıştır. (Şekil 29- (a),(b))
Günümüzde uzaktan algılama popüler bir alandır. Bu nedenle, güvenlik, savunma, ziraat, afet tespiti, şehir gelişimi, elektrik ve gaz dağıtımı gibi amaçlarla yaygın olarak kullanılmaktadır. Derin öğrenme için kullanılan algoritmalarda, çok güçlü bir bilgisayar donanımına ihtiyaç duyduğu gözlemlenmiştir. Derin öğrenme geleneksel makine öğrenmesi algoritmalarına göre en büyük avantajı olan otomatik özellik/öznitelik çıkarımı test edilmiştir. Bu yöntemin daha çok tercih edilme nedeni insandan bağımsız ve hızlı bir şekilde verilen görevi yerine getirmesi olarak sunulabilir. Çünkü bunun temelinde insanı taklit eden bir algoritma mevcuttur. Derin öğrenme yöntemlerinden Mask R CNN modelinde diğer diğer modeller gibi kargaşa giderme, öznitelik çıkarma, boyut azalma gibi algoritmalara ihtiyaç duyulmaması sebebiyle işlem yükü azalmakta ancak doğrudan görüntü üzerinden model eğitimleri gerçekleştiğinden eğitim süreleri uzun olmaktadır. Obje tespiti için Faster R-CNN ile karşılaştırıldığında bu yöntem hem ürettiği nesnelik puanı hem de hesaplama süresi açısından daha başarılı sonuçlar verir. Mask R-CNN’de, görüntülerdeki sınırlayıcı kutulara ilave olarak gerçek görünümlerine daha yakın maskelerle işaretlenmektedir. Bu modelde bulunan ve diğer bölgeye dayalı yöntemlerde bulunmayan, nesne konumunun daha doğru şekilde belirlenmesini sağlayan RoI katmanı yardımıyla daha yüksek doğruluk sağlamaktadır. Bu çalışmada olduğu gibi seçilen veri kümesinin dağınık dağılımlı olmamasıyla; derin öğrenme algoritmaları, makine öğrenmesinden daha iyi sonuçlar vermektedir. İş gücünü büyük ölçüde azaltmasına rağmen mükemmel doğrulukta olmadığını göstermektedir. Dağınık bir dağılımda zorlaştırıcı ve uğraştırıcı olabilir. Bu doğrultuda her şeye rağmen manuel bina çıkarımına gerek kalmaması açısından önerilen yöntem daha da geliştirilebilir. Ayrıca uydu görüntülerinden yollar, su ve diğer özelliklerin çıkarılması için de kullanılabilir hale getirilebilir.