۱٫ معرفی
فراوانی دادههای سنجش از راه دور چندزمانی در دسترس همچنان به گسترش خود ادامه میدهد و مطالعات تغییر زمین و پیگیری تکنیکهای مدلسازی مبتنی بر داده مانند یادگیری ماشین (ML) و یادگیری عمیق (DL) را تسریع میکند [ ۱ ]. این رویکردها نیاز به رمزگذاری روابط غیرخطی بین متغیرهای متعدد در کاربردهای تغییر زمین را دور زده اند [ ۲ ، ۳ ، ۴ ]. روشهای ML و DL برای یادگیری الگوهای دادههای آموزشی، برچسبها و تابع ضرر طراحی شدهاند [ ۵ ]. به طور خاص، روشهای DL اعمال شده در مجموعه دادههای چند زمانی، نتایج مطلوبی را برای طبقهبندی و پیشبینی LC نشان دادهاند [ ۵ ، ۶ ، ۷ ]]. به عنوان مثال، شبکه های عصبی بازگشتی (RNN) برای برون یابی از داده های سری زمانی مفید هستند [ ۵ ، ۶ ]، و ترکیب آنها با شبکه های عصبی کانولوشن (CNN) استخراج ویژگی های فضایی از هر مرحله زمانی را تسهیل می کند [ ۷ ]. با این حال، بسیاری از مدلهای DL نسبت به عدم تعادل دادهها حساس هستند و نسبت به نمونههای متعلق به گروههای اکثریتی که مجموعه داده را مشخص میکنند، سوگیری نشان میدهند [ ۸ ، ۹ ، ۱۰ ]. نواحی پایدار بر بیشتر مجموعه دادههای پوشش زمین [ ۱۱ ] تسلط دارند، که به دلیل مقدار نسبتاً کمی از مناطق تغییر یافته، چالش بزرگی را برای کاربرد روشهای DL ارائه میکند [ ۱۲ ].]. بنابراین، کاهش عدم تعادل بین مناطق تغییر یافته و پایدار برای روششناسی DL برای پیشبینی تغییر LC مؤثر است.
مطالعات قبلی استراتژیهای نمونهگیری و تکنیکهای افزایش دادهها را برای رسیدگی به عدم تعادل نواحی تغییر یافته و بدون تغییر به کار گرفتهاند. برای مثال، طرحهای نمونهگیری متوازن برای ارائه مدلهای ML با تعداد مساوی از نمونههای تغییر یافته و پایدار با استفاده از نمونهگیری تصادفی [ ۱۳ ، ۱۴ ] و یک رویکرد نمونهگیری بوت استرپ تکراری [ ۱۵ ] اجرا شد. با این حال، مدلهای DL از مقادیر بیشتری از دادهها بهره میبرند [ ۴ ]، الهامبخش روشهای افزایش دادههای جغرافیایی از جمله سازگاری با تکنیک اقلیت مصنوعی بیش از حد نمونه (SMOTE) [ ۱۶ ]، تبدیل نمونههای داده مانند چرخشها و تلنگرها [ ۱۷ ]]، و تولید نمونه مصنوعی با شبکه های متخاصم مولد (GANs) [ ۱۹ ]۱۸ ]. با وجود این، چنین رویکردهایی با ویژگیهای دینامیکی دادههای سری زمانی تغییر زمین تطبیق داده نشدهاند، و همچنین روابط فضایی جهتدار را در مورد تبدیلهای دستی یا بافت مکانی-زمانی دنیای واقعی نمونههای دادههای جغرافیایی حفظ نمیکنند. استراتژی های دیگر با هدف کاهش عدم تعادل داده ها شامل روش های حساس به هزینه مانند وزن دهی نمونه است [ ۹ ]. با تخصیص جریمه های افزایش یافته به نمونه های مهم یا اقلیت، پدیده های فضایی مورد علاقه تأثیر بیشتری بر پارامترهای آموخته شده مدل های DL دارند [ ]. با استفاده از طرحهای وزندهی نمونه، پدیدههای جغرافیایی کمیابتر یا غیرعادیتر میتوانند اهمیت بیشتری در روشهای آموزش مدل بدون دستکاری در سطح داده به خود اختصاص دهند.
وزن نمونه قبلاً برای بهبود پیشبینی غلظتهای اوج آلودگی هوا [ ۲۰ ]، برای افزایش اهمیت نمونههای نزدیک برای توصیههای مکان [ ۲۱ ] و برای افزایش دقت طبقهبندی LC چند کلاسه از طریق آنتروپی متقاطع طبقهای با فرکانس معکوس [۲۰] مورد بررسی قرار گرفته بود. ۲۲ ]. فروپاشی فاصله زمانی و مکانی-زمانی نیز برای مدلسازی قیمت خانه با تکنیکهای رگرسیون محلی [ ۲۳ ] و ردیابی هدف ویدیویی با مدلهای DL مکانی-زمانی [ ۲۴ ] اجرا شد.] برای کاهش تأثیر مکان ها یا ویژگی ها بر اساس مجاورت زمانی و مکانی. در حالی که تغییرات طرحهای وزندهی نمونه زمانی و مکانی برای سایر انواع مدلها و کاربردها بررسی شد، ناشناخته باقی میماند که چگونه نمونههای دارای وزن زمانی و مکانی-زمانی بر ظرفیت مدلهای DL مکانی-زمانی برای پیشبینی تغییرات LC در برابر طرح وزندهی فرکانس معکوس متداول تأثیر میگذارند.
هدف اصلی این مطالعه پژوهشی پیشنهاد و ارزیابی اثر بالقوه نمونههای وزندار زمانی و مکانی برای مدیریت عدم تعادلهایی بود که ظرفیت مدل DL را برای پیشبینی تغییرات LC مهار میکند. در حالی که پذیرفته شده است که نابرابری های هر طبقه مشخصه بعد دوم عدم تعادل است که بر ظرفیت مدل های DL برای پیش بینی تغییرات LC تأثیر می گذارد [ ۱۲ ]]، این مطالعه تحقیقاتی به طور کلی بر تغییرات LC متمرکز است. طرحهای وزندهی نمونه جدید با هدف حصول اطمینان از اینکه مناطق اخیراً تغییر یافته و مکانهای تغییر یافته با محلههای در حال انتقال تأثیر بیشتری در آموزش مدل دارند، اجرا میشوند. این امر از طریق طرحهای وزندهی معکوس فاصله به دست میآید که اهمیت متغیر نمونههای تغییر یافته را بر اساس مجاورت زمانی و مکانی-زمانی اختصاص میدهند. در همین حال، تمام نمونههای LC پایدار اهمیت کمتری دارند. موارد تجربی چهار نوع مدل DL فضایی-زمانی آموزش دیده با استفاده از طرحهای وزندهی نمونه پیشنهادی را در مقابل مدلهایی که بدون وزن نمونه و نمونههای وزنی فرکانس معکوس آموزش داده شدهاند، مقایسه میکنند. ارزیابی از اقدامات متمرکز بر تغییر برای برجسته کردن بهبودهای بالقوه مرتبط با طرحهای وزندهی نمونه پیشنهادی برای پیشبینیهای تغییر LC 5 ساله استفاده میکند.
۲٫ روش شناسی
۲٫۱٫ منطقه مطالعه و مجموعه داده ها
منطقه مطالعه انتخاب شده برای این کار تحقیقاتی، منطقه منطقه ای کلمبیا-شوسوپ در بریتیش کلمبیا، کانادا بود ( شکل ۱ a). در سال ۲۰۱۶، جمعیت این منطقه ۵۱۳۶۶ نفر بوده و سالمون آرم بزرگترین شهر آن بوده است [ ۲۵ ]. مجموعه دادههای MODIS برای ارائه دادههای LC سالانه با وضوح فضایی ۵۰۰ متر، از ۲۰۰۱ تا ۲۰۲۰ استفاده شد [ ۲۶ ]. اکثریت قریب به اتفاق منطقه توسط جنگل ها و بوته زارها مشخص می شود، با این دو کلاس LC به ترتیب ۴۵٪ و ۴۰٪ از منطقه را در سال ۲۰۰۱ پوشش می دهند. از آنجایی که تغییرات LC به ازای هر کلاس اولویت این مطالعه تحقیقاتی نیست، از هشت کلاس LC تجمیع شده برای حفظ ویژگیهای منطقه استفاده شد. تغییر خالصی که بین سالهای ۲۰۰۱ و ۲۰۲۰ رخ داد، ۲۱۲۰۲ کیلومتر مربع بود .، با ۲۰۷۶ کیلومتر مربع تغییر متوسط سالانه ( شکل ۱ ب).
علاوه بر دادههای LC چند زمانی، متغیرهای فضایی استاتیک اطلاعات کمکی در مورد محرکهای تغییرات زمین فراهم میکنند. متغیرهای توپوگرافی ارائه شده عبارتند از ارتفاع و شیب [ ۲۷ ، ۲۸ ]، در کنار متغیرهای دسترسی که با محاسبه فواصل اقلیدسی تا مراکز جمعیتی [ ۶ ]، جاده ها [ ۷ ]، راه آهن [ ۳ ]، مناطق حفاظت شده [ ۷ ، ۲۹ ]، ذخایر کشاورزی [۷، ۲۹] به دست می آیند. ۳۰ ]، و دریاچه ها و رودخانه ها [ ۲۹ ]. مدل ارتفاع دیجیتال جهانی ASTER برای متغیرهای توپوگرافی به دست آمد [ ۳۱] و متغیرهای مجاورت با توجه به لایه های داده موجود از آمار کانادا [ ۳۲ ، ۳۳ ] محاسبه شدند. همه لایههای داده به مجموعه دادههای MODIS با استفاده از درونیابی نزدیکترین همسایه برای لایههای طبقهبندی و درونیابی دوخطی برای لایههای پیوسته نمونهبرداری شدند، زیرا مجموعه داده LC درشتترین وضوح فضایی را نشان میدهد. داده های LC و متغیرهای کمکی به سیستم مختصات پیش بینی شده Albers Environment NAD 1983 قبل از میلاد، با حفظ اندازه گیری های سطح مسطح، بازپخش می شوند. مراحل پیش پردازش داده ها قبل از استخراج نمونه ها و وزن نمونه در مراحل بعدی شرح داده شده در نرم افزار ArcGIS Pro 2.9.1 تکمیل شد.
۲٫۲٫ ثبت اثرات همسایگی در نمونههای دادههای پوشش زمین
قبل از ایجاد وزن نمونه، نمونه داده های آموزشی با توجه به هر سلول منطقه مورد مطالعه استخراج شد. «اثرات همسایگی» به تأثیر تغییرات و ساختار پدیدهها در مجاورت یک مکان نمونه اشاره دارد [ ۳۴ ]. LC در یک مکان نمونه به شدت به حالات و تغییراتی که در اطراف آن رخ میدهد وابسته است، و تأثیرات همسایگی را در پیشبینی تغییر LC مهم میسازد [ ۴ ]. برای ادغام اثرات همسایگی در این مطالعه تحقیقاتی، ترکیب LC اطراف هر مکان در هر مرحله زمانی در هر نمونه داده گنجانده شد. با در نظر گرفتن لایه های داده های مکانی شطرنجی که در بخش ۲٫۱ توضیح داده شده استنمونه های داده برای هر سلول شامل منطقه مورد مطالعه با استفاده از پیکربندی محله مور به دست آمد. یک محله مور N سلول را می گیرد که پارامتر محدوده r را ارائه می دهد ، جایی که ن=۲r+12سلول ها [ ۳۵ ]. نمونهها با در نظر گرفتن هر سلول بهعنوان یک سلول مرکزی، با همسایگیهایی که سلولها را در محدوده r از مکان مرکزی در تمام مراحل زمانی میگیرند، به دست آمد. اندازه همسایگی را می توان با توجه به ابعاد مساحتی که توسط هر نمونه گرفته می شود، M × M ، که در آن M به تعداد سلول هایی که طولانی ترین لبه همسایگی سلول مرکزی را تشکیل می دهند اشاره کرد.
نمونههای داده برای منطقه منطقهای کلمبیا-شوسواپ شامل متغیرهای مکانی-زمانی LC و کمکی بود. LC مکانی-زمانی بهدستآمده برای هر مکان به اندازه T × M × M × C بود که T نشاندهنده تعداد گامهای زمانی است و C نشاندهنده تعداد کلاسهای LC است. متغیرهای فضایی به شکل M × M × V ارائه شدند که V نشان دهنده تعداد متغیرها است. ابعاد همسایگی مورد استفاده در این مطالعه تحقیقاتی ۹×۹ (یا r= 4 سلول در هر جهت از سلول مرکزی)، با توجه به مطالعات دیگر با استفاده از مدلهای DL [ ۳۶ ، ۳۷ ، ۳۸ ] و یافتههایی که تغییرات زمین را پیشنهاد میکنند، زمانی که M کمتر از ۵ کیلومتر با دادههای تفکیک مکانی ۵۰۰ متر است، به خوبی ثبت میشوند [ ۳۹ ] . بنابراین، محله ۹ × ۹ متغیرهای LC و فضایی را برای یک منطقه ۲۰٫۲۵ کیلومتر مربعی در اطراف هر سلول در منطقه مورد مطالعه به دست آورد.
۲٫۳٫ مشخصات مدل
مدلهای پیادهسازیشده در این مطالعه تحقیقاتی شامل مدلهایی بود که برای نمونههای مکانی-زمانی ارائهشده در کنار متغیرهای مکانی کمکی همانطور که در بخش ۲٫۲ توضیح داده شد، سازگار شدند . مدلهای خاص DL به نام شبکههای عصبی بازگشتی (RNN) برای استخراج الگوها از دادههای متوالی یا سری زمانی مفید هستند [ ۳۷ ]. پیادهسازیهای RNN تغییرات مختلفی را در معماریها نشان میدهند، از جمله حافظه کوتاهمدت بلند مدت (LSTM) [ ۴۰ ] و واحدهای بازگشتی دروازهای (GRUs) [ ۴۱ ]. شبکههای کانولوشنال زمانی (TCNs) با استفاده از شبکههای عصبی کانولوشنال (CNN) که بر روی بعد زمانی مجموعه دادههای مکانی عمل میکنند، جایگزینی برای RNN برای مدلسازی توالی ارائه میکنند [ ۴۲ ].]. با این حال، این تکنیکهای مدلسازی توالی به تنهایی همبستگیهای فضایی را در نمونههای داده استخراج نمیکنند. در عوض، گرفتن جلوههای همسایگی ابتدا با CNNهای سنتی [ ۴۳ ] و ارائه خروجیها به مدلهای دنبالهای (یعنی LSTM، GRU، و TCN) مدلهای فضایی-زمانی ترکیبی را پیادهسازی میکند، که برای ثبت الگوهای مکانی و زمانی تغییر زمین استفاده شدهاند [ ۷ ، ۴۴ ]. علیرغم ادغامهای نشاندادهشده، این مدلهای ترکیبی روابط صریح فضایی و زمانی را به طور همزمان نمیگیرند. به این ترتیب، LSTM کانولوشنال (ConvLSTM) برای تطبیق مستقیم روابط مکانی-زمانی فرموله شد و مزایایی را نسبت به پیاده سازی های CNN-LSTM ارائه کرد [ ۴۵ ].
چهار نوع مدل DL فضایی-زمانی اجرا شده در این مطالعه تحقیقاتی CNN-LSTM، CNN-GRU، CNN-TCN و ConvLSTM بودند. هر مدل مجهز به دو شاخه ورودی بود که به ترتیب توالیهای LC فضایی و زمانی و متغیرهای فضایی کمکی را در خود جای میدادند. این شبیه به نحوه ادغام متغیرهای سه بعدی و دو بعدی در مدل های DL در سایر برنامه های جغرافیایی است [ ۴۶ ]. ساختار کلی مدل شاخه ای پیاده سازی شده در شکل ۲ نشان داده شده است .
برای همه انواع مدل، شاخه ورودی متغیر فضایی (که در شکل ۲ به عنوان “شاخه فضایی” نشان داده شده است ) با دو مجموعه از دو لایه پیچشی به ترتیب با ۳۲، ۳۲، ۶۴ و ۶۴ فیلتر اجرا شد. پس از هر مجموعه از دو لایه CNN، یک عملیات ادغام حداکثر ۲ × ۲ اعمال شد. سپس، شاخه ورودی LC فضایی-زمانی (که در شکل ۲ به عنوان “شاخه مکانی-زمانی” نشان داده شده است ) با توجه به نوع مدل پیاده سازی شد. پیاده سازی برای CNN-LSTM، CNN-GRU، و CNN-TCN از مطالعات قبلی اقتباس شده است [ ۴۶ ، ۴۷]. برای پیادهسازی شاخه مکانی-زمانی مدل، روابط مکانی از هر مرحله زمانی نمونههای داده LC ابتدا با استفاده از CNN استخراج شد. دو مجموعه از دو لایه پیچشی با عملیات ادغام حداکثر ۲ × ۲ دنبال شدند، که در آن لایههای CNN به ترتیب با فیلترهای ۳۲، ۳۲، ۶۴ و ۶۴ با تابع فعالسازی ReLU پارامترسازی شدند . خروجیهای عملیات CNN مسطح شده و به مؤلفه مدل زمانی که با LSTM، GRU، یا TCN مدلهای مربوطه مشخص میشود، ارائه شد. مدلهای CNN-LSTM و CNN-GRU هر کدام دو لایه بازگشتی از ۳۲ و ۱۲۸ نورون را با استفاده از تابع فعالسازی tanh ، بر اساس پیادهسازیهای قبلی، به ترتیب نشان دادند [ ۳۶ ]. مدل CNN-TCN دارای دو لایه با فیلترهای ۳۲ و ۱۲۸ بودعملکرد فعال سازی ReLU پیاده سازی ConvLSTM دارای دو لایه ConvLSTM بود که به ترتیب دارای ۳۲ و ۱۲۸ فیلتر با عملکرد فعال سازی ReLU بودند . اندازه هسته برای همه لایههای CNN و ConvLSTM روی ۳ × ۳ تنظیم شد، همانطور که در مطالعات تحقیقاتی قبلی مشاهده شد [ ۳۶ ، ۴۸ ]. قبل از الحاق خروجی های هر شاخه مدل، ضریب حذف ۱۰ درصد اعمال شد. منظمسازی حذف بهصورت تصادفی درصد مشخصی از نورونها را با هدف جلوگیری از برازش بیش از حد مدل کاهش میدهد [ ۴۹ ]. در نهایت، لایه خروجی کاملا متصل دارای ۹ نورون و تابع فعال سازی Softmax است که احتمال هر برچسب کلاس LC را خروجی می دهد [ ۱۷ ]]. برای همه مدلها، نمونههای LC و دادههای متغیر مکانی با اثرات همسایگی توضیح داده شده در بخش ۲٫۲ ارائه شد. دادههای LC برای هر مکان نمونه مستقیماً به شاخه ورودی مکانی – زمانی به شکل T × M × M × C و دادههای متغیر مکانی کمکی به شکل M × M × V به شاخه ورودی متغیر مکانی ارائه شد.
۲٫۴٫ از دست دادن متقابل آنتروپی طبقه بندی شده
مدلهای DL نظارتشده با بهینهسازی وزنهای یک شبکه با توجه به برخی تابع هدف یا تابع از دست دادن آموزش داده شدند [ ۵۰ ]. با استفاده از الگوریتم گرادیان نزول (یا نزول گرادیان تصادفی)، هدف به حداقل رساندن یا به حداکثر رساندن میزان خطا بین مقدار واقعی و مقدار پیش بینی شده است. پیشبینی LC چند کلاسه بهعنوان یک مسئله طبقهبندی فرمولبندی میشود که به یک تابع هدف مجهز برای این کار احتمالی نیاز دارد. آنتروپی متقاطع طبقهای (CCE) معمولاً برای مسائل طبقهبندی استفاده میشود، که یادگیری کلاسهای متعدد را با انتشار خطا با توجه به مقادیر پیشبینیشده و کلاسهای LC دنیای واقعی تسهیل میکند [ ۵۱ ]. تابع CCE با توجه به نمونه i محاسبه شده استطبق مطالعات قبلی [ ۲۲ ] به صورت زیر بیان می شود:
که در آن برچسب های کلاس LC بردارهای کدگذاری شده یک داغ هستند که با نشان داده می شوند y^جو yج، جایی که y^جنشان دهنده LC دنیای واقعی کلاس c و yجنشان دهنده LC پیش بینی شده برای مکان است. C نشان دهنده تعداد کلاس های LC است.
در محاسبه خطا با توجه به تابع CCE، به هر نمونه میزان تاثیر یکسانی بر به روز رسانی مدل داده می شود. با افزودن یک عامل وزن به تابع CCE، نمونه ها را می توان جریمه های خطای متفاوتی در نظر گرفت که در نتیجه تأثیرات متفاوتی بر تنظیم وزن مدل در طول روش های آموزش مدل دارد [ ۵۲ ]. این به صورت زیر بیان می شود:
جایی که wمنوزن نمونه نمونه i را نشان می دهد. ارزش ها برای wمنوزن های نمونه توضیح داده شده در بخش بعدی را فرض کنید.
۲٫۵٫ محاسبه وزن نمونه زمانی و مکانی-زمانی
این مطالعه تحقیقاتی سه طرح جدید وزندهی نمونه LC را برای بهبود ظرفیت مدل برای ثبت تغییرات ارائه میکند. وزنهای نمونه زمانی و مکانی پیشنهادی برای دور زدن نیاز به هر گونه تخصیص دستی مقادیر هزینه به نمونهها، که در بسیاری از کاربردهای دنیای واقعی چالش برانگیز است، اجرا شدند [ ۹ ]. طرحهای وزندهی نمونه بر اساس نزدیکی زمانی و مکانی-زمانی به تغییرات، با استفاده از رویکرد وزندهی فاصله معکوس (IDW) [ ۵۳ ] بود.]. برای کار پیشبینی تغییر LC، هدف این بود که ابتدا شناسایی شود که آیا یک مکان دچار تغییر شده است یا خیر، سپس وزن نمونه را بر اساس اینکه آیا تغییر اخیراً اتفاق افتاده است یا اینکه محله مکان دچار تغییرات اخیر شده است، اصلاح شود. انطباق با پوسیدگی زمانی، ناهمگنی زمانی را با اهمیت دادن به سلولهای اخیراً تغییر یافته، مورد توجه قرار میدهد، بنابراین تأثیر تغییراتی را که مدتها پیش رخ دادهاند، کاهش میدهد. به عنوان مثال، مقادیر قابل توجهی از مناطق تغییر یافته بین سال های ۲۰۰۲ و ۲۰۰۳ مشاهده شد ( شکل ۱)ب). بر اساس طرحهای وزندهی نمونه پیشنهادی، مکانهایی که تغییر کردند اما پس از سال ۲۰۰۳ پایدار ماندند، وزن کمتری نسبت به مکانهایی داشتند که اخیراً تغییر کردهاند. علاوه بر این، حتی اگر تغییر زودتر اتفاق افتاده باشد، نمونهای از یک مکان تغییر یافته قبلی با محلهای که به طور فعال در حال تغییر است با اهمیت بالاتری وزن داده میشود.
اثرات سه طرح وزن دهی نمونه جدید با نمونه های وزنی نشده و طرح وزن دهی فرکانس معکوس به طور گسترده مورد مقایسه قرار می گیرد. بنابراین، پنج طرح وزن دهی نمونه اجرا شده در این پژوهش به شرح زیر است:
-
بدون وزن (مورد پایه یا “هیچ”)، که در آن وزن نمونه استفاده نشده است.
-
وزنهای دودویی (BW)، که در آن یک طرح وزندهی فرکانس معکوس سنتی از فرکانس معکوس تعداد نمونههای تغییر یافته در مقابل تعداد نمونههای پایدار برای تعیین وزن نمونه استفاده میکرد.
-
طرح وزن دهی زمانی ۱ (TW1)، که در آن وزن فاصله زمانی معکوس با توجه به جدیدترین تغییر سلول مرکزی محاسبه شد.
-
طرح وزندهی زمانی ۲ (TW2)، که در آن وزن فاصله زمانی معکوس با توجه به جدیدترین تغییر همسایگی سلول محاسبه شد.
-
طرح وزن دهی مکانی-زمانی (STW)، که در آن وزن فاصله مکانی-زمانی معکوس با توجه به جدیدترین تغییری که در همسایگی سلول مرکزی رخ داده محاسبه شد.
برای محاسبه وزن نمونه نمونه های داده های آموزشی، تغییرات در محدوده زمانی ۲۰۰۱ تا ۲۰۱۴ در نظر گرفته شد ( شکل ۱ ب). سه مرحله برای اجرای طرح های وزن دهی به شرح زیر است:
مرحله ۱٫ مشخص کنید که آیا تغییری در مکان نمونه یا سلول مرکزی محله رخ داده است ( شکل ۲ ). اگر تعداد رویدادهای تغییر از سال ۲۰۰۱ تا ۲۰۱۴ یک یا بیشتر بود، سلول به عنوان تغییر یافته در نظر گرفته می شد.
مرحله ۲٫ وزن فرکانس معکوس را با توجه به تعداد سلول های ثابت و تغییر یافته محاسبه کنید. مشابه یک مطالعه تحقیقاتی دیگر [ ۵۴ ]، وزن اولیه نمونه ها بر اساس نوع کلی آنها محاسبه شد. برای داده های LC، وزن اولیه نمونه های تغییر یافته بود بجمن=پ/پ+سیو وزن نمونه های ماندگار بود بپمن=سی/پ+سی، که در آن تعداد سلول های تغییر یافته با C و تعداد سلول های ماندگار با P نشان داده می شود . به نمونههای پایدار وزنهای غیرصفری اختصاص داده شد، زیرا هنوز برای ساختار مدل آموختهشده مهم بودند. بنابراین، وزن نمونه پایدار (wپمن)مقادیر را در نظر گرفت بپمنو نیازی به به روز رسانی بیشتر نیست. این امر محاسبات مورد نیاز برای اجرای طرح BW را به پایان میرساند، در حالی که تغییرات زمانی و مکانی به وزنهای نمونه تغییر یافته در مرحله ۳ برای طرحهای TW1، TW2 و STW اضافه شد.
مرحله ۳٫ با تأثیر سلول های پایدار مدیریت شده در مرحله ۲، محاسبات وزن نمونه برای طرح های TW1، TW2 و STW به وزن نمونه تغییر یافته اعمال شد. (wجمن)به عنوان تابعی از تغییرات زمانی و مکانی که در سلول مرکزی و در همسایگی آن در طول زمان رخ می دهد. برای اجرای طرحهای وزندهی زمانی (TW1 و TW2)، فاصله زمانی از آخرین سال نمونه آموزشی با توجه به آخرین تغییر در سلول مرکزی محاسبه شد. (دجج)و به سال جدیدترین تغییری که در همسایگی سلول مرکزی رخ داده است (دجn)، به ترتیب. برای طرح وزن دهی مکانی-زمانی (STW)، فاصله مکانی-زمانی از محل و سال آخرین سلول مرکزی در یک نمونه و مکان و سال آخرین سلول تغییر یافته در همسایگی آن محاسبه شد. دجnاستی. جدول ۱ فرمولاسیون TW1، TW2 و STW را نشان می دهد. با گسترش طرحهای وزندهی برای در نظر گرفتن تغییراتی که در همسایگی سلول اتفاق میافتد، طرحهای TW2 و STW وزن نمونههای تغییر را با انتقالهای اخیر نزدیک افزایش دادند. این به این معنی است که نمونههای تغییر پویاتر تأثیر بیشتری بر تنظیمات پارامتر مدل در طول روش آموزش با استفاده از طرحهای TW2 و STW داشتند. پارامتر توان یا توان IDW روی یک تنظیم شد زیرا وضوح فضایی این مطالعه تحقیقاتی درشت بود و مراحل زمانی محدودی در دسترس بود و همچنین برای اطمینان از اینکه مقادیر وزن مرتبط با تغییرات تاریخی غیرصفر بودند. وزن نمونه به دست آمده در شکل ۳ ارائه شده است. هیچ تنظیم دستی یا تکنیک های نرمال سازی برای تأثیر بیشتر بر اهمیت نمونه در وزن ها اعمال نشد. بنابراین، حداکثر مقادیر وزن ممکن توسط مرحله ۲، که در آن نسبت معکوس سلول های تغییر یافته و پایدار محاسبه شد، محدود شد. این منجر به حداکثر وزن ۰٫۹ شد ( شکل ۳ ).
۲٫۶٫ ارزیابی مدل
معیارهای انتخاب شده برای ارزیابی عملکرد مدل در این مطالعه بر تغییرات LC به جای دقت کلی متمرکز شدند، زیرا مقادیر دقت بالا را نمی توان برای بیان ظرفیت یک مدل برای پیش بینی تغییرات استفاده کرد [ ۵۵ ]. در عوض، ارزیابی شامل رقم شایستگی (FOM)، دقت تولیدکننده (PA)، و دقت کاربر (UA) [ ۵۶ ) بود.]، که برای ارزیابی پیشبینیهای تغییر LC مناسبتر شناسایی شدند. FOM معیاری از توافق بین تغییرات پیشبینیشده و تغییرات دنیای واقعی را ارائه میکند که با توجه به «ضربهها»، «مصادف»، «ضربههای اشتباه» و «آژارهای نادرست» محاسبه میشود. محاسبات برای PA و UA شامل زیرمجموعه هایی از اصطلاحات است که اندازه گیری FOM را شامل می شود. PA نسبت مساحتی را که یک مدل به درستی پیشبینی میکند با توجه به تغییرات دنیای واقعی نشان میدهد، در حالی که UA مقدار تغییرات پیشبینیشده درست در مقابل همه تغییرات پیشبینیشده را نشان میدهد. تغییرات صحیح (“بازدیدها”)، تغییرات از دست رفته (“از دست دادن”)، تغییرات نادرست (“هشدارهای نادرست”)، و پایداری صحیح (“ردهای صحیح”) مؤلفه های توافق و عدم توافق مورد استفاده برای محاسبه اندازه گیری FOM نیز به طور جداگانه گزارش می شوند. برای نمایش کمیت و تخصیص تغییرات [ ۵۷].
برای انجام تحلیل خطا، مقدار خطا، خطای ناشی از تخصیص و فاصله خطای تخصیص [ ۵۸ ] برای هر مدل و ترکیب وزن نمونه محاسبه شد. فاصله خطای تخصیص (AED) اطلاعاتی در مورد شدت خطاهای تخصیص ارائه می دهد، که در آن فاصله بین مکان های واقعی و مکان های پیش بینی های اشتباه با توجه به هر کلاس LC [ ۵۸ ] میانگین می شود. از آنجایی که در این مطالعه تحقیقاتی به عدم تعادل کلاس یا طبقه LC پرداخته نشد، AED با توجه به تمام خطاهای تخصیص (AED به طور کلی )، بزرگترین کلاس ها (AED بزرگ )، کلاس هایی که “متوسط” (AED متوسط ) تلقی می شوند، محاسبه شد و کوچکترین کلاسها (AED کوچک). هدف این بود که مشخص شود شدیدترین AE ها از کجا سرچشمه می گیرند. طبقه بندی طبقه بزرگ شامل جنگل های همیشه سبز، بوته زارها و ساواناها و زمین های بایر بود که ۹۱٫۱٪ از منطقه مورد مطالعه را شامل می شود. طبقه متوسط طبقه متوسط شامل برف و یخ دائمی، تودههای آبی و جنگلهای برگریز است که ۷/۸ درصد از منطقه مورد مطالعه را پوشش میدهد. کوچکترین طبقات، اراضی شهری و ساخته شده و زمین های زراعی بودند که کمتر از ۱ درصد از مساحت مورد مطالعه را به خود اختصاص دادند.
Python 3.9.1، GDAL 3.3، و Rasterstats 0.17.0 برای اجرای رویکرد فاصله خطای تخصیص ارائه شده در کار قبلی [ ۵۸ ] و سایر اقدامات متمرکز بر تغییر استفاده شدند. در این مطالعه تحقیقاتی، از معیار FOM برای شناسایی شش مدل با عملکرد برتر بر اساس پیشبینی LC 2016 استفاده شد. سپس عملکرد این مدلها در طول پیشبینیهای چند ساله تغییر LC مقایسه شد تا مشخص شود آیا روندها حفظ میشوند یا خیر. مؤلفههای FOM نقشهبرداری شده همچنین از یک ارزیابی بصری برای پیشبینیهای تولید شده توسط مدلهای با بهترین عملکرد شناسایی شده با توجه به ظرفیت آنها برای پیشبینی تغییرات پشتیبانی میکنند.
۲٫۷٫ تنظیمات آزمایش
مدلها با مشخصات توصیفشده در بخش ۲٫۳ با پایتون ۳٫۹٫۱ [ ۵۹ ]، Keras API [ ۶۰ ]، TensorFlow 2.5.0 [ ۶۱ ]، و پیادهسازی منبع باز TCN (Keras-TCN 3.4.0) پیادهسازی شدند. ) [ ۶۲ ]. تابع از دست دادن CCE که در بخش ۲٫۴ توضیح داده شده است در همه مدل ها استفاده شد. برای آموزش مدل ها، اندازه دسته روی ۱۲۸ تنظیم شد و بهینه ساز Adam با نرخ یادگیری اولیه ۰٫۰۱ استفاده شد [ ۷ ]. توقف زودهنگام و کاهش نرخ یادگیری (با استفاده از تابع “ReduceLROnPlateau” از TensorFlow) برای اطمینان از توقف آموزش مدل یا کاهش نرخ یادگیری زمانی که افزایش عملکرد ناچیز بود، استفاده شد.۶۳ ].
در این مطالعه، پیشبینیهای چند ساله با استفاده از یک استراتژی «پنجرهی غلتشی» مطابق با اجرای کار قبلی [ ۶۴ ] ایجاد شد. در عوض، پیشبینی «توالی به ترتیب» برای دور زدن انتشار خطا در گامهای زمانی پیشبینیشده نشان داده شد [ ۴۴ ]، زیرا این رویکرد گامهای زمانی محدود موجود را کاهش میدهد و منجر به توالیهای کوتاهی از دادههای MODIS LC میشود که مانع از مدلهای DL برای پیشبینی تغییر LC در مطالعه قبلی [ ۶۵]. با استراتژی “پنجره نورد”، یک پیش بینی تغییر LC چند ساله با استفاده از پیش بینی قبلی به عنوان مرحله زمانی بعدی دنباله آزمایش تولید شد. دادههای LC شامل سالهای ۲۰۰۱ تا ۲۰۱۴ برای پر کردن مجموعه داده آموزشی استفاده شد، در حالی که سال ۲۰۱۵ برای اعتبارسنجی مدل و ۲۰۱۶-۲۰۲۰ برای آزمایش مدل استفاده شد. نمونههایی از مجموعه دادههای آموزشی ۲۰۰۱-۲۰۱۴ با استفاده از یک رویکرد پنجره غلتشی بر اساس برنامه قبلی [ ۶۶ ]، که در آن ۱۰ مرحله زمانی شامل دنباله آموزشی بود، با مرحله زمانی زیر به عنوان برچسب آموزشی، بهدست آمد. بنابراین، توالی داده های آموزشی شامل t n ، t n+1 ، …، t n+9 ، با t n+10 شدند.به عنوان برچسب آموزشی هر نمونه داده شامل داده های مکانی-زمانی LC و متغیرهای مکانی استاتیک با مشخصات همسایگی بیان شده در بخش ۲٫۲ بود. نمونه هایی برای هر مکان برای آموزش مدل با وزن نمونه شرح داده شده در بخش ۲٫۵ و در شکل ۳ ارائه شده است. چهار نوع مدل با در نظر گرفتن هر طرح وزن نمونه (هیچ، BW، TW1، TW2، و STW) آموزش داده شدند، که در آن “هیچ” به ترکیب های تجربی یا مورد پایه ای اشاره دارد که در آن هیچ طرح وزن دهی نمونه اعمال نشده است.
۳٫ نتایج
۳٫۱٫ ارزیابی تغییرات چند ساله
ارزیابی مدل توصیف شده در بخش ۲٫۶ برای تعیین کمیت تأثیر طرحهای وزندهی نمونه پیشنهادی در چهار نوع مدل استفاده شد. با توجه به اندازه گیری FOM به دست آمده برای سال ۲۰۱۶، شش ترکیب برتر مدل و وزن نمونه عبارتند از CNN-TCN STW ، CNN-GRU STW ، ConvLSTM TW2 ، ConvLSTM STW ، CNN-LSTM TW1 و ConvLSTM TW1 ( شکل ۴ ). به دنبال مقادیر FOM به دست آمده توسط این مدل و ترکیب وزن نمونه، ۱۹٫۷٪ تفاوت بین مدل بعدی و ترکیب وزن نمونه وجود دارد ( شکل ۴).) و کاهش قابل توجهی در مقادیر FOM مشاهده شده برای حالت پایه (که با “هیچ” مشخص می شود). همه طرحهای وزندهی نمونه، اندازهگیریهای بهبود یافته FOM را نسبت به مورد پایه برای پیشبینیهای تغییر LC 2016، صرفنظر از نوع مدل، تسهیل کردند. طرح BW با مقادیر FOM به طور مداوم بهبود یافته در مقایسه با حالت پایه همراه بود، اگرچه ترکیب برتر با استفاده از BW (CNN-GRU BW ) ۲۷٫۶-۳۲٫۶٪ کمتر از شش عملکرد برتر شناسایی شده بود. علاوه بر این، طرح STW با مقادیر FOM بالاتر برای سه نوع از چهار مدل (CNN-GRU، CNN-TCN و ConvLSTM) همراه بود ( شکل ۴ ).). مقادیر FOM بهدستآمده با طرح TW2 همچنین عملکرد بهبود یافته را در مقابل طرح BW برای همان سه مدل فعال کرد. طرح TW1 برای CNN-LSTM و ConvLSTM به خوبی کار کرد، اما مقادیر FOM را برای CNN-GRU و CNN-TCN کاهش داد.
پس از شناسایی شش مدل برتر با توجه به مقادیر FOM محاسبهشده برای پیشبینیهای ۲۰۱۶، مشاهده شد که این مدلها بالاترین اندازههای FOM را در پیشبینی ۵ ساله حفظ کردند ( شکل ۵ a). در همین حال، مقادیر FOM برای حالت پایه پایین ماند و نشان داد که هیچ وزن نمونهای بدون توجه به نوع مدل، مدلهای تغییر LC را تولید نمیکند. طرح BW اثرات ثابتی را روی همه انواع مدل حفظ کرد، اگرچه CNN-TCN BW و CNN-GRU BW در طول زمان افزایش جزئی را نشان دادند. برخلاف روندهای اولیه مشاهده شده در شکل ۴ ، ConvLSTM TW1 پس از طرح ریزی سال ۲۰۱۷ از ConvLSTM STW و ConvLSTM TW2 پیشی گرفت ، در حالی که CNN-TCNSTW ، CNN-GRU STW ، و CNN-LSTM TW1 همچنان بالاترین اندازههای FOM را نشان میدهند ( شکل ۵ a). اندازهگیریهای PA محاسبهشده با توجه به نواحی تغییر یافته از همان روند پیروی میکنند ( شکل ۵ ب)، که نشان میدهد نسبت تغییرات پیشبینیشده نسبت به تغییرات دنیای واقعی در پیشبینیهای بهدستآمده از شش مدل برتر و ترکیب وزن نمونه بالاترین بود. در مقابل، UA روندی متفاوت با آنچه با اندازه گیری های FOM و PA مشاهده می شود نشان داد ( شکل ۵ ج). بیشترین میزان UA توسط CNN-LSTM None و ConvLSTM None به دست آمد، نشان می دهد که نسبت تغییرات درست شبیه سازی شده در مقابل همه تغییرات پیش بینی شده زیاد است. مقادیر کم تغییرات پیشبینیشده بدون وزن نمونه، معیارهای UA را در طول زمان افزایش داد، زیرا این معیارها با مقادیر کمی تغییر LC پیشبینیشده افزایش یافتند، همانطور که با «ضربهها»، «آژارهای نادرست» و «تغییرات اشتباه» برای هر دو سال ۲۰۱۶ و ۲۰۱۶ مشخص شد. ۲۰۲۰ ( شکل ۶ a,b). قابل ذکر است که ConvLSTM TW2 و ConvLSTM STW نسبت به شش مدل برتر دیگر، نسبت UA بالاتری را نشان دادند. این نشان میدهد که این ترکیبها مقادیر بیشتری از نواحی بهدرستی تغییر یافته را از بین تمام تغییرات پیشبینیشده پیشبینی میکنند و مناطقی که تغییر نادرست را تغییر دادهاند، علیرغم دستیابی به حداکثر FOM یا میزان بازدید، کاهش میدهند ( شکل ۵ ج و شکل ۶).). به طور کلی، CNN-TCN STW بیشترین میزان تغییر منطقه را در بین تمام پیشبینیهای تغییر LC 2020 به دست آورد ( شکل ۶ ). بیشترین تعداد بازدیدها یا ناحیه تغییر صحیح برای هر نوع مدل مربوط به TW1، TW2 و STW بود، به جز CNN-GRU TW1 . علاوه بر این، CNN-TCN STW و ConvLSTM TW1 بیشترین تعداد آلارم کاذب را در بین شش مدل برتر تولید کردند.
۳٫۲٫ تجزیه و تحلیل خطای چند ساله
بیشترین مقدار EQ برای هر مورد پایه مدل مشاهده شد که در آن از وزن نمونه استفاده نشده بود ( شکل ۷ a). در همین حال، سه مدل از شش مدل برتر (CNN-LSTM TW1 ، CNN-GRU STW ، و CNN-TCN STW ) کمترین EQ را برای انواع مدلهای مربوطه ارائه کردند، که نشان میدهد هر کدام مقادیر واقعیتری از تغییرات را پیشبینی میکنند. ConvLSTM TW1 کمترین EQ را برای نوع مدل ConvLSTM حفظ کرد، در حالی که مقادیر EQ نسبت داده شده به ConvLSTM TW2 و ConvLSTM STW به تدریج از مقادیر ConvLSTM BW فراتر رفت.. برعکس، مورد پایه به کمترین اندازههای EA، مربوط به حداقل مقادیر آلارمهای کاذب و تغییرات اشتباه مشاهدهشده، رسید ( شکل ۶ و شکل ۷ ب). از شش مدل برتر، CNN-LSTM TW1 ، CNN-GRU STW ، CNN-TCN STW ، و ConvLSTM TW1 بیشترین مقدار تغییر منطقه را به اشتباه پیشبینی کردند، در حالی که ConvLSTM STW کمترین EA را برای هر مرحله از پیشبینی ۵ ساله پیشبینی کرد. .
با توجه به فاصله تخصیص اشتباه به مکانهای رده LC در دنیای واقعی، AED به طور کلی ، AED بزرگ ، AED متوسط و AED کوچک روندهای مشابهی را در طول پیشبینی ۵ ساله حفظ کردند ( شکل ۸ ). مقادیر کلی AED و مقادیر بزرگ AED که کوچکترین یا نزدیکترین خطاهای تخصیص را نشان می دهد با پیش بینی سال ۲۰۱۶ توسط ConvLSTM TW2 مرتبط است ( شکل ۸ a,b). برای AED به طور کلی ، یک انحراف قابل توجه برای CNN-TCN BW مشاهده شد، که در آن شدت خطای تخصیص کلی از حالت پایه بدون وزن بیشتر بود. شش مدل برتر خطاهای تخصیص کلی را به طور کلی به مناطق واقعی نزدیکتر از حالت پایه بدون وزن در پیش بینی های ۲۰۱۷-۲۰۲۰ ایجاد کردند. همین روند برای AED بزرگ نیز مشاهده شد ، به جز پیشبینی سال ۲۰۱۷ که توسط ConvLSTM TW1 ارائه شد. با این حال، مشاهده شد که تخصیص کلاس بزرگ اشتباه یا تصحیح شد یا با تخصیص LC 2018 در دنیای واقعی سازگارتر بود، زیرا مقدار بزرگ AED برای مرحله زمانی بعدی کاهش یافت. لازم به ذکر است که گسترش AED به طور کلی و AED بزرگ استمقادیر قابل توجهی نبودند، نشان می دهد که خطاهای تخصیص کلی و خطاهای تخصیص منتسب به بزرگترین کلاس های LC با توجه به وضوح فضایی مجموعه داده حاشیه ای هستند. محیط AED نشان داد که شش مدل برتر، به جز مدل ConvLSTM STW ، خطاهای تخصیص نزدیکتر به کلاسهای دنیای واقعی را نسبت به حالت پایه بدون وزن ایجاد میکنند ( شکل ۸ ج). در حالی که مقادیر کوچک AED محاسبهشده از پیشبینی ۲۰۱۶ برای ConvLSTM STW و ConvLSTM TW2 صفر بود ، انحرافات بزرگتری بین سالهای ۲۰۱۸ و ۲۰۲۰ مشاهده شد. این بدان معناست که مناطق کشاورزی یا ساختهشده دور از تخصیصهای دنیای واقعی پیشبینی شدهاند.
۳٫۳٫ ارزیابی بصری
برای ارزیابی بصری، CNN-TCN STW و ConvLSTM STW در نظر گرفته شدند زیرا اولی بالاترین FOM را نشان داد، در حالی که دومی کمترین تعداد هشدارهای نادرست را در بین شش مدل برتر پیشبینی کرد. برای پیشبینیهای سال ۲۰۱۶، آلارمهای کاذب و از دست دادن ظاهر «نمک و فلفل» را نشان دادند ( شکل ۹ a,c). CNN-TCN STW چند خوشه کوچک از هشدارهای کاذب را در غرب و جنوب غربی منطقه مورد مطالعه به نمایش گذاشت. با این حال، برای پیشبینی LC 2020، CNN-TCN STW خوشههای متمایزتری از آلارمهای کاذب را نشان داد که با تغییرات صحیح احاطه شده بودند. به نظر می رسد مناطقی که پایدار بودند و به اشتباه پیش بینی شده بودند در نزدیکی یا در مکان هایی هستند که وزن نمونه بالاتری داشتند (شکل ۳ د و شکل ۹ ب). پیشبینی سال ۲۰۲۰ از ConvLSTM STW ، خوشههای کوچکتر و کمتری از آلارمهای کاذب را نشان داد. قبلاً نشان داده شده بود که خطاها بیشترین خطاها را داشته اند ( شکل ۶ )، و تغییرات از دست رفته نشان داده شده است که از نظر بصری در هر دو پیش بینی سال ۲۰۲۰ سازگار هستند ( شکل ۹ b,d).
۴٫ بحث
نتایج بهدستآمده در این مطالعه تحقیقاتی نشان داد که، صرفنظر از مدل DL انتخاب شده، طرحهای وزندهی نمونه پیشنهادی برای پیشبینی تغییرات LC مفید بودند. طرح های TW1، TW2 و STW به طور کلی نسبت به طرح سنتی BW بهبود نشان دادند. به طور خاص، طرح STW اقدامات FOM را در مقایسه با طرح BW در تمام انواع مدل های بررسی شده بهبود بخشید. با توجه به مقادیر FOM بهدستآمده برای پیشبینیهای LC 2016، شش ترکیب مدل و وزن شناسایی شدند: CNN-TCN STW ، CNN-GRU STW ، ConvLSTM TW2 ، ConvLSTM STW ، CNN-LSTM TW1 ، و ConvLSTM TW1 .. مشاهده شد که بالاترین اندازههای FOM مرتبط با این شش ترکیب برای پیشبینی ۵ ساله حفظ شد. علاوه بر این، شش مدل برتر به بالاترین میزان PA دست یافتند. اقدامات UA برخی از روندهای جالب را در میان طرح های وزن دهی، به ویژه برای ConvLSTM برجسته کرد. افزایش تدریجی UA مشاهده شده برای ConvLSTM STW با توجه به تغییرات پیشبینیشده تجمعی نشاندهنده افزایش مداوم در تغییرات صحیح در مقابل همه تغییرات پیشبینیشده است، در حالی که هشدارهای نادرست کمتر یا انتقالهای نادرست LC را پیشبینی میکند. به طور کلی، STW برای CNN-GRU و CNN-TCN در تمام آزمایشها سودمندتر بود، در حالی که TW1، TW2 و STW به طور مشابه از مدلهای ConvLSTM سود بردند. طرح TW1 بیشترین سود را برای CNN-LSTM برای تمام مراحل پیشبینی ۵ ساله و مقادیر FOM مرتبط با ConvLSTM داشت.TW1 همچنین از ConvLSTM TW2 و ConvLSTM STW پس از سال ۲۰۱۷ پیشی گرفت. این با این مشاهدات مطابقت دارد که مقادیر وزن نمونه و تغییرات TW1 و STW بیشتر از آنچه که طرحهای TW2 یا BW را مشخص میکند، همسو میکند ( شکل ۳ ). با این حال، شباهت ها تفاوت تقریبی ۲٪ بین اندازه گیری های FOM CNN-LSTM و CNN-GRU را با طرح های TW1 و STW توضیح ندادند ( شکل ۵ a). این امر مستلزم بررسی آینده پارامترهای مدل، ساختار و تکنیکهای منظمسازی با توجه به طرحهای وزندهی است. TW2 تنها با یکی از شش مدل برتر (ConvLSTM TW2 ) همراه بود) و عملکرد مشابه مدل های آموزش دیده با STW را برای انواع مدل های دیگر تسهیل نکرد. این ممکن است به این دلیل باشد که مقادیر وزن نمونه TW2 بیشتر شبیه به طرح وزن دهی فرکانس معکوس سنتی (BW) است که در سراسر منطقه مورد مطالعه مشاهده شده است ( شکل ۳ a,c).
با در نظر گرفتن انواع خطاهای مرتبط با شش مدل برتر، CNN-TCN STW بیشترین میزان تغییر مناطق به درستی را پیشبینی کرد در حالی که بیشترین هشدارهای نادرست را برای پیشبینی سال ۲۰۱۶ پیشبینی کرد. با این حال، CNN-TCN STW دومین آلارم نادرست را برای پیشبینی سال ۲۰۲۰ پیشبینی کرد که توسط ConvLSTM TW1 جایگزین شد که پایدارترین منطقه را بهطور نادرست نشان میدهد. اگر حداکثر کردن توافق نواحی تغییر یافته برای پیش بینی ۵ ساله تنها هدف بود، CNN-TCN STW به عنوان “بهترین” مدل و ترکیب وزن نمونه در نظر گرفته می شد. در همین حال، ConvLSTM STWپس از ۵ سال ۸۶٫۳٪ آلارم های کاذب کمتر با خطای کمتر به دلیل کمیت (EQ) را پیش بینی کرد که در ارزیابی بصری مشهود بود ( شکل ۹ ). با توجه به معیارهای AED، انتظار این بود که همه طرحهای وزندهی نمونه به کاهش شدت خطای تخصیص به طور کلی و با توجه به بزرگترین کلاسها کمک کنند، که معمولاً همینطور بود. معیارهای AED نشان داد که بدترین خطاهای تخصیص عموماً با کلاسهای اندازه متوسط و کوچک مرتبط است، که منطقی است زیرا هیچ تکنیکی برای رسیدگی به مشکل عدم تعادل کلاس LC استفاده نشده است و از آنجایی که بهینهسازی تخصیص تغییر در هر کلاس هدف این مطالعه نبود. با این حال، رسانه AEDنشان داد که شش مدل برتر عموماً خطاهای تخصیص کمتری نسبت به حالت پایه بدون وزن ایجاد میکنند. استثنای این روند ConvLSTM STW بود ، که نشان میدهد یک یا چند کلاس با اندازه متوسط به خوبی توسط این مدل تخصیص داده نشدهاند. اقدامات کوچک AED همچنین نشان داد که ConvLSTM STW و ConvLSTM TW2 مناطق ساخته شده یا کشاورزی را به دور از تخصیص های واقعی خود پیش بینی می کنند. این نتیجه مورد انتظار بود، زیرا این بعد دوم عدم تعادل مشخص کننده مجموعه داده های LC چالش هایی را برای پیش بینی تغییرات چند طبقه با مدل های DL اضافه می کند. به این ترتیب، مطالعات تحقیقاتی آینده باید ترکیبات بیشتری از وزن نمونه با وزن کلاس یا تابع کاهش کانونی را بررسی کنند [ ۶۷ ]] برای کاهش کمیت و فاصله خطای تخصیص با توجه به دستههای LC غیراکثریتی.
از ارزیابی بصری، مشاهده شد که تغییرات فضایی وزنها برای طرح STW ( شکل ۳d ) با تخصیص موافق و مخالف تغییرات LC پیشبینیشده با CNN-TCN STW و ConvLSTM STW مرتبط بود ( شکل ۹ ). ترکیب CNN-TCN STW نسبت به مقادیر بالاتر وزن نمونه در برخی مناطق حساس تر به نظر می رسد، که در پیش بینی ۲۰۲۰ بیشتر قابل توجه بود ( شکل ۹ ب). برای مثال، ضربات پیشبینیشده و آلارمهای کاذب معمولاً در اطراف مکانهایی با وزن نمونه بزرگتر دیده میشوند ( شکل ۳ د، شکل ۹).ب). این ممکن است نشان دهد که نمونههای پایدار همچنان به وزنهای کاهشیافته یا استراتژیهای کمنمونهگیری برای مدیریت تأثیر خود بر پارامترهای مدل آموختهشده نیاز دارند. این نتیجه ممکن است به نوع مدل نیز بستگی داشته باشد، زیرا پیشبینی سال ۲۰۲۰ که توسط ConvLSTM STW ارائه شد کمتر تحت تأثیر مناطقی بود که وزن نمونه محاسبهشده برای مکان بالا بود. برعکس، در هر نقشه حاصل، مناطق پراکنده و خوشهای تغییرات از دست رفته در مکانهای فضایی مشابه برای مناطق با مقادیر وزن کم وجود داشت. با این حال، با توجه به ظهور بازدیدهای خوشهای و آلارمهای کاذب در پیشبینیهای ۲۰۲۰ ( شکل ۹ b,d)، طرح STW ممکن است برای کارهای آینده که به دنبال مدیریت ویژگیهایی مانند تغییرپذیری فضایی هستند سودمند باشد [ ۶۸ ].
هدف این مطالعه پژوهشی بهبود پیشبینی تغییر LC با مدلهای DL با پیشنهاد و ارزیابی یک طرح وزندهی نمونه بود که مجاورت زمانی و مکانی-زمانی را از دادههای سری زمانی جغرافیایی یکپارچه میکند. اثر وزن نمونه به دست آمده از فاصله زمانی و مکانی-زمانی از تغییرات اخیر برای پیشبینی تغییر LC با مدلهای DL ناشناخته بود، که به شدت تحتتاثیر مناطق عمدتاً پایدار هستند. همچنین تأیید شده است که نرخ تغییر LC معمولاً کوچک است [ ۶۹ ]. تغییرات از دست رفته رایج ترین خطای نسبت داده شده به تمام ترکیبات طرح وزن دهی مدل و نمونه بود ( شکل ۶ ). با این حال، تلاشهای مدلسازی قبلی با استفاده از دادههای تفکیک زمانی ۱۵ ساله به ۳.۳۸ درصد تغییرات صحیح دست یافتند [ ۲۷ ]]. بنابراین، ۱٫۰۵٪ از مناطق به درستی تغییر یافته توسط CNN-TCN STW برای پیش بینی ۵ ساله ممکن است تا حدودی قابل مقایسه باشد. علاوه بر این، اندازه گیری FOM یک رابطه خطی مثبت با تغییرات خالص مشاهده شده داشت [ ۵۶ ]. به عنوان مثال، یک مدل تغییر زمین با تفکیک زمانی ۱۰ ساله، مقدار FOM 9 درصد را به دست آورد که کمتر از ۵ درصد از منطقه مورد مطالعه در آن دوره زمانی دستخوش تغییرات شد [ ۲۸ ]. این مقادیر بهدستآمده در این مطالعه تحقیقاتی را تأیید میکند که در آن CNN-TCN STWبه یک مقدار FOM 7.8٪ رسید که تنها ۳٫۸٪ از منطقه از سال ۲۰۱۶ تا ۲۰۲۰ دستخوش تغییرات شده است. کار آینده باید بهینه سازی بیشتر مدل ها و طرح های وزن نمونه را برای مجموعه داده ها با وضوح فضایی بهتر، همسایگی های گسترده، توالی های LC طولانی تر و مجموعه داده های پر سر و صدا در نظر بگیرد. . متغیرهای آب و هوایی نیز محرکهای مهم تغییر LC هستند [ ۷۰ ] و همچنین باید برای افزایش بیشتر ظرفیت مدل برای پیشبینی تغییرات در کنار طرحهای وزندهی نمونه، ادغام شوند. تعدیلهای اضافی برای وزنهای نمونه محاسبهشده نیز ممکن است مفید باشد، زیرا کار قبلی مشخص کرده بود که وزنهای کم در تأثیرشان بر رویههای آموزشی مدل ناچیز است [ ۲۰ ]. در نهایت، ترکیبی از افزایش داده ها [ ۱۶] و حذف یا کم نمونه برداری از نمونه های پایدار [ ۱۴ ] ممکن است در کنار طرح های وزن دهی نمونه پیشنهادی سودمند باشد. با این وجود، خطر حذف نمونههای بالقوه مهم داده LC همچنان یک مشکل باز است.
۵٫ نتیجه گیری ها
این مطالعه تحقیقاتی پتانسیل طرحهای وزندهی نمونه فاصله زمانی معکوس و فاصله مکانی-زمانی معکوس را برای پیشبینی تغییر LC با مدلهای DL مکانی-زمانی و دادههای LC چندزمانی موجود برای منطقه منطقهای کلمبیا-شوسواپ در BC بررسی کرد. منطق وزندهی نمونه آموزشی کاهش تأثیر نمونههایی بود که مدتها قبل تحت تغییرات قرار گرفتهاند در حالی که تأثیر نمونههای تغییر یافتهای را که تغییرات اخیر در مکان مرکزی یا در همسایگی خود متحمل شدهاند، افزایش میدهد. با نمونههای تغییر LC وزن زمانی و مکانی-زمانی، پیشبینیهای مدل پیشرفتهای ثابتی را در مؤلفههای FOM و FOM توافق و مخالفت در مقابل حالت پایه وزننشده (“هیچ”) و طرحهای وزن فرکانس معکوس سنتی (BW) نشان داد. در حالی که خطاهای تخصیص یک مشکل برجسته برای مدلهای DL باقی میماند، طرحهای وزندهی نمونه پیشنهادی میانگین فاصله خطاهای تخصیص را تا دستههای LC دنیای واقعی به طور کلی و با توجه به کلاسهای LC با اندازه بزرگ و متوسط کاهش داد. بر اساس یافتههای این مطالعه پژوهشی، طرحهای وزندهی نمونه پیشنهادی عملکرد قابلتوجهی بهتری را در مقایسه با استفاده از نمونههای وزننشده برای پیشبینی تغییر LC با مدلهای DL فضایی-زمانی امکانپذیر کرد. از همه طرحهای وزندهی نمونه، STW به طور مداوم با اقدامات بهبود یافته FOM و PA برای همه انواع مدل در مقابل طرح سنتی BW همراه بود. توصیه میشود که طرحهای وزندهی نمونه TW1، TW2، و STW را با توجه به سایر مجموعههای داده و پیکربندیهای مدل DL مکانی-زمانی در مطالعات آینده بررسی، تجزیه و تحلیل و تنظیم بیشتر کنید. طرحهای وزندهی نمونه پیشنهادی میانگین فاصله خطاهای تخصیص تا دستههای LC دنیای واقعی را به طور کلی و با توجه به کلاسهای LC با اندازه بزرگ و متوسط کاهش داد. بر اساس یافتههای این مطالعه پژوهشی، طرحهای وزندهی نمونه پیشنهادی عملکرد قابلتوجهی بهتری را در مقایسه با استفاده از نمونههای وزننشده برای پیشبینی تغییر LC با مدلهای DL فضایی-زمانی امکانپذیر کرد. از همه طرحهای وزندهی نمونه، STW به طور مداوم با اقدامات بهبود یافته FOM و PA برای همه انواع مدل در مقابل طرح سنتی BW همراه بود. توصیه میشود که طرحهای وزندهی نمونه TW1، TW2، و STW را با توجه به سایر مجموعههای داده و پیکربندیهای مدل DL مکانی-زمانی در مطالعات آینده بررسی، تجزیه و تحلیل و تنظیم بیشتر کنید. طرحهای وزندهی نمونه پیشنهادی میانگین فاصله خطاهای تخصیص تا دستههای LC دنیای واقعی را به طور کلی و با توجه به کلاسهای LC با اندازه بزرگ و متوسط کاهش داد. بر اساس یافتههای این مطالعه پژوهشی، طرحهای وزندهی نمونه پیشنهادی عملکرد قابلتوجهی بهتری را در مقایسه با استفاده از نمونههای وزننشده برای پیشبینی تغییر LC با مدلهای DL فضایی-زمانی امکانپذیر کرد. از همه طرحهای وزندهی نمونه، STW به طور مداوم با اقدامات بهبود یافته FOM و PA برای همه انواع مدل در مقابل طرح سنتی BW همراه بود. توصیه میشود که طرحهای وزندهی نمونه TW1، TW2، و STW را با توجه به سایر مجموعههای داده و پیکربندیهای مدل DL مکانی-زمانی در مطالعات آینده بررسی، تجزیه و تحلیل و تنظیم بیشتر کنید. طرحهای وزندهی نمونه پیشنهادی در مقایسه با استفاده از نمونههای بدون وزن برای پیشبینی تغییرات LC با مدلهای DL فضایی-زمانی، عملکرد بهتری را بهطور قابل توجهی فعال میکنند. از همه طرحهای وزندهی نمونه، STW به طور مداوم با اقدامات بهبود یافته FOM و PA برای همه انواع مدل در مقابل طرح سنتی BW همراه بود. توصیه میشود که طرحهای وزندهی نمونه TW1، TW2، و STW را با توجه به سایر مجموعههای داده و پیکربندیهای مدل DL مکانی-زمانی در مطالعات آینده بررسی، تجزیه و تحلیل و تنظیم بیشتر کنید. طرحهای وزندهی نمونه پیشنهادی در مقایسه با استفاده از نمونههای بدون وزن برای پیشبینی تغییرات LC با مدلهای DL فضایی-زمانی، عملکرد بهتری را بهطور قابل توجهی فعال میکنند. از همه طرحهای وزندهی نمونه، STW به طور مداوم با اقدامات بهبود یافته FOM و PA برای همه انواع مدل در مقابل طرح سنتی BW همراه بود. توصیه میشود که طرحهای وزندهی نمونه TW1، TW2، و STW را با توجه به سایر مجموعههای داده و پیکربندیهای مدل DL مکانی-زمانی در مطالعات آینده بررسی، تجزیه و تحلیل و تنظیم بیشتر کنید.
با توجه به ماهیت معمولاً آهسته و کمیاب رویدادهای تغییر LC که مانع از کاربردهای مستقیم مدلهای DL میشود، این مطالعه تحقیقاتی به استراتژیهای پیشرفته مورد استفاده برای کاهش عدم تعادل دادهها برای پیشبینی تغییر LC و سایر پدیدههای جغرافیایی کمک میکند. قبلاً ناشناخته بود که چگونه طرحهای وزندهی نمونه زمانی و مکانی به ظرفیت مدل DL برای پیشبینی تغییرات LC کمک میکنند. به این ترتیب، این مطالعه تحقیقاتی وزنهای نمونه ساده را بر اساس نزدیکی زمانی و مکانی-زمانی به رویدادهای تغییر معرفی کرد، که نشاندهنده بهبود ظرفیت مدل DL برای پیشبینی تغییرات LC است. این کار بدون کنار گذاشتن تصادفی نمونههای بالقوه مفید یا افزودن نمونههای مصنوعی یا تبدیلشده که زمینه و روابط فضایی دنیای واقعی را به چالش میکشند، انجام شد. این مطالعه تحقیقاتی میتواند برای هر تلاش مدلسازی DL که با دادههای LC یا دادههای سری زمانی جغرافیایی نامتعادل سروکار دارد، مفید باشد. با رویکردهای مدلسازی مبتنی بر دادههای منبع باز که به طور فزایندهای در دسترس هستند و دارای گزینههای پارامتر وزن نمونه هستند، تکنیکهای یادگیری حساس به هزینه را میتوان بدون تغییرات برنامهای پیچیده به دست آورد. طرحهای وزندهی نمونه جدید همچنین میتواند با اختصاص اهمیت کمتر به نمونههای قدیمیتر بهدستآمده برای کاربردهای جغرافیایی مانند پیشبینی رشد شهری، تغییر جنگل، یا گسترش کشاورزی، به بهبود مدلهای DL غیر سری زمانی یا مدلهای ML به طور کلی کمک کند. تکنیک های یادگیری حساس به هزینه را می توان بدون تغییرات برنامه ای پیچیده به دست آورد. طرحهای وزندهی نمونه جدید همچنین میتواند با اختصاص اهمیت کمتر به نمونههای قدیمیتر بهدستآمده برای کاربردهای جغرافیایی مانند پیشبینی رشد شهری، تغییر جنگل، یا گسترش کشاورزی، به بهبود مدلهای DL غیر سری زمانی یا مدلهای ML به طور کلیتر کمک کند. تکنیک های یادگیری حساس به هزینه را می توان بدون تغییرات برنامه ای پیچیده به دست آورد. طرحهای وزندهی نمونه جدید همچنین میتواند با اختصاص اهمیت کمتر به نمونههای قدیمیتر بهدستآمده برای کاربردهای جغرافیایی مانند پیشبینی رشد شهری، تغییر جنگل، یا گسترش کشاورزی، به بهبود مدلهای DL غیر سری زمانی یا مدلهای ML به طور کلیتر کمک کند.