۱٫ مقدمه
الگوریتمهای یادگیری ماشین (ML) در تجزیه و تحلیل دادههای سنجش از دور رایج شدهاند [ ۱ ، ۲ ، ۳ ، ۴ ، ۵ ، ۶ ، ۷ ، ۸ ]. استفاده موفقیتآمیز از ML برای انواع کاربردهای GIS و سنجش از دور منجر به پیادهسازی این روشها، اغلب مبتنی بر روشهای آماری ماشین بردار پشتیبان (SVM) و جنگل تصادفی (RF) در بستههای نرمافزاری GIScience شده است که میتوان از آنها استفاده کرد. محققین غیر فنی ابزارها بهویژه برای طبقهبندیهای نظارت شده به آسانی در دسترس هستند [ ۹ ، ۱۰]. مطالعات متعددی از استفاده از یادگیری ماشین بر طبقهبندیهای سنتی، یعنی طبقهبندیهای مبتنی بر آمار، مانند روشهای حداکثر احتمال، با SVM که اغلب بهترین عملکرد را دارند، حمایت کردهاند [ ۱۱ ، ۱۲ ، ۱۳ ، ۱۴ ]. طبقهبندیکنندههای ML اکنون در سراسر جامعه حرفهای بهعنوان ابزاری قابل اعتماد برای نقشهبرداری، بدون نیاز به یادگیری ماشینی و تجربیات برنامهنویسی گسترده، ایجاد شدهاند.
پیشرفت ها در ده سال گذشته منجر به تقسیم بندی جدیدی در یادگیری ماشین شده است. یادگیری عمیق (DL) یک الگوریتم یادگیری است که برای تقلید از عملکرد مغز انسان در قالب شبکه های عصبی طراحی شده است [ ۱۵ ]. یک زیربخش پیشرفته از ML، DL قادر به انجام عملکردهای هوش مصنوعی با منابع آموزشی گسترده است. محبوبیت و موفقیت اخیر DL در رشته ها و کاربردهای دیگر، مانند تشخیص گفتار [ ۱۶ ] و تشخیص تصویر پزشکی [ ۱۷ ]، منجر به افزایش استفاده از آن در کاربردهای سنجش از دور شده است. ضمن استناد به بررسی های دیگر در مورد کاربردهای DL در سنجش از دور، [ ۱۸ ، ۱۹ ، ۲۰ ]] با توصیف انواع مدل های مختلف DL در سنجش از دور، یک بررسی جامع ارائه کرد. نویسندگان همچنین در فراتحلیل خود از این موضوع دریافتند که تا زمان انتشار مقاله آنها، ۲۲۱ مقاله بررسی شده و ۱۸۱ مقاله کنفرانس یا مجموعه مقالات مربوط به سنجش از دور و DL وجود داشته است. واضح است که موارد استفاده از DL در کاربردهای سنجش از دور به سرعت در حال افزایش است.
همانطور که کاربرد طبقهبندیکنندههای DL در سنجش از دور بیشتر میشود، الگوریتمها و ابزارهایی که از DL برای طبقهبندی تصویر استفاده میکنند، به عنوان ابزارهای رابط کاربر گرافیکی کاربرپسند (GUI) در نرمافزار متداول GIS، درست مانند ابزارهای ML، در دسترس قرار میگیرند. اگرچه شرکتهای نرمافزار مکانی از ابزارهای DL کاربرپسند و قوی استفاده میکنند، اغلب دستکاری ابزارها بر اساس مشخصات مورد نظر کاربر دشوار است. با این وجود، همانطور که همه جا ابزارهای ML GUI استفاده از ML را برای کاربران بدون پیشینه برنامه نویسی و ML باز کرد، ابزارهای DL نیز اکنون در دسترس همه هستند. محققان، مدیران و متخصصان علوم GIS برنامه محور ممکن است در انتخاب یا دانستن مناسب بودن یک ابزار خاص برای یک مورد استفاده خاص مشکل داشته باشند.
یک پایگاه ادبیات رو به رشد، آزمایش گسترده طبقهبندیکنندههای DL را در برابر طبقهبندیکنندههای سنتی ML در محیطهای مختلف و با انواع دادهها و اندازههای مختلف آغاز کرده است [ ۲۱ ، ۲۲ ، ۲۳ ، ۲۴]. هدف این مطالعات شناسایی بهترین طبقهبندیکننده با مقایسه نتایج طبقهبندیکنندهها در مجموعه دادههای مشابه، معمولاً با استفاده از دادههای آموزشی و اعتبارسنجی یکسان یا مشابه است. نتایج این مطالعات، تا کنون، در مورد اینکه کدام طبقهبندیکننده (DL یا ML) برای بسیاری از محیطها بهترین عملکرد را دارد، قطعی نبوده است، اگرچه ادبیات موجود فعلی میتواند راهنماییهایی را برای حرفهایهایی که به دنبال استفاده از چنین ابزارهایی برای کاربردهای خاص هستند (به عنوان مثال، طبقه بندی کاربری/پوشش زمین، پوشش گیاهی و طبقه بندی زیستگاه صخره های مرجانی) [ ۲۵ ، ۲۶ ، ۲۷]. مطمئناً هر ابزاری باید بر اساس بهترین پاسخ به سؤال تحقیق انتخاب شود. با این حال، مطالعات کمی از ابزارهای رابط کاربری گرافیکی توسعه یافته برای محققانی که از نظر فنی کمتر تمایل دارند توسط شرکت های بزرگ نرم افزار GIS استفاده کرده اند.
مطالعه حاضر به دنبال شناسایی بهترین طبقهبندی کننده (در میان سه طبقهبندی کننده DL و ML موثر و رایج) برای نقشهبرداری کاربری زمین/پوشش زمین (LU/LC) با استفاده از مجموعه دادههای بزرگ، پیچیده و در سطح شهرستان برای یک شهرستان ساحلی است. بسته به سؤال تحقیق، روشها، کیفیت تصویر و دادههای میدانی، پردازش و طبقهبندی مجموعههای داده تصویری بزرگ و با وضوح بالا از مناطق ساحلی که شامل پوشش زمین پیچیده است، دشوارتر است. تصاویر با وضوح بالا به دلیل تغییرات درون کلاسی می توانند جلوه نمک و فلفل را ایجاد کنند. دانستن اینکه کدام طبقهبندیکننده در این نوع محیط و با تصاویری از این مشخصات بهترین عملکرد را دارد، بهویژه برای مدیران و متخصصان ساحلی مفید خواهد بود. این مطالعه به طور خاص از ابزارهای ML و DL، تعبیه شده در Esri ArcGIS Pro 2.8.1 استفاده خواهد کرد.
در این مطالعه سه طبقهبندی کننده ML و DL موثر و رایج مورد استفاده قرار میگیرند. شبکه عصبی کانولوشنال U-Net (CNN) یک الگوریتم DL است که در ابتدا برای تقسیمبندی تصاویر زیست پزشکی ایجاد شد، اما اکنون برای کاربردهای طبقهبندی تصویر سنجش از دور استفاده میشود [ ۲۸ ، ۲۹ ]. معماری شبکه را می توان به دو نیمه تقسیم کرد – یک سمت رمزگذاری یا “قراردادی” و یک سمت رمزگشایی یا “گسترده” – که شکل “u” را به معماری می دهد. الگوریتم U-Net در طبقه بندی تالاب های ساحلی با استفاده از تصاویر سنجش از دور در مطالعات قبلی موفقیت آمیز نشان داده است [ ۳۰ ، ۳۱]. طبقهبندیکنندههای SVM و RF معمولاً از طبقهبندیکنندههای ML برای تحلیل سنجش از دور استفاده میشوند. طبقه بندی کننده SVM یک روش طبقه بندی نظارت شده بر اساس تئوری یادگیری آماری است و در جامعه علوم کامپیوتر در دهه ۱۹۹۰ توسعه یافت [ ۳۲ ] (ص. ۳۳۷). اکنون معمولاً در تحقیقات سنجش از دور استفاده می شود [ ۲۱ ، ۳۳ ، ۳۴ ]. طبقهبندیکنندههای SVM مفید هستند زیرا میتوانند نمونههای آموزشی کوچک را مدیریت کنند و نمونههای آموزشی نیازی به توزیع عادی ندارند. طبقهبندیکنندههای SVM میتوانند مرزهای کلاس غیرخطی و چندین کلاس را مدیریت کنند. طبقه بندی کننده RF یک روش طبقه بندی نظارت شده بر اساس روش آماری جنگل تصادفی است [ ۳۲ ]] (ص ۳۱۱). مجموعه ای از تصمیمات بر اساس ترکیب آماری کلاس ها و همچنین تصویر کلی گرفته می شود. تصمیمات با هم منشعب می شوند و شبیه شاخه های درخت می شوند. هنگامی که کل تصویر طبقه بندی می شود، بسیاری از نمونه های طبقه بندی بر روی زیرمجموعه های داده ها انجام می شود، بنابراین درخت های تصمیم گیری زیادی ایجاد می شود [ ۳۵ ]. رایج ترین خروجی درخت به عنوان طبقه بندی کلی استفاده می شود. استفاده از درختان متعدد به منظور کاهش بیش از حد برازش به نمونه های آموزشی ارائه شده توسط کاربر است. بهترین طبقهبندیکننده با مقایسه هزینههای زمانی برای طبقهبندی تصاویر و نتایج دقت کلی (OA) تعیین میشود.
پس از تعیین مؤثرترین طبقهبندیکننده، یک مطالعه موردی برای نشان دادن استفاده مؤثر از بهترین طبقهبندیکننده با استفاده از مجموعه دادههای بزرگ و در سطح شهرستان برای شناسایی تغییرات در LU/LC در یک دوره ده ساله انجام میشود که میتواند بر باتلاق گسترده تأثیر بگذارد. محیط در سراسر یک شهرستان بزرگ در کارولینای جنوبی، ایالات متحده. در حالی که اصلاح مستقیم محیط باتلاق برای نقشه برداری مهم است، به منظور توسعه، اثرات غیرمستقیم مانند آلودگی، مواد مغذی و ورودی بیش از حد فاضلاب، سایر توسعه های بالادست و انحرافات آب شیرین ناشی از جوامع ساحلی ممکن است اثرات منفی پایداری بر سلامت داشته باشد. از تالاب های ساحلی مهم ما [ ۳۶ ، ۳۷ ، ۳۸ ، ۳۹ ].
بخش ۲ این مطالعه به تشریح مواد و روش های آزمایش و مطالعه موردی می پردازد. این شامل توصیف منطقه مورد مطالعه، دادههای مورد استفاده، نحوه آموزش و کاربرد طبقهبندیکنندهها و تجزیه و تحلیل تشخیص تغییر است. بخش ۳ نتایج حاصل از مقایسه و مطالعه موردی را ارائه می کند. نتایج این مطالعه موردی بینشهایی را برای مدیران ساحلی فراهم میکند تا سلامت باتلاق را بهتر نظارت و مدیریت کنند. در نهایت، نتایج در چارچوب ادبیات فعلی مورد بحث قرار میگیرند و پس از آن یک نتیجهگیری کوتاه ارائه میشود.
۲٫ مواد و روشها
۲٫۱٫ رویکردهایی برای آزمایش مقایسه طبقهبندیکننده
گردش کار کلی این مطالعه در شکل ۱ نشان داده شده است. این آزمایش با طبقهبندی همان تصویر هوایی با وضوح بالا در سطح شهرستان و با استفاده از سه طبقهبندیکننده مختلف انجام شد: RF، SVM، و DL U-Net. کاربرد ریاضی و کدگذاری این طبقهبندیکنندهها به نحوه طراحی آنها توسط تیم توسعه ESRI در ArcGIS Pro 2.8.1 واگذار شد تا آنچه را که در دسترس مدیران و دانشمندان ساحلی با دسترسی به این ابزارهای رایج است، به بهترین شکل نشان دهد.
طبقهبندیکنندههای شی گرا (OOC) به دلیل توانایی آنها در کاهش برخی از وضوح بالا، جزئیات درون کلاسی و پدیده نمک و فلفل که اغلب با طبقهبندیهای مبتنی بر پیکسل رخ میدهد، برای آزمایش استفاده شد [ ۴۰ ]. در حالی که نویز هنوز در اشیاء یافت می شود، پارامترهای شی می توانند قسمت زیادی از اثر نمک و فلفل را صاف کنند. نشان داده شده است که OOC دقت بهتری نسبت به طبقهبندیکنندههای مبتنی بر پیکسل در محیطهای مختلف، از جمله سالت مارش و سایر کلاسهای LU/LC موجود در منطقه مورد مطالعه ما دارد [ ۴۱ ، ۴۲ ، ۴۳]. طبقهبندیکننده U-Net، بخشبندی معنایی را بدون ورودی کاربر یک تصویر تقسیمبندی شده انجام داد. برای طبقه بندی SVM و RF، تصویر پایه با استفاده از ویژگی های مختلف تقسیم شد. جزئیات طیفی در بالاترین اهمیت قرار گرفت و جزئیات فضایی در رتبه دوم قرار گرفت. در محدوده ۱٫۰ تا ۲۰٫۰، جزئیات طیفی در ۱۸٫۵ قرار گرفت، در حالی که جزئیات فضایی در تلاش برای صاف کردن تصویر در ۸ قرار گرفت. حداقل اندازه بخش در ۵ پیکسل (۵ × ۵ متر) قرار داده شد تا ساختمان های کوچکتر و تکه های پوشش گیاهی مرداب را در خود جای دهد.
هر طبقهبندی کننده به پارامترهای ورودی خاصی فراتر از تصاویر و دادههای آموزشی (شرح شده در بخش ۲٫۲ ) نیاز داشت. برای آموزش طبقه بندی کننده U-Net DL، آموزش AOIs1 به عنوان ورودی در مدل آموزش عمیق Train ArcGIS Pro استفاده شد.ابزار برای انجام آموزش، کل تصویر شطرنجی به ۷۱۶۹ کاشی با ابعاد ۲۵۶ × ۲۵۶ پیکسل تقسیم شد. داده های آموزشی نیز تعبیه شده است. این ابزار تمام این کارها را در نرم افزار بدون چند کلیک انجام داد. هنگامی که طبقهبندیکننده با استفاده از دادههای آموزشی آموزش داده شد، و همه کاشیهای کوچک وارد طبقهبندی کننده U-Net شدند و در نهایت یکی یکی طبقهبندی شدند، قبل از اینکه دوباره با هم موزاییک شوند تا کل تصویر طبقهبندی شده ایجاد شود. خروجی نهایی یک رستر تصویر طبقه بندی شده بود. معماری U-Net شامل مجموعهای از نمونهبرداریهای پایین و بالا است که در نتیجه شبکهای با ظاهر حرف U ایجاد میشود. در نیمه اول معماری که گاهی به آن رمزگذار نیز گفته می شود، ویژگی های تصویر ورودی توسط لایه های پیچشی ۳×۳ استخراج می شود. به دنبال آن یک تابع فعال سازی ReLU و حداکثر عملیات ادغام ۲×۲٫ در نیمه دوم شبکه که اغلب به آن رمزگشا می گویند، دکانولوشن رخ می دهد تا تصویر را به وضوح اصلی بازگرداند. در نهایت، یک هسته کانولوشن ۱ × ۱ در لایه خروجی نهایی استفاده می شود [۲۸ ].
ایده ساده پشت طبقه بندی کننده SVM را می توان در شکل ۲ مشاهده کرد که بر اساس طبقه بندی کننده حداکثر حاشیه [ ۳۲ ] است. در اینجا، یک ابر صفحه حداکثر حاشیه محاسبه میشود، که در آن ابر صفحه دو کلاس را از هم جدا میکند و از هر یک از دادههای آموزشی دورتر است. مشاهداتی که بر روی مرز، یا در خارج از وسعت ابرصفحه قرار می گیرند، به یک “دال” تبدیل می شوند. این نقاط لبه بردارهای پشتیبان هستند. با این حال، اکثر مجموعه دادههای طبیعی را نمیتوان به زیبایی مثال جدا کرد. دستهبندیکنندههای ماشین بردار پشتیبان به یک مرز تصمیم غیرخطی اجازه میدهد تا کلاسها را از هم جدا کند.
برای آزمایش، طبقهبندیکننده SVM به ورودی تصویر بخشبندی شده، نمونههای آموزشی و طرح طبقهبندی نیاز داشت. تنها یک پارامتر واحد از حداکثر ۵۰۰ نمونه در هر کلاس مورد نیاز بود که تعداد نمونه های آموزشی را که می توانید برای هر کلاس استفاده کنید محدود می کند. پارامتر روی پیش فرض ارائه شده توسط ArcGIS Pro 2.8.1 تنظیم شد. هنگامی که هر یک از ورودی ها به طور جمعی برای آموزش طبقه بندی کننده SVM استفاده شد، آنها بر روی کل تصویر در سطح شهرستان اعمال شدند. خروجی نهایی یک رستر تصویر طبقه بندی شده بود.
در ArcGIS Pro، طبقهبندیکننده درختان تصادفی یک روش طبقهبندی نظارت شده است که بر اساس روش آماری جنگل تصادفی است [ ۳۲ ] (ص. ۳۱۱). مجموعه ای از تصمیمات بر اساس ترکیب آماری کلاس ها و همچنین تصویر کلی گرفته می شود. تصمیمات با هم منشعب می شوند و شبیه شاخه های درخت را تشکیل می دهند ( شکل ۳ ). هنگامی که کل تصویر طبقه بندی می شود، بسیاری از نمونه های طبقه بندی بر روی زیر مجموعه های داده ها انجام می شود، بنابراین درخت های تصمیم گیری زیادی ایجاد می شود [ ۳۵ ]]. این روش جنگل تصادفی نامیده میشود زیرا هر طبقهبندی از زیر مجموعه تصادفی پیکسلهای آموزشی، انتخاب شده از تصویر کلی ساخته میشود و طبقهبندی نهایی بر اساس پرتکرارترین خروجی درخت از چندین درخت است. استفاده از درختان متعدد به منظور کاهش بیش از حد برازش به نمونه های آموزشی ارائه شده توسط کاربر است.
طبقه بندی RF از روش مشابهی پیروی کرد. ورودی های یکسانی برای آموزش RF مورد نیاز بود، اگرچه پارامترهای مورد نیاز متفاوت بود. طبقهبندی کننده RF با استفاده از پارامترهای زیر آموزش داده شد: حداکثر ۱۲۰ درخت، حداکثر عمق درخت ۳۰، و ۱۰۰۰ به عنوان حداکثر تعداد نمونه در هر کلاس. هر یک از این پارامترها اندازه جنگل را در طول آموزش طبقهبندیکننده محدود میکرد، در حالی که به دنبال حفظ سطح بالایی از دقت بود.
هر سه روش طبقهبندی با استفاده از دادههای نمونه آموزشی مشابهی آموزش داده شدند و از سال ۲۰۱۹ روی همان ترکیب تصویر هوایی اعمال شدند. نتایج نهایی سه رستر تصویر طبقهبندی شده برای مقایسه بود.
ارزیابی دقت
معیارهای ارزیابی دقت برای مقایسه دقت سه طبقهبندی کننده استفاده شد. یک ماتریس سردرگمی با استفاده از ابزار ArcGIS Pro’s Compute Confusion Matrix محاسبه شد، که در آن دقت سازنده، دقت کاربر، دقت کلی و کاپا محاسبه شد. دقت سازنده، تعداد کل پیکسلهایی است که بهدرستی برای یک کلاس طبقهبندی شدهاند، تقسیم بر تعداد کل پیکسلهای آن کلاس، همانطور که از دادههای درستی زمین تعیین میشود. دقت کاربر تعداد کل پیکسل هایی است که به درستی در یک کلاس طبقه بندی شده اند، تقسیم بر تعداد کل پیکسل های طبقه بندی شده در آن کلاس. درصد دقت کلی (OA) نیز محاسبه شد:
که در آن x ii نشان دهنده یک پیکسل است که به درستی طبقه بندی شده است، و N تعداد کل پیکسل های مورد ارزیابی است.
تحلیل کاپا یک تکنیک چند متغیره برای ارزیابی دقت است که اولین بار در سال ۱۹۸۳ در یک مجله سنجش از دور منتشر شد [ ۴۴ ]. کاپا شبیه دقت کلی است، به عنوان معیاری برای دقت کل طبقه بندی، اما هر کدام اطلاعات کمی متفاوت را در نظر می گیرند. تخمین کاپا به صورت [ ۴۵ ] تعیین شد:
که در آن N تعداد کل نمونهها، k تعداد ردیفهای ماتریس سردرگمی، x ii تعداد مشاهدات در ردیف i و ستون i ، و x i+ و x +j مجموعهای حاشیهای برای ردیف i و ستون هستند. ج .
۲٫۲٫ مطالعه موردی
۲٫۲٫۱٫ منطقه مطالعه
شهرستان بوفورت یکی از شهرستان های پرجمعیت کارولینای جنوبی است که در سواحل جنوبی این ایالت واقع شده است ( شکل ۴ ). از سال ۲۰۱۰ تا ۲۰۱۹، جمعیت شهرستان بوفورت از ۱۶۲۲۳۳ به ۱۹۲۱۲۲ افزایش یافته است که افزایش ۱۸٫۴ درصدی را نشان می دهد [ ۴۶ ]. این شهرستان با توجه به میانگین درآمد خانوار ۶۸۳۷۷ دلاری به عنوان ثروتمندترین شهرستان در ایالت است. شهرستان بوفورت خانه نیمی از نمکزارهای این ایالت است [ ۴۷ ]. طبق [ ۴۸]، باتلاقهای نمکی کارولینای جنوبی و تالابهای ساحلی خدماتی را در چهار دسته خدمات اکوسیستمی ارائه میکنند: تأمین، تنظیم، فرهنگی و پشتیبانی. هر یک از این دسته بندی ها، اگرچه همه خدماتی که به بازار عرضه نمی شوند، منابع ارزشمندی را در اختیار جوامع ساحلی قرار می دهند. به عنوان مثال، شوره زارها به عنوان زیستگاه مهدکودک برای بسیاری از گونه ها، به ویژه میگوها عمل می کند. صنعت ماهیگیری تجاری کارولینای جنوبی، که بر این محیط ها متکی است، سالانه ۴۲ میلیون دلار برای اقتصاد ایالت تولید می کند [ ۴۹ ]. خدمات دیگر، مانند حفاظت در برابر سیل، ترسیب کربن، فیلتراسیون و گردشگری، همگی به ارزش عظیم این مرداب ها برای سواحل کارولینای جنوبی کمک می کنند. گونه غالب پوشش گیاهی مردابی Spartina Alterniflora است. Juncus Romerianusنیز معمولا یافت می شود. این شهرستان دارای انواع مختلفی از پوشش زمین، از جمله تالاب ها، جنگل ها، آب های بزرگ، مسکن و توسعه های تجاری گسترده و کشاورزی است. از آنجایی که جمعیت شهرستان در یک محیط ساحلی پویا و پیچیده به رشد خود ادامه میدهد، اهمیت نظارت بر تغییرات با استفاده از روشهای طبقهبندی دقیق برای برنامهریزیهای آتی و اندازهگیری روندهای سلامت اجتماعی-اقتصادی و اکولوژیکی حیاتی است.
علیرغم مقررات گسترده برای کاهش اثرات زیست محیطی توسعه در باتلاق نمک شهرستان بوفورت، در [ ۵۰ ] (ص. ۳۳)، ذینفعان جامعه همچنان به ابراز نگرانی در مورد سلامت مرداب می پردازند. در حالی که هیچ شواهد قابل توجهی مبنی بر از دست دادن مرداب ذکر نشده است، بینش های اضافی از این سند بیان می کند که فقدان نظارت در شهرستان بوفورت به درک ما از نحوه تأثیرگذاری مرداب آسیب می رساند [ ۵۰ ] (ص. ۳۴). علاوه بر این، طرح جامع شهرستان بوفورت مذکور، به مهاجرت مرداب ها در مواجهه با افزایش سطح دریا توجهی نمی کند [ ۵۱ ]]. این مطالعه علاوه بر مقایسه صلاحیت الگوریتم DL در نگاشت یک تصویر بزرگ، پیچیده و در سطح شهرستان با دیگر طبقهبندیکنندههای ML، به دنبال پر کردن شکاف در درک تغییرات کاربری/حجم پوشش زمین در منطقه است که ممکن است مستقیماً یا تاثیر غیر مستقیم بر سلامت مرداب
۲٫۲٫۲٫ داده ها
تصاویر هوایی مورد استفاده در این مطالعه توسط برنامه تصویربرداری ملی کشاورزی یا NAIP جمع آوری شده است. این برنامه در سال ۲۰۰۲ آغاز شد و توسط آژانس خدمات مزرعه ای وزارت کشاورزی ایالات متحده (USDA) برای جمع آوری تصاویر هوایی در طول فصول رشد اداره می شود. حسگرهای دیجیتالی که برای تصویرسازی NAIP استفاده میشوند، اگرچه در فرادادههای ارائهشده با تصاویر آشکار نیستند، اما با مشخصات کالیبراسیون صلب مطابقت دارند [ ۵۲ ]. تصاویر NAIP به طور کلی با وضوح فضایی ۱ متر (۵۰-۶۰ سانتی متر در برخی مناطق) در سراسر ایالات متحده جمع آوری می شود.
برای این مطالعه، از تصاویر NAIP از شهرستان بوفورت، که در سالهای ۲۰۰۹ و ۲۰۱۹ به دست آمد، استفاده شد ( جدول ۱).). تصاویر در ماه جمع آوری شده متفاوت است. برای تصاویر NAIP 2009، هر کاشی در ارتوموزائیک بین ۱۶ تا ۲۵ آوریل ۲۰۰۹ جمعآوری شد. تصاویر ۲۰۰۹ یک ارتوموزائیک سنتی با رنگ واقعی، با وضوح فضایی ۱ متر است که توسط حسگر ADS40-SH52 Leica Geosystems گرفته شده است. شماره های ۳۰۰۲۸ و ۳۰۰۴۵). تصاویر ۲۰۱۹ بین ۲۹ اوت و ۲۳ سپتامبر (۲۰۱۹) جمع آوری شده است. پروازهای ۲۰۱۹ منجر به وضوح فضایی ۶۰ سانتی متر و تصاویری با رنگ واقعی از سنسور مدل ADS100 Leica Geosystems (شماره سنسور ۱۰۵۳۰ و ۱۰۵۵۲) شد. اندازه پیکسل برای مطابقت با تصویر ۲۰۰۹ مجدداً به ۱ متر نمونه برداری شد. جزر و مد هر تصویر، حتی در داخل یک تصویر، به دلیل زمان پرواز هر کاشی که تصاویر را می سازد، متفاوت بود. به طور کلی، تصویر سال ۲۰۰۹ جزر و مد بالاتر را نشان می دهد، که بیشتر باتلاق پایین کمی آب گرفته است.۵۳ ]. پس از پوشاندن، تصاویر به اندازه کوچکتر کاهش یافت و برای طبقه بندی قابل کنترل تر شد. هر دو تصویر به سیستم مختصات NAD83 (2011) UTM 17N تبدیل شدند.
۲٫۲٫۳٫ روش های طبقه بندی و تجزیه و تحلیل مطالعه موردی
هر دو تصویر NAIP در چندین کلاس LU/LC سطح ۱، ۲، و ۳ طبقهبندی شدند که به طور آزاد بر اساس [ ۵۴ ] است. طبقات سطح ۳ شامل گل و لای، پوشش گیاهی مرداب، جنگل، جاده، ساختمان، کشاورزی، علفزار، آب، سایه، زمین برهنه خشک و زمین برهنه مرطوب بود ( جدول ۲). چندین کلاس در کلاس های سطح ۲ ما ترکیب شدند تا هفت کلاس غالب باقی بماند که LU/LC عمومی را در منطقه مورد مطالعه توصیف می کرد. به عنوان مثال، پوشش گیاهی گل و لای و باتلاق، طبقه مرداب، جاده ها و ساختمان ها را در طبقه شهری و زمین های خشک و مرطوب را در یک طبقه زمین برهنه ترکیب کردند. مشخص شد که طبقات کشاورزی و علف به طور قابل توجهی اشتباه گرفته شده اند و بنابراین به دلیل شباهت هایشان با هم ترکیب شده اند. این ترکیبها برای شناسایی محیطهای عمومی و محدود کردن طبقهبندیهای اشتباه غیرضروری ساخته شدهاند.
مجموعه نهایی کلاسهای سطح ۱ با ترکیب زمین برهنه، شهری، و چمن/کشاورزی در یک کلاس توسعهیافته که بهعنوان پروکسی برای تغییرات کلی LU/LC که میتواند بر سلامت مرداب تأثیر بگذارد، تعیین شد. زمین برهنه در توسعه گنجانده شده است زیرا سایت های ساخت و ساز و سایت های پیش از ساخت در سراسر شهرستان معمولاً زمین خالی هستند. چمن به عنوان یک کلاس توسعه گنجانده شده است زیرا نشان دهنده از دست دادن منطقه ساحلی جنگلی طبیعی است. بسیاری از پارک ها و حیاط ها بخشی از توسعه هستند و اینجاست که چمن پیدا می شود. علاوه بر این، در حالی که اگر کشاورز از مواد شیمیایی خاصی استفاده میکند، استفاده کشاورزی ممکن است تأثیرگذار باشد، همین امر را میتوان برای مناطق بزرگ چمن نیز گفت، جایی که مواد مغذی افزوده شده میتوانند در نهایت از طریق رواناب به تالابها برسند. طبقات دیگر مانند آب، سایه، جنگل و مرداب، در طبقه بندی سطح ۱ جدا باقی ماند. در پایان، کلاسهای جنگل و توسعه برای تعیین تغییراتی که بر باتلاقها تأثیر میگذارد، مهمترین تلقی شدند. جدای از تعیین تغییرات واقعی مرداب (یعنی توسعه در مرداب یا افزایش باتلاق از طریق احیای مرداب)، تغییرات در زمین های جنگلی و افزایش توسعه به عنوان شاخصی برای چگونگی تأثیر باتلاق مورد استفاده قرار گرفت.
مناطق مورد علاقه (AOI) برای نمونه های آموزشی و اعتبار سنجی به صورت دستی از تصاویر NAIP 1 متری بر اساس دانش تخصصی در منطقه مورد مطالعه و بازدیدهای میدانی در دو سال گذشته دیجیتالی شدند. نمونه های آموزشی به صورت بصری از تصاویر با همکاری مدیر نقشه برداری و برنامه های کاربردی شهرستان بوفورت، که از سال ۱۹۹۵ در این موقعیت اقامت داشته است، جمع آوری شد. بخشی از لایه ردپای ساختمان منبع باز، ارائه شده توسط مایکروسافت، به عنوان AOI برای کلاس ساختمان [ ۵۵ ، ۵۶]. در حالی که مجموعه داده در سال ۲۰۱۸ تولید شد، کاشیها یا صحنههای منفرد در سراسر تصاویر برای طیف وسیعی از تاریخها جمعآوری شدند. بنابراین، یک زیرمجموعه ردپای ساختمان شهرستان بوفورت قبل از استفاده بهعنوان دادههای آموزشی و اعتبارسنجی فرعی بهطور کامل مورد بررسی قرار گرفت. بیش از ۱۰۰ AOI آموزشی برای هر کلاس سطح ۳ تولید شد، اگرچه اندازه همه چند ضلعی ها برابر نبود. در نتیجه، چندین کلاس دارای AOI های کمتر اما مناطق بسیار بزرگی برای آموزش طبقه بندی کننده ها بودند. از آنجایی که منطقه مورد مطالعه بسیار بزرگ بود (نزدیک به ۲۴۰۰ کیلومتر مربع ) ، فضای کافی برای تعریف تعداد زیادی نمونه آموزشی و اعتبار سنجی وجود داشت ( جدول ۳ ).
ارزیابی دقت برای هر تصویر طبقه بندی شده با استفاده از AOI های اعتبارسنجی ایجاد شده به روشی مشابه با AOI های آموزشی انجام شد. اعتبارسنجی AOI کسری از کل AOI برای هر کلاس مشخص بود. AOI ها برای ارزیابی دقت ترکیب شدند تا کلاس های سطح ۲ را منعکس کنند، که نسبت به کلاس های فردی سطح ۳ جالب تر بودند. صرف نظر از تعداد AOI های اعتبارسنجی، یک نمونه تصادفی طبقه بندی شده از ۱۵۰۰ امتیاز اعتبار سنجی برای فرآیند اعتبار سنجی در AOI های اعتبار سنجی داده شده برای هر تصویر ایجاد شد ( شکل ۵ ). سپس نقاط اعتبارسنجی برای محاسبه معیارهای ارزیابی دقت، همانطور که در بخش ۲٫۱ توضیح داده شد، استفاده شد .
پس از طبقهبندی تصاویر سال ۲۰۱۹ و ۲۰۰۹ از شهرستان بوفورت، یک تحلیل تشخیص تغییر با استفاده از ابزار تشخیص تغییر در ArcGIS pro v.2.8.1 انجام شد. این ابزار به ورودی یک سری نقشه یا تصاویر نیاز دارد و در ازای آن یک نقشه تشخیص تغییر و ماتریس تغییر را محاسبه می کند. برای تجزیه و تحلیل تشخیص تغییر، یک نقشه طبقه بندی نهایی، با کلاس های ترکیبی، ایجاد شد. طبقات آب، سایه ها، مرداب ها و جنگل ها دست نخورده باقی ماندند، اما طبقات کشاورزی/علف، زمین برهنه و شهری در طبقه ای به نام توسعه ترکیب شدند. حوزههای تغییر بر اساس تعداد پیکسلهایی که از یک کلاس خاص به کلاس دیگر تغییر میکردند، ارزیابی شدند. تعداد پیکسل در اندازه پیکسل ۱ متر × ۱ متر برای تعیین مساحت تقریبی بر حسب متر مربع ضرب شد. تبدیل بیشتر از m2 به هکتار با ضرب در ۰۰۰۱/۰ به دست آمد.
در حالی که نقشه برداری یک کلاس مرداب به تنهایی اطلاعات مستقیمی در مورد تغییرات واقعی در باتلاق به ما می دهد، بسیاری از اثرات غیرمستقیم از تغییرات کاربری زمین/پوشش زمین در نزدیکی ثبت شده است [ ۳۷ ، ۵۷ ]. به دلیل این تأثیرات مستند، ما تصمیم گرفتیم همه طبقات را نقشه برداری کنیم تا پیشنهاد و بحث کنیم که در صورت ادامه روند توسعه، چه تغییراتی ممکن است رخ دهد.
پیکسل هایی که از یک کلاس خاص به کلاس سایه یا از کلاس سایه به کلاس دیگر تغییر می کردند، برای این تحلیل تغییر نادیده گرفته شدند. پیکسلهای مورد علاقه برای این مطالعه پیکسلهایی بودند که از کلاس مرداب یا جنگل به هر کلاس دیگری، به ویژه به کلاس توسعه تغییر کردند. پیکسل هایی که این تغییرات را تجربه کردند، برای تعیین تأثیرات و ارزیابی تأثیرات احتمالی آینده، نقشه برداری و به صورت بصری تجزیه و تحلیل شدند.
۳٫ نتایج
۳٫۱٫ مقایسه عملکرد و دقت مدل
زمان پردازش یک عامل مهم در پردازش تصاویر با اندازه بزرگ است. هزینه های محاسباتی به داده های در حال پردازش و همچنین توانایی های محاسباتی ماشین مورد استفاده بستگی دارد. در اینجا، برای پردازش هر طبقهبندی از یک CPU 6 هستهای Dell Inspiron 5680 اینتل i7 با ۱۶ گیگابایت رم و Nvidia GTX 1060 3GB GPU استفاده شده است. همانطور که در جدول ۱ ذکر شده استطبقهبندیکننده U-Net به کمترین زمان آموزش، اما بیشترین زمان طبقهبندی کل، برای اعمال مدل آموزشدیده شده روی تصویر نیاز دارد. آموزش طبقه بندی کننده U-Net به ۲ ساعت و ۵۹ دقیقه نیاز داشت که حداقل ۳۰ دقیقه سریعتر از دو طبقه بندی دیگر است. با این حال، طبقه بندی خود تصویر ۴۳ ساعت و ۲۳ دقیقه و در مجموع ۴۶ ساعت و ۲۲ دقیقه طول کشید. با این حال، طول طبقهبندی یک یافته رایج نیست، زیرا طبقهبندیکنندههای U-Net سریعتر از بسیاری دیگر در کاربردهای سنجش از دور هستند [ ۳۰ ، ۳۱ ، ۵۸ ]]. نویسندگان پیشنهاد میکنند که مدت زمان اضافی مورد نیاز برای تکمیل طبقهبندی به دلیل مشخصات ماشین، اندازه مجموعه دادهها و روشهایی است که کاشیها توسط آنها طبقهبندی شده و متعاقباً با هم موزائیک شدند. طبقهبندیکننده SVM به ۴ ساعت و ۵۲ دقیقه برای آموزش و سپس ۳۰ دقیقه برای طبقهبندی تصویر نیاز داشت. طبقه بندی کننده RF در ۴ ساعت و ۲۹ دقیقه آموزش داده شد و تقریباً در ۲۳ دقیقه روی تصویر اعمال شد. زمان های محاسباتی و دقت طبقه بندی در جدول ۴ گزارش شده است.
دقت کلی سه طبقهبندیکننده برای تصویر ۲۰۱۹ از ۷۵٫۷۴٪ تا ۹۲٫۳۸٪ متغیر بود و طبقهبندی کننده U-Net بهترین عملکرد را داشت ( جدول ۳ ). این مطالعه نشان داد که طبقهبندیکنندههای ML مبتنی بر شی به خوبی عمل نمیکنند، اگرچه کلاسهای خاصی عملکرد خوبی داشتند ( جدول ۵ ، جدول ۶ و جدول ۷). کلاس جنگل به طور مداوم با دقت بالای کاربر و تولید کننده (۹۹-۸۹٪) طبقه بندی شد. کلاس های دیگر بر اساس طبقه بندی کننده متفاوت بودند. به عنوان مثال، طبقهبندیکنندههای SVM و RT حداقل ۷۰ درصد مواقع مارش را به درستی طبقهبندی کردند، اگرچه طبقهبندیکننده U-Net دقت کاربر ۸۴٫۴۱ درصد و دقت تولیدکننده ۹۳٫۵۲ درصد داشت. با این حال، هر دو طبقه بندی کننده ML، به طور جالبی، marsh را با کلاس شهری بیشتر اشتباه گرفته اند. پیشنهاد میشود که تصاویر با وضوح بالا و محیط پیچیده منجر به تنوع بالای درون کلاسی میشود و جداسازی کلاسها را برای طبقهبندیکنندههای ML دشوار میکند.
پس از یافتن اینکه طبقهبندیکننده U-Net بهترین عملکرد را دارد، در مجموعه دادههای NAIP 2009 نیز اعمال شد. دقت کلی طبقه بندی تصویر در سال ۲۰۰۹ ۸۵٫۲۸% بود، با آمار کاپا ۸۰٫۴۵%. در حالی که بسیاری از کلاس های مشابه بین دو مجموعه تصویر به طور قابل توجهی خوب عمل کردند، به نظر می رسد محدوده جزر و مد در تصویر ۲۰۰۹ برای طبقه بندی کننده U-Net دشوار است. دقت سازنده برای کلاس مرداب ۶۵٫۱۸% پایین بود، اگرچه دقت کاربر ۹۶٫۹۰% بود. مناطق مردابی اغلب برای کلاس های آب یا کشاورزی/علف اشتباه گرفته می شد. طبقه کشاورزی/علف نیز اغلب گیج شده بود. پیشنهاد میشود که این به دلیل جمعآوری تصویر در طول بیوماس اوج بود، زمانی که S. Alternifloraسبزترین و شبیه به یک محصول کشاورزی یا علف است. خارج از طبقههای مرداب و زمین برهنه، که برای مناطق شهری اشتباه گرفته شدهاند، تمام کلاسهای دیگر به دقت تولید حداقل ۹۰٫۰ درصد منجر میشوند.
۳٫۲٫ مقایسه نتایج طبقه بندی
طبقهبندیکننده DL U-Net توانست پیچیدگیهای محیط را بهتر از سایر طبقهبندیکنندههای ML هدایت کند و به دقت بالاتری دست یابد. شواهد این ادعا را می توان در سه حوزه زیر مجموعه با چالش های طبقه بندی یافت. شکل ۶ یک منطقه جنگلی و کشاورزی در شمال شهرستان بوفور را نشان می دهد. توسط U-Net به خوبی طبقه بندی شده است ( شکل ۶ A)، که اثر نمک و فلفل بسیار کمی را در طبقه بندی نشان می دهد. با این حال، SVM و RF ( شکل ۶ب، ج) بسته به رنگ فضای سبز، جنگل را به اشتباه به عنوان آب، مرداب یا سایه طبقه بندی کرد. بخشهایی از مرداب در لبه غربی تصویر توسط RF برای زمین خالی اشتباه گرفته شد، اگرچه طبقهبندیکنندههای U-Net و SVM عموماً آن را باتلاقی تشخیص دادند. SVM همچنین بخش های کوچکی از منطقه مرداب را به عنوان منطقه شهری به اشتباه طبقه بندی کرد. U-Net با مناطق مرطوب در داخل و اطراف آب های داخلی مبارزه کرد و پوشش گیاهی اطراف را به عنوان مرداب طبقه بندی کرد.
در زیرمجموعه دیگری که در حال توسعه است ( شکل ۷ )، U-Net ( شکل ۷ الف) یک بار دیگر مناطق برهنه را به درستی به همراه مناطق وسیع حومه شهر طبقه بندی می کند. SVM به طور مشابه بیشتر زمین های خالی و مناطق شهری را به درستی طبقه بندی کرد. با این حال، RF مناطق برهنه را به اشتباه به عنوان مناطق شهری طبقه بندی کرد. مشکل دیگر برای هر طبقهبندی، تمایز برخی مناطق تالاب و حوضچهها، در محلهها و زمینهای گلف، از باتلاق بود. SVM و U-Net گهگاه آن مناطق را به اشتباه طبقه بندی می کردند، در حالی که RF بیشترین مشکل را داشت. تقریباً هر آب داخلی توسط طبقهبندی کننده RF به اشتباه به عنوان مرداب طبقهبندی شد.
به خوبی شناخته شده است که ترسیم گستره مرداب دشوار است، به خصوص زمانی که دامنه جزر و مد در سراسر تصویر متفاوت است. این اختلافات جزر و مدی طبقه بندی باتلاق را برای هر طبقه بندی کننده در این مطالعه دشوار کرد ( شکل ۸). مارش گاهی به اشتباه به عنوان آب، شهری، زمین برهنه و حتی چمن طبقه بندی می شد. اگر تصاویر در شرایط جزر و مد در کل منطقه مورد مطالعه جمع آوری می شد، طبقه بندی می توانست دقیق تر باشد. رنگهای آبی، از آبی تا آبهای سبز پر از جلبک، طبقهبندی آب و علف را نیز دشوار میکرد. اطلاعات کمکی، مانند بافت، شاخصهای مبتنی بر RGB یا حتی یک DEM، ممکن است به تمایز بین برخی از کلاسهای مشکلدارتر کمک کند. برخی از مناطق داخلی در و اطراف حوضچه های کوچک نیز به اشتباه به عنوان مرداب طبقه بندی شدند. این شبیه RF است که تقریباً در هر حوضچه داخلی (همانطور که در شکل ۷ C نشان داده شده است) کلاس آب را از کلاس مرداب متمایز می کند .
۳٫۳٫ توسعه سواحل و تاثیر آن بر باتلاق ها
پس از اعمال طبقه بندی کننده DL U-Net برای هر دو تصویر ۲۰۱۹ و ۲۰۰۹، تغییرات بین این دو تاریخ به صورت بصری و تا حد امکان از نظر کمی ارزیابی شد. طبقهبندی تصویر در سال ۲۰۰۹ برای طبقهبندی درست مردابها در برخی مناطق تلاش کرد و برخی از پیکسلها را بهعنوان توسعه (به عنوان مثال، طبقات شهری، چمن/کشاورزی یا زمین برهنه) به جای مرداب اختصاص داد. با این دانش، واضح است که چندین ناحیه که به عنوان ضرر یا سود باتلاق علامت گذاری شده اند، در واقع خطاهایی توسط طبقه بندی کننده بوده اند. این مناطق مورد بازرسی چشمی قرار گرفت. شکل ۹C,D دو منطقه را نشان می دهد که در آن تغییرات واقعی رخ داده است. در واقع، برخی از پوشش گیاهی مرداب از بین رفت. تلفات کلی سیستم مرداب ۳۳۰۰ هکتار برآورد شد. با این حال، به دلیل خطاهایی که به طور گسترده در سراسر کلاس مرداب ۲۰۰۹ شناسایی شده است، به ویژه، ارزیابی کمی از تلفات مرداب ممکن است کاملاً قابل اعتماد نباشد. برای تکرار مسائلی که در بالا توضیح داده شد، دقت تولیدکننده از کلاس مرداب در تصویر ۲۰۰۹ تنها ۶۵ درصد بود، که کمترین میزان در بین تمام کلاسها بود. این مرداب به دلیل درخشش خورشید و گاهی اوقات به دلیل سرسبزی بودن به عنوان منطقه شهری به اشتباه طبقه بندی می شد. ما از مشاهدات بصری متخصص استفاده کردیم تا مشخص کنیم که تلفات باتلاقی بسیار کمی در طول دوره ده ساله وجود داشته است. چند منطقه وجود داشت که وسعت پوشش گیاهی مرداب بین تاریخ ها گسترش یافته است ( شکل ۹A، B)، اما هیچ منطقه ای شناسایی نشده است که پوشش گیاهی یا گل و لای باتلاق به طور مستقیم تحت تأثیر توسعه در سیستم مرداب قرار گرفته باشد. سطوح جزر و مد، در هر دو تصویر، طبقه بندی و مقایسه را دشوار می کرد. علیرغم استفاده از یک کلاس جداگانه برای باتلاق های غوطه ور یا زیر آب، این مناطق جایی هستند که بسیاری از طبقه بندی های اشتباه در بین طبقه مرداب ها رخ داده است.
مناطق وسیعی از توسعه توسعه در سراسر شهرستان شناسایی شد. این مطالعه نشان می دهد که تقریباً ۷۱۰۲٫۷۴ هکتار از جنگل به دلیل سایر طبقات پوشش زمین (به عنوان مثال، شهری، زمین برهنه، و چمن / کشاورزی) از بین رفته است. برای اهداف مطالعه موردی، هر گونه جنگل از دست رفته به کلاس توسعه سطح ۱ توسعه تلقی شد. توسعه در شمال شهرستان بوفورت شامل مناطق کوچکی از شهری و مناطق وسیعی از توسعه کشاورزی بود. شهرستان بوفورت جنوبی بیشترین میزان رشد شهری را داشته است. شکل ۱۰منطقه توسعه در سراسر شهرستان را نشان می دهد. از سوی دیگر، برخی از مناطق شهری قبلاً از سال ۲۰۰۹ در طول ۱۰ سال گذشته طبیعی شدند. برخی از مناطق کشاورزی و شهری از سال ۲۰۰۹ توسط درختچه ها و درختان کوچک در طول دوره ده ساله غلبه کردند. سپس این مناطق اغلب به عنوان جنگل طبقه بندی می شدند و به عنوان زمین های توسعه یافته از دست رفته به حساب می آمدند.
۴٫ بحث
نتایج طبقهبندی DL، SVM، و RT در مقایسه با سایر مطالعات نقشهبرداری DL با مساحت بزرگ که شامل تالابها و سایر کلاسهای پوشش زمین پیچیده میشد، خوب بود. برای نقشه برداری تالاب در مقیاس بزرگ در سراسر آلبرتا کانادا، [ ۵۹ ] با استفاده از CNN عمیق، ۸۰٫۲٪ OA را به دست آورد. در مطالعهای با مقایسه RF، SVM و سه طبقهبندی کننده یادگیری عمیق دیگر برای طبقهبندی تالاب با استفاده از سیستمهای هوایی بدون سرنشین کوچک تصاویر وضوح فرافضایی، [ ۶۰ ] نشان داد که طبقهبندیکنندههای DL بهتر از طبقهبندیکنندههای SVM و RF عمل میکنند، بهویژه زمانی که تعداد نمونههای آموزشی انجام شده باشد. بالا طبقهبندیکنندههای RF و SVM به ترتیب به میزان ۶۵% و ۶۷% OA منجر شدند. طبقه بندی کننده های DL منجر به OA از ۷۶٪ تا ۸۴٪ شد. به طور مشابه، نتایج ما از ادعاهای ارائه شده توسط [ ۶۱] که CNN می تواند از طبقه بندی کننده های RF بهتر عمل کند. به طور خاص، نشان داده شده است که U-Net از طبقه بندی SVM و RF برای نقشه برداری تالاب با استفاده از تصاویر ۱۰ متری Sentinel-2 بهتر عمل می کند. مرجع. [ ۳۱ ] کشف کردند که طبقهبندیکنندههای SVM و RT تنها به ترتیب به OA 50.5% و ۴۶٫۴% میرسند، در حالی که طبقهبندی کننده U-Net به طور مرتب بسته به تابع بهینهسازی مورد استفاده، حداقل به ۸۵% میرسد. مطالعه ما نشان میدهد که تصاویر NAIP با وضوح بالاتر شامل جزئیات فضایی کافی برای بهبود OA تا سطوح دقت شناساییشده هستند (به عنوان مثال، U-Net = 92.4٪، SVM = 81.6٪، و RT = 75.7٪). هنگام استفاده از داده های تفکیک مکانی مشابه، از ماهواره Worldview 3، برای طبقه بندی تالاب های جنگلی با استفاده از DL CNN، [ ۶۲] سطوح دقت مشابهی را با مطالعه ما (۹۲٪) پیدا کرد، زمانی که فقط از تصاویر نوری استفاده شد.
در این مطالعه، هر سه طبقهبندی کننده در طبقهبندی موزاییکهای تصویر هوایی بزرگ و پیچیده، شایستگی مناسبی از خود نشان دادند. کاربردهای دیگر، که این طبقهبندیکنندهها، بهویژه طبقهبندیکننده DL U-Net با بالاترین کارایی، ممکن است مورد استفاده قرار گیرند، شامل نقشهبرداری پوشش درختی، ارزیابی بلایا با استفاده از تصاویر مستقیماً پس از یک رویداد طوفانی یا بلایای طبیعی، طبقهبندی تصاویر sUAS و نقشهبرداری در سطح گونهها هستند. طبقهبندیکنندهها را میتوان برای این اهداف مناسب در نظر گرفت، زیرا نتایج این مطالعه نشان میدهد که تصاویر با وضوح بالا میتوانند به سرعت و با دقت بالا پردازش شوند. در برخی از این مثال ها، زمان می تواند عامل مهمی باشد. در این مطالعه نشان داده شده است که طبقه بندی کننده های SVM و RF نتایج کافی را به سرعت (۲ تا ۳ ساعت) حتی برای مسافت ۲۴۰۰ کیلومتر مربعی بزرگ ارائه می دهند .، منطقه مطالعه
هنگام طبقهبندی باتلاق جزر و مدی ساحلی در شهرستان بوفورت برای این مطالعه با چالشهای متعددی مواجه شد. مانور جزر و مد، و سطح آب به طور کلی، یک چالش مهم در هنگام استفاده از تصاویر سنجش از دور برای نقشه برداری از تالاب های ساحلی، از جمله باتلاق های جزر و مدی ساحلی است [ ۶۳ ]. این امر بهویژه در این مطالعه مشهود بود، بهعنوان یک رویداد در تصاویر NAIP، برای یک شهرستان، تفاوت قابلتوجهی در بین کاشیهایی که تصویر را در سطوح جزر و مد تشکیل میدادند، وجود داشت. این یکی از مشکلات عمده در طبقه بندی مرداب بود. سایر شرایط محیطی، مانند پوشش ابر و سایههایی که توسط اجسام بلند (مانند ساختمانها، درختان، و برجهای آبی) ایجاد میشوند، تالابهای هدف را پنهان میکنند، علائم طیفی پیچیدهای را ایجاد میکنند و تفسیر یا استفاده از تصاویر نوری را دشوار میکنند [ ۶۴ ]]. فنولوژی گیاهی نیز در طبقه بندی تصاویر نقشی ایفا کرد. شرایط اوج زیست توده برای مدلسازی ویژگیهای سلامت گیاه، مانند زیست توده، بهترین است و میتواند در نقشهبرداری برخی از گونههای تالاب ساحلی مفید باشد [ ۶۵ ، ۶۶ ]. تصویر سال ۲۰۰۹ در آوریل گرفته شد، که در مراحل ابتدایی رشد و سبز شدن S. Alterniflora ، چمن باتلاقی غالب در شهرستان بوفورت است. تصاویر ۲۰۱۹ در اواخر آگوست و اوایل سپتامبر گرفته شده است که در اوج زیست توده S. Alterniflora است [ ۶۷ ]]. هر سه طبقه بندی کننده در طبقه بندی کلاس مرداب در تصاویر ۲۰۱۹ موفق تر از طبقه بندی کننده U-Net در تصویر ۲۰۰۹ بودند. ما پیشنهاد می کنیم که فنولوژی گیاه، همراه با سطوح جزر و مد در سراسر هر تصویر، عامل مهمی در این نتایج بود.
مجموعه دادههای NAIP تصاویر هوایی با وضوح بالا، با پتانسیل زیادی برای نقشهبرداری پوشش گیاهی، بهویژه زمانی که در شرایط برگی به دست میآیند، ارائه میکنند. در حالی که ما مقدار زیادی موفقیت در نقشه برداری طبقات مختلف، از جمله کلاس مرداب پیدا کردیم، تصاویر NAIP RGB به تنهایی برای غلبه بر همه پیچیدگی های محیط تالاب ساحلی کافی نبود. برای طبقه بندی بهتر باتلاق جزر و مد ساحلی، به ویژه پوشش گیاهی و گل و لای، استفاده از داده های سنجش از راه دور کمکی مناسب است. این فرآیند که ادغام داده نامیده می شود، می تواند برای توصیف و طبقه بندی بهتر تالاب ها استفاده شود [ ۶۸ ]. ادغام داده ها را می توان در سطح پیکسل، سطح ویژگی و سطوح تصمیم گیری انجام داد. [ ۶۹ ]، همانطور که در [ ۷۰ ] توضیح داده شد]، دریافتند که آنها می توانند طبقه بندی پوشش زمین را با ادغام داده های چند طیفی با داده های راداری بهبود بخشند. در حالی که افزایش دقت کلی (OA) اندک بود، برخی از زیر کلاس ها بهبود یافتند، در حالی که برخی دیگر اندکی در دقت طبقه بندی کاهش یافتند. مرجع. [ ۷۱] تلفیقی از تصاویر چند طیفی، با مجموعه دادههای ارتفاعی مشتقشده از LiDAR را برای نقشهبرداری زمینهای پیت در کانادا، با ۷۶.۴ درصد OA، در مقابل تنها دستیابی به ۶۵.۸ درصد با باندهای RGB و IR به کار برد. ادغام داده ها می تواند اطلاعات بهتری را برای تصمیم گیرندگان فراهم کند. به عنوان مثال، افزودن یک باند NIR یا شاخص گیاهی، مانند شاخص گیاهی تفاوت نرمال شده (NDVI)، تمایز بیشتری بین پوشش گیاهی مرداب و گل و لای، و همچنین پوشش گیاهی مرداب از سایر طبقات گیاهی ایجاد میکند. دادههای ارتفاعی که از LiDAR یا منابع دیگر به دست میآیند، استخراج ویژگیهای درختان، کشاورزی، و علفها را از علفهای مرداب و همچنین گل و لای بهبود میبخشد.
سوگیری ها و خطاهای بالقوه، معرفی شده در مطالعه، ممکن است در انتخاب AOI های آموزشی و اعتبارسنجی توسط محققان معرفی شوند. تعصب بالقوه با درگیر کردن چندین ساکن درازمدت شهرستان، که تصاویر هوایی را تفسیر کردند و چند ضلعی های آموزشی و اعتبارسنجی را بر اساس دانش گسترده محلی انتخاب کردند، کاهش یافت.
کار آینده باید داده های کمکی از راه دور را در فرآیند طبقه بندی بگنجاند تا دقت طبقه بندی را افزایش دهد. همانطور که قبلاً گفته شد، سایر باندها و شاخصهای طیفی، دادههای ارتفاعی، و تصاویر از مقیاسهای دیگر (یعنی سیستمهای هوایی بدون سرنشین کوچک) باید برای تولید محصول همجوشی دادهای با دقت بالقوه بالاتر مورد بررسی قرار گیرند. نتایج طبقهبندیهای LU/LC را میتوان به عنوان ورودی مدلها برای پدیدههای دیگر، مانند کیفیت آب استفاده کرد [ ۷۲]. کیفیت آب عنصر دیگری است که می تواند بر سلامت مرداب تأثیر بگذارد. آزمایشهای بیشتر با دیگر طبقهبندیکنندههای پیکسل یادگیری عمیق موجود، مانند DeepLabv3، ابزارهای مفیدی برای بررسی هستند. این روشها میتوانند از طریق کاربرد و آزمایش در محیطهای ساحلی مشابه اعتبار بیشتری داشته باشند.
۵٫ نتیجه گیری ها
این مطالعه، DL را با طبقهبندیکنندههای سنتی ML، بر اساس طبقهبندی تصاویر با وضوح بالا در کل شهرستان ساحلی با استفاده از برنامههای رابط کاربری گرافیکی از ArcGIS Pro 2.8.1 مقایسه کرد. مطالعه موردی ما سپس از نقشههای LU/LC در سالهای ۲۰۱۹ و ۲۰۰۹ برای شناسایی الگوهای تغییر باتلاق نمک در یک دوره ۱۰ ساله استفاده کرد. نتایج نشان داد که یک طبقهبندیکننده U-Net DL به طور قابلتوجهی از طبقهبندیکنندههای دیگر برای طبقهبندی مجموعه دادههای پیچیده، با وضوح بالا و در سطح شهرستان، از نظر OA (92.4٪ در مقابل ۸۱٫۶٪ توسط SVM و ۷۵٫۷٪ توسط SVM) بهتر عمل کرد. RF). الگوریتمهای DL که اکنون برای هر مدیر ساحلی یا تحلیلگر GIS با دسترسی به ArcGIS pro Esri در دسترس است، کاربرد بالای خود را برای نقشهبرداری منطقه بزرگ نشان داد. با استفاده از منابع محاسباتی که معمولاً در دسترس مدیران ساحلی و تحلیلگران حرفه ای GIS است، طبقهبندی U-Net به زمان بیشتری برای طبقهبندی مجموعه داده بزرگ نیاز داشت (۴۶ ساعت کل در مقابل ۵.۳۳ و ۴.۸۳ ساعت). از آنجایی که این مورد در سایر متون، در مورد سایر طبقهبندیکنندههای U-Net یافت نشد، ما معتقدیم زمان لازم برای طبقهبندی تابعی از مجموعه دادههای بزرگ، منابع محاسباتی و ساختار مدل DL است. مطالعه ما بر طبقهبندیکنندههای DL و ML از دیدگاه مدیر محیطی یا ساحلی متمرکز بود. یافتهها آینده روشنی را برای طبقهبندی DL و ML LU/LC برای نقشهبرداری با مساحت بزرگ نشان میدهد، حتی برای کسانی که برنامهنویسی پیچیده و پسزمینه DL یا ML ندارند. مطالعه موردی ما قدرت استفاده از این ابزارها را برای تشخیص تغییر نشان داد و مناطق وسیعی از توسعه را در یک دوره ۱۰ ساله در سراسر شهرستان نشان داد که ممکن است بر سلامت مرداب تأثیر بگذارد. تحقیقات بیشتری برای تأیید یافتهها و آزمایش روشهای مشابه در محیطهای پیچیده ساحلی مشابه مورد نیاز است. داده های سنجش از راه دور کمکی اضافی، از جمله تصاویر چند طیفی و فراطیفی، LiDAR و RADAR، می توانند برای بهبود دقت طبقه بندی ادغام شوند.