ارزیابی انتخاب متغیر و الگوریتم‌های یادگیری ماشین برای تخمین ارتفاعات جنگل با ترکیب داده‌های Lidar و فراطیفی

خلاصه

یادگیری ماشین برای کارهای مختلف نقشه برداری و مدل سازی با استفاده از متغیرهای ورودی از منابع مختلف داده های سنجش از دور استفاده شده است. برای انتخاب ویژگی شامل داده‌های ابعاد فضایی و طیفی بالا، روش‌های مختلفی توسعه یافته و در چارچوب یادگیری ماشین گنجانده شده است تا از یک فرآیند محاسباتی کارآمد و بهینه اطمینان حاصل شود. هدف این تحقیق ارزیابی دقت روش‌های مختلف انتخاب ویژگی و یادگیری ماشین برای تخمین ارتفاع جنگل با استفاده از AISA (طیف‌سنج تصویربرداری هوا برای کاربردها)، باندهای فراطیفی (۴۷۹ باند) و تشخیص و محدوده نور هوابرد (lidar) متریک ارتفاع (۳۶ متریک)، به تنهایی و ترکیبی انتخاب ویژگی و کاهش ابعاد با استفاده از Boruta (BO)، تجزیه و تحلیل اجزای اصلی (PCA)، بازپخت شبیه سازی شده (SA)، و الگوریتم ژنتیک (GA) در ترکیب با الگوریتم‌های یادگیری ماشین مانند اسپلاین رگرسیون تطبیقی ​​چند متغیره (MARS)، درخت‌های اضافی (ET)، رگرسیون برداری پشتیبانی (SVR) با تابع پایه شعاعی، و تقویت گرادیان شدید (XGB) با درخت‌ها (XGbtree) و XGBdart) و طبقه بندی خطی (XGBlin) مورد ارزیابی قرار گرفتند. نتایج نشان داد که ترکیب‌های BO-XGBdart و BO-SVR بهترین عملکرد مدل را برای تخمین ارتفاع جنگل‌های استوایی با ترکیب داده‌های لیدار و ابرطیفی با R ارائه کردند.۲ = ۰٫۵۳ و RMSE = 1.7 متر (۱۸٫۴٪ از nRMSE و ۰٫۰۴۶ متر بایاس) برای BO-XGBdart و R2 = ۰٫۵۱ و RMSE = 1.8 متر (۱۵٫۸٪ از nRMSE و ۰٫۲۴۴- متر سوگیری) برای BO-XGB. مطالعه ما همچنین اثربخشی BO را برای انتخاب متغیرها نشان داد. می تواند ۹۵ درصد از داده ها را کاهش دهد تا ۲۹ متغیر مهم از ۵۱۶ متغیر اولیه از معیارهای لیدار و داده های فراطیفی انتخاب شود.

کلید واژه ها:

ارتفاع جنگل ; انتخاب ویژگی ؛ کاهش ابعاد ; لیدار ; فراطیفی AISA

چکیده گرافیکی

۱٫ معرفی

ویژگی‌های ساختاری جنگل منابع اطلاعاتی حیاتی برای اندازه‌گیری و پایش بیومس بالای زمینی (AGB) هستند که برای پیش‌بینی مقدار ذخایر کربن در توده‌های جنگلی استفاده می‌شود [ ۱ ، ۲ ، ۳ ]. داده های زیست توده دقیق به منظور نظارت بر پیشرفت به سمت کاهش ۵٫۲ درصدی انتشار کربن در مقایسه با سطوح سال ۱۹۹۰ مورد نیاز است که توسط ۳۷ کشور در پروتکل کیوتو از کنوانسیون چارچوب سازمان ملل متحد در مورد تغییر آب و هوا (UNFCC) مورد توافق قرار گرفته است [۴ ] . علاوه بر این، ویژگی‌های ساختاری جنگل برای استنباط شرایط جنگل، و همچنین برای ارزیابی زیستگاه و تنوع زیستی در ساختارهای جنگلی، به‌ویژه برای ارگانیسم‌های تاج‌نشین مهم هستند [ ۵ ، ۶ ،۷ ].
UNFCC سه سطح دقت را برای نقشه برداری انتشار کربن، از مقیاس ملی تا منطقه ای و جهانی، تعیین کرده است، که در آن سنجش از دور به عنوان یکی از فناوری های امیدوارکننده برای نقشه برداری این ویژگی ها شناخته شده است. اندازه گیری کربن به طور سنتی با نمونه برداری از نمودار میدانی، با دقت بالا انجام شد. با این حال، این روش گران و زمان بر بود [ ۱ ، ۸ ، ۹ ]. بنابراین، توسعه فناوری‌های سنجش از دور که می‌توانند مناطق وسیع‌تری از منطقه‌ای (۱۰۰۰ کیلومتر مربع ) تا جهانی (۱۰ ۸ ثانیه کیلومتر مربع) نقشه‌برداری کنند.) مقیاس‌ها در سطوح بالایی از جزئیات به طور گسترده برای نقشه‌برداری و مدل‌سازی ویژگی‌های ساختاری جنگل مورد بررسی قرار گرفته‌اند. با این حال، نقشه برداری از ویژگی های ساختاری جنگل با استفاده از سنجش از دور هنوز یک کار چالش برانگیز است، به ویژه هنگامی که با محیط های پیچیده جنگلی سروکار داریم. بنابراین، ارزیابی بیشتر مربوط به عدم قطعیت های استفاده از روش های سنجش از دور برای نقشه برداری از ویژگی های ساختاری جنگل مورد نیاز است [ ۱۰ ].

۱٫۱٫ سنجش از دور برای مدل‌سازی ویژگی‌های ساختاری جنگل

متغیرهای ساختاری جنگل مجموعه پیچیده ای از ویژگی ها هستند که مقادیر و توزیع فضایی اجزای جنگل، از جمله برگ ها و شاخه ها را به تصویر می کشند [ ۱۱ ]. این متغیرها، از جمله ارتفاع درخت، قطر در ارتفاع سینه (DBH)، سطح پایه، و AGB، از داده‌های چند / فراطیفی [ ۱۲ ، ۱۳ ]، پراکندگی برگشتی شدت رادار [ ۱۴ ، ۱۵ ] و متریک‌های ارتفاع از هر دو مدل بزرگ مدل‌سازی شده‌اند. – و داده های لیدار با ردپای کوچک [ ۲ ، ۱۶ ، ۱۷]. به دلیل ناتوانی روش‌های سنجش از دور برای اندازه‌گیری مستقیم ویژگی‌های ساختاری جنگل، آنها معمولاً با پیوند داده‌های موجودی نمودار میدانی با معیارهای سنجش از دور از طریق مدل‌سازی تجربی با استفاده از تحلیل تک یا چند متغیره اندازه‌گیری می‌شوند.
تجزیه و تحلیل تک متغیره با استفاده از متغیرهای منفرد از معیارهای سنجش از راه دور دارای چندین محدودیت است. برای مثال، رابطه قوی بین شاخص‌های پوشش گیاهی چندطیفی پهنای باند و شاخص سطح برگ، دقت پیش‌بینی را برای اندازه‌گیری مناطق جنگلی پیچیده با تراکم بالا کاهش می‌دهد [۱۸]، در حالی که پراکندگی پس‌انداز راداری برای سطوح زیست توده بیش از ۱۰۰ میلی‌گرم در هکتار به اشباع می‌رود. ۱۵ ] و همچنین تحت تأثیر سطوح بارندگی است. اشباع پس پراکندگی رادار و تأثیر سطوح بارندگی باعث افزایش سطح رطوبت خاک و پوشش گیاهی و کاهش دامنه دینامیکی پس پراکندگی رادار می شود، در نتیجه حساسیت مدل را کاهش می دهد [۱۴، ۱۹ ، ۲۰ ] .]. مناسب‌ترین فناوری سنجش از دور برای اندازه‌گیری ویژگی‌های ساختاری جنگل، استفاده از داده‌های لیدار است که می‌تواند اندازه‌گیری دقیق و دقیق ارتفاع زمین و اجسام را فراهم کند و امکان اندازه‌گیری ویژگی‌های اجسام بالای زمینی را فراهم کند که نزدیک به ویژگی‌های ساختاری جنگل هستند. هاید و همکاران [ ۱ ] دریافتند که عملکرد داده های لیدار را می توان با ترکیب حسگرهای لیدار با سنسورهای دیگر افزایش داد.
مدل‌سازی چند حسگر، مانند ترکیب لیدار و سایر حسگرهای سنجش از راه دور، می‌تواند عملکرد مدل‌سازی ویژگی‌های ساختاری جنگل، عمدتاً زیست توده جنگل‌های استوایی را افزایش دهد و می‌تواند دقت استاندارد برای فعالیت‌های نظارت، گزارش و تأیید (MRV) را برآورده کند. با این حال، عملکرد و دقت ترکیب چند حسگر می تواند متفاوت باشد [ ۲۱ ، ۲۲ ]. بهبود هنگام ترکیب داده‌های سنجش از دور چندحسگر مختلف ناشی از ویژگی‌ها یا معیارهای منحصربه‌فردی است که هر داده می‌تواند ایجاد کند، که می‌تواند دقت مدل‌سازی ویژگی‌های ساختاری جنگل را افزایش دهد. زولکوس، گوتز و دوبایه [ ۲۱] اشاره کرد که لیدار به شدت با نیمرخ های عمودی درختان مطابقت دارد. حسگرهای نوری غیرفعال اطلاعاتی را در مورد گونه‌ها و انواع جنگل‌ها ارائه می‌کردند و رادار تنوع شاخ و برگ درختان و شاخه‌ها را از طریق مقادیر پس‌پراکندگی فراهم می‌کرد. در همین حال، لو، چن، وانگ، لیو، لی و موران [ ۲۲ ] ویژگی‌های احتمالی فضایی، طیفی و ارتفاعی را که می‌توان به طور جداگانه از منابع مختلف داده‌های سنجش از دور (RS) از حسگرهای فعال و غیرفعال تولید کرد، فهرست کرد. در مدلسازی اموال ساختاری جنگل استفاده شده است. بنابراین، بررسی بهینه‌سازی احتمالی مدل همجوشی چندحسی برای نقشه‌برداری ساختار جنگل ضروری است [ ۲۲ ].

۱٫۲٫ اهداف

تحقیقات قبلی نشان داده‌اند که ترکیب داده‌های سنجش از دور، به‌ویژه آنهایی که حسگرهای غیرفعال و فعال دارند، می‌تواند دقت نقشه‌برداری و مدل‌سازی پارامترهای ساختاری جنگل را بهبود بخشد. متغیرهای بیشتری در مدل‌سازی استفاده می‌شوند که می‌توانند زمان محاسبات و پیچیدگی مدل را افزایش دهند و بر دقت طبقه‌بندی کننده تأثیر بگذارند [ ۲۳ ، ۲۴ ]. علاوه بر این، نفرین ابعاد بیشتر الگوریتم های یادگیری ماشین را تحت تاثیر قرار می دهد، به طوری که بهینه سازی برای انتخاب متغیرهای مهم ضروری است [ ۲۵]]. بنابراین، این مطالعه بهترین ترکیب بین استراتژی‌های انتخاب متغیر و الگوریتم‌های یادگیری ماشین را برای مدل‌سازی با استفاده از داده‌های ورودی با ابعاد بالا بررسی می‌کند. چندین استراتژی انتخاب متغیر، مانند Boruta (BO)، تجزیه و تحلیل مؤلفه اصلی (PCA)، بازپخت شبیه‌سازی شده (SA) و الگوریتم‌های ژنتیک (GAs)، با الگوریتم‌های یادگیری ماشینی مانند درخت‌های اضافی (ET)، ماشین بردار پشتیبانی ترکیب شدند. SVM) با هسته تابع پایه شعاعی، و خانواده ای از الگوریتم های تقویت گرادیان شدید (XGB)، از جمله تقویت کننده خطی XGB (XGBlin)، تقویت کننده درختی XGB (XGBtree) و تقویت کننده درخت رگرسیون XGB (XGBdart). ارتفاع جنگل با استفاده از متغیرهای جمع‌آوری‌شده از AISA (طیف‌سنج تصویربرداری هوا برای کاربردها)، داده‌های فراطیفی (۴۷۹ باند) و معیارهای آماری ارتفاع لیدار در هوا (۳۷ متغیر) مدل‌سازی شد.

۲٫ مواد و روشها

۲٫۱٫ سایت مطالعه

این مطالعه در رابسون کریک، جنگل های بارانی کوئینزلند دور شمال، کوئینزلند، استرالیا، که بخشی از منطقه زیستی Wet Tropics واقع در امتداد خط ساحلی و در مجاورت دیواره مرجانی بزرگ است، انجام شد. منطقه رابسون کریک یک جنگل بارانی استوایی است که توسط جنگل‌های انبوه انگور نوتوفیل تسلط دارد که بالاترین زیست توده را در استرالیا در خود جای داده است [ ۲۶ ]. منطقه مورد مطالعه در شمال شرقی آترتون، در دامنه های غربی رشته بره در پارک دانبولا، کوئینزلند، استرالیا واقع شده است. میانگین ارتفاع آن ۷۰۰ متر، شدت بارندگی ۲۳۰۰ میلی متر و دمای متوسط ​​آن ۱۹ درجه سانتی گراد است. جنگل های این ناحیه تحت سلطه جنگل های انگور ساده نوتوفیل با ارتفاع متوسط ​​۲۶ تا ۴۰ متر است. یک منطقه شبکه ای ۵۰۰ × ۵۰۰ متر با مقادیر متوسط ​​زیست توده ۴۱۸٫۵ میلی گرم در هکتار [ ۲۷]]، واقع در ۱۴۵٫۲۳۲ درجه شرقی و ۱۷٫۱۲ درجه جنوبی در نهر رابسون، به عنوان محل مطالعه در این منطقه استفاده شد ( شکل ۱ ).

۲٫۲٫ داده ها

۲٫۲٫۱٫ مجموعه داده های فیلد

داده های صحرایی از مطالعه برادفورد، متکالف، فورد، لیدل، گرین و مک کیون [ ۲۷ ] به دست آمد که سرشماری از درختان با قطر در ارتفاع سینه (DBH)> 10 سانتی متر در پارک ملی دانبولا در شمال غربی انجام داد. آترتون، کوئینزلند شمالی دور، استرالیا. سایت مطالعه نهر رابسون یک قطعه دائمی به مساحت ۲۵ هکتار است که شامل قطعات ۱۰۰×۱۰۰ متری و قطعات چهارگانه ۲۰×۲۰ متری است. این منطقه توسط شبکه تحقیقاتی اکوسیستم زمینی و تحقیقات جنگل های استوایی CSIRO مدیریت می شود. از دسامبر ۲۰۰۹ تا دسامبر ۲۰۱۲، این منطقه برای جمع آوری داده های گونه های گیاهی و پیکربندی ساختارهای درختی، از جمله ارتفاع درختان (متر)، به ویژه برای درختان با DBH بالای ۱۰ سانتی متر مورد بررسی قرار گرفت.
در بررسی میدانی، تقریباً ۲۳۰۰۰ درخت منفرد، متعلق به ۲۰۹ گونه، نقشه برداری و با استفاده از سیستم GPS تفاضلی Trimble Pro XRT، مجهز به سیگنال OmniSTAR DGPS با دقت انحراف استاندارد ۲٫۳ متر و ۱٫۸ متر اندازه گیری شدند. گونه های گیاهی این منطقه توسط Litsea leefeana ، Cardwellia sublimis ، Findersia bourjotiana ، Elaeocarpus largiflorens و Alphitonia whitei غالب هستند که ۲۸ درصد از گونه های این منطقه را تشکیل می دهند. ارتفاع پوشش گیاهی از ۲ تا ۱۲۰ متر، با میانگین ارتفاع ۱۸٫۴ متر و متوسط ​​DBH 20.9 سانتی متر متغیر بود ( جدول ۱). در زمین‌های مزرعه، هیچ نشانه‌ای از اغتشاش دست‌ساخته وجود نداشت، از جمله نشانه‌هایی برای درمان‌های جنگلی با آخرین قطع درختان انتخابی که بین سال‌های ۱۹۶۰ و ۱۹۶۹ انجام شد، همانطور که در مطالعه برادفورد، متکالف، فورد، لیدل، گرین و شرح داده شد. مک کیون [ ۲۷ ].
۲٫۲٫۲٫ داده های فراطیفی
سیستم فراطیفی SPECIM AISA متشکل از دو حسگر فراطیفی عقاب و هاوک است که در زیر بال هواپیمای تحقیقاتی ARA (انجمن تحقیقات هواپیما) ECO-Dimona نصب شده‌اند. این داده ها در ۱۳ و ۱۴ سپتامبر ۲۰۱۲ به دست آمدند. سنسور Eagle دارای ۲۵۲ باند طیفی، از ۴۰۰٫۷ تا ۹۹۹٫۲ نانومتر، با ۲٫۲ تا ۲٫۴۵ نانومتر نیمه حداکثر پهنای کامل (FWHM) است، در حالی که حسگر هاوک دارای ۲۲۹ باند از ۲۲۹۳ است. به ۲۴۹۷٫۴ نانومتر، با ۶٫۲۲ تا ۶٫۳۲ نانومتر FWHM ( جدول ۲ )، با عرض نواری ۲۹۶ پیکسل. نمونه هایی از پاسخ های طیفی پوشش گیاهی در مناطق مورد مطالعه از سنسورهای ایگل و هاوک در شکل ۲ ارائه شده است.. تصاویر در ارتفاع ۵۰۰ متری از سطح زمین به دست آمد که منجر به وضوح فضایی ۳۰ سانتی متر تا ۱ متر شد و حسگرها در حالت فشار جارو کار کردند. سپس داده‌ها با استفاده از ماژول FLAASH (تجزیه و تحلیل اتمسفری خط دید سریع ابرمکعب‌های طیفی) در ENVI 4.8 از نظر اتمسفر به مقادیر بازتاب تصحیح شدند. داده‌ها برای ناهنجاری متقاطع تصحیح شدند تا اثرات روشن‌کننده اندام یا لبه را حذف کنند، که مقدار پیکسل‌های واقع در سراسر مسیر پرواز را تغییر می‌دهد [ ۲۸ ].
۲٫۲٫۳٫ Lidar Metrics
داده‌های لیدار بازگشت گسسته با ردپای کوچک در این مطالعه استفاده شد. داده‌ها از لیدار شکل موج کامل با استفاده از ابزار Riegl Q560 که در زیر بال هواپیمای ECO-Dimona ARA نصب شده بود، تولید شد و همزمان با اندازه‌گیری‌های فراطیفی گرفته شد. حسگر لیدار در ارتفاع ۳۰۰ متری از سطح زمین با سرعت ۴۰ متر بر ثانیه ضبط کرد و توزیع نقطه ای ۰٫۳۰ متری در طول مسیر و در سراسر مسیر با قطر کمتر از ۰٫۱۵ متر برای هر پالس ایجاد کرد تا نقطه لیدار تولید کند. ابرها پرواز لیدار برای اطمینان از نرخ نفوذ بالاتر و بازگشت اول/آخرین بالاتر به زمین نزدیک‌تر بود که برای ارزیابی دارایی ساختاری جنگل مفید بود [ ۲۹ ، ۳۰ ].
پردازش لیدار با تولید لیدار نرمال شده ارتفاع آغاز شد. برای ایجاد لیدار نرمال‌شده با ارتفاع، داده‌های لیدار خام با استفاده از سطح درون‌یابی شبکه نامنظم مثلثی (TIN) با استفاده از بازگشت‌های زمینی نرمال‌سازی شدند. حسگر لیدار قادر به ثبت بازگشت‌های چندگانه از یک پالسی بود که به چندین جسم برخورد می‌کند، با اولین بازگشت بالاترین شیء است، و بازگشت زمین را می‌توان از شدت بالای آخرین بازگشت زمانی که ردپای بزرگ لیدار استفاده شد، شناسایی کرد [۳۱ ]]، اگرچه همه بازده های آخر را نمی توان به عنوان بازده زمینی طبقه بندی کرد. روش دیگری برای تشخیص بازگشت زمین را می توان از بازگشت لیدار شناسایی کرد، که تنها یک بازگشت دارد، که معمولاً زمانی اتفاق می افتد که پالس به یک جسم جامد یا یک سطح برخورد می کند. فرآیند عادی سازی ارتفاع در محیط R با استفاده از بسته “LidR” [ ۳۲ ] انجام شد. مقایسه لیدار غیر نرمال شده و لیدار نرمال شده ارتفاع در شکل ۳ ارائه شده است .
برای استخراج معیارهای آماری ارتفاع لیدار، تابع “standard_z” در بسته “LidR” [ ۳۲ ] برای استخراج معیارهای استاندارد لیدار محاسبه شده با استفاده از مقادیر ارتفاع استفاده شد. این فرآیند ۳۶ معیار شطرنجی را ایجاد کرد که ویژگی‌های آماری ابرهای نقطه‌ای را در یک سطل ۵ × ۵ متر مربع نشان می‌داد . معیارهای ارتفاع تاج پوشش اضافی (CHMs) با استفاده از الگوریتم بدون گودال توسعه یافته توسط خسروی پور و همکاران ایجاد شد. [ ۳۳ ] برای محاسبه بی‌نظمی‌های ارتفاع تاج و حذف حفره‌ها از داده‌های نهایی CHM. بنابراین، در مجموع از ۳۷ متغیر لیدار برای مدل‌سازی ارتفاع جنگل استفاده شد ( جدول ۳ ).

۳٫ روش شناسی

۳٫۱٫ انتخاب ویژگی و کاهش ابعاد

۳٫۱٫۱٫ اجرای تصادفی جنگل در بوروتا

بوروتا توسط Kursa و Rudnicki [ ۳۴ ] توسعه داده شد و به عنوان یک پوشش در اطراف الگوریتم جنگل تصادفی (RF) طراحی شد. الگوریتم اصلی RF می تواند متغیرهای قابل توجهی را با در نظر گرفتن کاهش دقت زمانی که جایگشت متغیرهای ورودی انجام می شود، تعیین کند. با این حال، در BO، متغیرهای مهم با معرفی متغیرهای سایه تولید شده با به هم زدن تصادفی مقادیر مشخصه برای استفاده در طبقه‌بندی RF در کنار متغیرهای اصلی تعیین می‌شوند. سپس، یک جستجوی تکراری برای مجموعه‌ای از متغیرهای اصلی که عملکرد بهتری از متغیرهای سایه دارند، با ارجاع به Z-score به عنوان معیاری برای کاهش دقت انجام می‌شود. شبه کد BO را می توان در Paja و همکارانش یافت. [ ۳۵ ] مطالعه کنید.
Boruta در انواع مختلف مدل‌سازی یادگیری ماشین برای انتخاب متغیر، از جمله مدل‌سازی فرسایش خندقی [ ۳۶ ]، مدل‌سازی ضخامت ذغال سنگ نارس [ ۳۷ ]، و نقشه‌برداری و مدل‌سازی دیجیتال خاک [ ۳۸ ، ۳۹ ] اجرا شده است. همچنین برای انتخاب باند ابرطیفی [ ۳۶ ] برای کاهش تعداد باندهای مورد استفاده در آنالیز استفاده شده است . در این تحقیق، بوروتا با تعداد تکرار و تعداد درخت به ترتیب ۲۰۰ و ۱۰۰۰ درخت اجرا شد.
۳٫۱٫۲٫ تجزیه و تحلیل مؤلفه های اصلی
PCA یک روش کلاسیک برای فشرده سازی ابعاد داده ها با چرخش داده ها بر اساس جهت اکثر توزیع داده ها در فضاهای n بعدی است. اولین مؤلفه اصلی (PC) ایجاد می شود، در حالی که رایانه دوم به سمت عمود بر اولی هدایت می شود و به همین ترتیب، باندهای رایانه شخصی را با اعدادی برابر با تعداد باندهای ورودی ایجاد می کند [۴۰ ]]. باندهای PC به شدت با یکدیگر همبستگی ندارند و بیشترین واریانس موجود در داده های اصلی را دارند، مخصوصاً برای اولین باندهای رایانه شخصی. بنابراین، تجزیه و تحلیل PCA برای کاهش ابعاد از داده های بسیار همبسته در حالی که اکثر اطلاعات ذخیره شده در داده های اصلی را حفظ می کند، مفید است. تجزیه و تحلیل همچنین می تواند برای کاهش نویز در داده های اصلی با تبدیل / چرخش باندهای PCA به داده های اصلی گسترش یابد. PCA عمدتاً برای طبقه‌بندی با استفاده از داده‌های فراطیفی استفاده می‌شود، و هنگامی که داده‌های با ابعاد بالا با همبستگی بالا بین متغیرها استفاده می‌شد، منجر به دقت ناپایدار می‌شود. این کاهش دقت هنگام استفاده از داده های با ابعاد بالا معمولاً به عنوان پدیده “هیوز” نامیده می شود [ ۴۱ ].
در مطالعه ما، PCA در چندین مجموعه داده برای اندازه‌گیری عملکرد باندهای رایانه شخصی هنگام استفاده در مدل‌سازی با استفاده از الگوریتم‌های یادگیری ماشین استفاده شد. در اینجا، PCA برای داده های فراطیفی هر حسگر (سنسورهای ایگل و هاوک) و معیارهای آماری لیدار اعمال شد. ده باند PC اول از هر طیف الکترومغناطیسی و متریک لیدار استخراج شد. بنابراین، تعداد کل متغیرهای PC برای استفاده به عنوان ورودی برای الگوریتم‌های یادگیری ماشین ۳۰ بود. انتخاب تعداد ثابتی از باندهای رایانه شخصی از هر مجموعه داده به دلیل دشواری ارزیابی خودکار مؤلفه‌های معنادار باندهای رایانه شخصی انجام شد. بدون ارزیابی بصری [ ۴۲ ]. پردازش با استفاده از تابع “rasterPCA” در بسته RSToolbox در R [ ۴۳] انجام شد.]. خروجی استاندارد شد (مقیاس و مرکز) به طوری که تعیین اهمیت متغیر از باندهای PC می تواند از بارهای عامل رایانه شخصی شناسایی شود.
۳٫۱٫۳٫ بازپخت شبیه سازی شده
SA یک استراتژی انتخاب ویژگی غیر قطعی است که از یک تابع احتمالی استفاده می کند [ ۴۴ ]. این استراتژی انتخاب متغیر که برای بهینه‌سازی چند متغیره استفاده می‌شود، فرآیند مکانیک آماری دستیابی به تعادل حرارتی در انجماد فلز یا شیشه را تقلید می‌کند [ ۴۵ ]. تابع احتمال در SA از یک فرآیند جستجو ساخته می‌شود که به زیرمجموعه‌های آزمایشی اجازه می‌دهد که تابع هدف را با کنترل محدوده متغیرهای دما و طرح خنک‌کننده بدتر می‌کنند و فرآیند فیزیکی بازپخت را تقلید می‌کنند [۴۶ ] . شبه کد SA را می توان در مطالعه قیاس و اسمیت [ ۴۷ ] یافت. در این مطالعه، SA با استفاده از یک لفاف RF در بسته Caret [ ۴۸] اجرا شد]. یک اعتبارسنجی متقاطع سه برابری با ۱۰۰۰ تکرار برای ایجاد انتخاب متغیر و R2 با اندازه گیری تناسب اجرا شد . ما همچنین مقادیر بهبود را با ۵۰ تکرار تنظیم کردیم، به این معنی که اگر در تکرار ۵۰ پس از یافتن بهترین ترکیب، بهبودی حاصل نشد، الگوریتم با استفاده از آخرین بهترین ترکیب، شبکه جستجو را بازنشانی می‌کند. این به منظور جلوگیری از گیر افتادن در حداکثرهای محلی انجام شد.
۳٫۱٫۴٫ الگوریتم ژنتیک
GA همچنین یک استراتژی غیر قطعی برای انتخاب متغیر است. این استراتژی مراحل تکامل طبیعی را برای یافتن بهترین ترکیب متغیرها (یا کروموزوم) از طریق فرآیندهای زیر تقلید می کند: (۱) انتخاب بر اساس معیار تناسب برای ایجاد نامزد والد از ترکیب اولیه تصادفی، (۲) ترکیب ژن از دو والدین، و (۳) جهش ژنها در کروموزوم والدین (یا ترکیب متغیر) با چرخاندن تصادفی ژن [ ۴۹ ، ۵۰ ]. شبه کد GA را می توان در مطالعات Chau و همکارانش یافت. [ ۵۱ ] و قیاس و اسمیت [ ۴۷]. این سه فرآیند به طور مکرر انجام می شوند تا زمانی که معیار توقف برآورده شود. یعنی هیچ پیشرفت قابل توجهی در سطح تناسب اندام یافت نشد یا تعداد تکرارهای تعیین شده به دست آمد. در این مطالعه، مشابه SA، GA با استفاده از یک لفاف RF در Caret، با اجرای اعتبار متقاطع سه برابری برای ۱۰۰۰ تکرار و ضریب تعیین (R2) به عنوان معیار تناسب اجرا شد . علاوه بر این، از همان تنظیمات بهبود که در SA استفاده می‌شود، برای یافتن بهترین ترکیب محلی و در عین حال اجتناب از به دام افتادن در حداقل/حداکثر محلی استفاده شد.

۳٫۲٫ الگوریتم یادگیری ماشین

۳٫۲٫۱٫ Spline رگرسیون تطبیقی ​​چند متغیره

اسپلاین رگرسیون تطبیقی ​​چند متغیره (MARS) روشی است که توسط فریدمن [ ۵۲ ] توسعه یافته و توسط فریدمن و روزن [ ۵۳ ] به تفصیل توضیح داده شده است. این شامل استفاده از یک تابع پایه spline برای ساخت یک مدل غیر خطی دقیق از داده‌های با ابعاد بالا است. برخلاف تابع اسپلاین استاندارد، مدل غیر خطی برای شبیه به تقریب کلی توزیع داده ها با تقسیم پیش بینی کننده ها به چندین تابع خطی بر اساس مفاصل یا گره های شناسایی شده ساخته شد. شبه کد برای الگوریتم MARS را می توان در مطالعه Alkaim و Al-Janabi [ ۵۴] یافت.]. MARS در انواع مختلفی از مدل‌سازی چند متغیره استفاده شده است و گزارش شده است که عملکرد بهتری از سایر الگوریتم‌های مدل‌سازی دارد، مانند مدل افزایشی تعمیم‌یافته برای توزیع گونه‌ها [۵۵]، Cubist برای مدل‌سازی AGB [ ۵۶ ]، حداکثر احتمال، و موازی برای طبقه‌بندی پوشش زمین. [ ۵۷ ]؛ با این حال، دقت MARS ممکن است به اندازه پیکسل داده‌های مورد استفاده در مدل‌سازی وابسته باشد [ ۵۸ ]. این مطالعه از پیاده سازی MARS در بسته “زمین” به نام تابع قطار “Caret” [ ۵۹ ] استفاده کرد.
۳٫۲٫۲٫ درختان اضافی
RF، توسعه یافته توسط Breiman [ ۶۰ ]، یک روش مجموعه کیسه‌ای است که در سال‌های اخیر در مطالعه سنجش از دور برای رگرسیون و طبقه‌بندی محبوبیت پیدا کرده است. این به دلیل تعداد کم پارامترهای مورد استفاده در تجزیه و تحلیل و عملکرد قابل مقایسه آن با سایر روش های یادگیری ماشین مانند SVM است [ ۶۱ ]. علاوه بر این، الگوریتم به دلیل فرآیند موازی در ایجاد مجموعه طبقه‌بندی‌کننده‌ها، و از نظر محاسباتی فشرده‌تر است، کمتر مستعد بیش‌برازش است [ ۶۲ ]. RF چندین طبقه‌بندی درختی را از زیرمجموعه تصادفی داده‌ها ترکیب می‌کند و مقدار نهایی را از اکثریت رای (طبقه‌بندی) یا میانگین (رگرسیون) تعیین می‌کند [ ۶۳ ].
این مطالعه از گسترش اجرای اصلی RF، به اصطلاح درختان یا درختان اضافی تصادفی (ET)، در بسته “extraTrees” استفاده کرد [ ۶۴ ]. این الگوریتم توسط Geurts و همکاران توسعه داده شده است. [ ۶۵ ]، که استراتژی تقسیم گره ها را با استفاده از یک زیرمجموعه تصادفی از بهترین ویژگی و ویژگی های مربوطه اصلاح کردند و هر طبقه بندی درخت را با استفاده از کل مجموعه داده به جای زیرمجموعه تصادفی داده ها در RF اصلی آموزش دادند. مطالعه Geurts، Ernst و Wehenkel [ ۶۵ ] نیز جزئیات و شبه کد را برای الگوریتم ET فهرست کردند. بنابراین، مدل ET کمتر احتمال دارد که بیش از حد برازش کند، و تصادفی سازی در فرآیند تقسیم گره، واریانس را بهتر از RF اصلی کاهش می دهد و سوگیری را به حداقل می رساند [ ۶۵]]. علاوه بر این، همچنین گزارش شده است که الگوریتم در فرآیندهای آموزشی و پیش‌بینی سریع‌تر است، با دقتی که با RF کیسه‌بندی اصلی مقایسه می‌شود [ ۶۶ ، ۶۷ ، ۶۸ ]. علاوه بر این، ET مورد استفاده برای طبقه بندی پوشش زمین در سنجش از دور گزارش شده است که دقت بهتری نسبت به RF و SVM اصلی ارائه می دهد [ ۶۹ ].
۳٫۲٫۳٫ افزایش گرادیان شدید
تقویت شیب شدید (XGB) نیز یک روش مجموعه ای است که بر اساس استراتژی تقویت به جای استراتژی بسته بندی در RF است. استراتژی تقویت با ارزیابی عملکرد از دست دادن مجموعه ساخته شده قبلی و تعیین وزن به خطای طبقه‌بندی قبلی هنگام ساخت و اصلاح مجموعه جدیدی از طبقه‌بندی‌کننده‌ها [ ۷۰ ] عمل می‌کند. این مطالعه از اجرای خطی، درختی و DART XGB در بسته “xgboost” [ ۷۱ ] استفاده کرد که بر اساس الگوریتم تقویت گرادیان توسط فریدمن [ ۷۲ ] است. جزئیات، مراحل و شبه کدهای الگوریتم های XGB در Chen و Guestrin [ ۷۳] ارائه شد.]. الگوریتم XGB قادر به انجام وظایف طبقه بندی و رگرسیون در چندین برنامه از جمله سنجش از راه دور است. محبوبیت روزافزون این روش به دلیل دقت و پایداری بهتر یا قابل مقایسه آن نسبت به الگوریتم های دیگر، مانند RF و SVM برای طبقه بندی پوشش زمین در مناطق شهری است. SVM برای مدل سازی تابش خورشیدی جهانی؛ SVM، RF و رگرسیون فرآیند گاوسی برای مدل‌سازی AGB حرا، و ET، SVM و RF برای نقشه‌برداری پوشش گیاهی با وضوح بالا [ ۷۴ ، ۷۵ ، ۷۶ ، ۷۷ ].
۳٫۲٫۴٫ رگرسیون برداری پشتیبانی
SVM که توسط Cortes و Vapnik [ ۷۸ ] توسعه یافته است، یک الگوریتم یادگیری ماشینی است که داده‌های ورودی را به فضایی با ابعاد بالا تبدیل می‌کند تا جداسازی خطی بهینه بین خوشه‌های مختلف داده را امکان‌پذیر سازد. با تنظیمات اضافی حاشیه نرم و هسته، SVMها داده‌ها را با یک مدل سطح خطی یا ابر صفحه جدا می‌کنند و داده‌ها را در فضایی با ابعاد بالاتر برای تطبیق با جداسازی خطی کلاس قرار می‌دهند [۷۹ ] . جزئیات و شبه کدهای SVM را می توان در گزارش آلوگانی و همکاران یافت. [ ۸۰ ]. این روش را می توان برای کارهای طبقه بندی و رگرسیون استفاده کرد و هنگامی که برای دومی استفاده می شود، این روش به عنوان رگرسیون بردار پشتیبان (SVR) نیز شناخته می شود [ ۸۱]. هر دو SVR و SVM به طور گسترده برای بسیاری از مطالعات سنجش از دور، به ویژه برای انجام مدل‌سازی از داده‌های با ابعاد بالا استفاده شده‌اند [ ۸۲ ]. علاوه بر این، SVM و SVR آسان برای استفاده، قوی، و کمتر مستعد نویز از داده های ورودی هستند [ ۸۳ ]. در این مطالعه، ما از SVR با هسته تابع پایه شعاعی در بسته R “kernlab” [ ۸۴ ] استفاده کردیم. هسته تابع پایه شعاعی متداول ترین تابع مورد استفاده در مدل سازی خواص بیوفیزیکی پوشش گیاهی است [ ۷۷ ].

۳٫۳٫ ساخت مدل

در این مطالعه، هر روش کاهش ویژگی و تجزیه و تحلیل انتخاب که در بالا توضیح داده شد با یادگیری ماشین ترکیب شد. از آنجایی که چهار روش کاهش ویژگی و تجزیه و تحلیل انتخاب و شش الگوریتم یادگیری ماشین وجود داشت، ۲۴ ترکیب در این مطالعه آزمایش شدند. علاوه بر این، از سه سناریو از داده های ورودی استفاده شد: باندهای فراطیفی (HS)، لیدار CHM و متریک های ارتفاع (LD)، و داده های ابرطیفی و لیدار (ALL). بنابراین، ۷۲ ترکیب از داده‌های ورودی، روش‌های تحلیل انتخاب و کاهش ویژگی و الگوریتم‌های یادگیری ماشین در این مطالعه مورد آزمایش قرار گرفتند.
در ساخت مدل، داده های ورودی به داده های آموزشی و آزمایشی به نسبت ۷۰:۳۰ تقسیم شدند. هر مدل با استفاده از اعتبار سنجی متقابل پنج برابری، با R2 به عنوان معیار عملکرد مدل آموزش داده شد . بهینه‌سازی فراپارامتر از طریق یک جستجوی تصادفی با ۵۰ تکرار برای یافتن بهترین پارامتر برای هر الگوریتم یادگیری ماشین انجام شد. جستجوی تصادفی می‌تواند بهترین بهینه‌سازی را برای پارامتر تنظیم با زمان محاسبه نسبتاً سریع‌تر پیدا کند [ ۸۵ ].

۳٫۴٫ اعتبارسنجی مدل

تخمین خطای مدل‌ها برای تعیین اینکه کدام مدل‌ها سطوح پیش‌بینی بهتری دارند، انجام شد. تجزیه و تحلیل ریشه میانگین مربعات خطا (RMSE) برای تعیین میزان حاشیه خطا بین داده‌های نمودار میدانی پیش‌بینی‌شده و واقعی استفاده شد. مقدار RMSE با گرفتن جذر از اختلاف کوادرات پی پیش‌بینی‌شده و داده‌های میدانی Oi ، همانطور که در رابطه (۱) نشان داده شده است، محاسبه شد. معیارهای اضافی بایاس و RMSE نرمال شده (nRMSE) نیز برای ارزیابی خطای مدل‌های خروجی (معادلات (۲) و (۳)) اضافه شدند، که در آن از سوگیری برای تعیین اینکه آیا مدل خروجی مقادیر واقعی را بیش از حد یا کمتر برآورد می‌کند، استفاده شد. [ ۸۶] و nRMSE یک مقدار RMSE مقیاس‌شده است (می‌توان آن را با درصد نشان داد) که با استفاده از مقادیر حداکثر و حداقل جمعیت محاسبه می‌شود، که در آن مقادیر کوچک‌تر نشان‌دهنده تناسب بهتر مدل با مقادیر واقعی است.

آرماسE= ∑من=۱n(پمن – Oمن)۲n
nآرماسE (%)= آرماسE(مآایکس(Oمن) – ممنn (Oمن) × ۱۰۰
بمنآس= ∑من=۱n(پمن – Oمن)∑من=۱nOمن

که در آن n تعداد مشاهدات است. Oi مقدار مشاهده شده/واقعی است که اندازه گیری داده های میدانی است. Pi مدلی است که در رابطه با ویژگی‌های ساختار جنگل از مدل سنجش از دور پیش‌بینی شده است. RMSE، nRMSE و بایاس برای مدل های خروجی با استفاده از معیارهای [ ۸۷ ] و بسته hydroGOF [ ۸۸ ] محاسبه شد. ارزیابی خطا با استفاده از ۳۰ درصد از کل داده های میدانی (۳۶ امتیاز) انجام شد، در حالی که ۷۰ درصد باقی مانده از داده ها (۸۵ امتیاز) برای ساخت مدل استفاده شد.

این مطالعه را می توان در گردش کار زیر خلاصه کرد ( شکل ۴ ).

۴٫ نتایج

۴٫۱٫ انتخاب ویژگی و کاهش ابعاد

تجزیه و تحلیل انتخاب ویژگی و کاهش ابعاد با استفاده از Boruta (BO)، بازپخت شبیه‌سازی شده (SA)، الگوریتم ژنتیک (GA)، و تجزیه و تحلیل اجزای اصلی (PCA) انجام شد. این روش‌ها برای انتخاب متغیرهای معنی‌دار از باندهای فراطیفی AISA (479 متغیر)، معیارهای آماری لیدار (۳۷ متغیر)، و ترکیبی از هر دو مجموعه داده (۵۱۶ متغیر) برای مدل‌سازی داده‌های ارتفاع جنگل استفاده شدند. هر یک از چارچوب‌های انتخاب ویژگی و کاهش ابعاد برای سه مجموعه داده اعمال شد: باندهای فراطیفی، معیارهای ارتفاع لیدار، و ترکیبی از معیارهای فراطیفی و لیدار. انتخاب ویژگی، تعداد متفاوتی از متغیرها را شناسایی کرد، از ۴ تا ۱۳۳ متغیر ( جدول ۴ )، که برای مدل‌سازی ارتفاع جنگل مهم تلقی شدند.
از جدول ۴، GA و SA عموماً متغیرهای مهم تری را نسبت به BO شناسایی کردند. آنها محدوده ای از ۲۰٫۱۶% تا ۳۷٫۸۴% از تعداد کل متغیرها را شناسایی کردند، در حالی که BO محدوده ای از ۰٫۸۴% ​​تا ۷۲٫۹۷% را شناسایی کردند. متغیرهای مهم شناسایی شده بالاتر در BO زمانی به دست آمد که از آن برای انتخاب متغیرهای لیدار معنی‌دار استفاده شد. بوروتا با اندازه‌گیری تعداد دفعاتی که متغیرهای اصلی بهتر از متغیرهای سایه تولید شده به‌طور تصادفی عمل می‌کنند، متغیرهای معنی‌دار را شناسایی کرد و زمانی که فراوانی اهمیت برای متغیر به بالای ۹۵ درصد اطمینان رسید، متغیر را معنادار در نظر گرفت. بنابراین، به نظر می‌رسد که اکثر متغیرهای لیدار عملکرد بهتری نسبت به متغیرهای سایه دارند، بنابراین متغیرهای معنی‌دار بیشتری شناسایی می‌شوند. جزئیات متغیرهای انتخاب شده از BO را می توان در شکل ۵ مشاهده کرد.
شکل ۵ رتبه بندی اهمیت را با توجه به هر متغیر انتخاب شده نشان می دهد، جایی که مقدار بالاتر نشان دهنده عملکرد بهتر است. بر اساس نتایج انتخاب ویژگی از BO، لیدار عملکرد کلی بهتری نسبت به باندهای فراطیفی نشان داد زیرا متغیرهای لیدار بیشتر به عنوان معنی‌دار تشخیص داده شدند. تشخیص متغیرهای کمتر از معیارهای فراطیفی نشان‌دهنده عملکرد ضعیف بیشتر باندهای طیفی اصلی در برابر متغیرهای “سایه” تولید شده به‌طور تصادفی است. علاوه بر این، BO همچنین معیارهای CHM را به عنوان مهم‌ترین متغیرها، هم برای متغیرهای ترکیبی و هم برای معیارهای لیدار شناسایی کرد، در حالی که طول موج ۲۴۱۰ نانومتر در هاوک (H ۲۴۱۰) سنسور مهم ترین متغیر در بین حسگرهای فراطیفی (هم هاوک و هم ایگل) در نظر گرفته شد. با این حال، از نظر تعداد متغیرهای شناسایی شده از باندهای فراطیفی، حسگرهای ایگل عملکرد بهتری نسبت به هاوک داشتند، با متغیرهای شناسایی شده بیشتری از سنسورهای ایگل.
متأسفانه، هیچ رتبه‌بندی برای متغیرهای تولید شده از تحلیل‌های GA و SA وجود نداشت، زیرا خروجی‌های متغیرهای شناسایی شده به عنوان ترکیبی در نظر گرفته شد که بهترین عملکرد را ایجاد کرد، که با استفاده از تابع تناسب RMSE و R2 پس از ۱۰۰۰ تکرار اندازه‌گیری شد . با این حال، ترکیب شناسایی شده از متغیرهای مهم به طور قابل توجهی با نتایج BO متفاوت است. برای مثال، GA و SA باندهای فراطیفی بیشتری را نسبت به معیارهای لیدار شناسایی کردند، اگرچه اکثر متغیرهای شناسایی شده از حسگرهای Eagle بودند، مشابه نتایج تجزیه و تحلیل BO. علاوه بر این، بر خلاف نتایج BO، CHMها به عنوان متغیرهای مهم در GA و SA شناسایی نشدند.
نتایج متفاوتی با استفاده از تجزیه و تحلیل PCA ارائه شد، زیرا PCA بهترین متغیرها را انتخاب نکرد، بلکه داده ها را در یک PC فشرده کرد و بیشتر اطلاعات یا واریانس داده ها را حفظ کرد. در اینجا، ما از ۱۰ رایانه اول از معیارهای ارتفاع Eagle، Hawk و lidar استفاده کردیم. ۱۰ جزء اول داده های ایگل، هاوک و لیدار به ترتیب ۹۹٫۶۰ درصد، ۹۹٫۴۶ درصد و ۹۶٫۱۱ درصد واریانس تجمعی را ذخیره کردند. بیشتر واریانس در رایانه های شخصی اول تا سوم ذخیره می شد که می تواند ۸۱٪ تا ۹۰٪ از کل واریانس را تشکیل دهد. برای درک سهم هر متغیر در رایانه شخصی، فاکتورهای بارگذاری ۱۰ جزء اول در شکل ۶ ارائه شده است .
تجزیه و تحلیل بار عاملی نشان داد که برخی از باندهای فراطیفی و معیارهای ارتفاع لیدار سهم بیشتری نسبت به سایر متغیرها در هر مجموعه داده داشتند. در مجموعه داده Eagle، سهم بیشتری را می توان از طیف آبی (E ۴۰۱ تا E ۴۱۹ ) و طیف مادون قرمز نزدیک (E ۹۷۲ تا E ۹۹۹ ) یافت، در حالی که حسگرهای Hawk بارهای فاکتور بالایی را در طیف های مادون قرمز کوتاه نشان دادند (H ۱۷۶۷ تا H ۱۹۶۱ ). و H ۲۳۵۴ تا H ۲۴۱۰ ). در معیارهای ارتفاع لیدار، متغیرهای LD1 تا LD9 و LD27 تا LD36 بارهای فاکتور بالایی را نشان دادند، اگرچه، برخلاف نتایج BO، متریک CHM سهم بالایی در رایانه‌های شخصی نشان نداد.
نتایج انتخاب متغیر، ترکیبات متنوعی از متغیرهای معنادار را نشان داد، اگرچه تا حدودی همخوانی بین متغیرهای معنادار نیز مشاهده شد. سپس تمام متغیرهای شناسایی شده به عنوان متغیرهای ورودی برای مدل‌سازی یادگیری ماشین به کار گرفته شدند تا دقت مدل‌سازی در حین استفاده از مجموعه متغیرهای شناسایی شده تعیین شود.

۴٫۲٫ عملکرد مدل

عملکرد مدل‌های تولید شده با استفاده از الگوریتم‌های یادگیری ماشین در بسته Caret با استفاده از مقادیر R2 برای تعیین بهترین ترکیب پارامتر ممکن ارزیابی شد . در این مطالعه، مقادیر R2 و RMSE با استفاده از داده‌های آموزش و آزمایش محاسبه و برای ارزیابی عملکرد کلی مدل‌ها ارائه شد.
شکل ۷ عملکرد مدل‌های ارتفاعات جنگل را نشان می‌دهد که با استفاده از ۸۵ مجموعه داده (در اندازه نمودار ۵۰ × ۵۰ متر مربع ) از متریک‌های فراطیفی انتخاب شده تولید شده‌اند. به طور کلی، مدل تولید شده با استفاده از معیارهای فراطیفی دارای R2 از ۰٫۱۲۷ تا ۰٫۴۳۲ و RMSE از ۱٫۷۸ متر تا ۲٫۹۶۱ متر بود. بهترین عملکرد مدل با استفاده از مجموعه داده از ترکیب GA و XGBtree (R ۲ = ۰٫۴۳۲ و RMSE = 1.78 m) و GA و XGBdart (R ۲ = ۰٫۴۲۴ و RMSE = 1.79 m) به دست آمد. با این حال، فرآیند اعتبار سنجی با استفاده از داده‌های آزمایشی R2 کمتر اما مقادیر RMSE قوی‌تر را به همراه داشت ، به عنوان مثال، عملکرد اعتبارسنجی درخت GA-XGB با استفاده از داده‌های آزمایشی R2 است .از ۰٫۱۵، RMSE 1.37 متر، nRMSE = 19.60٪، و بایاس ۰٫۲۷۷-، نشان دهنده یک تناسب مدل پایین تر اما با خطای کمتر و یک دست کم برآورد کلی هنگام تایید با استفاده از داده های آزمایشی است. برخی از مدل‌های تولید شده در هنگام آزمایش با استفاده از داده‌های آزمایشی ( n = ۳۶)، مانند ترکیب PCA با MARS (افزایش خطای RMSE از ۱٫۹۵۶ متر (مدل) به ۲٫۵۴ متر، منجر به بیش‌برازش، با R2 کمتر یا افزایش RMSE شدند . (اعتبار سنجی) با nRMSE 26.7 درصد و بایاس ۰٫۷۶۳ (بیش برآورد)) و SVR (افزایش خطا از ۱٫۹۴۲ متر (مدل) به ۲٫۰۷ متر (اعتبارسنجی) با ۱۸٫۷ درصد nRMSE و ۰٫۲۵۲ (خطای بیش از حد) افزایش یافته است. مدل تولید شده زمانی که با داده هایی که در فرآیند ورودی استفاده نشده است آزمایش شود.
علاوه بر این، اگرچه بهترین عملکرد مدل توسط GA-XGBtree به دست آمد، بهترین عملکرد اعتبارسنجی با استفاده از داده های فراطیفی به تنهایی با استفاده از ترکیب BO و ET، با R2 از ۰٫۳۶، RMSE 1.16 متر، nRMSE 16.6 نمایش داده شد . درصد و بایاس ۰٫۰۸۶ متر. جدول کامل مقادیر nRMSE و بایاس را می توان در مواد تکمیلی یافت .
با مقایسه شکل ۷ و شکل ۸ در بالا، برخی از پیشرفت های قابل توجه را می توان در عملکرد مدل ها با استفاده از معیارهای لیدار انتخاب شده یافت. مدل‌های تولید شده توسط معیارهای لیدار منتخب عملکردی از ۰٫۲۷ تا ۰٫۵۰ (R2 ) و ۱٫۸۲ متر تا ۳٫۶۲ متر (RMSE) را به همراه داشت. بهترین عملکرد توسط معیارهای لیدار منتخب از ترکیب داده‌های PCA و SVR (R2 = 0.50 و RMSE = 2.2 متر) ایجاد شد ، در حالی که دومین مدل برتر از ترکیب GA و XGBtree (R2) ایجاد شد .= ۰٫۴۵ و RMSE = 1.87 متر). اگرچه ترکیب PCA و SVR بهترین عملکرد را در هنگام استفاده از معیارهای لیدار به همراه داشت، همچنان می‌توان مورد تطابق بیش از حد با داده‌های PCA را مشاهده کرد، همانطور که با افزایش RMSE و R2 پایین‌تر در هنگام آزمایش مدل با داده‌های آزمایش نشان داده شد ( R2 = ۰٫۳۱، RMSE = 2.2 متر، nRMSE = 20.70 درصد، سوگیری = ۰٫۰۱۲، n = ۳۶). علاوه بر این، ترکیب GA و XGBtree نیز R ۲ پایین تری ایجاد کردمقدار (۰٫۱۶ < 0.44) در فرآیند اعتبارسنجی، اما یک مقدار اعتبار RMSE بالاتر از مقدار RMSE در عملکرد مدل (۰٫۸۶ m > 1.86 m)، با nRMSE 19٪ و بایاس ۰٫۰۴۶۱-، که نشان می دهد مقادیر تولید شده مدل هستند. کمی کمتر از داده های میدانی واقعی است. با این حال، بهترین عملکرد مدل با استفاده از داده‌های فقط لیدار، از ترکیب SA-ET، با R ۲ از ۰٫۳۳، RMSE 0.94، nRMSE 17.3 درصد، و بایاس ۰٫۰۰۴- متر، و GA-MARS، با یک R2 از ۰٫۳۸، RMSE از ۱٫۰۹، nRMSE از ۱۶٫۷٪، و سوگیری -۰٫۴ متر، نشان دادن دست کم گرفتن کلی از مدل GA-MARS.
همانطور که در شکل ۹ خلاصه شده است، بهبودهای اضافی و بهترین عملکرد در میان مدل‌های دیگر با استفاده از لیدار و ابرطیفی تنها به عنوان داده‌های ورودی در مدل می‌تواند با استفاده از ترکیب داده‌های معیارهای لیدار و ابرطیفی به دست آید . مقادیر R2 از ۰٫۲۵ تا ۰٫۵۳ و RMSE از ۰٫۴۷ متر تا ۲٫۳ متر متغیر بود به طور کلی، انتخاب متغیر BO در این بخش از تجزیه و تحلیل بهتر عمل کرد، به طوری که بهترین و دومین عملکرد با ترکیب متغیرهای انتخاب شده BO با XGBdart (R2 = 0.53 و RMSE = ۱٫۷ متر) و SVR (R2 ) به دست آمد. = ۰٫۵۱ و RMSE = 1.8 متر)، به ترتیب. هر دو روش اعتبار R2 کمتری را به همراه داشتند(۰٫۴۳ < 0.53 در XGBdart) اما مقادیر RMSE با اعتبار بالاتر (۱٫۰۶ m > 1.7 m در XGBdart)، با nRMSE 15.8٪، که کمترین مقدار nRMSE در بین مدل‌های دیگر بود، و بایاس ۰٫۰۴۶، که نشان‌دهنده تخمین کمی از مقادیر است. از مدل BO-XGBdart. بایاس کامل و مقادیر nRMSE را می توان در مواد تکمیلی یافت .

۵٫ بحث

۵٫۱٫ بررسی اجمالی نتایج

این مطالعه ترکیبی از مجموعه داده‌های ورودی مختلف، روش‌های انتخاب متغیر و الگوریتم‌های یادگیری ماشین را برای مدل‌سازی ارتفاعات جنگل در رابسون کریک، جنگل‌های بارانی کوئینزلند دور شمال، کوئینزلند، استرالیا، با استفاده از فراطیفی و لیدار با وضوح فضایی بالا و ابعاد بالا مورد بررسی قرار داد. داده ها. به طور کلی، عملکرد اندازه‌گیری شده در تحلیل‌ها را می‌توان در سه عنوان خلاصه کرد: عملکرد مجموعه داده‌های ورودی مختلف، روش‌های مختلف انتخاب متغیر، و الگوریتم‌های مختلف یادگیری ماشین.
خلاصه ای از عملکرد مجموعه داده های ورودی را می توان در نمودارهای جعبه در شکل ۱۰ مشاهده کرد . این مدل را می‌توان با ترکیب داده‌های لیدار و ابرطیفی برای به دست آوردن میانگین عملکرد مدل ۰٫۴۱ (R2) و ۱٫۹ متر (RMSE) در مقایسه با زمانی که تنها معیارهای فراطیفی یا لیدار استفاده می‌شد، بهبود بخشید . با این حال، برخی از مدل‌های تولید شده با استفاده از معیارهای لیدار می‌توانند عملکرد مشابه یا بهتری را در مقایسه با مجموعه داده‌های ترکیبی/همه ایجاد کنند. در میان مجموعه داده ها، معیارهای لیدار بهترین مقادیر میانگین RMSE را به دست آوردند ( شکل ۱۰د). به‌علاوه، بهبودی که هنگام ترکیب داده‌های فراطیفی برای مدل‌سازی ارتفاع جنگل شناسایی شد، از نظر آماری معنی‌دار نبود، زیرا برخی از مدل‌هایی که از داده‌های لیدار استفاده می‌کنند، می‌توانند عملکرد تقریبا مشابه یا بهتری با زمان محاسبات کارآمدتر در مقایسه با مدل‌هایی که از مجموعه داده ترکیبی استفاده می‌کنند، ایجاد کنند. این یافته شبیه به یافته سواتانتران و همکاران است. [ ۸۹ ]، که از داده های فراطیفی لیدار و AVIRIS برای مدل سازی زیست توده جنگل استفاده کرد.
عملکرد بهتر لیدار نسبت به ابرطیفی انتظار می رود زیرا اندازه گیری لیدار به طور مستقیم با ساختار ارتفاع پوشش گیاهی در مقایسه با مقادیر طیفی ارائه شده در باندهای فراطیفی مطابقت دارد. مطالعات دیگر توانایی داده‌های لیدار را برای مدل‌سازی ارتفاع درخت (به‌ویژه تاج پوشش بلند بالای لایه) با دقت بالا نشان داده‌اند [ ۹۰ ]. نقشه‌های بهترین مدل‌های عملکرد اعتبارسنجی با استفاده از lidar (SA-ET)، فراطیفی (BO-ET)، و مجموعه داده‌های ترکیبی (BO-XGBdart) را می‌توان در شکل ۱۱ یافت . از روی نقشه ها می توان دریافت که حسگر فراطیفی قادر به به تصویر کشیدن نواحی بلندتر و کوتاه تر درخت نیست، همانطور که در نقشه های مبتنی بر ترکیب لیدار و لیدار-فوق طیفی (که با دایره های سبز در شکل ۱۱ مشخص شده است) نشان داده شده است .). شکل ۱۱ همچنین توانایی کمتر باندهای فراطیفی را به تنهایی در هنگام استفاده برای مدل سازی ساختار پوشش گیاهی در منطقه مورد مطالعه نشان می دهد. برخلاف حسگرهای لیدار، حسگرهای فراطیفی به ندرت برای مدل‌سازی ویژگی‌های ساختاری پوشش گیاهی، به‌ویژه ارتفاع، بدون ترکیب سایر مجموعه‌های داده استفاده می‌شوند. یک مطالعه توسط چو و همکاران انجام شد. [ ۹۱ ] که توانایی این حسگر را برای مدل‌سازی DBH و تراکم درختان بهتر از ارتفاع نشان داد، که برای تخمین زیست توده مفید خواهد بود، همانطور که توسط مطالعه Laurin و همکاران نشان داده شد. [ ۹۲ ]. با این وجود، هنوز هم می‌توان از حسگرهای فراطیفی برای نقشه‌برداری گونه‌های مختلف گیاهی برای تکمیل اطلاعات سایه‌بان سه بعدی از لیدار استفاده کرد [ ۲۵ ، ۹۳ ، ۹۴٫]. با این حال، باید توجه داشت که در جمع آوری داده های میدانی برای برخی نمودارهای گرفته شده در کمپین سرشماری قبلی (۲۰۰۹) و مشاهده پرواز (۲۰۱۲) تفاوت زمانی وجود داشت که ممکن است بر دقت مدل ها و نقشه های تولید شده در برخی موارد تأثیر بگذارد. مکان ها در منطقه مورد مطالعه
طیف مهم مربوط به ویژگی‌های ساختاری جنگل شناسایی‌شده در مطالعه چو، اسکیدمور و سبحان [ ۹۱ ] مشابه طیف‌های مهم شناسایی‌شده در مطالعه ما بود، به‌ویژه نتایج حاصل از BO. مطالعه چو، اسکیدمور و سبحان [ ۹۱ ] طیف لبه قرمز (۷۵۶ تا ۸۲۰ نانومتر)، طیف مادون قرمز نزدیک (۱۱۷۲ تا ۱۳۰۱ نانومتر)، و طیف مادون قرمز موج کوتاه (SWIR) (1953 تا ۱۹۷۲ نانومتر تا ۲۴۲ نانومتر) را شناسایی کردند. در حالی که تجزیه و تحلیل BO در مطالعه ما طیف های مهم ۷۶۹ نانومتر، ۸۰۴ نانومتر، ۱۹۲۴ نانومتر و ۲۴۱۰ نانومتر را به عنوان باندهای فراطیفی مهم برای مدل سازی ارتفاع جنگل پیدا کرد.
خلاصه ای از روش های مختلف انتخاب متغیر در شکل ۱۲ ارائه شده است . مقادیر متوسط ​​نمایش داده شده در شکل نشان می دهد که تفاوت معنی داری در مدل های خروجی تولید شده توسط متغیرهای ورودی از روش های مختلف انتخاب متغیر وجود ندارد. با این حال، BO مدل هایی با R ۲ بالاتر از ۰٫۴ به دست آورد ( شکل ۱۲ A). علاوه بر BO، GA می تواند متغیرهایی را انتخاب کند که می توانند برای تولید مدل هایی با RMSE کمتر استفاده شوند ( شکل ۱۲).ج، د). با این حال، GA (و SA) متغیرهای بیشتری (بیش از ۱۰۰ متغیر) را نسبت به BO انتخاب کردند، به‌ویژه زمانی که ورودی داده‌های با ابعاد بالا بود، که متعاقباً زمان محاسبات را در مراحل مدل‌سازی افزایش داد، بدون اینکه بهبود قابل‌توجهی در عملکرد مدل‌سازی مشاهده شود. همانطور که توسط لطیفی، فاسناخت و کخ [ ۲۵ ] پیشنهاد شده است، یک مدل با ۹ تا ۱۲ پیش بینی کننده برای تولید یک مدل دقیق برای ساختار جنگل کافی است که زمان محاسبه را نیز کاهش می دهد. علاوه بر این، زمان محاسبه از انجام GA در بسته Caret به طور قابل توجهی بیشتر از زمان محاسبه در BO یا SA بود، مشکلی که در مطالعات دیگر نیز گزارش شده است [ ۹۵ ].
بخش بعدی این بخش بحث، عملکرد روش های مختلف یادگیری ماشین را مورد بحث قرار می دهد. شکل ۱۳ خلاصه ای از عملکرد مدل سازی و اعتبارسنجی ۷۲ مدل تولید شده را نشان می دهد. اگرچه تفاوت ها معنی دار نبودند، اما سه روش مدل های کمی بهتر تولید کردند: ET، XGBtree و SVR. علاوه بر این، XGbtree، به طور خاص، نتیجه نسبتاً پایداری ایجاد کرد، همانطور که توسط مدل و آمار اعتبار سنجی نشان داده شده است، که ممکن است به دلیل عادی سازی تابع ضرر در XGBtree باشد، که می تواند احتمال بیش از حد برازش را کاهش دهد [۹۶ ] . عملکرد بهتر مدل یادگیری ماشین مبتنی بر درخت در مطالعه ما مشابه نتایج به‌دست‌آمده توسط Kattenborn و همکاران است. [ ۹۷] هنگام مقایسه جنگل های تصادفی با مدل رگرسیون تقویت کننده تعمیم یافته (GBM)، مدل افزایشی تعمیم یافته (GAM) و GAM تقویت شده برای مدل سازی زیست توده جنگل از ترکیب Hyperion، Worldview-2، و Tandem-X.

۵٫۲٫ بهبود آینده

مطالعه ما ترکیبی از روش‌های مختلف انتخاب و استخراج ویژگی و الگوریتم‌های یادگیری ماشین را برای مدل‌سازی ویژگی ساختاری جنگل با استفاده از داده‌های سنجش از دور بعد فضایی و طیفی بالا از حسگرهای هوابرد و حسگرهای ابرطیفی بررسی کرد. با این حال، توسعه سریع روش‌های انتخاب ویژگی هنوز هم فضایی را برای بهبود در این مطالعه باقی می‌گذارد. به عنوان مثال، کاوش الگوریتم‌های بهینه‌سازی الهام‌گرفته از طبیعت مختلف علاوه بر GA، مانند بهینه‌سازی ازدحام ذرات (PSO) و سایر تغییرات با توانایی حل مسئله محاسباتی چند جمله‌ای غیر قطعی [۹۸]، برای استفاده با داده‌های با ابعاد بالا . لازم است. مطالعه حامدیان فر و همکاران. [ ۹۹] برتری ترکیب PSO و XGB برای طبقه بندی پوشش اراضی کاربری اراضی را گزارش کرده است.
علاوه بر این، مطالعه ما یک نمای کلی از عملکرد ترکیب‌های مختلف روش‌های انتخاب ویژگی و یادگیری ماشین برای ارزیابی ساختاری جنگل ارائه داد. وجود حسگرهای ابرطیفی مبتنی بر ماهواره اخیر مانند PRecursore IperSpettrale della Missione Applicativa (PRISMA) [ ۱۰۰ ، ۱۰۱ ، ۱۰۲ ] و ارتفاع سنجی لیزری مبتنی بر ماهواره در تحقیقات دینامیک اکوسیستم جهانی ناسا (GEDI) مطالعات بیشتری را انجام خواهد داد [ ۱۰ ] با استفاده از ترکیب داده های چند سنسوری برای مثال، داده‌های GEDI با شدت پراکندگی راداری برای ارزیابی ساختاری جنگل ترکیب شده‌اند [ ۱۰۴]]. با افزایش داده‌های ماهواره‌ای از حسگرهای غیرفعال نوری (چند طیفی و فراطیفی) و حسگرهای فعال از رادار و لیدار، بهینه‌سازی گردش کار پردازش در قالب انتخاب متغیر و روش‌های یادگیری ماشین زمانی که ترکیبی از مجموعه داده‌های مختلف انجام می‌شود مورد نیاز است.

۶٫ نتیجه گیری

این مطالعه ترکیبی از داده‌های لیدار و ابرطیفی را با استفاده از ترکیب‌های مختلف روش‌های انتخاب متغیر و الگوریتم‌های یادگیری ماشین برای مدل‌سازی ارتفاعات جنگل در رابسون کریک، استرالیا بررسی کرد. در مجموع، ۷۲ مدل یادگیری ماشین از متغیرهای ورودی مختلف با استفاده از روش‌های مختلف انتخاب متغیر تولید شد و طیف وسیعی از عملکرد مدل به دست آمد. به طور کلی، هیچ تفاوت عملکرد قابل توجهی با ترکیب الگوریتم های مختلف انتخاب متغیر و یادگیری ماشین یافت نشد. با این حال، BO و GA برخی از خصوصیات را نشان دادند. آنها متغیرهای ورودی را تولید کردند که در طول فرآیند مدل سازی عملکرد بهتری داشتند. بوروتا به طور خاص می تواند تقریباً ۹۵٪ از داده های اصلی را تشخیص داده و حذف کند تا ۲۹ متغیر را شناسایی کند که مدل هایی با عملکرد مشابه یا بهتر در مقایسه با سایر مدل ها تولید می کنند. ترکیب Boruta و XGdart می تواند بهترین مدل عملکرد را در مطالعه ما ایجاد کند، با R2 = ۰٫۵۳ و RMSE = 1.7 متر، با ترکیب Boruta و SVR که دومین مدل بهترین عملکرد را به همراه دارد، با R2 = ۰٫۵۱ و RMSE = 1.8 متر. علاوه بر این، مطالعه ما همچنین عملکرد کلی بهتر XGBdart، XGBtree و SVR را هنگامی که با مجموعه داده‌های مختلف برای تخمین ارتفاع جنگل ترکیب می‌شوند، نشان داد. مطالعه ما نتایج بهینه‌سازی را با استفاده از استراتژی‌های مختلف انتخاب متغیر و روش‌های یادگیری ماشین برجسته کرد، که برای مطالعات آتی با استفاده از ترکیب داده‌های چند حسگر، مانند ابرطیفی مبتنی بر ماهواره، یعنی Hyperion و PRISMA، و ماهواره‌ها مفید خواهد بود. داده های ارتفاع سنجی لیزری، به عنوان مثال، ICESat GLAS و GEDI.

منابع

  1. هاید، پی. دبیه، ر. واکر، دبلیو. بلر، جی بی. هافتون، ام. هونساکر، سی. نقشه برداری ساختار جنگل برای تجزیه و تحلیل زیستگاه حیات وحش با استفاده از هم افزایی چند حسگر (LiDAR، SAR/InSAR، ETM+، Quickbird). سنسور از راه دور محیط. ۲۰۰۶ ، ۱۰۲ ، ۶۳-۷۳٫ [ Google Scholar ] [ CrossRef ]
  2. دریک، جی بی. دبیه، RO; کلارک، دی بی؛ ناکس، آر جی. بلر، جی بی. هافتون، مادر Chazdon، RL; ویشامپل، جی اف. Prince, S. برآورد ویژگی های ساختاری جنگل های استوایی با استفاده از لیدار با ردپای بزرگ. سنسور از راه دور محیط. ۲۰۰۲ ، ۷۹ ، ۳۰۵-۳۱۹٫ [ Google Scholar ] [ CrossRef ]
  3. کلارک، دی بی؛ کلارک، DA تنوع در مقیاس چشم انداز در ساختار جنگل و زیست توده در یک جنگل بارانی استوایی. برای. Ecol. مدیریت ۲۰۰۰ ، ۱۳۷ ، ۱۸۵-۱۹۸٫ [ Google Scholar ] [ CrossRef ]
  4. ونتر، او. Koh, LP کاهش انتشار گازهای گلخانه ای ناشی از جنگل زدایی و تخریب جنگل (REDD+): تغییر دهنده بازی یا فقط یک راه حل سریع دیگر؟ ان آکادمی نیویورک علمی ۲۰۱۲ ، ۱۲۴۹ ، ۱۳۷-۱۵۰٫ [ Google Scholar ] [ CrossRef ]
  5. پامرنینگ، الف. رویکردهای کمی سازی ساختارهای جنگلی جنگلداری ۲۰۰۲ ، ۷۵ ، ۳۰۵-۳۲۴٫ [ Google Scholar ] [ CrossRef ]
  6. Ingram, JC; داوسون، تی پی؛ Whittaker، RJ نقشه‌برداری ساختار جنگل‌های استوایی در جنوب شرقی ماداگاسکار با استفاده از سنجش از دور و شبکه‌های عصبی مصنوعی. سنسور از راه دور محیط. ۲۰۰۵ ، ۹۴ ، ۴۹۱-۵۰۷٫ [ Google Scholar ] [ CrossRef ]
  7. لساک، آا; Radeloff، VC; هاوبکر، تی جی؛ Pidgeon، AM; گوباکن، تی. Contrucci، K. مدل سازی غنای گونه های پرنده آوازخوان جنگل با استفاده از معیارهای مشتق شده از LiDAR از ساختار جنگل. سنسور از راه دور محیط. ۲۰۱۱ ، ۱۱۵ ، ۲۸۲۳-۲۸۳۵٫ [ Google Scholar ] [ CrossRef ]
  8. کوکالی، RF؛ کلارک، تعیین طیف‌سنجی RN بیوشیمی برگ با استفاده از آنالیز عمق باند ویژگی‌های جذب و رگرسیون خطی چندگانه گام به گام. سنسور از راه دور محیط. ۱۹۹۹ ، ۶۷ ، ۲۶۷-۲۸۷٫ [ Google Scholar ] [ CrossRef ]
  9. استویانوا، دی. پانوف، پی. جورجیوسکی، وی. کوبلر، ا. Džeroski، S. برآورد ارتفاع پوشش گیاهی و تاج پوشش از داده های سنجش از دور با یادگیری ماشین. Ecol. آگاه کردن. ۲۰۱۰ ، ۵ ، ۲۵۶-۲۶۶٫ [ Google Scholar ] [ CrossRef ]
  10. Lu, D. پتانسیل و چالش تخمین زیست توده مبتنی بر سنجش از دور. بین المللی J. Remote Sens. ۲۰۰۷ ، ۲۷ ، ۱۲۹۷-۱۳۲۸٫ [ Google Scholar ] [ CrossRef ]
  11. نادکارنی، ن.م. مک اینتاش، ACS؛ کوشینگ، JB چارچوبی برای طبقه بندی مفاهیم ساختار جنگل. برای. Ecol. مدیریت ۲۰۰۸ ، ۲۵۶ ، ۸۷۲-۸۸۲٫ [ Google Scholar ] [ CrossRef ]
  12. میونگ، اس. نواک، دی جی; Duggin، MJ تجزیه و تحلیل زمانی ذخیره‌سازی کربن جنگل‌های شهری با استفاده از سنجش از دور. سنسور از راه دور محیط. ۲۰۰۶ ، ۱۰۱ ، ۲۷۷-۲۸۲٫ [ Google Scholar ] [ CrossRef ]
  13. Heiskanen, J. تخمین بیوماس درختان بالای زمین و شاخص سطح برگ در جنگل توس کوهی با استفاده از داده های ماهواره ای ASTER. بین المللی J. Remote Sens. ۲۰۰۶ ، ۲۷ ، ۱۱۳۵-۱۱۵۸٫ [ Google Scholar ] [ CrossRef ]
  14. ریگنوت، ای. راه، جی. ویلیامز، سی. Viereck، L. رادار زیست توده بالای زمین را در جنگل های شمالی آلاسکا تخمین می زند. IEEE Trans. Geosci. Remote Sens. ۱۹۹۴ , ۳۲ , ۱۱۱۷-۱۱۲۴٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  15. Carreiras، JMB; Vasconcelos، MJ; لوکاس، RM درک رابطه بین زیست توده بالای زمین و داده های ALOS PALSAR در جنگل های گینه بیسائو (غرب آفریقا). سنسور از راه دور محیط. ۲۰۱۲ ، ۱۲۱ ، ۴۲۶-۴۴۲٫ [ Google Scholar ] [ CrossRef ]
  16. لفسکی، مادر؛ کوهن، WB; آکر، سا; پارکر، جی جی؛ جاسوس، تا; هاردینگ، دی. سنسور از راه دور محیط. ۱۹۹۹ ، ۷۰ ، ۳۳۹-۳۶۱٫ [ Google Scholar ] [ CrossRef ]
  17. آسنر، GP; ماسکارو، جی. مولر-لاندو، HC; ویلدنت، جی. وودری، آر. رسامولینا، م. هال، JS؛ ون بروگل، M. رویکرد جهانی LiDAR هوابرد برای نقشه‌برداری کربن جنگل‌های استوایی. Oecologia ۲۰۱۲ ، ۱۶۸ ، ۱۱۴۷-۱۱۶۰٫ [ Google Scholar ] [ CrossRef ]
  18. کلارک، ام ال. رابرتز، دا؛ ایول، جی جی. Clark، DB برآورد زیست توده جنگل های بارانی استوایی با سنسورهای لیدار و ابرطیفی با ردپای کوچک. سنسور از راه دور محیط. ۲۰۱۱ ، ۱۱۵ ، ۲۹۳۱-۲۹۴۲٫ [ Google Scholar ] [ CrossRef ]
  19. لوکاس، آر. آرمستون، جی. فیرفکس، آر. فنشم، آر. Accad، A.; کاریراس، جی. کلی، جی. بانتینگ، پ. کلولی، دی. بری، اس. و همکاران ارزیابی ALOS PALSAR L-Band Backscatter-Above Ground Biomass Relationship کوئینزلند، استرالیا: اثرات وضعیت رطوبت سطحی و ساختار پوشش گیاهی. IEEE J. Sel. بالا. Appl. زمین Obs. Remote Sens. ۲۰۱۰ , ۳ , ۵۷۶-۵۹۳٫ [ Google Scholar ] [ CrossRef ]
  20. مورل، AC; ساعتچی، اس.اس. ملحی، ی. بری، نیوجرسی؛ بنین، ال. برسلم، دی. نیلوس، آر. Ong، RC تخمین بیومس بالای زمین در جنگل و مزارع نخل روغنی در صباح، بورنئو مالزی با استفاده از داده های ALOS PALSAR. برای. Ecol. مدیریت ۲۰۱۱ ، ۲۶۲ ، ۱۷۸۶-۱۷۹۸٫ [ Google Scholar ] [ CrossRef ]
  21. زولکوس، اس. گوتز، اس. Dubayah, R. متاآنالیز تخمین زیست توده بالای زمینی با استفاده از سنجش از دور لیدار. سنسور از راه دور محیط. ۲۰۱۳ ، ۱۲۸ ، ۲۸۹-۲۹۸٫ [ Google Scholar ] [ CrossRef ]
  22. لو، دی. چن، کیو. وانگ، جی. لیو، ال. لی، جی. موران، ای. بررسی روش‌های تخمین زیست توده زیرزمینی مبتنی بر سنجش از دور در اکوسیستم‌های جنگلی. بین المللی جی دیجیت. زمین ۲۰۱۶ ، ۹ ، ۶۳-۱۰۵٫ [ Google Scholar ] [ CrossRef ]
  23. یانگ، جی. Honavar, V. انتخاب زیر مجموعه ویژگی با استفاده از الگوریتم ژنتیک. در استخراج، ساخت و انتخاب ویژگی ؛ Springer: Boston, MA, USA, 1998; صص ۱۱۷-۱۳۶٫ [ Google Scholar ]
  24. بانو، بی. Lin, Y. انتخاب ویژگی مبتنی بر الگوریتم ژنتیک برای تشخیص هدف در تصاویر SAR. تصویر Vis. محاسبه کنید. ۲۰۰۳ ، ۲۱ ، ۵۹۱-۶۰۸٫ [ Google Scholar ] [ CrossRef ]
  25. لطیفی، ح. Fassnacht، F. Koch، B. مدل‌سازی ساختار جنگل با داده‌های ترکیبی ابرطیفی هوا و LiDAR. سنسور از راه دور محیط. ۲۰۱۲ ، ۱۲۱ ، ۱۰-۲۵٫ [ Google Scholar ] [ CrossRef ]
  26. یوهانسن، ک. ترویتیک، آر. بردفورد، ام. هکر، جی. مک گرات، ا. Lieff, W. استرالیا نمونه هایی از کمپین های میدانی و هوایی AusCover. در دستورالعمل‌های عملکرد خوب AusCover: کتابچه راهنمای فنی پشتیبانی از کالیبراسیون و فعالیت‌های اعتبارسنجی محصولات داده‌های سنجش از راه دور، نسخه ۱٫۱٫ TERN AusCover ; TERN AusCover; دانشگاه کوئینزلند: سنت لوسیا، استرالیا، ۲۰۱۵; نسخه جلد ۱٫۱٫ [ Google Scholar ]
  27. بردفورد، ام. متکالف، دی. فورد، آ. لیدل، ام. گرین، پ. Mckeown، A. Floristics، ساختار توده و زیست توده بالای زمین از یک قطعه جنگل بارانی ۲۵ هکتاری در مناطق استوایی مرطوب استرالیا. جی تروپ. برای. علمی ۲۰۱۴ ، ۲۶ ، ۵۴۳-۵۵۳٫ [ Google Scholar ]
  28. شبیه سازی و تصحیح اثر لبخند طیفی و تأثیر آن بر نقشه برداری فراطیفی. پایان نامه کارشناسی ارشد، ITC Faculty Geo-Information Science and Earth Observation، Enschede، هلند، ۲۰۰۸٫ [ Google Scholar ]
  29. گودوین، NR; Coops، NC; Culvenor، DS ارزیابی ساختار جنگل با LiDAR هوابرد و اثرات ارتفاع پلت فرم. سنسور از راه دور محیط. ۲۰۰۶ ، ۱۰۳ ، ۱۴۰-۱۵۲٫ [ Google Scholar ] [ CrossRef ]
  30. تاکاهاشی، تی. آوایا، ی. هیراتا، ی. فورویا، ن. ساکائی، ت. Sakai, A. اثرات ارتفاع پرواز بر ارتفاعات درختان مشتق شده از LiDAR در جنگل های کوهستانی با نرخ نفوذ لیزر ضعیف. فتوگرام جی. فینل. ۲۰۰۸ ، ۲۱ ، ۸۶-۹۶٫ [ Google Scholar ]
  31. دبیه، RO; Drake، JB Lidar سنجش از دور برای جنگلداری. جی. برای. ۲۰۰۰ ، ۹۸ ، ۴۴-۴۶٫ [ Google Scholar ]
  32. راسل، ج.-ر. اوتی، دی. دی بویسیو، اف. Meador, A. lidR: Airborne LiDAR Data Manipulation and Visualization for Forestry Applications , R Package Version 1; ۲۰۱۸٫ در دسترس آنلاین: https://cran.r-project.org/web/packages/lidR/index.html (در ۲۲ اوت ۲۰۲۰ قابل دسترسی است).
  33. خسروی پور، ع. اسکیدمور، AK; ایزنبورگ، م. وانگ، تی. Hussin, YA تولید مدل های ارتفاع سایبان بدون گودال از هوابرد لیدار. فتوگرام مهندس Remote Sens. ۲۰۱۴ , ۸۰ , ۸۶۳-۸۷۲٫ [ Google Scholar ] [ CrossRef ]
  34. Kursa، MB; Rudnicki، WR انتخاب ویژگی با بسته Boruta. آمار نرم افزار ۲۰۱۰ ، ۳۶ ، ۱-۱۳٫ [ Google Scholar ]
  35. پاجا، دبلیو. پانسرز، ک. Grochowalski، P. حذف ویژگی نسلی و برخی دیگر از روش های انتخاب ویژگی رتبه بندی. در پیشرفت در انتخاب ویژگی برای داده ها و تشخیص الگو . Springer: Cham, Switzerland, 2018; صص ۹۷-۱۱۲٫ [ Google Scholar ]
  36. امیری، م. پورقاسمی، HR; قنبریان، ج.ا. افضلی، SFJG ارزیابی اهمیت عوامل موثر بر فرسایش خندقی با استفاده از الگوریتم بوروتا و مدل‌سازی و نقشه‌برداری فضایی آن با استفاده از سه الگوریتم یادگیری ماشین. Geoderma ۲۰۱۹ ، ۳۴۰ ، ۵۵-۶۹٫ [ Google Scholar ] [ CrossRef ]
  37. میناسنی، بی. ستیوان، BI; Saptomo، SK; مک براتنی، AB نقشه برداری دیجیتال باز به عنوان یک روش مقرون به صرفه برای نقشه برداری ضخامت ذغال سنگ نارس و ارزیابی ذخایر کربن تورب های گرمسیری. Geoderma ۲۰۱۸ ، ۳۱۳ ، ۲۵-۴۰٫ [ Google Scholar ]
  38. کسکین، اچ. گرونوالد، اس. هریس، WG نقشه برداری دیجیتالی کسر کربن خاک با یادگیری ماشینی. Geoderma ۲۰۱۹ ، ۳۳۹ ، ۴۰-۵۸٫ [ Google Scholar ] [ CrossRef ]
  39. خو، ی. اسمیت، SE; گرونوالد، اس. عبدالرحمن، ع. Wani، SP ادغام تصاویر سنجش از دور ماهواره‌ای به مدل‌های نقشه‌برداری و پیش‌بینی دیجیتال خاک برای توصیف تنوع خواص خاک در مزارع کشاورزی کوچک. ISPRS J. Photogramm. Remote Sens. ۲۰۱۷ ، ۱۲۳ ، ۱-۱۹٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  40. Jensen, J. Chapter 8. Image Enhancement. In Introductory Digital Image Processing: A Remote Sensing Perspective , ۵th ed.; پیرسون: Glenview، IL، ایالات متحده آمریکا، ۲۰۱۵; صص ۳۰۱-۳۲۲٫ [ Google Scholar ]
  41. ما، دبلیو. گونگ، سی. هو، ی. منگ، پی. Xu, F. پدیده هیوز در طبقه بندی فراطیفی بر اساس طیف زمینی مراتع در منطقه اطراف دریاچه چینگهای. در مجموعه مقالات سمپوزیوم بین المللی تشخیص و تصویربرداری فوتوالکترونیک ۲۰۱۳: فناوری ها و کاربردهای طیف سنج تصویربرداری، پکن، چین، ۲۵-۲۷ ژوئن ۲۰۱۳٫ پ. ۸۹۱۰۱٫ [ Google Scholar ]
  42. آسنر، GP; Knapp، DE; بوردمن، جی. گرین، RO؛ کندی-بودوین، تی. ایستوود، ام. مارتین، RE; اندرسون، سی. میدانی، CB Carnegie Airborne Observatory-2: افزایش ابعاد داده های علمی از طریق همجوشی چند سنسوری با وفاداری بالا. سنسور از راه دور محیط. ۲۰۱۲ ، ۱۲۴ ، ۴۵۴-۴۶۵٫ [ Google Scholar ] [ CrossRef ]
  43. لوتنر، بی. هورنینگ، ن. Leutner, MB Package ‘RStoolbox’ نسخه ۰٫۱; ۲۰۱۷٫ در دسترس آنلاین: https://cran.r-project.org/web/packages/RStoolbox/index.html (در ۲۲ اوت ۲۰۲۰ قابل دسترسی است).
  44. میری، ر. زهوی، ج. استفاده از بازپخت شبیه سازی شده برای بهینه سازی مسئله انتخاب ویژگی در برنامه های بازاریابی. یورو جی. اوپر. Res. ۲۰۰۶ ، ۱۷۱ ، ۸۴۲-۸۵۸٫ [ Google Scholar ] [ CrossRef ]
  45. کرک پاتریک، اس. Gelatt، CD; Vecchi، MP بهینه سازی با بازپخت شبیه سازی شده. Science ۱۹۸۳ , ۲۲۰ , ۶۷۱-۶۸۰٫ [ Google Scholar ] [ CrossRef ]
  46. بروسکو، MJ مقایسه الگوریتم های بازپخت شبیه سازی شده برای انتخاب متغیر در تجزیه و تحلیل مؤلفه های اصلی و تجزیه و تحلیل متمایز. محاسبه کنید. آمار داده آنال. ۲۰۱۴ ، ۷۷ ، ۳۸-۵۳٫ [ Google Scholar ] [ CrossRef ]
  47. غیاس، IA; اسمیت، LS انتخاب زیر مجموعه ویژگی در حوزه های ابعاد بزرگ. تشخیص الگو ۲۰۱۰ ، ۴۳ ، ۵-۱۳٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  48. کوهن، م. وینگ، جی. وستون، اس. ویلیامز، ای. کیفر، سی. انگلهارت، آ. کوپر، تی. مایر، ز. کنکل، بی. تیم اصلی R; و همکاران بسته Caret ; وین، اتریش، ۲۰۱۲٫ در دسترس آنلاین: https://cran.r-project.org/package=caret (در ۲۲ اوت ۲۰۲۰ قابل دسترسی است).
  49. تان، اف. فو، ایکس. ژانگ، ی. Bourgeois, AG یک روش مبتنی بر الگوریتم ژنتیک برای انتخاب زیر مجموعه ویژگی. محاسبات نرم. ۲۰۰۸ ، ۱۲ ، ۱۱۱-۱۲۰٫ [ Google Scholar ] [ CrossRef ]
  50. اورسکی، اس. Oreski، G. اکتشافی مبتنی بر الگوریتم ژنتیک برای انتخاب ویژگی در ارزیابی ریسک اعتباری. سیستم خبره Appl. ۲۰۱۴ ، ۴۱ ، ۲۰۵۲-۲۰۶۴٫ [ Google Scholar ] [ CrossRef ]
  51. Chau، AL; لی، ایکس. Yu, W. پشتیبانی از طبقه‌بندی ماشین بردار برای مجموعه داده‌های بزرگ با استفاده از درخت تصمیم و تشخیص خطی فیشر. ژنرال آینده. محاسبه کنید. سیستم ۲۰۱۴ ، ۳۶ ، ۵۷-۶۵٫ [ Google Scholar ] [ CrossRef ]
  52. فریدمن، JH خطوط رگرسیون تطبیقی ​​چند متغیره. ان آمار ۱۹۹۱ ، ۱۹ ، ۱-۶۷٫ [ Google Scholar ] [ CrossRef ]
  53. فریدمن، جی اچ. Roosen, CB Introduction to Multivariate Adaptive Regression Splines ; انتشارات Sage Sage CA: Thousand Oaks، CA، USA، ۱۹۹۵٫ [ Google Scholar ]
  54. القایم، اف. الجنابی، س. بهینه سازی چند هدفه برای کاهش شعله ور شدن گاز از تولید نفت. در مجموعه مقالات کنفرانس بین المللی در زمینه داده های بزرگ و فناوری های شبکه، لوون، بلژیک، ۲۹ آوریل تا ۲ می ۲۰۱۹؛ صص ۱۱۷-۱۳۹٫ [ Google Scholar ]
  55. لیثویک، جی. الیت، جی. Hastie, T. عملکرد مقایسه ای مدل های افزایشی تعمیم یافته و خطوط رگرسیون تطبیقی ​​چند متغیره برای مدل سازی آماری توزیع گونه ها. Ecol. مدل. ۲۰۰۶ ، ۱۹۹ ، ۱۸۸-۱۹۶٫ [ Google Scholar ] [ CrossRef ]
  56. فیلیپی، AM; Güneralp، İ. Randall, J. سنجش از دور فراطیفی زیست توده بالای زمین در خم پیچ رودخانه با استفاده از خطوط رگرسیون تطبیقی ​​چند متغیره و تقویت گرادیان تصادفی. سنسور از راه دور Lett. ۲۰۱۴ ، ۵ ، ۴۳۲-۴۴۱٫ [ Google Scholar ] [ CrossRef ]
  57. کویروس، ای. Felicísimo، Á.M. Cuartero، A. آزمایش خطوط رگرسیون تطبیقی ​​چند متغیره (MARS) به عنوان روشی برای طبقه‌بندی پوشش زمین تصاویر ماهواره‌ای TERRA-ASTER. Sensors ۲۰۰۹ , ۹ , ۹۰۱۱-۹۰۲۸٫ [ Google Scholar ] [ CrossRef ]
  58. Güneralp، İ. فیلیپی، AM; Randall, J. برآورد زیست توده بالای زمین دشت سیلابی با استفاده از سنجش از دور چند طیفی و مدلسازی ناپارامتریک. بین المللی J. Appl. زمین Obs. Geoinf. ۲۰۱۴ ، ۳۳ ، ۱۱۹-۱۲۶٫ [ Google Scholar ] [ CrossRef ]
  59. Milborrow, S. Package ‘Earth’ , R Package نسخه ۵٫۱٫۲; ۲۰۲۰٫ در دسترس آنلاین: https://cran.r-project.org/web/packages/earth/index.html (در ۲۲ اوت ۲۰۲۰ قابل دسترسی است).
  60. بریمن، L. جنگل های تصادفی. ماخ فرا گرفتن. ۲۰۰۱ ، ۴۵ ، ۵-۳۲٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  61. پال، M. طبقه بندی جنگل تصادفی برای طبقه بندی سنجش از دور. بین المللی J. Remote Sens. ۲۰۰۵ ، ۲۶ ، ۲۱۷-۲۲۲٫ [ Google Scholar ] [ CrossRef ]
  62. Gislason، PO; بندیکتسون، جی. Sveinsson, JR جنگل های تصادفی برای طبقه بندی پوشش زمین. تشخیص الگو Lett. ۲۰۰۶ ، ۲۷ ، ۲۹۴-۳۰۰٫ [ Google Scholar ] [ CrossRef ]
  63. لیاو، ا. وینر، ام. طبقه بندی و رگرسیون توسط جنگل تصادفی. R News ۲۰۰۲ , ۲ , ۱۸-۲۲٫ [ Google Scholar ]
  64. سیم، جی. Abril, I. Extratrees: Extremely Randomized Trees (ExtraTrees) Method for Classification and Regression , R Package Version 1.0.5; ۲۰۱۴٫ در دسترس آنلاین: https://cran.r-project.org/web/packages/extraTrees/extraTrees.pdf (در ۲۲ اوت ۲۰۲۰ قابل دسترسی است).
  65. Geurts، P. ارنست، دی. Wehenkel, L. درختان بسیار تصادفی. ماخ فرا گرفتن. ۲۰۰۶ ، ۶۳ ، ۳-۴۲٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  66. احمد، مگاوات; مرشد، م. Rezgui, Y. روش‌های مجموعه مبتنی بر درخت برای پیش‌بینی تولید برق PV و مقایسه آنها با رگرسیون بردار پشتیبان. انرژی ۲۰۱۸ ، ۱۶۴ ، ۴۶۵-۴۷۴٫ [ Google Scholar ] [ CrossRef ]
  67. احمد، مگاوات; رینولدز، جی. Rezgui، Y. مدل سازی پیش بینی برای سیستم های انرژی حرارتی خورشیدی: مقایسه رگرسیون بردار پشتیبان، جنگل تصادفی، درختان اضافی و درختان رگرسیون. جی. پاک. تولید ۲۰۱۸ ، ۲۰۳ ، ۸۱۰-۸۲۱٫ [ Google Scholar ] [ CrossRef ]
  68. زدرافسکی، ای. لامسکی، پ. کولاکوف، آ. Trajkovik, V. مقایسه عملکرد جنگل های تصادفی و درختان بسیار تصادفی. در مجموعه مقالات سیزدهمین کنفرانس انفورماتیک و فناوری اطلاعات (CIIT 2016)، دانشکده علوم و مهندسی کامپیوتر (FCSE) و انجمن کامپیوتر مقدونیه، استروگا، مقدونیه، ۲۲ تا ۲۴ آوریل ۲۰۱۶٫ [ Google Scholar ]
  69. بارت، بی. نیتزه، آی. گرین، اس. Cawkwell، F. ارزیابی رادار چند زمانی، چند سنسوری و داده های فضایی جانبی برای نظارت بر مراتع در ایرلند با استفاده از رویکردهای یادگیری ماشین. سنسور از راه دور محیط. ۲۰۱۴ ، ۱۵۲ ، ۱۰۹-۱۲۴٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  70. لارنس، آر. بان، ا. پاول، اس. Zambon، M. طبقه بندی تصاویر سنجش از دور با استفاده از تقویت گرادیان تصادفی به عنوان اصلاح تجزیه و تحلیل درخت طبقه بندی. سنسور از راه دور محیط. ۲۰۰۴ ، ۹۰ ، ۳۳۱-۳۳۶٫ [ Google Scholar ] [ CrossRef ]
  71. چن، تی. او، تی. بنستی، م. خوتیلوویچ، وی. Tang, Y. Xgboost: Extreme Gradient Boosting , R Package نسخه ۱٫۱٫۱٫۱٫ ۲۰۲۰٫ در دسترس آنلاین: https://cran.r-project.org/web/packages/xgboost/index.html (در ۲۲ اوت ۲۰۲۰ قابل دسترسی است).
  72. تقریب تابع فریدمن، JH Greedy: یک ماشین تقویت کننده گرادیان. ان آمار ۲۰۰۱ ، ۲۹ ، ۱۱۸۹-۱۲۳۲٫ [ Google Scholar ] [ CrossRef ]
  73. چن، تی. Guestrin, C. Xgboost: یک سیستم تقویت درخت مقیاس پذیر. در مجموعه مقالات بیست و دومین کنفرانس بین المللی ACM SIGKDD در مورد کشف دانش و داده کاوی، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، ۱۳ تا ۱۷ اوت ۲۰۱۶؛ صص ۷۸۵-۷۹۴٫ [ Google Scholar ]
  74. جورجانوس، اس. گریپا، تی. ونهویسه، اس. لنرت، ام. شیمونی، م. Wolff، E. طبقه‌بندی کاربری زمین-پوشش زمین مبتنی بر شی با وضوح بسیار بالا با استفاده از تقویت شیب شدید. IEEE Geosci. سنسور از راه دور Lett. ۲۰۱۸ ، ۱۵ ، ۶۰۷–۶۱۱٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  75. فن، جی. وانگ، ایکس. وو، ال. ژو، اچ. ژانگ، اف. یو، ایکس. لو، ایکس. Xiang، Y. مقایسه ماشین بردار پشتیبان و تقویت گرادیان شدید برای پیش‌بینی تابش خورشیدی جهانی روزانه با استفاده از دما و بارش در آب و هوای نیمه گرمسیری مرطوب: مطالعه موردی در چین. مبدل انرژی مدیریت ۲۰۱۸ ، ۱۶۴ ، ۱۰۲-۱۱۱٫ [ Google Scholar ] [ CrossRef ]
  76. ژانگ، اچ. عزيز، ع. شیائو، جی. تائو، اس. وانگ، اس. تانگ، ز. ژو، جی. Fang, J. نقشه برداری پوشش گیاهی با وضوح بالا با استفاده از افزایش گرادیان فوق العاده بر اساس ویژگی های گسترده. Remote Sens. ۲۰۱۹ ، ۱۱ ، ۱۵۰۵٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  77. فام، تی دی; Le، NN; ها، NT; نگوین، LV; شیا، جی. یوکویا، ن. به، TT; Trinh، HX; Kieu، LQ; Takeuchi، W. برآورد زیست توده حرا در بالای زمین با استفاده از الگوریتم درختان تصمیم گیری افزایش گرادیان شدید با داده های Sentinel-2 و ALOS-2 PALSAR-2 در Can Gio Biosphere Reserve، ویتنام. Remote Sens. ۲۰۲۰ , ۱۲ , ۷۷۷٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  78. کورتس، سی. Vapnik، V. شبکه های پشتیبان-بردار. ماخ فرا گرفتن. ۱۹۹۵ ، ۲۰ ، ۲۷۳-۲۹۷٫ [ Google Scholar ] [ CrossRef ]
  79. Noble, WS ماشین بردار پشتیبان چیست؟ نات. بیوتکنول. ۲۰۰۶ ، ۲۴ ، ۱۵۶۵-۱۵۶۷٫ [ Google Scholar ] [ CrossRef ] [ PubMed ]
  80. علقانی، م. الجاف، ع. حسین، ع. بیکر، تی. مصطفینا، ج. الجمیلی، د. خلف، م. پیاده‌سازی الگوریتم‌های یادگیری ماشین برای ایجاد پروفایل‌های پذیرش مجدد بیماران دیابتی. Med Inform. تصمیم می گیرد. ماک ۲۰۱۹ ، ۱۹ ، ۲۵۳٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  81. دراکر، اچ. برگز، سی جی; کافمن، ال. اسمولا، ای جی; Vapnik، V. ماشین‌های رگرسیون بردار پشتیبانی ; مطبوعات MIT: کمبریج، MA، ایالات متحده آمریکا، ۱۹۹۷; صص ۱۵۵-۱۶۱٫ [ Google Scholar ]
  82. Gualtieri، JA; ماشین‌های بردار پشتیبان Cromp، RF برای طبقه‌بندی سنجش از راه دور فراطیفی. در مجموعه مقالات بیست و هفتمین کارگاه AIPR: پیشرفت ها در تشخیص به کمک رایانه، واشنگتن، دی سی، ایالات متحده آمریکا، ۱۴ تا ۱۶ اکتبر ۱۹۹۸٫ ص ۲۲۱-۲۳۲٫ [ Google Scholar ]
  83. پازولی، ال. نوتارنیکولا، سی. Bruzzone, L. برآورد رطوبت خاک با تکنیک رگرسیون بردار پشتیبان. جیوسکی. سنسور از راه دور Lett. ۲۰۱۱ ، ۸ ، ۱۰۸۰-۱۰۸۴٫ [ Google Scholar ] [ CrossRef ]
  84. کاراتزوگلو، ع. اسمولا، ا. Hornik, K. Package ‘Kernlab’ , R Package نسخه ۰٫۹-۲۹; ۲۰۱۹٫ در دسترس آنلاین: https://cran.r-project.org/web/packages/kernlab/index.html (در ۲۲ اوت ۲۰۲۰ قابل دسترسی است).
  85. برگسترا، جی. Bengio، Y. جستجوی تصادفی برای بهینه سازی هایپرپارامتر. جی. ماخ. فرا گرفتن. Res. ۲۰۱۲ ، ۱۳ ، ۲۸۱-۳۰۵٫ [ Google Scholar ]
  86. والتر، کارشناسی; مور، JL مفاهیم تعصب، دقت و دقت، و استفاده از آنها در آزمایش عملکرد برآوردگرهای غنای گونه، با بررسی ادبیات عملکرد برآوردگر. اکوگرافی ۲۰۰۵ ، ۲۸ ، ۸۱۵-۸۲۹٫ [ Google Scholar ] [ CrossRef ]
  87. همنر، بی. Frasco, M. Metrics: Evaluation Metrics for Machine Learning , R Package نسخه ۰٫۱٫۴; ۲۰۱۸٫ در دسترس آنلاین: https://cran.r-project.org/web/packages/Metrics/index.html (در ۲۲ اوت ۲۰۲۰ قابل دسترسی است).
  88. Zambrano-Bigiarini, M. بسته ‘hydroGOF’: توابع مناسب برای مقایسه سری های زمانی هیدرولوژیکی شبیه سازی شده و مشاهده شده ، بسته R نسخه ۰٫۴٫ ۲۰۲۰٫ در دسترس آنلاین: https://cran.r-project.org/web/packages/hydroGOF/index.html (در ۲۲ اوت ۲۰۲۰ قابل دسترسی است).
  89. سواتانتران، ا. دبیه، ر. رابرتز، دی. هافتون، ام. بلر، JB نقشه برداری زیست توده و تنش در سیرا نوادا با استفاده از همجوشی داده های لیدار و ابرطیفی. سنسور از راه دور محیط. ۲۰۱۱ ، ۱۱۵ ، ۲۹۱۷-۲۹۳۰٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  90. سوارز، جی سی. اونتیوروس، سی. اسمیت، اس. اسنپ، اس. استفاده از LiDAR هوابرد و عکاسی هوایی در تخمین ارتفاع درختان در جنگلداری. محاسبه کنید. Geosci. ۲۰۰۵ ، ۳۱ ، ۲۵۳-۲۶۲٫ [ Google Scholar ] [ CrossRef ]
  91. چو، MA; اسکیدمور، AK; سبحان، اول. نقشه برداری ساختار جنگلی راش ( Fagus sylvatica L.) با تصاویر فراطیفی هوابرد. بین المللی J. Appl. زمین Obs. Geoinf. ۲۰۰۹ ، ۱۱ ، ۲۰۱-۲۱۱٫ [ Google Scholar ] [ CrossRef ]
  92. Laurin، GV; چن، کیو. لیندسل، جی. کومز، دی. دل فراته، اف. گوریرو، ال. پیروتی، اف. والنتینی، R. تخمین زیست توده بالای زمین در یک جنگل استوایی آفریقا با داده های لیدار و ابرطیفی. ISPRS J. Photogramm. Remote Sens. ۲۰۱۴ ، ۸۹ ، ۴۹-۵۸٫ [ Google Scholar ] [ CrossRef ]
  93. سانکی، تی. دوناجر، ج. مک وی، جی. Sankey، JB UAV Lidar و همجوشی فراطیفی برای نظارت بر جنگل در جنوب غربی ایالات متحده. سنسور از راه دور محیط. ۲۰۱۷ ، ۱۹۵ ، ۳۰-۴۳٫ [ Google Scholar ] [ CrossRef ]
  94. اندرسون، جی. پلورد، ال. مارتین، ام. براسول، بی. اسمیت، ام. دبیه، ر. هافتون، ام. بلر، جی. ادغام لیدار شکل موج با تصاویر فراطیفی برای فهرست جنگل های معتدل شمالی. سنسور از راه دور محیط. ۲۰۰۸ ، ۱۱۲ ، ۱۸۵۶-۱۸۷۰٫ [ Google Scholar ] [ CrossRef ]
  95. خو، تی. وی، اچ. Hu, G. مطالعه بر روی مسئله طراحی شبکه پیوسته با استفاده از آنیل شبیه سازی شده و الگوریتم ژنتیک. سیستم خبره Appl. ۲۰۰۹ ، ۳۶ ، ۱۳۲۲-۱۳۲۸٫ [ Google Scholar ] [ CrossRef ]
  96. چانگ، Y.-C. چانگ، K.-H. وو، جی.-جی. استفاده از درختان تقویت کننده شیب شدید در ساخت مدل های ارزیابی ریسک اعتباری برای موسسات مالی. J. Appl. محاسبات نرم. ۲۰۱۸ ، ۷۳ ، ۹۱۴-۹۲۰٫ [ Google Scholar ] [ CrossRef ]
  97. کاتنبورن، تی. ماک، جی. Faßnacht، F. انسل، اف. ارمرت، جی. Koch، B. نقشه برداری زیست توده جنگل از فضا-تلفیقی داده های ابرطیفی EO1-hyperion و مدل های ارتفاع تاج پوشش Tandem-X و WorldView-2. بین المللی J. Appl. زمین Obs. Geoinf. ۲۰۱۵ ، ۳۵ ، ۳۵۹-۳۶۷٫ [ Google Scholar ] [ CrossRef ]
  98. برزوچنیک، ال. فیستر، آی. Podgorelec، V. الگوریتم های هوش ازدحام برای انتخاب ویژگی: یک بررسی. Appl. علمی ۲۰۱۸ ، ۸ ، ۱۵۲۱٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  99. حامدیان فر، ع. جبرئیل، MBA؛ حسین پور، م. Pellikka، PK استفاده هم افزایی از بهینه سازی ازدحام ذرات، شبکه عصبی مصنوعی و الگوریتم های تقویت گرادیان شدید برای نقشه برداری LULC شهری از تصاویر WorldView-3. Geocarto Int. ۲۰۲۰ ، ۱-۱۹٫ [ Google Scholar ] [ CrossRef ]
  100. لوئیزو، آر. گوارینی، آر. لونگو، اف. اسکوپا، تی. فرمارو، آر. فاچینتی، سی. واراکالی، جی. پریزما: ماموریت ابرطیفی ایتالیا. در مجموعه مقالات IGARSS 2018-2018 IEEE بین المللی زمین شناسی و سمپوزیوم سنجش از دور، والنسیا، اسپانیا، ۲۲ تا ۲۷ ژوئیه ۲۰۱۸؛ صص ۱۷۵-۱۷۸٫ [ Google Scholar ]
  101. لوپینتو، ای. Ananasso، C. ماموریت فراطیفی پریسما. در مجموعه مقالات سی و سومین سمپوزیوم EARSeL، به سوی افق ۲۰۲۰: مشاهده زمین و دیدگاه های اجتماعی، ماترا، ایتالیا، ۳ تا ۷ ژوئن ۲۰۱۳٫ [ Google Scholar ]
  102. پیگناتی، اس. پالمبو، ا. پاسکوچی، اس. رومانو، اف. سانتینی، اف. سیمونیلو، تی. اومبرتو، ا. وینچنزو، سی. آسیتو، ن. دیانی، ام. ماموریت فراطیفی PRISMA: فعالیت های علمی و فرصت ها برای نظارت بر کشاورزی و زمین. در مجموعه مقالات سمپوزیوم بین المللی زمین شناسی و سنجش از دور IEEE 2013-IGARSS، ملبورن، استرالیا، ۲۱ تا ۲۶ ژوئیه ۲۰۱۳٫ ص ۴۵۵۸-۴۵۶۱٫ [ Google Scholar ]
  103. ماگرودر، ال. نوینشواندر، آ. نویمان، تی. کورتز، ن. دانکنسون، ال. دوبایه، R. ماموریت های ICESat-2 و GEDI ناسا برای کاربردهای زمین و پوشش گیاهی. در مجموعه مقالات بیست و یکمین مجمع عمومی EGU، وین، اتریش، ۷ تا ۱۲ آوریل ۲۰۱۹٫ [ Google Scholar ]
  104. دانکنسون، ال. نوینشواندر، آ. هنکاک، اس. توماس، ن. فاتویینبو، تی. سیمرد، م. سیلوا، کالیفرنیا؛ آرمستون، جی. Luthcke, SB; Hofton، M. تخمین زیست توده از GEDI، ICESat-2 و NISAR شبیه سازی شده در سراسر شیب های محیطی در شهرستان سونوما، کالیفرنیا. سنسور از راه دور محیط. ۲۰۲۰ , ۲۴۲ , ۱۱۱۷۷۹٫ [ Google Scholar ] [ CrossRef ]
شکل ۱٫ منطقه محل مطالعه رابسون کریک، کوئینزلند شمالی دور، استرالیا، با ( شکل سمت راست ) که مدل ارتفاع تاج را از هوابرد لیدار نشان می دهد و شکل وسطی که کامپوزیت های رنگی کاذب AISA (طیف سنج تصویربرداری هوابرد برای کاربردها) و ۱۰۰ را نشان می دهد. -m نمودارها، در حالی که ( شکل های سمت چپ ) داخل منطقه مورد مطالعه را در مقیاس های وسیع تر نشان می دهد.
شکل ۲٫ نمونه هایی از پاسخ های طیفی از سنسورهای ایگل ( شکل بالا ) و هاوک ( شکل پایین ) در ۱۰ نقطه تصادفی در منطقه مورد مطالعه.
شکل ۳٫ تفاوت بین لیدار نرمال شده غیر ارتفاع ( شکل بالا ) و لیدار نرمال شده ارتفاع ( شکل پایین ). رنگ نشان دهنده ارتفاع است.
شکل ۴٫ گردش کار تحقیق.
شکل ۵٫ انتخاب متغیرها با استفاده از Boruta. ( A ) مجموعه داده های فراطیفی (E ۷۶۹ ، E ۸۰۴ ، H ۱۹۲۴ ، و H ۲۴۱۰ )، ( B ) معیارهای ارتفاع لیدار (LD1، LD2، LD4-LD7، LD10، LD12-LD28، LD35-LD36، و CHM)، و ( C ) معیارهای فراطیفی و لیدار (E ۷۶۷ ، E ۷۹۹ ، E ۸۷۰ ، E ۸۷۵ ، H ۲۴۱۰ ، LD1، LD2، LD4-LD7، LD10، LD13-LD27، و LD36)، بر اساس تعداد متغیرهای با عملکرد بهتر در برابر متغیرهای سایه ( y -axis؛ اهمیت).
شکل ۶٫ بارگذاری عاملی (استاندارد شده) از هر مجموعه داده، که سهم خطی هر متغیر ورودی را در باندهای رایانه شخصی نشان می دهد: ( الف ) سنسور عقاب، ( ب ) سنسور هاوک، و ( C ) معیارهای لیدار.
شکل ۷٫ عملکرد مدل یادگیری ماشینی R2 ( سمت چپ ) و RMSE ( راست ) با استفاده از مجموعه داده ورودی از باند ابرطیفی انتخاب شده.
شکل ۸٫ عملکرد مدل یادگیری ماشین R2 ( سمت چپ ) و RMSE ( راست ) با استفاده از مجموعه داده ورودی از معیارهای لیدار انتخاب شده.
شکل ۹٫ عملکرد مدل یادگیری ماشین R2 ( سمت چپ ) و RMSE ( راست ) با استفاده از مجموعه داده ورودی از ترکیب انتخابی داده‌های لیدار و ابرطیفی.
شکل ۱۰٫ عملکرد مجموعه داده های ورودی مختلف هنگام استفاده برای مدل سازی ارتفاعات جنگل.
شکل ۱۱٫ نقشه های ارتفاع تولید شده با استفاده از بهترین مدل یافت شده با استفاده از مجموعه داده های مختلف. ( A ) فقط معیارهای لیدار (SA-ET)، ( B ) فقط باندهای فراطیفی (BO-ET) و ( C ) ترکیبی از لیدار و فراطیفی (BO-XGBdart). دایره‌های سبز نواحی ارتفاع درخت پایین‌تر را نشان می‌دهند که توسط مدل فراطیفی شناسایی نشدند.
شکل ۱۲٫ عملکرد متغیرهای انتخاب شده از الگوریتم های مختلف انتخاب متغیر هنگام استفاده برای مدل سازی ارتفاع جنگل.
شکل ۱۳٫ مدل یادگیری ماشین و عملکرد اعتبار سنجی با استفاده از مجموعه داده های ورودی مختلف.

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

خانهدربارهتماسارتباط با ما