ارزیابی دقیق و منابع خطا
روالهای درون یابی مکانی امروزه معمولاً در GIS در دسترس هستند. استفاده از آنها آسان و ساده است. با این حال ، مهم است بدانیم که هر روش درون یابی مکانی شامل خطاهایی است. همه آنها از نظر ریاضی توزیع مداوم یک متغیر محیطی خاص را در یک منطقه بر اساس مجموعه ای از دادههای نقطه ای توزیع شده به طور تقریبی تخمین میزنند. تقریب ریاضی خود شامل عدم قطعیت است. از سطوح بارشی درون یابی ارائه شده در بالا ، همچنین دشوار نیست که ببینیم روشهای مختلف درون یابی نتایج متفاوتی را با مجموعه داده یکسان تولید میکنند. برخی از روشها ممکن است نتایج دقیق تری نسبت به بقیه داشته باشند. دقت سطحی که با یک روش خاص درون یابی شده است اغلب از طریق اعتبار متقابل ارزیابی میشود.
اعتبارسنجی متقابل عملکرد روش درون یابی را در دو مرحله ارزیابی میکند. ابتدا هر مکان نمونه را یکی یکی حذف کرده و مقدار آن را بر اساس نقاط نمونه باقی مانده با استفاده از روش درون یابی برآورد میکند. سپس برای تمام نقاط نمونه، مقادیر مشاهده شده و برآورد شده را برای محاسبه خطاهای تخمین مقایسه میکند. خطاها معمولاً بر اساس میانگین خطا و RMSE اندازه گیری میشوند (به بخش ۳-۵ مراجعه کنید). برای کریجینگ از معیارهای اضافی از جمله خطای استاندارد و RMSE استاندارد شده استفاده میشود که به عنوان نسبت RMSE به خطای استاندارد محاسبه میشود.
میانگین خطا، اختلاف میانگین بین مقادیر اندازه گیری شده و برآورد شده است. RMSE برای تجمیع بزرگی خطاها در مقادیر درون یابی شده برای همه نقاط نمونه به یک اندازه واحد از دقت درون یابی عمل میکند. این معیاری برای بزرگی خطاها است. هرچه RMSE کوچکتر باشد، سطح درون یابی دقیق تر است. روش درون یابی بهتر RMSE کوچکتری تولید میکند. خطای میانگین و RMSE را میتوان در کنار هم برای تشخیص تغییرات خطاها به کار برد. RMSE همیشه خواهد بود بزرگتر یا برابر با میانگین خطا باشد و هرچه تفاوت بین آنها بیشتر باشد ، واریانس خطاهای فردی بیشتر میشود. اگر RMSE برابر با میانگین خطا باشد ، پس همه خطاها از یک اندازه هستند.
RMSE استاندارد شده معیار خوبی برای ارزیابی خطای استاندارد است. همانطور که قبلا ذکر شد، خطای استاندارد در کریجینگ تخمین خطا و فاصله اطمینان را برای مقادیر درونیابی ارائه میدهد. اگر خطای استاندارد دقیق یا درست ارزیابی شده باشد، نسبت RMSE به خطای استاندارد باید نزدیک به ۱ باشد. بنابراین روش کریجینگ بهتر باید RMSE کوچکتر و یک RMSE استاندارد نزدیک به ۱ تولید کند.
علاوه بر خطاهای ذاتی در روشهای درون یابی، دو منبع مشترک دیگر خطا در درون یابی مکانی، از جمله عدم قطعیت دادههای نمونه و اثرات لبه وجود دارد. عدم قطعیت در دادههای نمونه عمدتاً ناشی از تعداد بسیار کم نقاط نمونه، توزیع محدود یا خوشه ای نقاط نمونه و عدم قطعیت در مورد مکانها و یا مقادیر نقاط نمونه است. به طور کلی هر چه تعداد نقاط نمونه بیشتر باشد، تخمینها دقیق تر است. با این حال نقاط نمونه خوشه ای ممکن است اطلاعات زیادی در مقایسه با مواردی که به طور یکنواخت پراکنده شده اند، اضافه نکنند. در واقع نقاط نمونه خوشه ای ممکن است نتایج درون یابی را سوگیری کنند. برای حصول نتیجه خوب از درون یابی، داشتن تعداد کافی از نمونه نمونهها که به خوبی توزیع شدهاند مهم است. هنگامی که به دست آوردن پوشش گسترده و توزیع شده یکنواخت از دادههای نمونه در منطقه ای با توپوگرافی پیچیده و تنوع زیاد در کاربری زمین و سایر متغیرهای محیطی غیرعملی است، لازم است تغییرات مکانی پدیدههای محیطی مرتبط را در درون یابی گنجانده شود. مطالعه موردی ۶ درفصل ۱۰ چنین نمونه ای را ارائه میدهد
اثرات لبه به تحریف ارزشهای درون یابی نزدیک مرز منطقه مورد مطالعه به دلیل فقدان دادههای نمونه در خارج از منطقه اشاره دارد. همانطور که در شکلهای ۴-۳۳ b و ۴-۳۴ b نشان داده شده است، مناطق مرزی دارای بالاترین خطاهای استاندارد هستند. در واقع در مناطق مرزی روش درون یابی دیگر درون یابی نیست – یعنی برآورد مقادیر ناشناخته در یک منطقه. بلکه اکنون در حال برون یابی است – یعنی مقادیر را در مناطقی که دادههای نمونه وجود ندارد پیش بینی میکند. برای حذف جلوههای حاشیه ای، راه حل آسان این است که دادههای نمونه را در خارج از منطقه مورد نظر جمع آوری کرده، آنها را در درون یابی قرار دهید سپس منطقه مورد نظر را از سطح درون یابی خارج کنید. به این ترتیب اکثر نادرستیها به منطقه خارج از نقاط نمونه منتقل میشوند و نتایج دقیق تری را در محدوده مورد نظر تولید میکنند.
درک روشهای اصلی درون یابی مکانی و منابع خطای آنها میتواند نه تنها به بهبود دقت درونیابی کمک کند سطوح ، بلکه افزایش آگاهی از خطاهای مربوط به هرگونه تحلیل بعدی که بر اساس نتایج درون یابی است.کادر ۴-۱۴ نحوه انجام درون یابی مکانی و مقایسه روشهای مختلف درونیابی مکانی در ArcGIS را نشان میدهد.
کادر ۴-۱۴ درون یابی مکانی در ArcGIS |
کاربردی |
برای پیروی از این مثالArcMap را راه اندازی کنید و گیجها و کلاس ویژگی مرزی را از مسیر زیر دانلود کنید. |
C:\Databases\GIS4EnvSci\VirtualCatchment |
شکل فایل حاوی سوابق هواشناسی در مجموعه ای از ایستگاههای هواشناسی در حوضه مجازی است. کلاس ویژگی مرز حوضه را به تصویر میکشد. پسوند ArcGIS Geostatistical Analyst مورد نیاز است. برنامه افزودنی Geostatistical Analyst را شروع کنید. |
۱) Customize > Extensions را از منوی اصلی انتخاب کنید. کادر محاوره ای Extensions باز میشود. |
۲) در کادر محاوره ای Extensions: |
الف) چک باکس Geostatistical Analyst را علامت بزنید. |
ب) روی Close کلیک کنید. پسوند Geostatistical Analyst فعال است. |
۳) روی Customize > Toolbars > Geostatistical Analyst کلیک کنید. نوار ابزار Geostatistical Analyst اضافه شد. سطح میانگین بارندگی سالانه را با استفاده از IDW درون یابی کنید. |
۴) از منوی کشویی Geostatistical Analyst، Geostatistical Wizard را انتخاب کنید. |
۵) در کادر محاوره ای Geostatistical Wizard : |
الف) در کادر فهرست Methods در سمت چپ گفتگو، روی Inverse Distance Weighting کلیک کنید. |
ب) در کادر فهرست دادههای ورودی در سمت راست کادر گفتگو، روی فلش Source Dataset کلیک کرده و gauges را انتخاب کنید. |
ج) روی فلش Data Field کلیک کنید و قسمت rainfall را انتخاب کنید. این فیلد دادههای میانگین بارندگی را برای هر ایستگاه هواشناسی ذخیره میکند. |
د) روی دکمه Next کلیک کنید. توجه داشته باشید که مقدار توان پیش فرض ۲ در پانل گفتگوی دوم است. |
ه) روی دکمه Optimize Power Value در سمت راست کادر برق کلیک کنید. اکنون توجه کنید که توان از ۲ به ۱ تغییر میکند. این بدان معنی است که مقدار توان بهینه برای این مورد ۱ است. مقادیر توان دیگر خطاهای بیشتر و بزرگتری ایجاد میکند. |
و) از تنظیمات پیش فرض برای سایر تنظیمات استفاده کنید، سپس روی Next کلیک کنید. نتایج اعتبارسنجی متقابل فهرست شده است، از جمله جدولی از مقادیر اندازهگیری شده و پیشبینیشده برای همه نقاط نمونه، نمودار اعتبارسنجی متقاطع که نشان میدهد روش درونیابی تا چه حد مقادیر را در مکانهای ناشناخته پیشبینی میکند، و میانگین (میانگین خطا) و مقادیر Root-Mean-Square (RMSE) در این حالت میانگین خطا ۲۶/۳ و RMSE 19/114 است. |
ز) روی دکمه Finish کلیک کنید، سپس روی OK در گفتگوی گزارش روش کلیک کنید. لایه Inverse Distance Weighting به نمای داده اضافه شده است. |
۶) در فهرست مطالب، بر روی Inverse Distance Weighting کلیک راست کرده و روی Properties کلیک کنید. |
۷) در کادر محاوره ای Layer Properties : |
الف) روی برگه Extent کلیک کنید و وسعت را به وسعت مستطیلی مرز تنظیم کنید. |
ب) روی تب نمادشناسی کلیک کنید. روی طبقه بندی کلیک کنید. در گفتگوی Classification، روش طبقه بندی را به Manual تغییر دهید، تعداد کلاسها را روی ۸ قرار دهید و شکستهای کلاس را به ترتیب به ۴۰۰، ۴۵۰، ۵۰۰، ۵۵۰، ۶۰۰، ۶۵۰ و ۷۰۰ تغییر دهید، سپس روی OK کلیک کنید. |
ج) روی OK کلیک کنید. سطح درون یابی اکنون کل منطقه حوضه آبریز را میپوشاند و باید مانند شکل ۴-۲۷ a باشد. میتوانید ۲ را برای مقدار توان امتحان کنید، و نتیجه باید مشابه شکل ۴-۲۷ bباشد. |
با استفاده از مدل سطح روند، میانگین سطح بارندگی سالانه را درون یابی کنید |
۸) جادوگر زمین آماری را شروع کنید. |
۹) در کادر محاوره ای جادوگر زمین آماری: |
الف) در کادر فهرست Methods، روی Global Polynomial Interpolation کلیک کنید. |
ب) در کادر فهرست دادههای ورودی، روی فلش Source Dataset کلیک کرده و gauges را انتخاب کنید. |
ج) روی فلش Data Field کلیک کنید و قسمت rainfall را انتخاب کنید. |
د) روی دکمه Next کلیک کنید. در پانل گفتگوی دوم، ترتیب چند جمله ای را روی ۳ تنظیم کنید. سطح روند مرتبه سوم استفاده خواهد شد. |
ه) روی Next کلیک کنید. مشاهده نتایج اعتبار سنجی متقابل میانگین خطا ۱۴/۶ و RMSE ۶۹/۱۴۴ است. |
و) روی دکمه Finish کلیک کنید، سپس در گفتگوی گزارش روش، روی OK کلیک کنید. لایه جهانی چند جمله ای درون یابی به نمای داده اضافه میشود. |
۱۰) مراحل ۶ و ۷ بالا را برای تغییر نمادشناسی لایه درونیابی چند جمله ای جهانی دنبال کنید. لایه باید شبیه شکل ۴-۲۹ c باشد. میتوانید سطح روند اول، دوم و چهارم را امتحان کنید تا سطوح بارندگی دیگری مشابه آنچه در شکل ۴-۲۹ نشان داده شده است ایجاد کنید. |
سطح میانگین بارندگی سالانه را با استفاده از اسپلاین درون یابی کنید |
۱۱) جادوگر زمین آماری را شروع کنید. |
۱۲) در کادر محاوره ای Geostatistical Wizard : |
الف) در کادر فهرست Methods، روی Radial Bassis Functions کلیک کنید. |
ب) سنجها را به عنوان مجموعه داده منبع و میزان بارش را به عنوان فیلد داده انتخاب کنید. روی Next کلیک کنید. |
ج) Completely Regularized Spline را به عنوان تابع هسته (یعنی تابع spline) انتخاب کنید. |
د) برای بهینه سازی مقدار پارامتر هسته، دکمه Optimize را کلیک کنید. فرآیند بهینه سازی چندین مدل را ارزیابی میکند و مقدار پارامتر Kernel را برای تابع هسته انتخاب شده انتخاب میکند که کمترین RMSE را تولید میکند. |
ه) از تنظیمات پیش فرض برای سایر تنظیمات استفاده کنید، سپس روی Next کلیک کنید. |
و) مشاهده نتایج اعتبار سنجی متقاطع. میانگین خطا ۱۹/۳ و RMSE ۲/۱۱۸ است. |
ز) روی دکمه Finish کلیک کنید، سپس روی OK در گفتگوی گزارش روش کلیک کنید. لایه Radial Basis Functions به نمای داده اضافه میشود. |
۱۳) مراحل ۶ و ۷ بالا را برای تغییر نماد شناسی لایه Radial Basis Functions دنبال کنید. باید شبیه شکل ۴-۳۰a باشد. به روشی مشابه، همانطور که در شکل ۴-۳۰b نشان داده شده است، میتوان با استفاده از Spline with Tension سطح بارندگی ایجاد کرد. |
سطح میانگین بارندگی سالانه را با استفاده از کریجینگ معمولی درون یابی کنید |
۱۴) Geostatistical Wizard را شروع کنید. |
۱۵) در کادر محاوره ای Geostatistical Wizard : |
الف) در کادر لیست Methods ، روی Kriging/CoKriging کلیک کنید. |
ب) سنجها را به عنوان مجموعه داده منبع و میزان بارش را به عنوان فیلد داده انتخاب کنید. روی Next کلیک کنید. |
ج) روی Ordinary کریجینگ کلیک کنید Prediction را به عنوان نوع سطح خروجی انتخاب کنید. |
د) روی Next کلیک کنید. مدل semivariogram و semivariogram نمایش داده میشود. Model #1 را باز کرده و نوع را به Exponential تغییر دهید. روی دکمه Optimize کلیک کنید تا پارامترهای مدل semivariogram بهینه شود. از تنظیمات پیش فرض برای تنظیمات دیگر استفاده کنید، سپس روی Next کلیک کنید. |
ه) صفحه پیش نمایش در سمت چپ در پانل گفتگو، نقاط نمونه ای را نشان میدهد که برای محاسبه مقدار در یک مکان ناشناخته استفاده میشود (که با علامت متقاطع مشخص شده است). نقاط قرمز در پیشنمایش بیشتر از نقاط سبز وزن میشوند، زیرا به مکان تخمین زده شده نزدیکتر هستند. |
ز) پانل Weights را در سمت راست باز کنید. تعداد امتیازهای نمونه در لیست به همراه مقیاس تقریبی وزن آنها در محاسبه محاسبه میشود. |
ح) در چند مکان مختلف در قسمت پیش نمایش در سمت چپ کلیک کنید. توجه داشته باشید که محله حرکت میکند و نقاط نمونه جدید انتخاب میشوند. |
ت) از تنظیمات پیش فرض برای تنظیمات دیگر استفاده کنید، سپس روی Next کلیک کنید. |
ی) نتایج اعتبارسنجی متقابل را مشاهده کنید. میانگین خطا ۶۵/۲،RMSE ۱۶/۱۰۹،RMSE استاندارد شده ۹۶/۰ و میانگین خطای استاندارد ۲۳/۱۱۴ است. |
ک) روی دکمه Finish کلیک کنید، سپس روی OK در گفتگوی گزارش روش کلیک کنید. لایه Kriging به نمای داده اضافه میشود. |
۱۶) مراحل ۶ و ۷ بالا را برای تغییر نمادشناسی لایه کریجینگ دنبال کنید. باید شبیه شکل ۴-۳۳ a باشد. |
۱۷) جادوگر زمین آماری را دوباره شروع کنید. از کریجینگ معمولی و همان پارامترهایی که در مرحله ۱۵ در بالا تنظیم شده است استفاده کنید، اما خطای استاندارد پیش بینی را به عنوان نوع سطح خروجی انتخاب کنید. نتیجه یک نقشه خطای استاندارد است، همانطور که در شکل ۴-۳۳ b نشان داده شده است. |
سطح میانگین بارندگی سالانه را با استفاده از کریجینگ جهانی درون یابی کنید |
۱۸) جادوگر زمین آماری را شروع کنید. |
۱۹) در کادر محاوره ای Geostatistical Wizard : |
الف) Kriging/CoKriging را به عنوان روش درون یابی، سنجها را به عنوان مجموعه داده منبع، و بارش را به عنوان فیلد داده انتخاب کنید. روی Next کلیک کنید. |
ب) Universal را به عنوان نوع کریجینگ و Prediction را به عنوان نوع سطح خروجی انتخاب کنید. در پانل سمت راست، ترتیب حذف روند را به عنوان اول تنظیم کنید. روی Next کلیک کنید. |
ج) Exponential را به عنوان تابع هسته انتخاب کنید. روی Next کلیک کنید. |
د) مدل #۱ را گسترش دهید و نوع را به نمایی تغییر دهید. روی دکمه Optimize کلیک کنید تا پارامترهای مدل semivariogram بهینه شود. از تنظیمات پیش فرض برای تنظیمات دیگر استفاده کنید، سپس روی Next کلیک کنید. دوباره روی Next کلیک کنید. |
ه) نتایج اعتبارسنجی متقابل را مشاهده کنید. میانگین خطا ۴۷/۰، RMSE ۱/۱۲۱، RMSE استاندارد شده ۰۷۶/۱ و میانگین خطای استاندارد ۱۱/۱۱۴ است. |
و) روی دکمه Finish کلیک کنید، سپس روی OK در گفتگوی گزارش روش کلیک کنید. لایه Kriging_2 به نمای داده اضافه میشود. |
۲۰٫ مراحل ۶ و ۷ بالا را برای تغییر نمادشناسی لایه Kriging_2 دنبال کنید. باید شبیه شکل ۴٫۳۴a باشد. به طور مشابه، نقشه خطای استاندارد را میتوان تولید کرد که مشابه شکل ۴٫۳۴b است. |
روشهای مختلف درون یابی را مقایسه کنید |
عملکرد روشهای مختلف درونیابی را میتوان بر حسب میانگین خطا، RMSE، RMSE استاندارد شده و میانگین خطای استاندارد ارزیابی کرد. این آمار برای روشهای درونیابی آزمایش شده در جدول ۶-۴ فهرست شده است. از جدول ۴-۶، کریجینگ معمولی کمترین مقدار خطا را تولید میکند زیرا دارای کمترین RMSE است. اگرچه کریجینگ جهانی کوچکترین میانگین خطا را دارد، تفاوت بین خطای RMSE و میانگین آن بیشتر از کریجینگ معمولی است، که نشان میدهد واریانس بیشتری در خطاهای فردی دارد. مقادیر استاندارد شده RMSE همچنین نشان میدهد که خطاهای استاندارد برآورد شده در کریجینگ معمولی قابل اعتمادتر از خطاهای برآورد شده در کریجینگ جهانی هستند. بنابراین، در بین روشهای آزمایش شده، کریجینگ معمولی بهترین است که دقیق ترین نتایج را ایجاد میکند. |
جدول ۴-۶ خطاهای تخمینی روشهای درونیابی آزمایش شده در کادر ۴-۱۴
خلاصه
- تجزیه و تحلیل مکانی اطلاعات و دانش مربوط به الگوهای مکانی ویژگیهای جغرافیایی و روابط مکانی بین آنها را از دادههای مکانی به دست میآورد. نتایج تجزیه و تحلیل مکانی بستگی به موقعیت ویژگیهای جغرافیایی مورد تجزیه و تحلیل دارد.
- جستجو مکانی در GIS عملیاتی برای بازیابی اطلاعات از مجموعه دادههای مکانی موجود یا پایگاههای داده است ، اما اطلاعات جدیدی ایجاد نمیکند.
- طبقه بندی مجدد یک عملیات GIS برای گروه بندی مجدد ویژگیها در کلاسهای مختلف یا اختصاص مقادیر جدید به ویژگیها است. عمدتا برای ساده سازی ، تعمیم و تغییر مقیاس اندازه گیری استفاده میشود.
- فاصله ، طول ، مساحت ، محیط و شکل را میتوان در GIS محاسبه کرد و برای توصیف ویژگیهای هندسی ویژگیهای جغرافیایی و استخراج معیارهای منظره استفاده کرد.
- ابزارهای بافر یا بافرهای اقلیدسی یا ژئودزیک (در قالب بردار) را در اطراف نقاط ، خط و ناحیه با عرض ثابت یا متغیر ترسیم میکنند ، در حالی که سطوح فاصله (در قالب رستری ) فاصلههای فیزیکی یا هزینه ای را به یک ویژگی خاص یا گروهی از آنها محاسبه میکند. امکانات. مسیرهای کم هزینه از یک مکان به مکان دیگر بر اساس سطوح فاصله یافت میشوند.
- فاصله شبکه به عنوان کوتاهترین فاصله در طول یک شبکه با استفاده از مجموعه داده شبکه که از پیوندها، گرهها و چرخشها تشکیل شده است اندازه گیری میشود. ممکن است پیوند را در نظر گرفته و امپدانس را تبدیل کند.
- همپوشانی شامل اضافه کردن دو یا چند لایه نقشه ثبت شده در یک سیستم مرجع مرجع مشترک به منظور نشان دادن روابط بین پدیدههای محیطی است که در یک فضای جغرافیایی مشابه رخ میدهد. تجزیه و تحلیل همپوشانی شامل ترکیب اطلاعات از لایههای ورودی برای استخراج یا استنباط اطلاعات جدید است. میتونه باشه به صورت بردار یا تصادفی انجام میشود.
- جبر نقشه از طریق همپوشانی رستری با عملگرها و توابع ریاضی (شامل عملگرهای حسابی ، منطقی ، مقایسه ، توابع شرطی ، مثلثاتی و آماری) و توابع تجزیه و تحلیل دادههای رستری (شامل توابع محلی ، کانونی ، منطقه ای و جهانی) اجرا میشود.
- درون یابی مکانی فرایند استفاده از نمونه ای از مکانها با مقادیر شناخته شده برای برآورد مقادیر در سایر مکانهای اندازه گیری نشده است. سطوحی با مقادیر پیوسته ایجاد میکند. IDW ، مجاور طبیعی ، سطح روند ، spline و kriging تکنیکهای درون یابی مکانی هستند که معمولاً در GIS موجود است. صحت درون یابی مکانی اغلب از طریق اعتبار سنجی متقابل ارزیابی میشود.
برگرفته از کتاب کاربرد GISدر محیط زیست
ترجمه:سعید جوی زاده،شهناز تیموری،فاطمه حسین پور فرزانه
بدون دیدگاه