منابع اصلی خطا در دادههای مکانی
منابع خطای زیادی وجود دارد که ممکن است بر کیفیت دادههای مکانی تأثیر بگذارد. در اینجا ما بر سه منبع اصلی تمرکز میکنیم : دادههای منبع، رمزگذاری و تبدیل داده ها، و پردازش و تجزیه و تحلیل داده ها.
خطا در دادههای منبع
دادههای مکانی از طریق فرآیند انتخاب، تعمیم، طرح ریزی و نمادسازی تولید میشوند. با توجه به قوانین مقیاس، بسیاری از ویژگیها و تغییرات مکانی دقیق در دنیای واقعی ممکن است حذف شوند. شکل ها، جهت ها، فواصل و نواحی ویژگیهای انتخاب شده ممکن است تحریف شوند. ویژگیهای منطقه ممکن است به دلیل اندازه کوچک آنها به عنوان ویژگیهای نقطه ای (مانند دریاچه ها) یا ویژگیهای خطی (مانند رودخانه ها) نشان داده شوند. و مرزهای مبهم، تدریجی یا مبهم در دنیای واقعی (مانند مرزهای خاک) ممکن است به اشتباه به عنوان مرزهای «ترد» معرفی شوند. بنابراین، دادههای منبع ذاتاً حاوی خطاهایی با اندازه ناشناخته هستند.
علاوه بر این دادههای مکانی بر اساس مدلهای دادهای بردار، رستری یا شیگرا ساخته میشوند. با این حال، تمام مدلهای دادههای مکانی دارای محدودیتهایی هستند. مدل دادههای برداری فرض میکند که جهان را میتوان به عنوان متشکل از نقاط، خطوط و چندضلعیهای مجزا تصور کرد که میتوانند با استفاده از جفت مختصات منفرد یا مجموعهای از آنها نمایش داده شوند. در واقع مدل برداری تقریبی است، اما دقیقاً شکل ویژگیها را با استفاده از نقاط نشان نمیدهد. مدل رستری از سلولهای شبکهای منفرد یا مجموعهای از سلولها برای نمایش ویژگیها استفاده میکند و فرض میکند که هیچ گونه تغییر مکانی در هر سلول وجود ندارد. دقت نمایش رستری به وضوح بستگی دارد. در وضوح کمتر، ویژگیها و تغییرات مکانی بیشتری از بین میروند.
دادههای منبع ممکن است از طریق بررسی میدانی، اندازه گیری فتوگرامتری، سنجش از دور، تفسیر و تجزیه و تحلیل تصویر، یا جمع سپاری گرفته شده باشد. خطاهای اندازه گیری ممکن است با مشاهده معیوب، مشاهده گرهای مغرضانه یا توسط تجهیزات کالیبراسیون نادرست یا نامناسب ایجاد شوند. برای مثال، یک گیرنده جیپیاس غیردیفرانسیل دستی ممکن است خطای موقعیت ۳۰ متری ایجاد کند. یک کنتور اکسیژن محلول که به درستی کالیبره نشده باشد، مقادیر اشتباهی از غلظت اکسیژن در یک جریان میدهد. تصاویر سنجش از دور ممکن است اشتباه تفسیر شوند و طبقه بندی خودکار تصاویر به ندرت ۱۰۰ درصد دقیق است (به فصل ۶ مراجعه کنید). دادههای منبع ممکن است خیلی قدیمی باشد که برای پروژههای GIS فعلی مفید باشد. نه تنها ممکن است بسیاری از پایگاههای اطلاعاتی تغییر کرده باشند، بلکه استانداردهای جمع آوری دادههای گذشته نیز ممکن است عمدتا ناشناخته یا در حال حاضر غیرقابل قبول باشند. خطاها در دادههای منبع ممکن است علیرغم قدرت GIS نتایج را منحرف، سوگیری یا نفی کنند.
خطا در رمزگذاری و تبدیل داده ها
رمزگذاری دادههای مکانی فرآیند رقومی کردن و وارد کردن دادهها در یک GIS است. رقومی کردن منبع مهم خطا است. علاوه بر خطاهای موجود در دادههای منبع ارسال شده به GIS، خطاهای اپراتور اغلب رخ میدهد، مانند آنچه در شکل ۳-۶ نشان داده شده است. همچنین ممکن است هنگام ثبت نامناسب نقشهها در طول رقومی کردن، خطاهایی ایجاد شود. ورودی داده ویژگی صفحه کلید نیز ممکن است دادههای اشتباهی تولید کند. چنین خطاهایی ممکن است ناشی از عدم قطعیت در خصوص ویژگیهای ویژگیهای جغرافیایی، مخلوط کردن مقادیر مشخصه اختصاص داده شده به ویژگی ها، یا ورود نادرست باشد. علاوه بر این، هنگام ترجمه دادهها از یک ساختار داده به ساختار دیگر یا از یک سیستم ارجاع جغرافیایی به سیستم دیگر، ممکن است خطا رخ دهد. شکلهای ۳-۸ و ۳-۹ از دست دادن اطلاعات و تحریف ایجاد شده در فرآیند رستری و برداری را نشان میدهد. همانطور که در بخش ۳-۳ نشان داده شد، خطاهایی در تبدیل هندسی رخ میدهد. نتیجه تبدیل هندسی در صورتی دقیق در نظر گرفته میشود که RMSE در مقدار تحمل قابل قبول باشد. RMSE نشان دهنده بزرگی خطای متوسط است، اما بسیاری از خطاها ممکن است بزرگتر از RMSE باشند و برخی دیگر ممکن است کوچکتر باشند. هیچ نشانه ای از تنوع مکانی خطاها را نشان نمیدهد. خطا در پردازش و تجزیه و تحلیل دادهها خطاها ممکن است در طول پردازش و تجزیه و تحلیل دادهها رخ دهد. به طور خاص، گرد کردن عددی، تحلیل همپوشانی و درون یابی مکانی به احتمال زیاد دچار خطا میشوند. خطاهای گرد کردن زمانی اتفاق میافتد که نتایج پردازش دادهها به نزدیکترین اعداد صحیح کوتاه میشوند، که ممکن است باعث گرد شدن نقاط نزدیک مرزها در داخل یا خارج از یک منطقه شود (Burrough and McDonnell 1998).
تجزیه و تحلیل همپوشانی فرآیندی است از قرار دادن دو یا چند لایه داده بر روی یکدیگر برای ایجاد یک لایه ترکیبی برای تجزیه و تحلیل یکپارچه (که در بخش ۴-۴ مورد بحث قرار خواهد گرفت). توجه به این نکته مهم است که دادههایی که ویژگیهای یکسانی را در لایههای مختلف نشان میدهند ممکن است یکنواخت نباشند و در معرض تغییر باشند. همپوشانی چندین لایه داده ممکن است منجر به مشکلاتی مانند slivers شود (چند ضلعیهای نازکی که در جایی که مرزهای مشترک با هم همپوشانی دارند تشکیل میشوند؛ شکل ۳-۶ را ببینید). علاوه بر این، تحلیل همپوشانی از اطلاعات مکانی برای ساخت ویژگیهای جدید (نقاط، خطوط یا چندضلعی) از لایههای ورودی استفاده میکند. در نتیجه، خطاهای موقعیتی و ویژگیهای موجود در لایههای ورودی به لایه خروجی ترکیبی منتقل میشود. خروجی حاصل از تجزیه و تحلیل همپوشانی تنها به خوبی بدترین لایه ورودی است ( هی وود و همکاران، ۲۰۱۱، صفحه ۳۲۷).
درون یابی مکانی برای تخمین مقادیر در مکانهای ناشناخته بر اساس تعدادی از نمونههای نقطه ای استفاده میشود. همانطور که در بخش ۴-۵ بحث خواهد شد، تکنیکهای درونیابی مکانی زیادی وجود دارد. با این حال، تکنیکهای درون یابی مختلف ممکن است نتایج متفاوتی بر اساس دادههای نمونه مشابه ایجاد کنند. هر تکنیک درون یابی شامل خطاهایی است. خروجی GIS ممکن است حاوی انباشتگی از خطاها از هر سه منبع فوق باشد.