منابع اصلی خطا در داده‌های مکانی


منابع اصلی خطا در داده‌های مکانی

منابع خطای زیادی وجود دارد که ممکن است بر کیفیت داده‌های مکانی تأثیر بگذارد. در اینجا ما بر سه منبع اصلی تمرکز می‌کنیم : داده‌های منبع، رمزگذاری و تبدیل داده ها، و پردازش و تجزیه و تحلیل داده ها.

خطا در داده‌های منبع

داده‌های مکانی از طریق فرآیند انتخاب، تعمیم، طرح ریزی و نمادسازی تولید می‌شوند. با توجه به قوانین مقیاس، بسیاری از ویژگی‌ها و تغییرات مکانی دقیق در دنیای واقعی ممکن است حذف شوند. شکل ها، جهت ها، فواصل و نواحی ویژگی‌های انتخاب شده ممکن است تحریف شوند. ویژگی‌های منطقه ممکن است به دلیل اندازه کوچک آنها به عنوان ویژگی‌های نقطه ای (مانند دریاچه ها) یا ویژگی‌های خطی (مانند رودخانه ها) نشان داده شوند. و مرزهای مبهم، تدریجی یا مبهم در دنیای واقعی (مانند مرزهای خاک) ممکن است به اشتباه به عنوان مرزهای «ترد» معرفی شوند. بنابراین، داده‌های منبع ذاتاً حاوی خطاهایی با اندازه ناشناخته هستند.

علاوه بر این داده‌های مکانی بر اساس مدل‌های داده‌ای بردار، رستری یا شی‌گرا ساخته می‌شوند. با این حال، تمام مدل‌های داده‌های مکانی دارای محدودیت‌هایی هستند. مدل داده‌های برداری فرض می‌کند که جهان را می‌توان به عنوان متشکل از نقاط، خطوط و چندضلعی‌های مجزا تصور کرد که می‌توانند با استفاده از جفت مختصات منفرد یا مجموعه‌ای از آنها نمایش داده شوند. در واقع مدل برداری تقریبی است، اما دقیقاً شکل ویژگی‌ها را با استفاده از نقاط نشان نمی‌دهد. مدل رستری از سلول‌های شبکه‌ای منفرد یا مجموعه‌ای از سلول‌ها برای نمایش ویژگی‌ها استفاده می‌کند و فرض می‌کند که هیچ گونه تغییر مکانی در هر سلول وجود ندارد. دقت نمایش رستری به وضوح بستگی دارد. در وضوح کمتر، ویژگی‌ها و تغییرات مکانی بیشتری از بین می‌روند.

داده‌های منبع ممکن است از طریق بررسی میدانی، اندازه گیری فتوگرامتری، سنجش از دور، تفسیر و تجزیه و تحلیل تصویر، یا جمع سپاری گرفته شده باشد. خطاهای اندازه گیری ممکن است با مشاهده معیوب، مشاهده گرهای مغرضانه یا توسط تجهیزات کالیبراسیون نادرست یا نامناسب ایجاد شوند. برای مثال، یک گیرنده جی‌پی‌اس غیردیفرانسیل دستی ممکن است خطای موقعیت ۳۰ متری ایجاد کند. یک کنتور اکسیژن محلول که به درستی کالیبره نشده باشد، مقادیر اشتباهی از غلظت اکسیژن در یک جریان می‌دهد. تصاویر سنجش از دور ممکن است اشتباه تفسیر شوند و طبقه بندی خودکار تصاویر به ندرت ۱۰۰ درصد دقیق است (به فصل ۶ مراجعه کنید). داده‌های منبع ممکن است خیلی قدیمی باشد که برای پروژه‌های GIS فعلی مفید باشد. نه تنها ممکن است بسیاری از پایگاه‌های اطلاعاتی تغییر کرده باشند، بلکه استانداردهای جمع آوری داده‌های گذشته نیز ممکن است عمدتا ناشناخته یا در حال حاضر غیرقابل قبول باشند. خطاها در داده‌های منبع ممکن است علیرغم قدرت GIS نتایج را منحرف، سوگیری یا نفی کنند.

خطا در رمزگذاری و تبدیل داده ها

رمزگذاری داده‌های مکانی فرآیند رقومی کردن و وارد کردن داده‌ها در یک GIS است. رقومی کردن منبع مهم خطا است. علاوه بر خطاهای موجود در داده‌های منبع ارسال شده به GIS، خطاهای اپراتور اغلب رخ می‌دهد، مانند آنچه در شکل ۳-۶ نشان داده شده است. همچنین ممکن است هنگام ثبت نامناسب نقشه‌ها در طول رقومی کردن، خطاهایی ایجاد شود. ورودی داده ویژگی صفحه کلید نیز ممکن است داده‌های اشتباهی تولید کند. چنین خطاهایی ممکن است ناشی از عدم قطعیت در خصوص ویژگی‌های ویژگی‌های جغرافیایی، مخلوط کردن مقادیر مشخصه اختصاص داده شده به ویژگی ها، یا ورود نادرست باشد. علاوه بر این، هنگام ترجمه داده‌ها از یک ساختار داده به ساختار دیگر یا از یک سیستم ارجاع جغرافیایی به سیستم دیگر، ممکن است خطا رخ دهد. شکل‌های ۳-۸ و ۳-۹ از دست دادن اطلاعات و تحریف ایجاد شده در فرآیند رستری و برداری را نشان می‌دهد. همانطور که در بخش ۳-۳ نشان داده شد، خطاهایی در تبدیل هندسی رخ می‌دهد. نتیجه تبدیل هندسی در صورتی دقیق در نظر گرفته می‌شود که RMSE در مقدار تحمل قابل قبول باشد. RMSE نشان دهنده بزرگی خطای متوسط ​​است، اما بسیاری از خطاها ممکن است بزرگتر از RMSE باشند و برخی دیگر ممکن است کوچکتر باشند. هیچ نشانه ای از تنوع مکانی خطاها را نشان نمی‌دهد. خطا در پردازش و تجزیه و تحلیل داده‌ها خطاها ممکن است در طول پردازش و تجزیه و تحلیل داده‌ها رخ دهد. به طور خاص، گرد کردن عددی، تحلیل همپوشانی و درون یابی مکانی به احتمال زیاد دچار خطا می‌شوند. خطاهای گرد کردن زمانی اتفاق می‌افتد که نتایج پردازش داده‌ها به نزدیک‌ترین اعداد صحیح کوتاه می‌شوند، که ممکن است باعث گرد شدن نقاط نزدیک مرزها در داخل یا خارج از یک منطقه شود (Burrough and McDonnell 1998).

تجزیه و تحلیل همپوشانی فرآیندی است از قرار دادن دو یا چند لایه داده بر روی یکدیگر برای ایجاد یک لایه ترکیبی برای تجزیه و تحلیل یکپارچه (که در بخش ۴-۴ مورد بحث قرار خواهد گرفت). توجه به این نکته مهم است که داده‌هایی که ویژگی‌های یکسانی را در لایه‌های مختلف نشان می‌دهند ممکن است یکنواخت نباشند و در معرض تغییر باشند. همپوشانی چندین لایه داده ممکن است منجر به مشکلاتی مانند slivers شود (چند ضلعی‌های نازکی که در جایی که مرزهای مشترک با هم همپوشانی دارند تشکیل می‌شوند؛ شکل ۳-۶ را ببینید). علاوه بر این، تحلیل همپوشانی از اطلاعات مکانی برای ساخت ویژگی‌های جدید (نقاط، خطوط یا چندضلعی) از لایه‌های ورودی استفاده می‌کند. در نتیجه، خطاهای موقعیتی و ویژگی‌های موجود در لایه‌های ورودی به لایه خروجی ترکیبی منتقل می‌شود. خروجی حاصل از تجزیه و تحلیل همپوشانی تنها به خوبی بدترین لایه ورودی است ( هی وود و همکاران، ۲۰۱۱، صفحه ۳۲۷).

درون یابی مکانی برای تخمین مقادیر در مکان‌های ناشناخته بر اساس تعدادی از نمونه‌های نقطه ای استفاده می‌شود. همانطور که در بخش ۴-۵ بحث خواهد شد، تکنیک‌های درونیابی مکانی زیادی وجود دارد. با این حال، تکنیک‌های درون یابی مختلف ممکن است نتایج متفاوتی بر اساس داده‌های نمونه مشابه ایجاد کنند. هر تکنیک درون یابی شامل خطاهایی است. خروجی GIS ممکن است حاوی انباشتگی از خطاها از هر سه منبع فوق باشد.

برگرفته از کتاب کاربرد GISدر محیط زیست

ترجمه:سعید جوی زاده،شهناز تیموری،فاطمه حسین پور فرزانه

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

خانهدربارهتماسارتباط با ما