تجزیه و تحلیل الگوهای فضایی


تجزیه و تحلیل الگوهای فضایی

هدف تجزیه و تحلیل الگوی مکانی اندازه گیری میزان خوشه بندی، پراکندگی یا توزیع تصادفی ویژگیها در یک منطقه است. به عنوان مثال آیا تاکین‌ها به طور تصادفی توزیع می‌شوند، یا در خوشه‌هایی در مناطق خاصی متمرکز می‌شوند؟ آیا الگوی مکانی گربه پرنده سبز شبیه انجیر خفه کننده است؟ GIS چندین ابزار آماری مکانی ارائه می‌دهد که نه تنها اندازه گیری‌های کمی از الگوی مکانی را ارائه می‌دهد، بلکه اهمیت آماری آنها را نیز ارزیابی می‌کند.

آزمایش اهمیت الگوهای فضایی

اهمیت آماری این احتمال است که الگوی مکانی مشاهده شده به احتمال زیاد فقط به دلیل شانس نیست. الگوی مکانی مشاهده شده در صورتی در نظر گرفته می‌شود که بعید به نظر می‌رسد به طور اتفاقی رخ داده است. در تجزیه و تحلیل الگوی مکانی بر اساس داده‌های نمونه، تعیین اینکه آیا الگوی مکانی کمی‌سازی‌شده توسط یک معیار آماری می‌تواند به تنهایی یا از طریق خطای نمونه‌گیری به وجود آمده باشد یا اینکه ممکن است به جلوه‌های آماری معنی‌دار یک فرآیند مکانی در کار نسبت داده شود، مهم است. این فرآیند را آزمون معناداری یا فرضیه می‌نامند. اغلب با تعریف‌ی فرضیه صفر و فرضیه جایگزین شروع می‌شود.

فرضیه صفر H0، موقعیت پیش فرض است که به عنوان مثال، بسته به سؤال تحقیق مورد بررسی، هیچ الگوی مکانی وجود ندارد یا بین دو الگوی مکانی مشاهده شده رابطه وجود ندارد. فرضیه جایگزین، H1 ، موقعیتی مخالف با H0 است. H0 و  H1 متقابل هستند و فقط یکی از آنها معتبر تلقی می‌شود. تحلیل الگوی مکانی اغلب از H0 استفاده می‌کند که الگوی مکانی مشاهده شده تصادفی است، و H1 که الگوی مکانی مشاهده شده تصادفی نیست. آزمون معناداری یک آزمون آماری خاص را برای یافتن آمار آزمون مشاهده شده و استفاده از آن برای تعیین اینکه آیا H0 باید رد یا پذیرفته شود، اعمال می‌کند. اگر H0 رد شود، H1 باید پذیرفته شود.

آمار آزمون با تبدیل آمار نمونه (مانند میانگین و انحراف استاندارد) به نمره (مانند نمره z ، F ، t یا χ۲) یافت می‌شود. چندین آمار آزمون مختلف برای آزمایش انواع مختلف ادعاها استفاده می‌شود. این بخش فقط آمار آزمون z را مورد بحث قرار می‌دهد زیرا در تجزیه و تحلیل الگوی مکانی استفاده می‌شود. آمار آزمون F و t در بخش ۵٫۶ مورد بحث قرار می‌گیرد. بحث جامع آزمون اهمیت و سایر آمار آزمون‌ها را می‌توان در هر کتاب درسی آمار یافت.

از آمار آزمون z یا نمره z برای آزمایش فرضیه صفر در مورد میانگین (یا نسبت) و تعیین اینکه آیا مشاهده (نمونه) میانگین (یا نسبت) مشاهده شده با میانگین (یا نسبت) مورد انتظار جمعیت زیر متفاوت است یا خیر ، استفاده می‌شود. فرضیه صفر وقتی حجم نمونه بزرگ است (سی یا بیشتر). آماره آزمون z برای میانگین با معادلات زیر بدست می‌آید :

 

 

که در آن میانگین مشاهده شده، μ میانگین مورد انتظار، σ انحراف استاندارد جامعه، و n حجم نمونه است. خطای استاندارد  میانگین است. بنابراین، هنگام آزمایش فرضیه صفر در مورد میانگین، نمرات z واحدهای انحراف معیار هستند. آمار آزمون z برای نسبت متفاوت محاسبه می‌شود:

که نسبت مشاهده شده است، p نسبت مورد انتظار است و خطای استاندارد نسبت است.

به عنوان مثال، فرض کنید نمونه ای از ۱۲۰ مزرعه از یک منطقه روستایی داریم که اندازه متوسط آن ۱۳۰ هکتار است. جمعیت مزارع این منطقه به طور متوسط ۶۵ هکتار و انحراف معیار ۱۱۴ هکتار است. H0 این است که بین میانگین نمونه و میانگین جامعه تفاوتی وجود ندارد. امتیاز z برای این مثال :

 

فرض بر این است که آمار آزمون z دارای توزیع احتمال نرمال است که می‌تواند به صورت منحنی زنگوله ای به تصویر کشیده شود. همانطور که در شکل ۵-۷ منحنی احتمالات مربوط به نمرات z مختلف را نشان می‌دهد. زمانی به اوج می‌رسد که z برابر با صفر است که میانگین توزیع است و دنباله‌های آن به محور افقی نزدیک می‌شوند، اما هرگز به آن نمی‌رسند. مساحت کل زیر منحنی برابر با ۰/۱ است. نسبت مساحت زیر منحنی بین دو نمره z احتمال قرار گرفتن هر ویژگی یا مقداری بین دو نمره z است. به عنوان مثال  مساحت زیر منحنی z بین دو مقدار ۵/۰ و ۵/۰- (همانطور که در آن سایه زده شده است شکل ۵-۷) ۲۹/۳۸ درصد از کل مساحت تحت پوشش منحنی است، بنابراین ۲۹/۳۸ درصد احتمال دارد که هر ویژگی یا مقداری بین دو نمره z قرار گیرد. احتمال رخ ندادن یک ویژگی یا مقدار بین دو امتیاز (یعنی خارج از ناحیه سایه دار) ۱۰۰  درصد از ۲۹/۳۸  درصد برابر با ۷۱/۱۶ درصد است.

احتمالات مرتبط با امتیاز z مبنای تصمیم گیری در مورد رد یا پذیرش فرضیه صفر را تشکیل می‌دهند. احتمال اتخاذ چنین تصمیمی به عنوان سطح اهمیت شناخته می‌شود که با α نشان داده می‌شود. این نیز احتمال اشتباه در رد H0 در واقع  معتبر است. گزینه‌های معمول برای α  برابر با ۰۵/۰، ۰۱/۰ و ۱/۰ است که ۰۵/۰ رایج ترین آنها است. نمره z مطلق در سطح اهمیت انتخاب شده را مقدار بحرانی می‌نامند. مقدار بحرانی مساحت زیر منحنی نرمال آمار آزمون z را به مناطق بحرانی و غیر بحرانی تفکیک می‌کند (شکل ۵-۸). منطقه بحرانی شامل آمار آزمون است که مقادیر مطلق آن برابر یا بزرگتر از مقدار بحرانی است. هر نمره z در منطقه بحرانی منجر به رد H0 می‌شود. همه نمرات z در منطقه غیر بحرانی ما را به پذیرش H0 سوق می‌دهد.

برای مثال قبلی از ۱۲۰ مزرعه در منطقه روستایی، نمره آزمایشی ۲۴۶/۶ فوق العاده زیاد است که در منطقه بحرانی ۰٫۰۱ α = واقع شده است. در واقع احتمال بدست آوردن امتیاز آزمایشی ۲۴۶/۶ کمتر از ۰۰۰۰۰۰۰۰۰۶/۰  است که بسیار کم است. بنابراین میانگین اندازه ۱۳۰ هکتار نمونه مزرعه تفاوت معنی داری با میانگین جمعیت داردکه بسیار بعید است به طور تصادفی رخ دهد  و H0 را می‌توان با اطمینان رد کرد.

شکل ۵-۷ توزیع آمار آزمون z

شکل ۵-۸ مقادیر بحرانی و مناطق بحرانی توزیع z

 

نمرات

احتمال دقیق به دست آوردن مقدار آماره آزمون با قدر معین در صورتی که فرضیه صفر درست باشد، p-value نامیده می‌شود. مقدار p دو برابر مساحت ناحیه افراطی (منطقه دم) است که با نمره آزمون در زیر منحنی نرمال در توزیع احتمال آماره آزمون محدود شده است (شکل ۵٫۹). اگر امتیاز z محاسبه‌شده برای نمونه دارای مقدار p برابر یا کمتر از سطح معنی‌داری باشد، H0 باید رد شود. در غیر این صورت، H0 را نمی‌توان رد کرد. سطح معنی داری معمولاً قبل از انجام آزمون معناداری مشخص می‌شود. ابزارهای تحلیل الگوی مکانی در GIS معمولاً مقدار p مربوط به امتیاز z محاسبه‌شده را گزارش می‌کنند. فرضیه صفر یک الگوی مکانی تصادفی یا بدون الگوی مکانی را رد کنید اگر مقدار p ≤ α باشد (سطح معناداری، برای مثال ۰٫۰۵). اگر pvalue> α باشد، فرضیه صفر را بپذیرید.

 

شکل ۵-۹ یافتن مقادیر p در توزیع احتمال نمرات z

برگرفته از کتاب کاربرد GISدر محیط زیست

ترجمه:سعید جوی زاده،شهناز تیموری،فاطمه حسین پور فرزانه

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

خانهدربارهتماسارتباط با ما