درک کامل و تنوع الگوهای مجموعه داده استفاده از زمین و پوشش زمین مبتنی بر OSM در چین

خلاصه

داده‌های OpenStreetMap (OSM) برای نقشه‌برداری کاربری زمین و پوشش زمین (LULC) علیرغم عدم کیفیت آنها ضروری در نظر گرفته می‌شوند. اکثر مطالعات مربوطه از یک مجموعه داده مرجع LULC برای ارزیابی کیفیت استفاده کرده‌اند، اما چنین مجموعه‌ای مرجع برای اکثر کشورها و مناطق آزادانه در دسترس نیست. بنابراین، این مطالعه یک ارزیابی کیفیت ذاتی از مجموعه داده LULC مبتنی بر OSM (یعنی بدون استفاده از مجموعه داده LULC مرجع) با بررسی الگوهای کامل و تنوع آن انجام می‌دهد. با انتخاب چین به عنوان منطقه مورد مطالعه، ابتدا یک مجموعه داده LULC مبتنی بر OSM از این کشور با استفاده از معیارهای دقت مختلف تولید و تأیید شد. سپس الگوهای کامل و تنوع آن بر حسب هر تقسیمات کشور در سطح استان ترسیم و تحلیل شد. نتایج موارد زیر را نشان داد: (۱) در حالی که دقت کلی تا ۸۲٫۲٪ بود، اکثر مناطق کامل چین به دلیل عدم وجود کلاس های متنوع LULC به خوبی ترسیم نشدند. (۲) از نظر عوامل اجتماعی-اقتصادی و تعداد مشارکت کنندگان، همبستگی های بالاتری برای الگوهای تنوع نسبت به الگوهای کامل مشاهده شد. بنابراین، الگوی تنوع بازتاب بهتری از عوامل اجتماعی-اقتصادی و الگوهای فضایی مشارکت کنندگان است. (۳) هر دو الگوهای کامل و تنوع را می توان برای درک بهتر مجموعه داده LULC مبتنی بر OSM ترکیب کرد. این نتایج نشان می دهد که در نظر گرفتن تنوع به عنوان مکملی برای ارزیابی ذاتی کیفیت مجموعه داده LULC مبتنی بر OSM مفید است. این روش تحلیلی را می توان در سایر کشورها و مناطق نیز اعمال کرد. کامل ترین مناطق چین به دلیل عدم وجود کلاس های متنوع LULC به خوبی ترسیم نشدند. (۲) از نظر عوامل اجتماعی-اقتصادی و تعداد مشارکت کنندگان، همبستگی های بالاتری برای الگوهای تنوع نسبت به الگوهای کامل مشاهده شد. بنابراین، الگوی تنوع بازتاب بهتری از عوامل اجتماعی-اقتصادی و الگوهای فضایی مشارکت کنندگان است. (۳) هر دو الگوهای کامل و تنوع را می توان برای درک بهتر مجموعه داده LULC مبتنی بر OSM ترکیب کرد. این نتایج نشان می دهد که در نظر گرفتن تنوع به عنوان مکملی برای ارزیابی ذاتی کیفیت مجموعه داده LULC مبتنی بر OSM مفید است. این روش تحلیلی را می توان در سایر کشورها و مناطق نیز اعمال کرد. کامل ترین مناطق چین به دلیل عدم وجود کلاس های متنوع LULC به خوبی ترسیم نشدند. (۲) از نظر عوامل اجتماعی-اقتصادی و تعداد مشارکت کنندگان، همبستگی های بالاتری برای الگوهای تنوع نسبت به الگوهای کامل مشاهده شد. بنابراین، الگوی تنوع بازتاب بهتری از عوامل اجتماعی-اقتصادی و الگوهای فضایی مشارکت کنندگان است. (۳) هر دو الگوهای کامل و تنوع را می توان برای درک بهتر مجموعه داده LULC مبتنی بر OSM ترکیب کرد. این نتایج نشان می دهد که در نظر گرفتن تنوع به عنوان مکملی برای ارزیابی ذاتی کیفیت مجموعه داده LULC مبتنی بر OSM مفید است. این روش تحلیلی را می توان در سایر کشورها و مناطق نیز اعمال کرد. همبستگی های بالاتری برای الگوهای تنوع نسبت به الگوهای کامل مشاهده شد. بنابراین، الگوی تنوع بازتاب بهتری از عوامل اجتماعی-اقتصادی و الگوهای فضایی مشارکت کنندگان است. (۳) هر دو الگوهای کامل و تنوع را می توان برای درک بهتر مجموعه داده LULC مبتنی بر OSM ترکیب کرد. این نتایج نشان می دهد که در نظر گرفتن تنوع به عنوان مکملی برای ارزیابی ذاتی کیفیت مجموعه داده LULC مبتنی بر OSM مفید است. این روش تحلیلی را می توان در سایر کشورها و مناطق نیز اعمال کرد. همبستگی های بالاتری برای الگوهای تنوع نسبت به الگوهای کامل مشاهده شد. بنابراین، الگوی تنوع بازتاب بهتری از عوامل اجتماعی-اقتصادی و الگوهای فضایی مشارکت کنندگان است. (۳) هر دو الگوهای کامل و تنوع را می توان برای درک بهتر مجموعه داده LULC مبتنی بر OSM ترکیب کرد. این نتایج نشان می دهد که در نظر گرفتن تنوع به عنوان مکملی برای ارزیابی ذاتی کیفیت مجموعه داده LULC مبتنی بر OSM مفید است. این روش تحلیلی را می توان در سایر کشورها و مناطق نیز اعمال کرد. این نتایج نشان می دهد که در نظر گرفتن تنوع به عنوان مکملی برای ارزیابی ذاتی کیفیت مجموعه داده LULC مبتنی بر OSM مفید است. این روش تحلیلی را می توان در سایر کشورها و مناطق نیز اعمال کرد. این نتایج نشان می دهد که در نظر گرفتن تنوع به عنوان مکملی برای ارزیابی ذاتی کیفیت مجموعه داده LULC مبتنی بر OSM مفید است. این روش تحلیلی را می توان در سایر کشورها و مناطق نیز اعمال کرد.

کلید واژه ها:

OpenStreetMap ; نقشه برداری LULC ; کیفیت داده ها ؛ ارزیابی کیفیت ذاتی ; کامل بودن ؛ تنوع

۱٫ معرفی

نقشه‌های کاربری زمین (LU) و پوشش زمین (LC) اطلاعات مکانی در کلاس‌های مختلف ویژگی‌های جغرافیایی طبیعی و/یا ساخته‌شده توسط انسان روی زمین را نشان می‌دهند. این نقشه ها را می توان برای مدیریت منابع طبیعی [ ۱ ، ۲ ]، برنامه ریزی شهری و حمل و نقل [ ۳ ، ۴ ]، و نظارت و مدل سازی گسترش شهری [ ۵ ، ۶ ، ۷ ] اعمال کرد. تمرکز زیادی بر روی نقشه برداری کاربری و پوشش زمین (LULC) با استفاده از منابع داده های مختلف قرار گرفته است. به عنوان مثال، داده های سنجش از دور به طور گسترده برای تولید یک نقشه جهانی LC استفاده شده است [ ۸ ، ۹ ]] زیرا این فناوری از نظر تشخیص اشیاء فیزیکی (مانند جاده ها، ساختمان ها، رودخانه ها و دریاچه ها) در سطح زمین مزایایی دارد. با این حال، استفاده از داده‌های سنجش از دور در زمینه نقشه‌برداری LU مورد انتقاد قرار گرفته است، زیرا تشخیص ویژگی‌های موضوعی (مثلاً مسکونی، تجاری یا صنعتی) یک شی تنها با استفاده از این داده‌ها دشوار است [ ۱۰ ]. سایر منابع داده، به عنوان مثال، نقاط مورد علاقه (POI) [ ۱۱ ]، تصاویر نمای خیابان [ ۱۲ ]، و داده های تلفن همراه [ ۱۳ ]]، همچنین برای نقشه برداری LU مورد استفاده قرار گرفته اند، اما بیشتر آنها اغلب فقط برای مطالعه یک منطقه خاص از یک شهر در دسترس هستند، نه مناطق یک کشور یا منطقه بزرگتر. انتخاب دیگر، اطلاعات جغرافیایی ارائه شده توسط داوطلبان است، به اصطلاح “اطلاعات جغرافیایی داوطلبانه” (VGI) [ ۱۴ ]. به عنوان یکی از موفق ترین پروژه های VGI، OpenStreetMap (OSM) برای نقشه برداری LULC استفاده شده است [ ۱۵ ، ۱۶ ، ۱۷]. داده های OSM در این زمینه مفید هستند زیرا به صورت رایگان در دسترس هستند و پوشش جهانی و به روز رسانی تقریباً هم زمان را ارائه می دهند (به عنوان مثال، داده های OSM از نظر تئوری می توانند بر اساس دقیقه به دقیقه به روز شوند). با این وجود، نگرانی‌های زیادی در رابطه با کیفیت مجموعه داده‌های OSM به وجود آمده است، زیرا اکثر آنها توسط داوطلبانی از کشورها و/یا زمینه‌های مختلف ارائه می‌شوند که دارای سنین، مشاغل و درآمدهای مختلف هستند [ ۱۸ ]. بنابراین، بسیاری از تحقیقات بر ارزیابی کیفیت داده‌های OSM نه تنها از نظر ویژگی LULC [ ۱۵ ، ۱۹ ، ۲۰ ]، بلکه سایر ویژگی‌های جغرافیایی، به عنوان مثال، جاده‌ها [ ۲۱ ، ۲۲ ، ۲۳ ] و ساختمان‌ها [ ۲۴ ،۲۵ ].
اکثر مطالعات مرتبط از مجموعه داده مرجع LULC برای ارزیابی کیفیت استفاده کرده اند. به عنوان مثال، ارسنجانی و واز [ ۱۹ ] مجموعه داده های LU مبتنی بر OSM را در هفت کلانشهر اروپا با مجموعه داده های مرجع LU مربوطه از نظارت جهانی برای محیط زیست و امنیت شهری اطلس (GMESUA) مقایسه کردند. آنها دریافتند که از هر هفت کلانشهر، شش کلانشهر تقریباً بیش از ۷۵ درصد توافق بین هر جفت مجموعه داده مرجع OSM و LU دارند. اما کامل بودن (یعنی پوشش مجموعه داده های OSM در یک منطقه) از هفت کلانشهر متفاوت است، از ۴۲٪ برای بوداپست تا ۱۰۰٪ برای بخارست. استیما و پاینهو [ ۲۶] از داده های OSM-POI برای تولید یک مجموعه داده LULC از پرتغال استفاده کرد که دقت (یعنی سازگاری بین یک جفت مجموعه داده مرجع OSM و LULC) که ۷۶٫۷٪ بود. مجموعه داده مرجع LULC مربوطه از Coordination of Information on the Environment (CORINE) به دست آمد. دورن و همکاران [ ۲۷ ] کیفیت داده‌های LULC مبتنی بر OSM را در جنوب آلمان ارزیابی کرد و دریافت که کلاس LULC (یعنی جنگل) هم دقت بالا (۹۵٫۱٪) و هم کامل بودن بالا (۹۷٫۶٪) اما کلاس دیگری (یعنی زمین‌های کشاورزی) دارد. ) دارای مقدار کمال کامل (۴۵٫۹%) بود. ویانا و همکاران [ ۲۰] از داده های تاریخی OSM برای نگاشت چند زمانی LULC استفاده کرد و نتایج را با مجموعه داده های CORINE مقایسه کرد. آنها همچنین به این نتیجه رسیدند که مقادیر دقت به طور قابل ملاحظه ای بالا بود (از ۷۷٫۳٪ تا ۹۱٫۹٪)، اگرچه مقدار کامل بودن پایین بود.
با این حال، یک مجموعه داده مرجع LULC همیشه آزادانه در دسترس نیست، به ویژه برای یک منطقه مطالعه خارج از اروپا. این بدان معناست که برای اکثر نقاط جهان، ما باید کیفیت یک مجموعه داده LULC مبتنی بر OSM را بدون هیچ مجموعه داده مرجع (به نام ارزیابی کیفیت ذاتی) ارزیابی کنیم. مطالعات متعددی در مورد ارزیابی کیفیت ذاتی انجام شده است. به عنوان مثال، نگاه کنید به et al. [ ۲۸ ] دریافتند که کیفیت داده های ارائه شده توسط داوطلبان زمانی افزایش می یابد که آنها اعتماد بیشتری را نشان می دهند. کامبر و همکاران [ ۲۹] از تعدادی از نقاط کنترل برای تعیین دقت کلاس های LC تولید شده توسط تعدادی از داوطلبان استفاده کرد. با این حال، آنها بیشتر به دقت توجه داشتند تا کامل بودن. همچنین ارزیابی کامل بودن یک مجموعه داده OSM برای تعیین اینکه آیا داده های رایگان در دسترس است یا خیر، مطلوب است. برخی از مطالعات استفاده از شاخص های پروکسی (به عنوان مثال، تراکم ساختمان OSM و تراکم بلوک خیابان OSM) را برای تخمین کمی کامل بودن مجموعه داده OSM پیشنهاد کرده اند [ ۲۴ ، ۳۰ ]، اما این مطالعات به جای LULC بر ارزیابی داده های جاده و ساختمان متمرکز شده اند. داده ها در OSM
از نظر تئوری، لازم است از یک مجموعه داده مرجع LULC استفاده شود در حالی که فقط دقت و نه کامل بودن را ارزیابی می‌کند – دومی را می‌توان به عنوان نسبت مناطق تحت پوشش یک مجموعه داده LULC مبتنی بر OSM به کل منطقه یک منطقه اندازه‌گیری کرد. با این حال، به دلیل در دسترس بودن مجموعه داده های مرجع LULC، اکثر مطالعات کیفیت مجموعه داده های LULC مبتنی بر OSM را در شهرهای اروپایی ارزیابی کرده اند، اما تعداد کمی به مناطق خارج از اروپا توجه کرده اند. بنابراین، بررسی اینکه آیا کیفیت داده ها (به ویژه دقت) یک منطقه متفاوت با نتایج گزارش شده برای مناطق مورد مطالعه اروپایی قابل مقایسه است مفید است. علاوه بر این، مطالعات کمی ارزیابی کیفیت ذاتی مجموعه داده‌های LULC مبتنی بر OSM را انجام داده‌اند، که به‌ویژه برای یک منطقه مورد مطالعه بدون هیچ مجموعه داده مرجع مطلوب است. مهمتر از همه، علاوه بر کامل بودن،
بنابراین، این مطالعه یک ارزیابی کیفیت ذاتی از مجموعه داده‌های LULC مبتنی بر OSM را انجام می‌دهد. اصل رویکرد ما درک کامل و تنوع الگوهای چنین مجموعه داده ای است. به طور دقیق‌تر، یک مجموعه داده LULC مبتنی بر OSM ابتدا تولید و تأیید می‌شود و الگوهای کامل و تنوع آن نقشه‌برداری و تحلیل می‌شوند. تنوع را می توان به عنوان یک معیار کمی در نظر گرفت که تعداد کلاس های LULC در یک مجموعه داده را منعکس می کند. در حالی که تنوع به طور گسترده در علوم اجتماعی [ ۳۱ ] و تجزیه و تحلیل منظر [ ۳۲ ، ۳۳ ] به بهترین شکل دانش ما اعمال شده است، این معیار به ندرت برای ارزیابی کیفیت مجموعه داده های LULC مبتنی بر OSM به کار گرفته شده است.
این مطالعه دو مشارکت دارد:
(۱)
ارزیابی کیفیت ذاتی یک مجموعه داده LULC مبتنی بر OSM انجام شده است. در مقابل، بیشتر مطالعات گذشته از مجموعه داده مرجع LULC برای ارزیابی کیفیت استفاده کرده‌اند. روش تحلیلی ما را می توان برای مناطق دیگر، به ویژه مناطقی که مجموعه داده مرجع LULC رایگان برای آنها در دسترس نیست، اعمال کرد.
(۲)
هم کامل بودن و هم الگوهای تنوع کل یک کشور (چین) نقشه برداری و تجزیه و تحلیل شد، و نتایج نشان می دهد که معیار تنوع ممکن است به عنوان مکملی برای ارزیابی کیفیت ذاتی استفاده شود.
ساختار باقی مانده این مطالعه به شرح زیر است: بخش ۲ منطقه و داده های مورد مطالعه را معرفی می کند. بخش ۳ روش هایی را که نه تنها برای تولید مجموعه داده های LULC مبتنی بر OSM، بلکه برای تجزیه و تحلیل الگوهای کامل و تنوع آن استفاده می شود، ارائه می کند. بخش ۴ نتایج را گزارش و تجزیه و تحلیل می کند و بخش ۵ الگوهای ترکیبی کامل بودن و تنوع را تجزیه و تحلیل می کند. بخش ۶ و بخش ۷ به ترتیب شامل بحث و نتیجه گیری از این مطالعه است.

۲٫ منطقه مطالعه و داده ها

۲٫۱٫ منطقه مطالعه

(سرزمین اصلی) چین به دلایل مختلفی به عنوان منطقه مورد مطالعه انتخاب شد. اول، یک مجموعه داده مرجع LULC برای چین، تولید شده توسط آژانس های نقشه برداری یا شرکت های تجاری، به صورت رایگان در دسترس نبود. با این حال، مجموعه داده OSM ممکن است به عنوان جایگزین استفاده شود. دوم، بیشتر مطالعات مرتبط بر تجزیه و تحلیل مجموعه داده های LULC مبتنی بر OSM در اروپا و نه در سایر مناطق جهان متمرکز شده اند. چین سومین کشور بزرگ جهان از نظر مساحت است. بنابراین، بررسی مناطقی از چین که به خوبی نقشه‌برداری/نقشه‌برداری شده‌اند و اینکه آیا کیفیت داده‌های OSM در چین با اروپا قابل مقایسه است، مفید است. سوم، ۳۶۳ بخش در سطح استان در چین وجود دارد. ممکن است مفید باشد که بتوانیم کامل بودن و تنوع الگوهای چنین تعداد زیادی از تقسیمات را تجزیه و تحلیل کنیم.

۲٫۲٫ داده ها

مهم‌ترین داده‌ها در مطالعه ما، داده‌های مربوط به مجموعه داده‌های OSM در چین بود. این مجموعه داده به صورت رایگان از http://download.geofabrik.de/index.html بدست آمده استدر ژانویه ۲۰۱۹٫ مجموعه داده OSM دارای تعدادی ویژگی بود، از جمله POI، از نظر ویژگی‌های نقطه، و داده‌های مربوط به جاده‌ها، راه‌آهن‌ها، و آبراه‌ها، از نظر ویژگی‌های خط. مجموعه داده OSM همچنین LULC، آب و ساختمان ها را از نظر ویژگی های چند ضلعی پوشش می دهد. هر دو ویژگی خط و چند ضلعی برای تولید مجموعه داده LULC برای تمام چین استفاده شد زیرا چنین ویژگی هایی را می توان با طول یا مساحت مشخص کرد. علاوه بر این، هر شی در یک مجموعه داده OSM معمولاً دارای یک برچسب (مثلاً استفاده از زمین = جنگل) برای توصیف ویژگی خود است، که بر اساس آن (مثلاً جنگل) می‌توانیم هر شی را در یک کلاس LULC طبقه‌بندی کنیم. علاوه بر مجموعه داده OSM، مجموعه داده های بخش اداری (شامل داده های ۳۶۳ بخش در مجموع) به صورت رایگان از سرویس کاتالوگ ملی برای اطلاعات جغرافیایی دریافت شد.http://www.webmap.cn/main.do?method=index ). این مجموعه داده برای تقسیم مجموعه داده های OSM چین به زیربخش های مختلف استفاده شد.

۳٫ روش ها

اصل رویکرد ما درک کامل و تنوع الگوهای مجموعه داده LULC مبتنی بر OSM است. مجموعه داده LULC مبتنی بر OSM در چین ابتدا تولید و سپس با محاسبه معیارهای دقت مختلف تأیید شد. علاوه بر این، این مجموعه داده از نظر معیارهای کامل بودن و تنوع نقشه برداری و تجزیه و تحلیل شد.

۳٫۱٫ تولید و اعتبار سنجی مجموعه داده LULC مبتنی بر OSM

۳٫۱٫۱٫ تولید

تلاش‌های گسترده‌ای برای تولید مجموعه داده‌های LULC مبتنی بر OSM انجام شده است [ ۱۵ ، ۱۶ ، ۱۷ ]، که اکثر آنها دارای سه مرحله معمولی هستند. ابتدا ویژگی های خط را به ویژگی های چند ضلعی تبدیل کنید. دوم، طبقه بندی اشیاء OSM به کلاس های مرجع مربوطه با توجه به برچسب های آنها (به عنوان مثال، استفاده از زمین = جنگل). و سوم، چندین ویژگی OSM (یا لایه ها) را در یک لایه ادغام کنید. این مطالعه این سه مرحله را برای تولید مجموعه داده LULC مبتنی بر OSM دنبال می‌کند.
  • مرحله ۱: ویژگی های خط را به ویژگی های چند ضلعی تبدیل کنید. به گفته ژو و همکاران. [ ۱۷ ]، تبدیل یک ویژگی خط به یک ویژگی چند ضلعی از طریق بافر امکان پذیر است، یعنی ایجاد یک منطقه بافر در اطراف ویژگی خط، پس از آن، منطقه بافر را می توان به عنوان یک ویژگی چند ضلعی مشاهده کرد. چالش در اینجا تعیین شعاع بافر مناسب برای انواع مختلف OSM است زیرا اشیاء خط OSM ممکن است با مقادیر مشخصه های مختلف برچسب گذاری شوند (به عنوان مثال، بزرگراه ها = اولیه، بزرگراه ها = ثانویه، و بزرگراه ها = مسکونی). چنین شعاع مناسبی توسط ژو و همکاران تعیین شد. [ ۱۷] از طریق مقایسه با مجموعه داده LULC مرجع مربوطه (GMESUA). با این حال، چنین مجموعه داده مرجع برای منطقه مورد مطالعه ما در دسترس نبود، و بنابراین شعاع های بافر مختلف (از ۴٫۵ تا ۱۰ متر) برای انواع مختلف OSM به صورت دستی با مراجعه به استاندارد فنی مهندسی بزرگراه چین و تصاویر مربوطه تعیین شد. Google Earth ( جدول ۱ ). شعاع بافر به طور کلی با اهمیت یک نوع جاده OSM همبستگی مثبت داشت.
  • مرحله ۲: اشیاء OSM را به کلاس های مرجع مربوطه طبقه بندی کنید. به دلیل عدم وجود محصول مرجع LULC، ما به صورت دستی تمام اشیاء OSM را (با توجه به برچسب های آنها) به ۱۲ کلاس LULC طبقه بندی کردیم: کشاورزی، باغ، جنگل، چمن، تجاری، صنعتی، مسکونی، استفاده عمومی، استفاده ویژه، حمل و نقل، آب. ، و زمین های دیگر ( جدول ۲ ). تمام این کلاس‌های LULC از سطح اول استانداردهای طبقه‌بندی ملی کاربری زمین چین به‌دست آمدند.
  • مرحله ۳: چندین کلاس (یا لایه) LULC را در یک لایه ادغام کنید. این یک مرحله ضروری است زیرا برخی از اشیاء چند ضلعی در OSM ممکن است همپوشانی داشته باشند اما با کلاس های مختلف LULC مطابقت دارند. بنابراین ممکن است تعیین یک کلاس LULC منحصر به فرد برای همان منطقه جغرافیایی دشوار باشد. راه حل این است که (۱۲) کلاس های LULC با توجه به مساحت متوسط ​​آنها از کوچک به بزرگ همپوشانی داشته باشند [ ۱۷ ]. به طور خاص، مشخصه یا کلاسی با کمترین مساحت متوسط ​​در بالا و آن با بیشترین مساحت متوسط ​​در پایین قرار گرفت. پس از این فرآیند، تمام کلاس ها (یا لایه ها) LULC بیشتر در یک لایه ادغام شدند.
۳٫۱٫۲٫ اعتبار سنجی

دقت اندازه گیری می کند که مجموعه داده LULC مبتنی بر OSM چقدر با محصول مرجع LULC مربوطه مطابقت دارد. این مطالعه از راهبرد نمونه گیری طبقه ای استفاده کرد. تعدادی از نقاط نمونه ابتدا به طور تصادفی برای هر کلاس LULC انتخاب شد و سپس با درصد مساحت هر کلاس در مجموعه داده OSM همبستگی مثبت داشت. کلاس LULC واقعی هر نقطه نمونه به صورت دستی و مستقل توسط دو نفر با مراجعه به Google Earth علامت گذاری شد. هنگامی که هر نقطه توسط دو نفر به طور متفاوت مشخص می شد، نفر سوم در تحلیل شرکت می کرد و تصمیم نهایی با رای گیری گرفته می شد. تمام نقاط نمونه به عنوان مرجع برای ارزیابی دقت مجموعه داده LULC مبتنی بر OSM استفاده شد. بر اساس تمام امتیازات (در مجموع ۳۴۶۴) چندین معیار دقت با مقایسه هر جفت کلاس LULC در مجموعه داده مبتنی بر OSM با موارد موجود در مرجع محاسبه شد. سه معیار رایج – دقت کلی (OA)، دقت کاربر (UA) و دقت تولیدکننده (PA) – محاسبه شد:

OA = ∑من=۱nپمنن
Uآمن =∑من=۱nپمنپمن(oسمتر)
پآمن =∑من=۱nپمنپمن(rهf)

که در آن N تعداد نقاط در کل، n نشان دهنده تعداد کلاس های LULC ( n= 12) پمن(oسمتر)و پمن(rهf)تعداد نقاط طبقه بندی شده به عنوان متعلق به کلاس LULC – i را در مجموعه داده های مبتنی بر OSM و در مرجع به ترتیب نشان می دهد، و پمنتعداد نقاط طبقه بندی شده به عنوان متعلق به کلاس LULC -i در هر دو مجموعه داده را نشان می دهد.

۳٫۲٫ نقشه برداری و تحلیل الگوهای کامل بودن و تنوع

۳٫۲٫۱٫ معیارهای کامل بودن و تنوع

کامل بودن به طور گسترده ای برای ارزیابی کیفیت مجموعه داده های LULC مبتنی بر OSM استفاده شده است [ ۱۹ ، ۲۰ ، ۲۶ ، ۲۷ ]. کامل بودن به عنوان نسبت مساحت زمین یک واحد جغرافیایی تحت پوشش داده های OSM به کل مساحت واحد تعریف می شود.

یک نقشه/مجموعه داده LULC ممکن است با تعدادی کلاس LULC نیز مشخص شود (مثلاً ۱۲). تعاریف مختلفی از تنوع ارائه شده است [ ۳۴ ]، که در میان آنها شاخص تنوع شانون یا آنتروپی شانون [ ۳۵ ] بیشتر در ادبیات استفاده می شود. شاخص تنوع شانون را می توان برای اندازه گیری انواع کلاس های LULC در یک منطقه مورد استفاده قرار داد و بنابراین در مطالعه ما استفاده شد. به این معنا که،

اس = -∑من=۱nپمنلogپمن

جایی که S نشان دهنده شاخص تنوع شانون از مجموعه داده LULC مبتنی بر OSM است، پمننشان‌دهنده درصد مساحت کلاس LULC i در یک واحد جغرافیایی، و n نشان‌دهنده تعداد کلاس‌های LULC است. در مطالعه ما، n = ۱۲، و بنابراین اسمی تواند از صفر (به معنی فقط یک کلاس LULC) تا ۲٫۴۸ (یعنی همه ۱۲ کلاس دارای درصد یکسانی هستند، یعنی ۸٫۳۳٪) متفاوت باشد.

۳٫۲٫۲٫ نقشه برداری و تحلیل
برخلاف دقت، هم کامل بودن و هم تنوع را می توان بدون نیاز به مجموعه داده مرجع LULC ترسیم کرد. بنابراین روش تحلیلی ما مقادیر کامل و تنوع هر بخش در سطح استان را محاسبه کرد و آنها را برای کل منطقه مورد مطالعه ترسیم کرد. با توجه به تفاوت در ویژگی های LULC بین مناطق ساخته شده و غیر ساخته شده، تعداد نسبتاً زیادی از طبقات مصنوعی (مثلاً تجاری، صنعتی و مسکونی) در مناطق ساخته شده و تعداد نسبتاً زیادی وجود دارد. طبقات طبیعی (به عنوان مثال، جنگل، چمن، و آب) در مناطق غیر ساخته شده. این دو سناریو (I و II) مورد تجزیه و تحلیل قرار گرفت. برای سناریوی I، مقادیر کامل و تنوع برای کل بخش در سطح استان محاسبه شد و برای سناریوی II،
علاوه بر این، الگوهای کامل و تنوع چین با استفاده از دو روش تحلیل بصری و ارزیابی کمی مورد مقایسه و تجزیه و تحلیل قرار گرفت.
  • هر دو الگوهای کامل و تنوع به صورت بصری تجزیه و تحلیل شدند. تعدادی سوال در نظر گرفته شد. به عنوان مثال، کدام مناطق دارای ارزش کامل بودن و تنوع نسبتاً بالا یا پایین بودند؟ آیا تفاوتی بین الگوهای کامل و تنوع، از نظر سناریوهای I و II وجود داشت؟ آیا بین کامل بودن و تنوع الگوهای یک سناریو همبستگی وجود داشت؟
  • برای ارزیابی کمی، تعدادی از عوامل برای شناسایی عواملی که می‌توانستند الگوهای کامل و تنوع را تحت تأثیر قرار دهند، مورد استفاده قرار گرفتند. ابتدا سه عامل اجتماعی-اقتصادی [اندازه مناطق ساخته شده، جمعیت آنها و تولید ناخالص داخلی (GDP)] در نظر گرفته شد. داده های مربوطه در سال ۲۰۱۹ از اداره ملی آمار چین ( http://www.stats.gov.cn ) به دست آمده است. این عوامل به این دلیل انتخاب شدند که مطالعات نشان داده‌اند که کامل بودن داده‌های OSM در شهرداری‌هایی با تراکم جمعیت بالا بیشتر است [ ۲۷ ]. کامل بودن نیز با تولید ناخالص داخلی همبستگی مثبت دارد [ ۲۵]. بنابراین، بررسی اینکه آیا این عوامل هنوز هم می توانند با الگوهای کامل و تنوع مجموعه داده LULC مبتنی بر OSM چین همبستگی مثبت داشته باشند مفید است. علاوه بر این، تعداد مشارکت‌کنندگان (که داده‌های OSM را ویرایش کرده بودند) بر اساس تجزیه و تحلیل داده‌های تاریخچه OSM محاسبه شد ( https://planet.openstreetmap.org/planet/full-history/ ، در ژانویه ۲۰۱۹ مشاهده شد). این عدد بر حسب هر بخش در سطح استان (برای سناریوی I) و مناطق ساخته شده از هر بخش در سطح استان (برای سناریوی II) محاسبه شد تا مشخص شود که آیا تعداد مشارکت کنندگان با کامل بودن و/همبستگی مثبت دارد یا خیر. یا الگوهای تنوع

۴٫ نتایج و تجزیه و تحلیل

۴٫۱٫ تولید و اعتبار سنجی مجموعه داده LULC مبتنی بر OSM

نقشه LULC چین مبتنی بر OSM در شکل ۱ نشان داده شده است . اول، اکثر مناطق یا تحت پوشش داده های OSM نبودند یا توسط داوطلبان OSM نقشه برداری نشده بودند (با علامت “بدون داده”). بنابراین، مجموعه داده تا کامل شدن فاصله داشت. دوم، هر دو کلاس LULC، جنگل (سبز تیره) و آب (آبی روشن)، به راحتی قابل مشاهده بودند زیرا در مقایسه با سایر طبقات (به عنوان مثال، مسکونی در شکل ۱ ب) مناطق وسیعی را اشغال کردند. سوم، داده‌های OSM به‌طور نابرابر در سراسر کشور توزیع شده‌اند، به عنوان مثال، داده‌های نسبتاً بیشتری برای شرق، مرکز و شمال شرق چین وجود دارد – مناطقی که عمدتاً با جنگل‌ها نقشه‌برداری شده‌اند ( شکل ۱ ج).
ماتریس سردرگمی و دقت مربوط به مجموعه داده LULC مبتنی بر OSM در جدول ۳ فهرست شده است. دقت کلی قابل توجهی (یعنی OA = 82.2٪) به دست آمد. علاوه بر این، هشت کلاس از ۱۲ کلاس LULC از نظر UA و PA نزدیک یا بالاتر از ۷۰٪ بودند. دو مورد از آنها (جنگل و آب) نزدیک یا بالاتر از ۹۰٪ بودند. این نتایج کارایی مجموعه داده LULC تولید شده چین را تأیید می کند. علاوه بر این، مقادیر دقت به عنوان قابل مقایسه با مقادیر گزارش شده در مناطق مورد مطالعه اروپایی تایید شد [ ۱۹ ].

۴٫۲٫ نقشه برداری و تحلیل الگوهای کامل بودن و تنوع

مقادیر کامل بودن به شدت با توجه به تقسیم بندی در سطح استان ( شکل ۲ a,c) متفاوت بود، به عنوان مثال، از ۰٫۴٪ تا ۹۷٫۹٪ برای سناریوی I، و از ۱٫۷٪ تا ۸۹٫۴٪ برای سناریوی II. این یک توزیع ناهمگون از داده های OSM برای چین را نشان می دهد. در سناریوی I، اکثر تقسیمات در سطح استان با مقادیر کامل بودن بالا (مثلاً مقادیر بین ۵۰٪ تا ۹۷٫۹٪) در شرق، مرکز و شمال شرقی چین قرار داشتند زیرا منطقه وسیعی از این مناطق توسط جنگل ها اشغال شده است. ( شکل ۳آ). با این حال، الگوی کامل بودن سناریوی II توزیع متفاوتی را نشان داد. اکثر تقسیمات با مقادیر کامل بودن بالا در شمال غربی، جنوب غربی و شمال شرقی چین قرار داشتند زیرا در مناطق ساخته شده زمین های مسکونی بیشتر از جنگل ها وجود داشت ( شکل ۳ ب). علاوه بر این، اکثر مناطق ساخته شده با مقادیر کامل بودن بالا توسط داوطلبان (OSM) به عنوان چند چند ضلعی بزرگ نقشه‌برداری شده و به عنوان متعلق به طبقه مسکونی برچسب‌گذاری شده‌اند. در داخل این مناطق ساخته شده چند کلاس LULC دیگر (به عنوان مثال، تجاری، صنعتی و استفاده عمومی) وجود داشت. به عنوان مثال، شکل ۱b مناطق ساخته شده نانینگ (پایتختی در جنوب چین) را نشان می دهد که عمدتاً با یک زمین مسکونی پوشیده شده است. این نشان می دهد که این مناطق ساخته شده با وجود مقادیر نسبتاً کامل کامل، به خوبی نقشه برداری نشده اند.
الگوهای تنوع ( شکل ۲ ب، د) با الگوهای کامل ( شکل ۲ الف، ج) متفاوت بود. بیشتر بخش‌های بسیار متنوع دارای مقادیر کامل نسبتاً پایینی بودند – این بخش‌ها در سواحل شرقی چین قرار داشتند (مخصوصاً برای سناریوی II)، اما مقادیر کامل بودن آنها کم بود (در شکل ۲ ج با رنگ آبی مشخص شده‌اند). تفاوت بین کامل بودن و تنوع الگوها در شکل ۳ نشان داده شده است. اگر درصد مساحت یک کلاس LULC خاص (مثلاً جنگل یا مسکونی) به ویژه بالا بود، درصد مساحت سایر کلاس‌های LULC پایین بود و مقادیر تنوع همه طبقات نیز پایین بود.
جدول ۴ همبستگی بین عوامل متعدد (اندازه منطقه ساخته شده، جمعیت، تولید ناخالص داخلی، و تعداد مشارکت کنندگان) و چهار الگو را در شکل ۲ فهرست می کند. همبستگی بین هر یک از سه عامل اجتماعی-اقتصادی و تعداد مشارکت کنندگان نیز فهرست شده است.
همبستگی معنی داری بین الگوهای کامل بودن و اکثر عوامل مشاهده شد ( جدول ۴ ). همبستگی مثبت بین Completeness-I، و BUA، GDP، و NC-I، و همبستگی منفی بین Completeness-II، و BUA، POP، و NC-II مشاهده شد. به نظر می رسد این نتایج کاملاً با نتایج مطالعات گذشته مطابقت ندارد [ ۲۵ ، ۲۷]، که کامل بودن داده های OSM را با عوامل اجتماعی-اقتصادی همبستگی مثبت گزارش کرده اند زیرا مشارکت کنندگان OSM و فعالیت های نقشه برداری مرتبط در جمعیت های متراکم و/یا مناطق توسعه یافته بیشتر است. نتایج متناقض (فقط برای سناریوی II) احتمالاً به دو دلیل به وجود آمده اند: از یک طرف، اندازه مناطق ساخته شده در غرب چین نسبتاً کوچک بوده است ( شکل ۴ الف)، و چنین مناطقی ممکن است به راحتی نقشه برداری شوند. توسط داوطلبان از سوی دیگر، بیشتر مناطق ساخته شده با مقادیر کامل بودن بالا تنها با چند زمین مسکونی با چند کلاس LULC دیگر نقشه برداری شدند (به عنوان مثال، شکل ۱ ب). این احتمالاً به این دلیل است که غرب چین جمعیت نسبتاً کمی دارد ( شکل ۴ ب) و بنابراین مشارکت کنندگان کمی دارد (شکل ۴ د، ه).
همبستگی مثبت معنی داری بین هر یک از الگوهای تنوع (Diversity-I و Diversity-II) و همه عوامل ذکر شده در جدول ۴ به دست آمد. علاوه بر این، ضرایب همبستگی آنها بیشتر از ضرایب برای الگوهای کامل بودن (کامل-I و کامل-II) بود. این به این دلیل است که اکثر بخش‌های بسیار متنوع در سطح استان چین در مناطقی با جمعیت نسبتاً بالا قرار داشتند ( شکل ۴ ب و شکل ۴ ج تولید ناخالص داخلی ). مهمتر از همه، مطالعات گزارش کرده اند که عوامل اجتماعی-اقتصادی همبستگی مثبتی با تعداد مشارکت کنندگان و تراکم داده های نقشه برداری آنها دارند [ ۱۸ ، ۳۶ ]]. در این مطالعه، بین هر یک از عوامل اجتماعی-اقتصادی و تعداد مشارکت کنندگان نیز همبستگی متوسط ​​یا زیاد مشاهده شد. بنابراین، به نظر می‌رسد که تنوع در بازتاب الگوی فضایی مشارکت‌کنندگان و فعالیت‌های نقشه‌برداری آنها بهتر از کامل بودن است. علاوه بر این، ضرایب همبستگی برای Diversity-II بالاتر بود، احتمالاً به این دلیل که مشارکت کنندگان بیشتری در مناطق ساخته شده نسبت به مناطق غیر ساخته شده وجود داشت.

۵٫ ترکیبی از کامل بودن و الگوهای تنوع

در حالی که روندهای مخالف نیز مشاهده شد ( شکل ۲ )، همبستگی بین الگوهای کامل بودن و تنوع خیلی زیاد نبود، به عنوان مثال، ضرایب همبستگی برای سناریوهای I و II به ترتیب ۴۴۱/۰- و ۳۳۰/۰- بود. بنابراین ترکیب کامل و تنوع الگوها مفید است. الگوی ترکیبی با مراجعه به ژانگ و همکاران ترسیم شده است. [ ۲۳ ]: توزیع داده‌های هر یک از معیارها بررسی شد و اگر داده‌ها از توزیع نرمال پیروی نمی‌کردند، تحت یک تبدیل log قرار می‌گرفتند. متعاقباً، تمام بخش‌های سطح استان چین به چهار گروه مختلف تقسیم شدند:
  • گروه I (کامل بالا و تنوع بالا): کامل بودن بالاتر از یک آستانه معین بود ( آج، همانطور که تنوع بود ( آد).
  • گروه دوم (تنوع بالا و تنوع کم): کامل بودن بالاتر از آج، اما تنوع کمتر از آد.
  • گروه III (کامل کم و تنوع بالا): کامل بودن کمتر از آج، اما تنوع بالاتر از آد;
  • گروه چهارم (کمیت کم و تنوع کم): کامل بودن کمتر از آج، و تنوع کمتر از آد.
آستانه ها آجو آدبه ترتیب میانگین کامل بودن و میانگین تنوع همه بخش‌های سطح استان را نشان می‌دهد.
در مطالعه ما، تنها مقادیر کامل بودن با یک تبدیل log تبدیل شدند زیرا از توزیع نرمال پیروی نمی کردند. ما الگوهای ترکیبی را برای سناریوهای مختلف رسم کردیم ( شکل ۵ )، که در آن آستانه ها آجو آدبرای سناریوی اول به ترتیب ۰۹/۵ و ۱۶/۱ درصد و برای سناریوی دوم ۸۴/۱۸ درصد و ۱۰/۱ درصد بود. آستانه ها هنگام استفاده از میانگین (کامل بودن و تنوع) مشابه با استفاده از میانه بود و بنابراین فقط از میانگین ها در تجزیه و تحلیل استفاده شد. علاوه بر این، مقادیر کامل بودن برای اکثر بخش‌های سطح استان چین پایین بود.
چهار گروه برای هر سناریو در شکل ۵ نشان داده شده است :
  • گروه I: برای هر دو سناریو I و II، بیشتر بخش‌های سطح استان شهرداری‌ها بودند، به عنوان مثال، پکن ( شکل ۶ الف)، شانگهای، و تیانجین، شهرهای پایتخت، مانند گوانگژو، نانجینگ، چنگدو، و چانگشا، و نسبتاً توسعه‌یافته شهرها (شنژن، چینگدائو و شیامن)، و مناطقی در ساحل شرقی. این بخش‌ها احتمالاً توجه بیشتری را از جانب داوطلبان به خود جلب کردند، و بنابراین ارزش‌های کامل و تنوع آنها نسبتاً بالا بود.
  • گروه دوم: تقسیمات این گروه در سطح استان در سناریوها متفاوت بود. در سناریوی اول، بیشتر بخش‌ها در شرق، مرکز و شمال شرقی چین قرار داشتند که به دلیل داشتن درصد وسیعی از جنگل است. در سناریوی دوم، آنها در جنوب غربی، شمال غربی و شمال شرقی چین قرار داشتند که به دلیل داشتن درصد مساحت زیادی از زمین های مسکونی بود. این تقریباً با آنچه در شکل ۲ a,c نشان داده شده است مطابقت داشت.
  • گروه‌های III و IV: تقسیم‌بندی‌های سطح استان این گروه‌ها به چند دلیل ارزش کاملی پایینی داشتند: برخی از بخش‌ها (مانند Haixi و Naqu) با مساحت زمین بزرگ مشخص می‌شدند، و بنابراین داوطلبان به زمان و تلاش بیشتری نیاز داشتند. این تقسیمات را به خوبی ترسیم کنید. بعلاوه، برخی از بخش ها (مثلاً لشان ( شکل ۶ ب) و سونگ یوان ( شکل ۶ ج)) کمتر شناخته شده بودند، به ویژه در مقایسه با گروه I، و بنابراین احتمالاً داوطلبان کمتر مورد توجه قرار می گرفتند. علاوه بر این، اکثر بخش‌ها مقدار تنوع نسبتاً بالایی را نشان دادند، که نشان می‌دهد در بیشتر موارد کلاس LULC غالبی نبود. با این حال، برخی از بخش ها (به عنوان مثال، شکل ۶ج) درصد مساحت نسبتاً بزرگی از آب (۷۹٫۳٪ برای نمودار سمت چپ در شکل ۶ ج) یا زمین های مسکونی (۸۵٫۶٪ برای نمودار سمت راست در شکل ۶ c) را نشان می دهد، که منجر به ارزش تنوع پایین می شود.

۶٫ بحث

۶٫۱٫ معیارهای کیفیت

این مطالعه از سه معیار (دقت، کامل و تنوع) برای ارزیابی کیفیت ذاتی مجموعه داده LULC مبتنی بر OSM برای چین استفاده کرد. در مقابل، اکثر مطالعات گذشته [ ۱۹ ، ۲۰ ، ۲۷ ] نه تنها از یک مجموعه داده مرجع LULC برای مقایسه با یک مجموعه داده مبتنی بر OSM استفاده کردند، بلکه دو مورد (دقت و کامل بودن) را نیز تنها در نظر گرفتند. ما فکر می کنیم که چندین مزیت در نظر گرفتن تنوع برای ارزیابی کیفیت ذاتی مجموعه داده LULC مبتنی بر OSM وجود دارد.
اول، الگوهای تنوع OSM به طور قابل توجهی با الگوهای کامل بودن آن متفاوت است ( شکل ۲ ). به عنوان مثال، یک تقسیم بندی بسیار کامل در سطح استان نباید از نظر تنوع زیاد باشد زیرا تنوع کلاس های LULC ممکن است در مناطق مختلف متفاوت باشد. به عنوان مثال، ارزش تنوع معمولاً در مناطق ساخته شده بیشتر از مناطق غیر ساخته شده بود. مهمتر از آن، تنوع یک مجموعه داده LULC مبتنی بر OSM نیز به فعالیت های نقشه برداری مشارکت کنندگان مرتبط است. به عنوان مثال، ما دریافتیم که برخی از مناطق ساخته شده به عنوان چند ضلعی بزرگ ویرایش شده و با نوع OSM “مسکونی” برچسب گذاری شده اند ( شکل ۶ج)، اما سایرین با جزئیات بیشتر ویرایش شده بودند (مثلاً به عنوان تعداد بیشتری از چند ضلعی های کوچک) و با انواع مختلف OSM (مسکونی، صنعتی و استفاده عمومی، شکل ۶ a,b) برچسب گذاری شده بودند. بنابراین، تشخیص تنوع انواع OSM با استفاده از معیار تنوع مفید است.
دوم، الگوهای تنوع همبستگی مثبت معناداری با همه عوامل اجتماعی-اقتصادی (اندازه مناطق ساخته شده، جمعیت و تولید ناخالص داخلی در جدول ۴ ) نشان دادند. در مقابل، الگوی کامل (سناریوی II) همبستگی منفی معنی‌داری با اندازه مناطق ساخته‌شده و جمعیت نشان داد. علاوه بر این، عوامل اجتماعی و اقتصادی با تعداد مشارکت کنندگان ( جدول ۴ ) و احتمالاً تراکم داده های نقشه برداری آنها همبستگی مثبت داشتند [ ۱۸ ، ۳۶ ]]. برخی از مناطق ساخته شده با ارزش کامل بودن بالا برای چین با زمین های مسکونی نسبتاً بزرگ، اما با جزئیات کمی از سایر طبقات، نقشه برداری شدند، احتمالاً به این دلیل که چنین مناطق ساخته شده کمتر مورد توجه مشارکت کنندگان قرار گرفته بود. با این حال، اکثر بخش‌های بسیار کامل و بسیار متنوع در سطح استان چین احتمالاً توجه بیشتری را از سوی مشارکت‌کنندگان دریافت کردند. بنابراین، در نظر گرفتن تنوع برای درک الگوی فضایی مشارکت کنندگان و فعالیت های نقشه برداری آنها مفید است.
علیرغم مزایای فوق، ما پیشنهاد می کنیم از معیار تنوع به عنوان مکمل استفاده کنیم، نه راهی برای نتیجه گیری ساده که تنوع با کیفیت یک مجموعه داده همبستگی مثبت دارد. این به این دلیل است که مقدار واقعی تنوع ممکن است در مناطق مختلف متفاوت باشد. علاوه بر این، ارزیابی دقت ممکن است ضروری نباشد زیرا مطالعات گذشته تأیید کرده‌اند که دقت داده‌های OSM نسبتاً بالا است [ ۱۹ ، ۲۶ ، ۲۷ ]، که برای منطقه مورد مطالعه ما نیز همینطور بود.

۶٫۲٫ برنامه های کاربردی

روش پیشنهادی پتانسیلی را برای استفاده در خدمت درک کامل و تنوع الگوهای مناطق ارائه می دهد. به عنوان مثال، یک کاربر OSM ممکن است نه تنها از تقسیمات بسیار کامل در سطح استان برای تولید نقشه LULC مبتنی بر OSM استفاده کند، بلکه از تقسیمات بسیار متنوع (حتی اگر برخی از آنها ناقص باشند) استفاده کند. این به این دلیل است که طیف متنوعی از کلاس‌های LULC ممکن است به عنوان نمونه‌های آموزشی و/یا اعتبارسنجی استفاده شوند [ ۳۷ ]، که به نوبه خود می‌توانند برای تولید نقشه LULC، احتمالاً با منبع داده دیگری، به عنوان مثال، داده‌های سنجش از دور [ ۱۶ ، ۳۸ ] استفاده شوند. ]، POI [ ۳۹ ]، و/یا نمای خیابان [ ۴۰]. یک مشارکت‌کننده OSM ممکن است نه تنها از بخش‌هایی استفاده کند که دارای مقادیر کم‌بودن هستند، بلکه از بخش‌هایی با مقادیر کم‌تنوع نیز استفاده کند (حتی اگر برخی از آنها دارای مقادیر کامل بودن نسبتاً بالایی باشند). این به این دلیل است که مناطق بسیار کامل نیز ممکن است به خوبی ترسیم نشده باشند. بنابراین، کاربران و مشارکت کنندگان OSM می توانند از الگوهای ترکیبی برای درک بهتر مجموعه داده های LULC مبتنی بر OSM استفاده کنند.

۶٫۳٫ محدودیت ها

این مطالعه به دلیل فقدان مجموعه داده های مرجع در دسترس، که برای اکثر کشورها و مناطق جهان اعمال می شود، محدود شده است. در نتیجه، محاسبه دقت و مقادیر واقعی تنوع برای هر بخش در سطح استان دشوار بود. در حالی که محصولات جهانی LC (به عنوان مثال، GlobalLandcover30 و Climate Change Initiative Land Cover) به طور فزاینده ای در دسترس هستند، آنها فقط داده های LC و نه LU را ارائه می دهند. بنابراین، کلاس های مختلف LU، مانند تجاری، صنعتی، استفاده عمومی، مسکونی و حمل و نقل قابل دستیابی نیستند. نقشه ها و مجموعه داده های LULC ارائه شده توسط آژانس های نقشه برداری و شرکت های تجاری به صورت رایگان برای چین در دسترس نیستند. با این وجود، الگوهای کامل و تنوع یک مجموعه داده LULC مبتنی بر OSM را می توان بدون استفاده از هیچ مرجعی محاسبه کرد. از این رو،

۷٫ نتیجه گیری

این مطالعه یک ارزیابی کیفیت ذاتی مجموعه‌های داده LULC مبتنی بر OSM را با درک الگوهای کامل و تنوع چنین مجموعه‌های داده انجام داد. یک مجموعه داده LULC مبتنی بر OSM ابتدا با معیارهای دقت مختلف تولید و تأیید شد و سپس از نظر کامل بودن و تنوع نقشه‌برداری و تحلیل شد. چین، که قبلاً به ندرت مورد مطالعه قرار گرفته است، و با فقدان مجموعه داده مرجع LULC در دسترس مشخص می شود، به عنوان منطقه مورد مطالعه انتخاب شد. الگوهای کامل و تنوع مجموعه داده تولید شده برای دو سناریو مورد تجزیه و تحلیل قرار گرفت. در سناریوی اول، کل مساحت زمین هر بخش در سطح استان مورد تجزیه و تحلیل قرار گرفت. در سناریوی دوم، تنها مناطق ساخته شده از هر بخش در سطح استان مورد تجزیه و تحلیل قرار گرفت. علاوه بر این، همبستگی بین هر دو الگو (کامل بودن و تنوع) و سه عامل اجتماعی-اقتصادی (اندازه منطقه ساخته شده، جمعیت و تولید ناخالص داخلی)، و تعداد مشارکت کنندگان مورد بررسی قرار گرفت. نتایج موارد زیر را نشان داد:
(۱)
OA مجموعه داده LULC مبتنی بر OSM در چین به اندازه ۸۲٫۲٪ بود که نشان می دهد مجموعه داده های LULC تولید شده برای کشور موثر بوده و قابل مقایسه با داده های مربوط به مناطق مطالعاتی اروپایی در کار گذشته است.
(۲)
الگوهای کامل و تنوع هر دو با تقسیم بندی در سطح استان متفاوت بود. علاوه بر این، الگوهای کامل به طور قابل توجهی با الگوهای تنوع مربوطه متفاوت بود. به‌ویژه در مقیاس مناطق ساخته‌شده، تقسیم‌بندی‌هایی با مقادیر کامل بودن بالا ممکن است به دلیل ارزش تنوع پایین به خوبی ترسیم نشده باشند.
(۳)
همبستگی بین الگوهای تنوع و هر یک از سه عامل اجتماعی-اقتصادی و تعداد مشارکت کنندگان نه تنها بیشتر از آنهایی بود که برای الگوهای کامل در نظر گرفته می شد، بلکه به طور قابل توجهی مثبت بود. بنابراین، الگوی تنوع بازتاب بهتری از عوامل اجتماعی-اقتصادی و الگوی فضایی مشارکت‌کنندگان است.
(۴)
هر دو الگوی کامل و تنوع را می توان در گروه های مختلف (کاملیت زیاد و تنوع زیاد، کامل بودن زیاد و تنوع کم، کامل بودن کم و تنوع زیاد، و کامل بودن کم و تنوع کم) ترکیب کرد. الگوهای ترکیبی هم به کاربران OSM و هم برای داوطلبان سود می‌رسانند که درک بهتری از مجموعه داده‌های LULC مبتنی بر OSM ارائه می‌دهند.
نتایج بالا نشان می دهد که در نظر گرفتن تنوع به عنوان مکملی برای ارزیابی کیفیت ذاتی مجموعه داده LULC مبتنی بر OSM مفید است. در حالی که تنها چین در اینجا مورد بررسی قرار گرفت، روش تحلیلی پیشنهاد شده در این مطالعه می‌تواند برای درک الگوهای فضایی مجموعه داده LULC مبتنی بر OSM در سایر کشورها و مناطق استفاده شود.
در کار آینده، ابتدا، استفاده از یک مجموعه داده مرجع LULC برای ارزیابی بیشتر کیفیت مجموعه داده LULC مبتنی بر OSM برای چین مفید است. دوم، شاخص تنوع شانون به تنهایی در مطالعه ما به کار گرفته شد، اما برخی از شاخص های تنوع دیگر [ ۳۴ ] را می توان در نظر گرفت. استفاده از روش تحلیلی ارائه شده در اینجا برای ارزیابی ذاتی کیفیت مجموعه داده LULC مبتنی بر OSM برای سایر کشورها و مناطق باید آموزنده باشد.

منابع

  1. جونز، دی. هانسن، ای جی; بلی، ک. دوهرتی، ک. Verschuyl، JP; پاو، جی. کارل، آر. داستان، SJ نظارت بر استفاده از زمین و پوشش اطراف پارک ها: یک رویکرد مفهومی. سنسور از راه دور محیط. ۲۰۰۹ ، ۱۱۳ ، ۱۳۴۶-۱۳۵۶٫ [ Google Scholar ] [ CrossRef ]
  2. لیانگ، جی. ژونگ، ام. زنگ، جی. چن، جی. هوآ، اس. لی، ایکس. یوان، ی. وو، اچ. گائو، X. مدیریت ریسک برای برنامه‌ریزی استفاده بهینه از زمین که ارزش‌های خدمات اکوسیستم را یکپارچه می‌کند: مطالعه موردی در چانگشا، چین میانه. علمی کل محیط. ۲۰۱۷ ، ۵۷۹ ، ۱۶۷۵-۱۶۸۲٫ [ Google Scholar ] [ CrossRef ] [ PubMed ]
  3. مصدقی، ر. وارنکن، جی. تاملینسون، آر. میرفندرسسک، اچ. مقایسه AHP فازی و AHP در یک مدل تصمیم‌گیری چند معیاره فضایی برای برنامه‌ریزی کاربری اراضی شهری. محاسبه کنید. محیط زیست سیستم شهری ۲۰۱۵ ، ۴۹ ، ۵۴-۶۵٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  4. رییسی، م. بله، ال. رجبی فرد، ع. Ngo، T. برنامه ریزی کاربری زمین: مفاهیم برای پایداری حمل و نقل. سیاست کاربری زمین ۲۰۱۶ ، ۵۰ ، ۲۵۲-۲۶۱٫ [ Google Scholar ] [ CrossRef ]
  5. Hegazy, IR; Kaloop، MR نظارت بر رشد شهری و تشخیص تغییر کاربری زمین با GIS و تکنیک‌های سنجش از دور در استان دقاهلیه مصر. بین المللی J. Sustain. محیط ساخته شده ۲۰۱۵ ، ۴۴ ، ۱۱۷-۱۲۴٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  6. ریمال، بی. ژانگ، ال. کشتکار، ح. هک، BN; رجال، س. Zhang، P. پویایی کاربری/پوشش زمین و مدل‌سازی گسترش زمین شهری با ادغام اتوماتای ​​سلولی و زنجیره مارکوف. بین المللی J. Geo-Inf. ۲۰۱۸ ، ۷۷ ، ۱۵۴٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  7. زنگ، سی. لیو، ی. Stein، AL; جیائو، ال. خصوصیات و مدل‌سازی فضایی پراکندگی شهری در منطقه شهری ووهان، چین. بین المللی J. Appl. زمین Obs. Geoinf. ۲۰۱۵ ، ۳۴ ، ۱۰-۲۴٫ [ Google Scholar ] [ CrossRef ]
  8. چن، جی. چن، جی. لیائو، ا. کائو، ایکس. چن، ال. چن، ایکس. او، سی. آویزان شدن.؛ پنگ، اس. لو، ام. و همکاران نقشه برداری جهانی پوشش زمین با وضوح ۳۰ متر: یک رویکرد عملیاتی مبتنی بر POK ISPRS J. Photogramm. Remote Sens. ۲۰۱۵ ، ۱۰۳ ، ۷-۲۷٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  9. گرکوسیس، جی. مونتراکیس، جی. Kavouras, M. مروری بر ۲۱ محصول جهانی و ۴۳ منطقه ای نقشه برداری پوشش زمین. بین المللی J. Remote Sens. ۲۰۱۵ ، ۳۶ ، ۵۳۰۹-۵۳۳۵٫ [ Google Scholar ] [ CrossRef ]
  10. فریتز، اس. ببینید، L. پرگر، سی. مک کالوم، آی. شیل، سی. شپاچنکو، دی. دوراور، ام. کارنر، ام. درزل، سی. Laso-Bayas، JC; و همکاران مجموعه داده جهانی از داده‌های مرجع پوشش زمین و کاربری زمین جمع‌سپاری شده. علمی داده ۲۰۱۷ ، ۴ ، ۱۷۰۰۷۵٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  11. هو، ی. Han, Y. شناسایی مناطق عملکردی شهری بر اساس داده‌های POI: مطالعه موردی منطقه توسعه اقتصادی و فناوری گوانگژو. پایداری ۲۰۱۹ ، ۱۱ ، ۱۳۸۵٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  12. کانگ، جی. کورنر، ام. وانگ، ی. تاوبنبوک، اچ. طبقه‌بندی نمونه ساختمان Zhu، XX با استفاده از تصاویر نمای خیابان. ISPRS J. Photogramm. Remote Sens. ۲۰۱۸ , ۱۴۵ , ۴۴–۵۹٫ [ Google Scholar ] [ CrossRef ]
  13. پی، تی. سوبولفسکی، اس. راتی، سی. شاو، اس. لی، تی. ژو، سی. بینشی جدید در طبقه بندی کاربری زمین بر اساس داده های تلفن همراه جمع آوری شده است. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۴ ، ۲۸ ، ۱۹۸۸-۲۰۰۷٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  14. Goodchild، M. شهروندان به عنوان حسگرها: دنیای جغرافیای داوطلبانه. ژئوژورنال ۲۰۰۷ ، ۶۹ ، ۲۱۱-۲۲۱٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  15. ارسنجانی، ج. هلبیچ، ام. باکی‌الله، م. Hagenauer, J. به سمت نقشه برداری الگوهای کاربری زمین از اطلاعات جغرافیایی داوطلبانه. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۳ ، ۲۷ ، ۲۲۶۴-۲۲۷۸٫ [ Google Scholar ] [ CrossRef ]
  16. شولتز، ام. ووس، ج. اور، ام. کارتر، اس. Zipf، A. پوشش زمین را از OpenStreetMap و سنجش از راه دور باز کنید. بین المللی J. Appl. زمین Obs. Geoinf. ۲۰۱۷ ، ۶۳ ، ۲۰۶-۲۱۳٫ [ Google Scholar ] [ CrossRef ]
  17. ژو، Q. جیا، ایکس. Lin, H. رویکردی برای ایجاد مکاتبات بین OpenStreetMap و مجموعه داده های مرجع برای استفاده از زمین و نقشه برداری پوشش زمین. ترانس. GIS ۲۰۱۹ ، ۲۳ ، ۱۱۷۷–۱۴۶۴٫ [ Google Scholar ] [ CrossRef ]
  18. شن، جی. یانگ، اس. زنگ، ک. ژو، جی. فن، اچ. مائو، بی. نظر جمعیت مشارکت کننده برای OpenStreetMap: نظرسنجی در چین. بین المللی قوس. فتوگرام حسگر از راه دور اسپات. Inf. علمی ۲۰۱۸ ، ۴۲ ، ۱۵۲۵-۱۵۳۱٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  19. ارسنجانی، ج. Vaz, E. ارزیابی یک رویکرد نقشه برداری مشترک برای کاوش الگوهای کاربری زمین برای چندین کلانشهر اروپایی. بین المللی J. Appl. زمین Obs. Geoinf. ۲۰۱۵ ، ۳۵ ، ۳۲۹-۳۳۷٫ [ Google Scholar ] [ CrossRef ]
  20. ویانا، سی ام؛ انکالادا، ال. Rocha, J. ارزش مشارکت‌های تاریخی OpenStreetMap به عنوان منبع داده‌های نمونه‌گیری برای نقشه‌های کاربری/پوشش زمین چندزمانی. بین المللی J. Geo-Inf. ۲۰۱۹ ، ۸ ، ۱۱۶٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  21. Haklay, M. اطلاعات جغرافیایی داوطلبانه چقدر خوب است؟ مطالعه تطبیقی ​​مجموعه داده‌های OpenStreetMap و Ordnance Survey. محیط زیست طرح. B طرح. دس ۲۰۱۰ ، ۳۷ ، ۶۸۲-۷۰۳٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  22. گیرس، جی اف. Touya, G. ارزیابی کیفیت مجموعه داده OpenStreetMap فرانسه. ترانس. GIS ۲۰۱۰ ، ۱۴ ، ۴۳۵-۴۵۹٫ [ Google Scholar ] [ CrossRef ]
  23. ژانگ، ی. لی، ایکس. وانگ، آ. بائو، تی. تیان، اس. تراکم و تنوع شبکه‌های جاده‌ای OpenStreetMap در چین. J. Urban Manag. ۲۰۱۵ ، ۴۴ ، ۱۳۵-۱۴۶٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  24. ژو، Q. بررسی رابطه بین تراکم و کامل بودن داده های ساختمان شهری در OpenStreetMap برای تخمین کیفیت. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۸ ، ۳۲ ، ۲۵۷-۲۸۱٫ [ Google Scholar ] [ CrossRef ]
  25. تیان، ی. ژو، Q. Fu، X. تجزیه و تحلیل تکامل، کامل بودن و الگوهای فضایی داده های ساختمانی OpenStreetMap در چین. ISPRS Int. J. Geo-Inf. ۲۰۱۹ ، ۸۸ ، ۳۵٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  26. استیما، ج. Painho، M. بررسی پتانسیل OpenStreetMap برای استفاده از زمین / تولید پوشش زمین: مطالعه موردی برای پرتغال قاره. در OpenStreetMap در GIScience, Lecture Notes in Geoinformation and Cartography . جوکار ارسنجانی، ج.، زیپف، ع.، مونی، پ.، هلبیچ، م.، ویرایش. Springer International Publishing: Cham, Switzerland, 2015. [ Google Scholar ]
  27. دورن، اچ. تورنروس، تی. Zipf، A. ارزیابی کیفیت VGI با استفاده از داده‌های معتبر – مقایسه با داده‌های کاربری زمین در جنوب آلمان. ISPRS Int. J. Geo-Inf. ۲۰۱۵ ، ۴ ، ۱۶۵۷-۱۶۷۱٫ [ Google Scholar ] [ CrossRef ]
  28. ببینید، L. کامبر، ا. سالک، سی. فریتز، اس. ولده، م. پرگر، سی. شیل، سی. مک کالوم، آی. کراکسنر، اف. Obsersteiner, M. مقایسه کیفیت داده های جمع سپاری ارائه شده توسط متخصص و غیر متخصص. PLoS ONE ۲۰۱۳ ، ۸۸ ، e69958. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  29. کامبر، ا. ببینید، L. فریتز، اس. ولده، م. پرگر، سی. فودی، جی. استفاده از داده های کنترلی برای تعیین قابلیت اطمینان اطلاعات جغرافیایی داوطلبانه در مورد پوشش زمین. بین المللی J. Appl. زمین Obs. Geoinf. ۲۰۱۳ ، ۲۳ ، ۳۷-۴۸٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  30. ژو، Q. Tian، YJ استفاده از شاخص‌های هندسی برای تخمین کامل بودن کمی بلوک‌های خیابان در OpenStreetMap. ترانس. GIS ۲۰۱۸ ، ۲۲ ، ۱۵۵۰-۱۵۷۲٫ [ Google Scholar ] [ CrossRef ]
  31. هریستوا، دی. ویلیامز، ام. موصلی، م. پانزاراسا، پ. ماسکولو، سی. اندازه گیری تنوع اجتماعی شهری با استفاده از شبکه های به هم پیوسته جغرافیایی اجتماعی. در مجموعه مقالات بیست و پنجمین کنفرانس بین المللی وب جهانی، مونترال، QC، کانادا، ۱۱ تا ۱۵ آوریل ۲۰۱۶٫ [ Google Scholar ]
  32. Vogiatzakis، LN; Manolaki, P. بررسی تنوع و تنوع مناظر مدیترانه شرقی. Land ۲۰۱۷ , ۶۶ , ۷۱٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  33. ولاسکوز، جی. گوتیرز، جی. هرناندو، ا. گارسیا-آبریل، آ. مارتین، MA; Irastorza، P. اندازه گیری تنوع موزاییک بر اساس نقشه کاربری اراضی در منطقه مادرید، اسپانیا. سیاست کاربری زمین ۲۰۱۸ ، ۷۱ ، ۳۲۹-۳۳۴٫ [ Google Scholar ] [ CrossRef ]
  34. Nagendra، H. روندهای مخالف در پاسخ به شاخص های شانون و سیمپسون تنوع چشم انداز. Appl. Geogr. ۲۰۰۲ ، ۲۲ ، ۱۷۵-۱۸۶٫ [ Google Scholar ] [ CrossRef ]
  35. شانون، م. ویور، دبلیو . نظریه ریاضی ارتباطات . انتشارات دانشگاه ایلینوی: Champaign, IL, USA, 1949. [ Google Scholar ]
  36. نیس، پ. زیلسترا، دی. Zipf، A. مقایسه مشارکت داوطلبانه اطلاعات جغرافیایی و توسعه جامعه برای مناطق منتخب جهان. اینترنت آینده ۲۰۱۳ ، ۵ ، ۲۸۲-۳۰۰٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  37. Fonte, CC; مارتینهو، ن. ارزیابی کاربرد داده‌های OpenStreetMap برای کمک به اعتبارسنجی نقشه‌های کاربری/پوشش زمین. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۷ ، ۳۱ ، ۲۳۸۲-۲۴۰۰٫ [ Google Scholar ] [ CrossRef ]
  38. جانسون، کارشناسی; لیزوکا، ک. ادغام داده‌های جمع‌سپاری OpenStreetMap و تصاویر سری‌های زمانی Landsat برای نقشه‌برداری سریع استفاده از زمین/پوشش زمین (LULC): مطالعه موردی منطقه خلیج لاگونا فیلیپین. Appl. Geogr. ۲۰۱۶ ، ۶۷ ، ۱۴۰-۱۴۹٫ [ Google Scholar ] [ CrossRef ]
  39. لیو، ایکس. Long, Y. شناسایی و خصوصیات خودکار بسته ها با OpenStreetMap و نقاط مورد علاقه. محیط زیست طرح. B طرح. دس ۲۰۱۶ ، ۴۳ ، ۳۴۱-۳۶۰٫ [ Google Scholar ] [ CrossRef ]
  40. سریواستاوا، اس. لوبری، اس. تویا، دی. Vargas-Muñoz، J. خصوصیات کاربری زمین با استفاده از تصاویر Google Street View و OpenStreetMap. در مجموعه مقالات کنفرانس انجمن آزمایشگاه‌های اطلاعات جغرافیایی در اروپا (AGILE)، لوند، سوئد، ۱۲ تا ۱۵ ژوئن ۲۰۱۸٫ [ Google Scholar ]
شکل ۱٫ نقشه LULC چین مبتنی بر OSM.
شکل ۲٫ الگوهای کامل بودن و تنوع مجموعه داده LULC مبتنی بر OSM چین که سناریوهای I ( a , b ) و II ( c , d ) را نشان می دهد.
شکل ۳٫ درصد مساحت ۱۲ کلاس LULC از بخش های مختلف در سطح استان. برای هر کلاس LULC (محور x)، هر گره نشان دهنده درصد مساحت (محور y) کلاس در یک بخش در سطح استان است. ( الف ) سناریوی I و ( ب ) سناریوی II.
شکل ۴٫ الگوهای فضایی عوامل مختلف چین: ( الف ) اندازه مناطق ساخته شده. ( ب ) جمعیت؛ ( ج ) تولید ناخالص داخلی؛ ( د ) تعداد مشارکت کنندگان (سناریوی I)؛ و ( ه ) تعداد مشارکت کنندگان (سناریوی II).
شکل ۵٫ الگوهای ترکیبی کامل و تنوع. ( الف ) سناریوی اول و ( ب ) سناریوی دوم.
شکل ۶٫ نقشه های LULC مبتنی بر OSM از برخی شهرهای معمولی: ( الف ) پکن، ( ب ) لشان، و ( ج ) سونگ یوان.

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

خانهدربارهتماسارتباط با ما