تجزیه و تحلیل رفتار داوطلبان OpenStreetMap در نقشه برداری ساختمان چند ضلعی با استفاده از رویکرد یادگیری ماشینی

نقشه برداری به عنوان یک اقدام در اطلاعات جغرافیایی داوطلبانه با توجه به تنوع انسانی در جامعه داوطلب پیچیده است. هیچ راه حل یکپارچه ای وجود ندارد که تمام ناهمگونی های داده ها را مدل سازی و رفع کند. در عوض، محققان در تلاش برای ارزیابی و درک داده های جمع سپاری هستند. رویکردهای مبتنی بر آمار برای درک روند رفتارهای جمع‌آوری کمک کننده است. این مطالعه روندها را در اولین تصمیمات مشارکت کنندگان هنگام ترسیم ساختمان های OpenStreetMap (OSM) بررسی می کند. رویکرد پیشنهادی ارزیابی می‌کند که خواص یک نقطه چقدر در تعیین اولین نقطه نقشه‌های ساختمان اهمیت دارد. انواع مجاورت ساختمان ها را با استفاده از طبقه بندی جنگل تصادفی برای خواص طبقه بندی می کند و به استنباط روند ترسیم از تأثیر نسبی هر ملک کمک می کند. برای آزمایش رویکرد، از گروه های ساختمانی جدا و متصل در استانبول و ازمیر ترکیه استفاده شد. نتیجه ۸۳% امتیاز F بود. به طور خلاصه، داوطلبان تمایل داشتند نقاط دورتر از خیابان و مرکز ساختمان را به عنوان اولین نقاط انتخاب کنند و تراکم نقطه کمتری را در ساختمان‌های جدا شده نسبت به ساختمان‌های متصل ارائه کردند. این بدان معنی است که داوطلبان OSM هنگام ترسیم اولین نقاط ساختمان های جدا شده در مناطق مورد مطالعه، توجه بیشتری به فضاهای باز داشتند. این مطالعه روندهای ترسیم رایج در اقدامات نقشه برداری ساختمان را نشان می دهد. این بدان معنی است که داوطلبان OSM هنگام ترسیم اولین نقاط ساختمان های جدا شده در مناطق مورد مطالعه، توجه بیشتری به فضاهای باز داشتند. این مطالعه روندهای ترسیم رایج در اقدامات نقشه برداری ساختمان را نشان می دهد. این بدان معنی است که داوطلبان OSM هنگام ترسیم اولین نقاط ساختمان های جدا شده در مناطق مورد مطالعه، توجه بیشتری به فضاهای باز داشتند. این مطالعه روندهای ترسیم رایج در اقدامات نقشه برداری ساختمان را نشان می دهد.

کلید واژه ها:

OpenStreetMap ; اطلاعات جغرافیایی داوطلبانه نقشه کشی ; رد پای ساختمان ; فراگیری ماشین

۱٫ مقدمه

بیست سال پیش، اگر از مردم پرسیده می شد که محبوب ترین جنبه مطالعات اطلاعات جغرافیایی چیست، بسیاری از مردم پاسخ می دادند، “استفاده روزافزون از سیستم های اطلاعات جغرافیایی” (GIS). اکنون، به طور مشابه، اطلاعات جغرافیایی داوطلبانه جامعه اطلاعات جغرافیایی را وادار می کند تا مجموعه داده های جغرافیایی ایجاد شده توسط داوطلبان را درک کند. پلتفرم‌های جمع‌سپاری که شامل تولید داده‌های مکانی توسط شرکت‌کنندگان داوطلب است، پروژه‌های اطلاعات جغرافیایی داوطلبانه (VGI) نامیده می‌شوند. هر یک از داوطلبان مستقل از حق برابر برای تولید داده های مکانی و به روز رسانی داده های موجود برخوردار است. به عبارت دیگر، شرکت‌کنندگان داوطلب این امکان را دارند که داده‌های جغرافیایی نامحدودی ارائه کنند و مشارکت‌های یکدیگر را ویرایش کنند. با این حال، هیچ الزامی برای صلاحیت های نقشه برداری در میان شرکت کنندگان در پلتفرم های VGI وجود ندارد. از این رو، همیشه این احتمال وجود دارد که شخص بتواند یک نقشه کش غیر متخصص باشد. داوطلبانی که تخصص آنها به عنوان کافی تأیید نشده است می توانند داده های جغرافیایی را از طریق رابط های آنلاین ایجاد کنند [۱ ، ۲ ]. سازگاری داده‌های مکانی تنها پس از رفع تضادهای شناسایی شده به صورت دستی به دست می‌آید [ ۳ ]. بنابراین، مطالعات علمی مختلفی برای تعیین اینکه آیا داده های جغرافیایی تولید شده از طریق VGI می توانند برای اهداف حرفه ای مانند سایر نقشه های تولید شده توسط نقشه نگاران مورد استفاده قرار گیرند یا خیر، انجام شده است. بیشتر مطالعات بر روی ارزیابی دقت و کامل بودن داده های معنایی و هندسی در VGI متمرکز شده اند. تنها چند مطالعه به طور مستقیم رفتار داوطلبان را مورد بررسی قرار داده اند [ ۴ ، ۵ ، ۶ ، ۷ ، ۸ ]. به طور خلاصه، آنها مشارکت های هندسی و معنایی را بررسی کردند و فعالیت های داوطلبان را ارزیابی کردند.
این بخش ابتدا به معرفی کلی OpenStreetMap، محبوب ترین پلتفرم VGI می پردازد. در مرحله دوم، مطالعات ارزیابی کیفیت داده‌های VGI خلاصه می‌شوند، زیرا یکی از رایج‌ترین علایق تحقیقاتی در مورد داده‌های VGI هستند. سپس، مطالعات قبلی که انگیزه این مقاله و دامنه بررسی رفتار مشارکت‌کنندگان را شکل می‌دهند، ارائه می‌شوند. در نهایت انگیزه و طرحی مختصر از مطالعه معرفی شده است.
OSM، Wheelmap، Wikimapia و WorldMap برخی از پروژه های مهم VGI هستند. پروژه Wheelmap برای افراد دارای ناتوانی در راه رفتن برای شناسایی اشیاء جغرافیایی بر روی نقشه مناسب برای استفاده از ویلچر انجام می شود [ ۹ ]. WorldMap پروژه ای است که به سرعت تولید داده های جغرافیایی را برای آفریقا [ ۱۰ ]، قبل از گسترش به سایر قاره ها آغاز کرد. پروژه Wikimapia در سال ۲۰۰۶ [ ۱۱ ] با هدف ایجاد یک دانشنامه داده های جغرافیایی با الهام از ویکی پدیا تاسیس شد. یکی از پروژه های پیشگام VGI OSM است. برای همه نهادهای جغرافیایی که عمدتاً در نزدیکی یا مرتبط با جاده ها قرار دارند استفاده می شود. با این حال، هیچ محدودیتی در تنوع داده های جغرافیایی در پروژه وجود ندارد [ ۱۲]. شرکت کنندگان می توانند آزادانه اطلاعات هندسی و معنایی را برای هر مکانی در جهان ارائه دهند. داده ها به صورت هفتگی در planet.osm در دسترس قرار می گیرند. در ابتدای پروژه OSM، در حالی که برخی از شرکت کنندگان فعال بودند، بسیاری از آنها فقط عضو شدند و از هرگونه ویرایش خودداری کردند. Neis و Zipf [ ۱۳ ] ذکر کردند که تنها ۳۸٪ از داوطلبان حداقل یک مشارکت داشته اند و فقط ۵٪ به طور فعال به عنوان داوطلب OSM در شرایط واقعی مشارکت داشته اند. در طول سال‌ها، با افزایش مشارکت اعضا، نسخه فشرده داده‌های سیاره موجود برای اشتراک‌گذاری در ۳۱ دسامبر ۲۰۲۰ به ۵۴٫۵ گیگابایت و نسخه استخراج شده در قالب XML، ۱۳۳۸٫۴ گیگابایت افزایش یافته است [ ۱۴ ]]. هیچ مکانیزم کنترل داخلی هندسی، معنایی یا نقشه‌کشی به جز اختیار داوطلبان برای تنظیم مشارکت‌های یکدیگر وجود ندارد و هیچ قانون محدودکننده‌ای وجود ندارد که ارزیابی این منبع بزرگ داده‌های جغرافیایی را امکان‌پذیر کند. بنابراین، Mooney و Corcoran [ ۵ ] خاطرنشان می‌کنند که لازم است کاربران کیفیت داده‌های OSM را ارزیابی کنند، به‌ویژه برای برنامه‌های نقشه‌ای که نیاز به دقت هندسی و دقت بالایی دارند. بصیری و همکاران [ ۱۵ ] مشکلات مشارکت های OSM را ناشی از عدم تجربه داوطلبان در GIS، دانش ناکافی از منطقه ارائه شده، تفسیر ویژگی های مشابه با برچسب های مختلف برای اشیاء مشابه، و افزودن تعداد متفاوت برچسب ها به اشیاء مشابه ذکر کرد.
مطالعات اولیه برای ارزیابی داده های OSM بر تعیین دقت و کامل بودن با استفاده از داده های مرجع متمرکز بود. هاکلی [ ۱۶ ] بر تجزیه و تحلیل کیفیت مبتنی بر مقایسه داده های OSM انگلستان با داده های مقیاس بزرگ تولید شده توسط Ordnance Survey تمرکز کرد. نویسنده تعیین کرد که دقت داده های هندسی OSM تقریباً ۶ متر است. در فرانسه، Girres و Touya [ ۱۷ ] از معیارهای ارزیابی برای داده های OSM استفاده کردند که کیفیت داده های مکانی را تعیین می کند، مانند هندسی، صفت، دقت معنایی و زمانی، سازگاری منطقی و کامل بودن. Mondzech و Sester [ ۱۸] کیفیت OSM را از نظر پیمایش عابر پیاده با مقایسه داده های ATKIS و OSM ارزیابی کرد. آنها برخی از شهرهای آلمان را تجزیه و تحلیل کردند و به این نتیجه رسیدند که مجموعه داده هایی که مسیرهای طولانی در آنها شکل گرفته است شامل داده های ناقص است. دا کوستا [ ۱۹ ] کامل بودن ساختمان های OSM را با مقایسه آنها با مجموعه داده های رسمی ساختمان ارزیابی کرد. این مطالعه نشان داد که کامل بودن در مراکز شهرها نسبتاً بالا بود اما دورتر از مناطق شهری کاهش یافت. Zhang و Malczewski [ ۲۰ ] کیفیت داده های جاده OSM را در کانادا ارزیابی کردند. در نتیجه تجزیه و تحلیل آنها با استفاده از معیارهای ارزیابی داده های مکانی مانند کامل بودن، مکانی، صفت و دقت معنایی، آنها دریافتند که مشارکت در شبکه های جاده ای شهری بیشتر از مناطق روستایی است. مبشری و همکاران [ ۲۱] ارزیابی اولیه داده های پیاده رو در OSM را برای افزایش آگاهی و مشارکت جمعیت برای غنی سازی اطلاعات پیاده رو در شهرهای مختلف اروپایی انجام داد. در ایران، محمدی و صداقت [ ۲۲ ] چارچوبی را برای تخمین کیفیت VGI با استفاده از یک شاخص برای طبقه‌بندی آن‌ها بر اساس نیاز کاربران با استفاده از یک رویکرد یکپارچه شامل فرآیند تطبیق و طبقه‌بندی شبکه عصبی پیشنهاد کردند.
داده‌های مرجع می‌توانند اطلاعاتی در مورد درستی داده‌های هندسی یا معنایی ارائه دهند، اما اطلاعاتی در مورد انتخاب نوع برچسب یا روند کلی ترسیم توسط داوطلبان ارائه نمی‌کنند [ ۵ ]. مطالعات بدون داده های مرجع عموماً اشیاء OSM را با کمک معیارهای هندسی و معنایی ارزیابی می کنند و در مورد تکامل داده ها یا رفتار مشارکت کنندگان استنباط می کنند. برخی از مطالعات انجام شده بدون داده های مرجع بر روی تکامل و تولید خودکار داده های OSM متمرکز شده اند. کورکوران و همکاران [ ۲۳ ] تکامل زمانی سه شبکه جاده ای OSM در ایرلند را تحلیل کرد. آنها نتایج را با تراکم و اکتشاف در مناطق شهری ارزیابی کردند. ژائو و همکاران [ ۲۴] تکامل شبکه‌های جاده‌ای OSM پکن را بین سال‌های ۲۰۰۹ و ۲۰۱۲ از نظر معیارهای هندسی، توپولوژیکی و مرکزی بررسی کرد. در منطقه مورد مطالعه، مشخص شد که داوطلبان OSM شروع به مشارکت از مرزهای شهر کردند و نقاشی های آنها به سمت مرکز شهر هدایت شد. هاکار و همکاران [ ۲۵ ] تکامل شبکه‌های جاده‌ای OSM را در آنکارا بین سال‌های ۲۰۰۷ و ۲۰۱۷ با استفاده از معیارهای مرکزیت بررسی کرد. آنها پارامتر کامل بودن زمانی، سینوسی بودن جاده‌ها و تراکم فعال‌سازی داوطلبان را در طول سال‌ها اندازه‌گیری کردند. مشاهده شد که با افزایش تجربه مشارکت کنندگان، آنها مشارکت های دقیق تری داشتند. بصیری و همکاران [ ۲۶] مسیر حرکت را برای استخراج برخی الگوها و قوانین، که به تشخیص ناهنجاری ها و خطاها در داده های OSM کمک می کند، تجزیه و تحلیل کرد. علاوه بر این، بصیری و همکاران. [ ۱۵ ] مطالعه ای را با این فرض انجام داد که برخی از ویژگی های داده های خط سیر خام ممکن است به هندسه و ویژگی های اجسام مرتبط باشد. آنها رویکردی برای تولید اشیاء جدید یا ویرایش داده‌های موجود با استفاده از تکنیک‌های داده کاوی، که شامل تعمیم نقشه‌کشی و مراحل تطبیق است، پیشنهاد کردند. هاکار [ ۲۷ ] یک رویکرد نیمه خودکار برای شناسایی ارزش برچسب های اوقات فراغت پیشنهاد کرد. این رویکرد از داده‌های هندسی (مستطیل شکل، تراکم، مساحت و فاصله تا ایستگاه اتوبوس و فروشگاه) و معنایی (امکانات رفاهی) استفاده می‌کند و مقادیر کلیدی را با استفاده از طبقه‌بندی‌کننده جنگل تصادفی تخمین می‌زند.
ایجاد اشیاء جغرافیایی و تبدیل آنها به ویژگی های نقشه در تخصص نقشه نگاران است. مانند بسیاری از شاخه های مهندسی، این رشته نیز نیازمند دانش گسترده ای از هندسه تحلیلی است. قوانین نقشه برداری زیادی وجود دارد که با محدودیت های وضوح گرافیکی و هندسی در هنگام ایجاد نقشه ها تعریف می شوند. علاوه بر این، هنگامی که عمل طراحی یک فعالیت هنری در نظر گرفته شود، می توان تشخیص داد که اعمال ذهنی نیز انجام می شود [ ۲۸ ]]. این اقدامات عاداتی هستند که با تجربه نقشه‌برداران در طول زمان شکل گرفته‌اند و استانداردهای مشترک خاصی وجود ندارد. به عنوان مثال، هیچ قانون عینی برای تعیین محل شروع ترسیم شبکه جاده، مرز جنگل، دریاچه یا ساختمان وجود ندارد. ممکن است بررسی علمی عادت‌های طراحی ذهنی نقشه‌برداران در پروژه‌های متشکل از چندین نقشه‌بردار معنی‌دار نباشد. با این حال، داوطلبانی که در داده‌های VGI جمع‌سپاری شده مشارکت دارند، باید خارج از این محدوده در نظر گرفته شوند. در پروژه های VGI، بر خلاف دیگران، به جای عادات فردی، لازم است در مورد رفتار صدها هزار نفر صحبت شود. تحقیقات علمی در مورد رفتار مشارکت جمعی با استفاده از هر دو رویکرد هندسی و معنایی انجام شده است. مونی و همکاران [ ۴] کیفیت داده‌های OSM را با بررسی ایجاد چندضلعی‌هایی که نمایانگر هیدروگرافی و مناطق جنگلی هستند، ارزیابی کرد. آنها بیان کردند که ترسیم ویژگی های هیدروگرافی و مرزها از تصاویر ماهواره ای برای داوطلبان آسان تر از ترسیم مرزهای منطقه جنگلی است.
با این حال، بیشتر مطالعات ارزیابی کیفیت OSM برای ارزیابی برچسب‌های معنایی و مقادیر آنها طراحی شده‌اند. Mooney و Corcoran [ ۵ ، ۲۹ ] داده‌های به‌روز شده مکرر (حداقل ۱۵ بار) را بر اساس کشور بررسی کردند. اگرچه اشیایی که اغلب تغییر می کنند دارای نقاط مشترک خاصی هستند، اما مشاهده شد که آنها همبستگی ندارند. آنها دریافتند که بیش از ۹۰ درصد از داده های OSM کمتر از سه بار تغییر کرده و هیچ رابطه قوی بین تعداد مشارکت کنندگان و تعداد برچسب ها وجود ندارد. جیلانی و همکاران [ ۶] یک مدل یادگیری ماشینی (ML) را برای پیش‌بینی مقادیر برچسب “بزرگراه = *” که به کلاس‌های جاده OSM اشاره دارد، توسعه داد. آنها برخی از داده های نسبتاً قابل اعتماد جاده OSM لندن را به عنوان مرجع در نظر گرفتند. در نتیجه آزمایش، در حالی که بیش از ۵۰ درصد مسیرهای مسکونی، عابر پیاده، اولیه، بزرگراه، پیوند اولیه و پیوند بزرگراه به درستی پیش‌بینی شده بود، کمتر از ۴۰ درصد مسیر دوچرخه، راه افسار، مسیر، ثانویه و پیوند ثانویه درست بود. با توجه به تراکم داده‌ها در مناطق شهری، استفاده از راهنمای «ویژگی‌های نقشه» در وب‌سایت OSM Wiki به مشارکت‌های دقیق‌تر و دقیق‌تر کمک می‌کند [ ۳۰ ]]. در دفترچه راهنما، نام تگ هایی که به ویژه توسط کاربران طی چندین سال مورد علاقه و پذیرفته شده اند، همراه با تعاریف آنها ذکر شده است. مشارکت‌کنندگان می‌توانند برچسب‌های مناسب برای مشخصه یک شی جغرافیایی را از فهرست انتخاب کرده و داده‌های سازگار با سایر کاربران را وارد کنند. داوودوویچ و همکاران [ ۷ ] بررسی کرد که چقدر داوطلبان OSM در ۳۰ منطقه شهری مختلف صفحه وب OSM ویکی را در نظر می گیرند. آنها دریافتند که داوطلبان به طور کلی با دستورالعمل موجود در صفحه “ویژگی های نقشه” موافق بودند، اما انواع مشابهی از اشیاء جغرافیایی با برچسب های مختلف در شهرهای مختلف ایجاد شدند. هاکار [ ۸] داده‌های planet.osm را بررسی کرد، برچسب‌های مربوط به جاده‌ها را مقایسه کرد و تگ‌های اضافه کردن روند داوطلبان را مطالعه کرد. وی بیان کرد: در حالی که برچسب‌های سطحی، مبدا و یک طرفه در جاده‌های مسکونی با نرخی مشابه سایر جاده‌ها اضافه می‌شد، برچسب‌های نام به دفعات اضافه می‌شد. همچنین مشخص شد که در ۸۱ درصد از نقشه های جاده های مسکونی، منبع استفاده شده مشخص نشده است. وی خاطرنشان کرد: در حالی که OSM منبع داده خوبی از نظر تنوع برچسب است، اما از نظر کامل بودن داده ها دارای کمبودهایی است.
سوال تحقیق این مطالعه از مطالعه محدود روندهای جمع سپاری در ترسیم نقشه برداری الهام گرفته شده است. تا به حال، محققان این فرصت را داشته اند تا کشف کنند که داوطلبان چه چیزی می کشند، اما اطلاعات کافی در مورد نحوه ترسیم آنها وجود ندارد. هدف این مطالعه یافتن جهت یا روند مشترک در میان مشارکت‌کنندگان OSM هنگام نگاشت چند ضلعی‌ها است. از ویژگی های مختلف نقاط گوشه ساختمان برای اندازه گیری تمایزات احتمالی در بین نقاط استفاده می شود. رویکرد پیشنهادی ارزیابی می‌کند که ویژگی‌های یک نقطه در تبدیل آن به اولین نقطه ساختمان‌های OSM چقدر برجسته است. به منظور بررسی روندها، چندین معیار از نقاط تشکیل دهنده ساختمان ها (به عنوان مثال فاصله، تراکم و مستطیل) به عنوان متغیرهای مستقل استفاده می شود. علاوه بر این، از انواع مجاورت ساختمان ها به عنوان متغیرهای وابسته استفاده می شود. به منظور بررسی روند ترسیم، رویکرد پیشنهادی یک مطالعه طبقه‌بندی را با استفاده از طبقه‌بندی‌کننده جنگل تصادفی انجام می‌دهد. دلیل طبقه‌بندی اجرای این فرض است که «اگر یک طبقه‌بندی موفقیت‌آمیز (ضمیمه/جداشده) با معیارهای محاسبه‌شده با استفاده از اولین نقاط امکان‌پذیر باشد، رفتار مشترکی در ترسیم اولین نقاط ساختمان‌های متصل یا جدا وجود دارد. به عبارت دیگر، هر کلاس به درک روندهای خاص برای ساختمان های درون آن کمک می کند. روند ترسیم با استفاده از نتایج داده های آزمون تفسیر شد. در بخش بعدی روش پیشنهادی به تفصیل توضیح داده شده است. داده های OSM و منطقه مورد مطالعه نیز ارائه شده است. در بخش سوم، نتایج آزمایش بر اساس اهمیت اندازه گیری ارزیابی می شود. سرانجام،

۲٫ مواد و روشها

۲٫۱٫ حوزه و داده های مطالعه

ساختمان‌های OSM در استانبول و ازمیر، که مناطق شهری در آن متمرکز شده‌اند، برای مشاهده رفتار طراحی داوطلبان انتخاب شدند ( شکل ۱ ). ویژگی‌های هندسی نقاط تشکیل‌دهنده ساختمان‌ها از نظر انواع مجاور مورد بررسی قرار گرفت: متصل ( شکل ۲ الف) و جدا شده ( شکل ۲ ب). این مطالعه با هشت گروه ساختمانی به نمایندگی از انواع مجاور انجام شد ( جدول ۱ ). همانطور که در شکل ۲ مشاهده می شود ، هر گروه از ساختمان هایی با یکی از انواع مجاور تشکیل شده است. تعداد و مکان گروه ها با در نظر گرفتن نمایش پراکنده داده های ناهمگن انتخاب شدند.
یک باور کلی این است که در مکان‌های شهری، خانه‌های مجزا در مقایسه با آپارتمان‌های متصل ساختمان‌های نسبتاً کوچکی هستند. با این حال، منطقه مورد مطالعه ما نیز شامل آپارتمان های مجزا با اندازه های بزرگتر است. میانگین مساحت هر ساختمان نشان دهنده میانگین مساحت ساختمان در هر گروه است ( جدول ۱ ). این نشان می دهد که هیچ ارتباطی بین اندازه ساختمان و نوع مجاورت وجود ندارد. این مورد همچنین نشان می‌دهد که طبقه‌بندی مجاورت به چندین معیار پیچیده نیاز دارد، نه صرفاً به ناحیه چند ضلعی.

۲٫۲٫ رویکرد پیشنهادی

رویکرد پیشنهادی از برخی از ویژگی‌های هندسی نقاط تشکیل‌دهنده یک ساختمان (نقاط گوشه) برای ارزیابی رفتار ترسیمی استفاده می‌کند. برای ارزیابی انواع مختلف معیارها، مطالعات قبلی از تکنیک های داده کاوی استفاده کرده اند [ ۶ ، ۲۶ ، ۳۲ ، ۳۳ ]. بصیری و همکاران [ ۱۵ ] نمرات برخی از طبقه‌بندی‌کننده‌های ML را اندازه‌گیری کرد و دریافت که طبقه‌بندی‌کننده‌های K-نزدیک‌ترین همسایه و طبقه‌بندی تصادفی جنگل به ترتیب برای طبقه‌بندی نوع هندسی و جغرافیایی مناسب هستند. همچنین پازوکی و پهلوانی [ ۳۴] اخیراً چندین طبقه‌بندی کننده ML را با معیارهای مرکزی داده‌های OSM برای غنی‌سازی داده مقایسه کرد. جنگل تصادفی از نظر نمرات پیش‌بینی هم در یک سناریوی منفرد و هم در یک طبقه‌بندی چندگانه با ماشین بردار پشتیبانی برجسته شد. در این مطالعه، رویکرد پیشنهادی همچنین از جنگل تصادفی با ویژگی‌های هندسی داده‌های آموزشی برای طبقه‌بندی داده‌های آزمون استفاده می‌کند. شکل ۳ طرح کلی گردش کار پیشنهادی را برای طبقه بندی مجاورت و استنباط اهمیت ویژگی نشان می دهد. پس از اولین طبقه‌بندی که با استفاده از ویژگی‌ها انجام شد، نمرات پیش‌بینی را با مقایسه کلاس‌های پیش‌بینی‌شده با کلاس‌های واقعی (انواع مجاورت) داده‌های آزمون ارزیابی می‌کند.
در این مطالعه از معیارهای تشابه رایج مانند فاصله نقطه به نقطه و نقطه به خط [ ۳۵ ]، چگالی [ ۳۶ ، ۳۷ ] و مستطیل [ ۳۸ ، ۳۹ ] استفاده می شود. برای هر نقطه گوشه، مقدار چگالی هسته را اندازه گیری می کند  nسک، فاصله تا ساخت مرکز دی من _تیسیو کوتاهترین فاصله تا نزدیکترین خیابان دی من _تیاسمحاسبه می شوند. شکل ۴ طرح محاسباتی اندازه گیری های هندسی را خلاصه می کند. اندازه گیری اولین نقطه ترسیم شده در هر ساختمان و مجموع مقادیر اندازه گیری مربوط به تمام نقاط محاسبه می شود. به عبارت دیگر، هر ساختمان شامل مقادیر زیر است:
  • nسکfمن هستم _: تراکم هسته نقطه اول،
  • nسکاسm: مجموع مقادیر چگالی هسته تمام نقاط ساختمان،
  • دی من _تیسیfمن هستم _: فاصله بین نقطه اول و مرکز ساختمان،
  • دی من _تیسیاسm: مجموع فواصل تمام نقاط تا مرکز،
  • دی من _تیاسfمن هستم _: کوتاهترین فاصله بین نقطه اول و نزدیکترین خیابان و
  • دی من _تیاساسm: مجموع فواصل همه نقاط تا نزدیکترین خیابانها.
رویکرد پیشنهادی از انواع مجاورت ساختمان ها به عنوان متغیرهای وابسته برای اندازه گیری اثر استفاده می کند nسک، دی من _تیسی، و دی من _تیاسارزش انتخاب داوطلبان برای اولین امتیازشان. انواع مجاورت با استفاده از مقادیر (متغیرهای مستقل) پیش بینی می شوند. سپس با مقایسه انواع مجاورت واقعی (واقعی) با طبقات پیش بینی شده، نمرات پیش بینی به دست می آید. اهمیت nسک، دی من _تیسی، و دی من _تیاساقدامات در پیش بینی انواع مجاورت تعیین می شود (مرحله اول). به عبارت دیگر، روابط بین خصوصیات فضایی نقطه اول و کلاس مجاورت ساختمان از نوع مقادیر اهمیت استنباط می شود. روابط مشابهی برای ارزش مستطیل شکل ایجاد می شود آربو نام شهر نسی(مرحله دوم).
تمام نقاط گوشه ای که یک ساختمان را تشکیل می دهند، مجموعه نقطه آن ساختمان را نشان می دهند. از آنجایی که این رویکرد به مشاهده انتخاب نقطه اول در هر ساختمان، به جای مجموعه داده کامل، متکی است، برای محاسبه چگالی هسته، به جای مجموعه نقاط کل، فقط از مجموعه نقاط مربوطه استفاده می کند. چگالی فقط با در نظر گرفتن ساختمان هدف محاسبه می شود. به عبارت دیگر، تأثیرات ساختمان ها بر یکدیگر نادیده گرفته می شود. این به این دلیل است که مقدار چگالی در چند ضلعی هنگام انتخاب اولین نقطه در ساختمان نشان داده شده چقدر مهم است. ابزار چگالی هسته در ArcMap 10 [ ۴۰ ] با توجه به Silverman’s [ ۳۶ ] استفاده شد.] فرمول کوارتیک. چگالی در هر چند ضلعی محاسبه می شود. سپس، یک مقدار چگالی از نزدیکترین پیکسل به هر نقطه گوشه اختصاص داده می شود.
علاوه بر این، فاصله ها دی من _تیسیبین هر نقطه در مجموعه نقطه و مرکز ساختمان و کوتاهترین فواصل دی من _تیاسبین هر نقطه در مجموعه نقطه و نزدیکترین خیابان به ترتیب در شکل ۵ و شکل ۶ در هندسه اقلیدسی اندازه گیری می شود. روش پیشنهادی از تخمین مستطیل شکل ساده استفاده می کند آرببه عنوان نسبت مساحت چند ضلعی به مساحت حداقل مستطیل مرزی آن [ ۳۹ ].
رویکرد پیشنهادی به امتیازات پیش‌بینی نتایج طبقه‌بندی وابسته است. در این مطالعه، پیش‌بینی بیشتر داده‌های موردی برای بررسی رفتار ترسیمی مشارکت‌کنندگان و استنتاج قابل اعتماد در نظر گرفته شده است. بنابراین، نمرات پیش‌بینی بیشتر از ۵۰ درصد نشان‌دهنده اطمینان بیشتر در رویکرد است.
اجرای رویکرد پیشنهادی با استفاده از ArcMap 10.2.2 [ ۴۰ ]، زبان برنامه نویسی Python و بسته Scikit-learn [ ۴۱ ] انجام شد.

۳٫ نتایج و ارزیابی

این مطالعه با گروه های ساختمانی در استانبول و ازمیر انجام شد ( جدول ۱ و شکل ۲ ). در حالی که ۵۶۰۰ ساختمان به طور تصادفی به عنوان داده های آموزشی مورد استفاده قرار گرفتند، انواع مجاورت ۱۴۰۰ ساختمان باقی مانده پیش بینی شده است. نمرات پیش بینی داده های آزمون با مقایسه کلاس های پیش بینی شده و انواع مجاورت واقعی به دست آمد. در حالی که دقت را می توان به عنوان ارزش اخباری مثبت یا توانایی طبقه بندی کننده تعریف کرد، یادآوری حساسیت و توانایی طبقه بندی کننده برای یافتن تمام نمونه های مثبت است [ ۴۱ ]. امتیاز F نشان دهنده تعادل بین دقت و یادآوری است. این یک میانگین هارمونیک وزنی از دقت و یادآوری است، جایی که امتیاز به بهترین مقدار خود در ۱ و بدترین مقدار آن در ۰ می رسد [ ۴۱ ].در جدول ۲ و جدول ۳ به ترتیب نتایج مرحله اول و دوم ارائه شده است.
در مرحله اول مطالعه، تنها با استفاده از نوع مجاورت ساختمان ها پیش بینی شد nسکfمن هستم _، nسکاسm، دی من _تیسیfمن هستم _، دی من _تیسیاسm، دی من _تیاسfمن هستم _، و دی من _تیاساسmمعیارهای. امتیاز F آزمایش ۷۷ درصد تعیین شد ( جدول ۲ ). در مرحله دوم، نسیو آرببرای آموزش دوم به اقدامات موجود اضافه شد. در نتیجه، با استفاده از همه متغیرها، امتیاز به ۸۳ درصد افزایش یافت. جدول ۲ و جدول ۳ نشان می دهد که بیشتر کلاس ها پیش بینی شده اند. با این حال، نمرات پیش بینی نشان نمی دهد که چگونه معیارها بر نتایج تأثیر می گذارند. بنابراین، ارزیابی اضافی برای درک اینکه کدام معیار در پیش‌بینی مؤثرتر است، ضروری است.

به طور کلی، اهمیت یک اندازه گیری به عنوان کاهش کل (نرمال شده) معیار حاصل از آن اندازه گیری محاسبه می شود [ ۴۱ ]. اهمیت از فرمول پایه ناخالصی جینی [ ۴۲ ] می آید. پس از تعیین اهمیت هر معیار در فرآیند پیش‌بینی (PP)، اهمیت اندازه‌گیری در پیش‌بینی کلاس مربوطه (یعنی نوع مجاورت) نیز با (۱) محاسبه شد.

ممنسیمن یک ثانیهسمنمanمن سی __(ایکسمن) ×ممنمن،

جایی که ممنسیمن یک ثانیهسمناهمیت اندازه گیری i در پیش بینی نوع مجاورت خاص است، ایکسمنمقدار مقیاس شده اندازه گیری  و استممنمناهمیت اندازه گیری i در PP است. این فرمول با ضرب مقدار میانگین هر اندازه گیری در هر نوع مجاورت پیش بینی شده در اهمیت اندازه گیری مربوطه، اهمیت را پیدا می کند. در نتیجه، نمودار زیر اهمیت هر یک از معیارها را در پیش‌بینی انواع پیوست (PA در شکل ۷ ) و جدا شده (PD در شکل ۷ ) خلاصه می‌کند. علامت مقدار اهمیت در نمودار به ما کمک می کند تا تفسیر کنیم که مقدار مربوطه چقدر بیشتر (+) یا کمتر (-) اهمیت دارد. هر چه تراکم هسته هر دو نقطه اول بیشتر باشد ( nسکfمن هستم _) و تمام نکات ( nسکاسm، تراکم هسته در تخمین ساختمان های متصل اهمیت بیشتری دارد زیرا علامت در نمودار مثبت است ( شکل ۷).). برعکس، می توان گفت که هر چه تراکم کمتر باشد، در پیش بینی ساختمان های جدا شده موثرتر است زیرا علامت منفی است. به همین ترتیب، در پیش‌بینی ساختمان‌های جداشده، اگر نقطه اول از خیابان دور باشد، مؤثرتر است، در حالی که نزدیک‌تر بودن نقطه اول به خیابان در پیش‌بینی ساختمان‌های متصل مؤثرتر است. علاوه بر این، در ساختمان‌های متصل مهم‌تر است که نقطه اول به مرکز نزدیکتر باشد، در حالی که دورتر بودن آن در جدا شده مهم‌تر است. این نتایج شامل روندی است که نشان می دهد اولین نقاط ساختمان های متصل تراکم بیشتری دارند و به خیابان و مرکز نزدیک تر هستند. ساختمان های مجزا روند معکوس دارند. می توان به اهمیت اقدامات دستور داد. مقادیر فاصله و چگالی هسته اولین نقطه از کل فواصل و تراکم هسته همه نقاط مهمتر است. علاوه بر این، مقدار مستطیل پایین‌تر در ساختمان‌های متصل بیشتر است، در حالی که برای ساختمان‌های جدا شده برعکس است. در نهایت، نام شهرها تأثیر کمی بر PA و PD دارند. بنابراین، استنباط در مورد انواع مجاورت با توجه به معیار نام مستلزم آزمایشات اضافی در شهرهای مختلف است.

۴٫ نتیجه گیری

ارزیابی روند ترسیم در بین ساختمان‌های OSM چالش برانگیز است زیرا ساختمان‌ها در مقایسه با سایر ویژگی‌های جغرافیایی مانند جاده‌ها، نهرها، کاربری زمین یا دریا از تعداد محدودی نقاط تشکیل شده‌اند. این مطالعه از یک طبقه‌بندی کننده ML برای تفسیر مشارکت‌های هندسه ساختمان در OSM استفاده کرد. چهار معیار هندسی ( nسک، دی من _تیسی، دی من _تیاس، و آرب) و یک معیار معنایی ( نسی) برای ارزیابی رفتار نقاشی داوطلبان استفاده شد. روندهای مشترک در بین نقشه‌های OSM مشخص شد که توسط مشارکت‌های جمع‌سپاری در استانبول و ازمیر ایجاد شده‌اند. مشاهده شد که بین نوع مجاورت ساختمان و اولین اقدام ترسیمی داوطلبان OSM رابطه وجود دارد. برای ساختمان های متصل، گرایشی به سمت ترسیم اولین نقطه وجود دارد که در آن تراکم نقطه بزرگ و نزدیک به خیابان و مرکز است. این در ساختمان های مستقل برعکس است. همچنین امکان تعیین ترتیب اهمیت در بین اقدامات وجود داشت. فاصله تا خیابان از تراکم هسته مهمتر است و تراکم مهمتر از فاصله تا مرکز ساختمان است. به عبارت دیگر، برای ساختمان های متصل، داوطلبان روی ترسیم اولین نقطه ساختمان در نزدیک‌ترین قسمت‌ها به خیابان تمرکز کردند و از بین گزینه‌های جایگزین، تصمیم گرفتند آن را در محلی ترسیم کنند که در آن نقطه تراکم بیشتر و فاصله تا مرکز کمتر باشد. نتایج همچنین این استنباط را امکان‌پذیر کرد که برای ساختمان‌های مجزا، داوطلبان OSM هنگام ترسیم اولین نقاط توجه بیشتری به فضاهای باز داشتند، زیرا نقاط ترسیم شده اول چگالی کمتری دارند و هم از خیابان‌ها و هم از مرکز ساختمان دورتر از نقاط متصل هستند.
این مطالعه نشان می دهد که یک طبقه بندی کننده ML و اهمیت ویژگی بر اساس نتایج پیش بینی می تواند برای تعیین روند ترسیم مشارکت کنندگان OSM استفاده شود. تازگی این مطالعه این است که روندهای ترسیم رایج در اقدامات نقشه برداری ساختمان را نشان می دهد.
به نظر می‌رسد که افزودن نام شهر در مرحله دوم تأثیر کمی (به جای عدم تأثیر) در پیش‌بینی طبقات مجاورت داشته است، حتی اگر تعداد مساوی ساختمان در هر دو شهر استفاده شود. این بدان معنی است که داوطلبان ممکن است عادات طراحی خاصی در یک منطقه خاص داشته باشند. با این حال، برای اثبات این فرض، ساختمان های بیش از دو شهر باید در آینده مورد مطالعه قرار گیرند.
آزمون تجربی ویژگی‌های نقاشی داوطلبانی را که در OSM در مناطق مورد مطالعه مشارکت داشتند، ارائه می‌کند. استانبول و ازمیر هر دو کلان شهر هستند. بنابراین، انواع مختلف مناطق شهری یا روستایی ممکن است نتایج متفاوتی داشته باشند.
محدودیت اصلی مطالعه، معیارهای مورد استفاده به عنوان متغیرهای مستقل در PP است. جدای از اقدامات، برچسب های ارائه شده توسط داوطلبان OSM نیز می توانند به عنوان متغیرهای مستقل ارزیابی شوند و مطالعه مشابهی ممکن است انجام شود. بنابراین، روندهای جمع سپاری ممکن را می توان با ویژگی ها و برچسب های هندسی تفسیر کرد.

منابع

  1. Goodchild، MF Citizens به عنوان حسگر: دنیای جغرافیای داوطلبانه. ژئوژورنال ۲۰۰۷ ، ۶۹ ، ۲۱۱-۲۲۱٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  2. هیپک، سی. داده‌های جغرافیایی جمع‌سپاری. ISPRS J. Photogramm. ۲۰۱۰ ، ۶۵ ، ۵۵۰-۵۵۷٫ [ Google Scholar ] [ CrossRef ]
  3. Kang, X. نقشه برداری مشارکتی همزمان مبتنی بر نمودار. ژئوکارتو بین المللی ۲۰۱۵ ، ۳۰ ، ۲۸-۴۷٫ [ Google Scholar ] [ CrossRef ]
  4. مونی، پی. کورکوران، پ. Winstanley، AC به سمت معیارهای کیفیت برای OpenStreetMap. در مجموعه مقالات هجدهمین کنفرانس بین المللی SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی، سن خوزه، کالیفرنیا، ایالات متحده آمریکا، ۲ تا ۵ نوامبر ۲۰۱۰٫ صص ۵۱۴-۵۱۷٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  5. مونی، پی. Corcoran, P. فرآیند حاشیه نویسی در OpenStreetMap. ترانس. GIS ۲۰۱۲ ، ۱۶ ، ۵۶۱-۵۷۹٫ [ Google Scholar ] [ CrossRef ]
  6. جیلانی، م. کورکوران، پ. Bertolotto، M. ارزیابی خودکار برچسب بزرگراه شبکه های جاده ای OpenStreetMap. در مجموعه مقالات بیست و دومین کنفرانس بین المللی ACM SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی، دالاس/فورت ورث، تگزاس، ایالات متحده آمریکا، ۴ تا ۷ نوامبر ۲۰۱۴٫ صص ۴۴۹-۴۵۲٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  7. داوودوویچ، ن. مونی، پی. Stoimenov, L. تحلیلی از شیوه ها و الگوهای برچسب گذاری در مناطق شهری در OpenStreetMap. در مجموعه مقالات کنفرانس AGILE 2016، هلسینکی، فنلاند، ۱۴ تا ۱۷ ژوئن ۲۰۱۶٫ [ Google Scholar ]
  8. Hacar, M. تجزیه و تحلیل روند مشارکت داوطلبان با مقایسه ابرداده های برچسب جاده های مسکونی OpenStreetMap [عنوان اصلی به زبان ترکی: OpenStreetMap Yerleşim-içi Yollarına Ait Etiket Bilgilerinin Karşılaştırılmasıylağılörince. هاریتا درگیسی. ۲۰۲۰ ، ۱۶۴ ، ۷۷-۸۷٫ [ Google Scholar ]
  9. مبشری، ع. دیستر، جی. Dieterich, H. Wheelmap: پلت فرم جمع سپاری دسترسی به صندلی چرخدار. Geospat را باز کنید. نرم افزار داده ایستادن. ۲۰۱۷ ، ۲ ، ۱-۷٫ [ Google Scholar ] [ CrossRef ]
  10. گوان، دبلیو دبلیو. بول، پی کی; لوئیس، بی جی; برتراند، ام. برمن، ام ال. Blossom، JC WorldMap – یک چارچوب جغرافیایی برای تحقیقات مشترک. ان GIS ۲۰۱۲ ، ۱۸ ، ۱۲۱-۱۳۴٫ [ Google Scholar ] [ CrossRef ]
  11. بالاتوره، آ. جوکار ارسنجانی، جی. قرار دادن ویکی‌مپیا: تحلیلی اکتشافی. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۹ ، ۳۳ ، ۱۶۳۳-۱۶۵۰٫ [ Google Scholar ] [ CrossRef ]
  12. ویکی OpenStreetMap. به OpenStreetMap خوش آمدید. در دسترس آنلاین: https://wiki.openstreetmap.org/wiki/Main_Page (در ۲۰ اکتبر ۲۰۲۱ قابل دسترسی است).
  13. نیس، پ. Zipf، A. تجزیه و تحلیل فعالیت مشارکت کننده یک پروژه داوطلبانه اطلاعات جغرافیایی – مورد OpenStreetMap. ISPRS Int. J. Geo.-Inf. ۲۰۱۲ ، ۱ ، ۱۴۶-۱۶۵٫ [ Google Scholar ] [ CrossRef ]
  14. ویکی OpenStreetMap. سیاره.osm. در دسترس آنلاین: https://wiki.openstreetmap.org/wiki/Planet.osm (دسترسی در ۲۰ اکتبر ۲۰۲۱).
  15. بصیری، ع. امیریان، پ. Mooney, P. استفاده از مسیرهای crowdsourced برای رویکرد ورود خودکار داده OSM. Sensors ۲۰۱۶ , ۱۶ , ۱۵۱۰٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  16. Haklay, M. اطلاعات جغرافیایی داوطلبانه چقدر خوب است؟ مطالعه تطبیقی ​​مجموعه داده‌های OpenStreetMap و Ordnance Survey. محیط زیست طرح. B ۲۰۱۰ , ۳۷ , ۶۸۲-۷۰۳٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  17. گیرس، جی اف. Touya, G. ارزیابی کیفیت مجموعه داده OpenStreetMap فرانسه. ترانس. GIS ۲۰۱۰ ، ۱۴ ، ۴۳۵-۴۵۹٫ [ Google Scholar ] [ CrossRef ]
  18. موندزچ، جی. Sester، M. تجزیه و تحلیل کیفیت داده های OpenStreetMap بر اساس نیازهای برنامه. Cartographica ۲۰۱۱ ، ۴۶ ، ۱۱۵-۱۲۵٫ [ Google Scholar ] [ CrossRef ]
  19. ابزار Da Costa، ​​JN Novel برای بررسی کامل بودن داده ها بر اساس مطالعه تطبیقی ​​داده های VGI و مجموعه داده های ساختمان رسمی. Geodetski Vestnik ۲۰۱۶ ، ۶۰ ، ۴۹۵-۵۰۸٫ [ Google Scholar ] [ CrossRef ]
  20. ژانگ، اچ. Malczewski، J. ارزیابی دقت شبکه‌های جاده‌ای نقشه خیابان باز کانادا. IJGER ۲۰۱۸ ، ۵ ، ۱-۱۴٫ در دسترس آنلاین: https://dc.uwm.edu/ijger/vol5/iss2/1/ (دسترسی در ۲۰ اکتبر ۲۰۲۱).
  21. مبشری، ع. Zipf، A.; فرانسیس، L. OpenStreetMap غنی سازی کیفیت داده از طریق افزایش آگاهی و ابزارهای اقدام جمعی – تجربیات یک پروژه اروپایی. ژئو اسپات. Inf. علمی ۲۰۱۸ ، ۲۱ ، ۲۳۴-۲۴۶٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  22. محمدی، ن. صداقت، ع. چارچوبی برای طبقه بندی داده های جغرافیایی داوطلبانه بر اساس نیاز کاربر. Geocarto Int. ۲۰۲۱ ، ۳۶ ، ۱۲۷۶-۱۲۹۱٫ [ Google Scholar ] [ CrossRef ]
  23. کورکوران، پ. مونی، پی. برتولتو، ام. تجزیه و تحلیل رشد شبکه‌های OpenStreetMap. تف کردن آمار ۲۰۱۳ ، ۳ ، ۲۱-۳۲٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  24. ژائو، پی. جیا، تی. کوین، ک. شان، جی. Jiao, C. تجزیه و تحلیل آماری در مورد تکامل شبکه‌های جاده‌ای OpenStreetMap در پکن. Physica A ۲۰۱۵ ، ۴۲۰ ، ۵۹-۷۲٫ [ Google Scholar ] [ CrossRef ]
  25. هاکار، م. کیلیچ، بی. شاهباز، ک. تجزیه و تحلیل داده های جاده نقشه خیابان باز و توصیف رفتار مشارکت کنندگان در آنکارا، ترکیه. ISPRS Int. J. Geo.-Inf. ۲۰۱۸ ، ۷ ، ۴۰۰٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  26. بصیری، ع. جکسون، ام. امیریان، پ. پورعبدالله، ع. سستر، ام. وینستانلی، ا. مور، تی. Zhang, L. ارزیابی کیفیت داده های OpenStreetMap با استفاده از استخراج مسیر. ژئو اسپات. Inf. علمی ۲۰۱۶ ، ۱۹ ، ۵۶-۶۸٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  27. Hacar، M. استفاده از ویژگی های هندسی و معنایی برای شناسایی برچسب های نیمه خودکار در داده های OpenStreetMap. در مجموعه مقالات GISRUK 2021، کاردیف، انگلستان، ۱۴-۱۶ آوریل ۲۰۲۱٫ [ Google Scholar ] [ CrossRef ]
  28. رایت، جی کی نقشه سازان انسان هستند: نظرات در مورد موضوع ذهنی در نقشه ها. Geogr. Rev. ۱۹۴۲ , ۳۲ , ۵۲۷-۵۴۴٫ [ Google Scholar ] [ CrossRef ]
  29. مونی، پی. Corcoran, P. خصوصیات اشیاء به شدت ویرایش شده در OpenStreetMap. اینترنت آینده ۲۰۱۲ ، ۴ ، ۲۸۵-۳۰۵٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  30. ویکی OpenStreetMap. ویژگی های نقشه در دسترس آنلاین: https://wiki.openstreetmap.org/wiki/Map_Features (در ۲۰ اکتبر ۲۰۲۱ قابل دسترسی است).
  31. حوزه های اداری جهانی پایگاه داده GADM در دسترس آنلاین: http://www.gadm.org/ (دسترسی در ۲۰ اکتبر ۲۰۲۱).
  32. مبشری، ع. هوانگ، اچ. دگروسی، ال سی. Zipf، A. غنی سازی کامل بودن داده های OpenStreetMap با هندسه های پیاده رو با استفاده از تکنیک های داده کاوی. Sensors ۲۰۱۸ , ۱۸ , ۵۰۹٫ [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  33. موکنیک، FB؛ مبشری، ع. Zipf، A. زیرساخت داده کاوی منبع باز برای کاوش و تجزیه و تحلیل OpenStreetMap. Geospat را باز کنید. نرم افزار داده ایستادن. ۲۰۱۸ ، ۳ ، ۱-۱۵٫ [ Google Scholar ] [ CrossRef ]
  34. پازوکی، ش. پهلوانی، ص. توسعه یک سیستم چند طبقه‌بندی برای طبقه‌بندی برچسب‌های OSM بر اساس پارامترهای مرکزیت. Appl. زمین Obs. Geoinf. ۲۰۲۱ ، ۱۰۴ ، ۱۰۲۵۹۵٫ [ Google Scholar ] [ CrossRef ]
  35. موستیر، اس. Devogele, T. تطبیق شبکه ها با سطوح مختلف جزئیات. GeoInformatica ۲۰۰۸ ، ۱۲ ، ۴۳۵-۴۵۳٫ [ Google Scholar ] [ CrossRef ]
  36. سیلورمن، تخمین چگالی BW برای آمار و تجزیه و تحلیل داده ها . چاپمن و هال، چاپ CRC: لندن، انگلستان، ۱۹۸۶٫ [ Google Scholar ]
  37. گیبین، م. لانگلی، پی. اتکینسون، P. تخمین چگالی کرنل و کانتورهای درصد حجمی در تجزیه و تحلیل حوضه آبریز در مناطق شهری. در مجموعه مقالات GISRUK 2007، کیلدر، ایرلند، ۱۱-۱۳ آوریل ۲۰۰۷; ص ۲۸۲-۲۸۸٫ [ Google Scholar ]
  38. فن، اچ. Zipf، A.; فو، س. Neis, P. ارزیابی کیفیت برای ایجاد داده های ردپایی در OpenStreetMap. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۴ ، ۲۸ ، ۷۰۰-۷۱۹٫ [ Google Scholar ] [ CrossRef ]
  39. Rosin, PL اندازه گیری مستطیل شکل. ماخ Vision Appl. ۱۹۹۹ ، ۱۱ ، ۱۹۱-۱۹۶٫ [ Google Scholar ] [ CrossRef ]
  40. ArcMap. چگالی هسته چگونه کار می کند-ArcMap. مستندات. (دوم). در دسترس آنلاین: https://desktop.arcgis.com/en/arcmap/latest/tools/spatial-analyst-toolbox/how-kernel-density-works.htm (دسترسی در ۲۰ اکتبر ۲۰۲۱).
  41. پدرگوسا، اف. واروکو، جی. گرامفورت، آ. میشل، وی. تیریون، بی. گریزل، او. بلوندل، م. پرتنهوفر، پی. ویس، آر. دوبورگ، وی. و همکاران Scikit-learn: یادگیری ماشینی در پایتون. جی. ماخ. Res را یاد بگیرید. ۲۰۱۱ ، ۱۲ ، ۲۸۲۵-۲۸۳۰٫ [ Google Scholar ]
  42. بریمن، ال. فریدمن، جی. استون، سی جی; اولشن، RA طبقه بندی و رگرسیون درختان ; چاپمن و هال، چاپ CRC: لندن، انگلستان، ۱۹۸۴٫ [ Google Scholar ]
شکل ۱٫ محل گروه های ساختمانی متصل (نقاط قرمز) و جدا شده (نقاط سبز) در استانبول و ازمیر (داده های نقشه گرفته شده از پایگاه داده مناطق اداری جهانی [ ۳۱ ]).
شکل ۲٫ ساختمان های متصل ( الف ) و جداشده ( ب ).
شکل ۳٫ گردش کار رویکرد پیشنهادی.
شکل ۴٫ طرح محاسباتی اندازه گیری ها.
شکل ۵٫ ساختمان ها (سیاه پیوسته)، مجموعه نقطه (قرمز)، مرکز (آبی)، دی من _تیسی(خاکستری خط چین)، و خیابان ها (خاکستری پیوسته).
شکل ۶٫ ساختمانها (سیاه پیوسته)، مجموعه نقطه (قرمز)، دی من _تیاس(خاکستری خط چین)، و خیابان ها (خاکستری پیوسته).
شکل ۷٫ اهمیت اقدامات در پیش بینی انواع مجاورت: PP به عنوان فرآیند پیش بینی، PD به عنوان پیش بینی ساختمان های جدا شده، و PA به عنوان پیش بینی ساختمان های متصل.

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

خانهدربارهتماسارتباط با ما