شاخص جامعیت فضایی (S-COM): شناسایی گستره های فضایی بهینه در مجموعه داده های نقطه اطلاعات جغرافیایی داوطلبانه

خلاصه

رسانه های اجتماعی و سایر اشکال اطلاعات جغرافیایی داوطلبانه (VGI) اغلب به عنوان منبع داده های بزرگ و دقیق برای تحقیق استفاده می شوند. در حالی که استفاده از داده‌های رسانه‌های اجتماعی با ارجاع جغرافیایی برای اهداف گسترده‌ای رایج شده است، مقیاس‌های مربوطه که این داده‌ها بر روی آنها اعمال می‌شوند معمولاً ناشناخته است. برای اینکه محققین از VGI به طور مناسب استفاده کنند (به عنوان مثال، ادغام واحدهای منطقه ای (مثلاً محله ها) برای استخراج اطلاعات کلیدی روند یا جمعیت شناختی)، روش های کلی برای ارزیابی کیفیت مورد نیاز است، به ویژه، ارتباط صریح کیفیت داده ها و مقیاس های فضایی مربوطه، به عنوان مثال. هیچ استاندارد یا کنترل نمونه پذیرفته شده ای وجود ندارد. ما یک معیار کیفیت داده، شاخص جامعیت فضایی (S-COM) را ارائه می دهیم. که می تواند مناطق مطالعاتی امکان پذیر یا گستره های فضایی را بر اساس کیفیت VGI ناهموار و پویا از نظر جغرافیایی ارجاع دهد. این رویکرد حساس به مقیاس برای تجزیه و تحلیل VGI بر روی دانه های مختلف با داده های دو طرح علمی شهروندی نشان داده شده است. شاخص S-COM را می توان هم برای ارزیابی وسعت مطالعه امکان پذیر بر اساس پوشش، ناهمگونی کاربر و تراکم و هم برای یافتن مناطق مطالعات فرعی امکان پذیر از یک منطقه بزرگتر و نامشخص استفاده کرد. نتایج، حوزه‌های مطالعه فرعی VGI را برای تجزیه و تحلیل متمرکز شناسایی کرد، که امکان پذیرش گسترده‌تر روش‌شناسی مشابه در تحلیل‌های چند مقیاسی VGI را فراهم کرد. شاخص S-COM را می توان هم برای ارزیابی وسعت مطالعه امکان پذیر بر اساس پوشش، ناهمگونی کاربر و تراکم و هم برای یافتن مناطق مطالعات فرعی امکان پذیر از یک منطقه بزرگتر و نامشخص استفاده کرد. نتایج، حوزه‌های مطالعه فرعی VGI را برای تجزیه و تحلیل متمرکز شناسایی کرد، که امکان پذیرش گسترده‌تر روش‌شناسی مشابه در تحلیل‌های چند مقیاسی VGI را فراهم کرد. شاخص S-COM را می توان هم برای ارزیابی وسعت مطالعه امکان پذیر بر اساس پوشش، ناهمگونی کاربر و تراکم و هم برای یافتن مناطق مطالعات فرعی امکان پذیر از یک منطقه بزرگتر و نامشخص استفاده کرد. نتایج، حوزه‌های مطالعه فرعی VGI را برای تجزیه و تحلیل متمرکز شناسایی کرد، که امکان پذیرش گسترده‌تر روش‌شناسی مشابه در تحلیل‌های چند مقیاسی VGI را فراهم کرد.

کلید واژه ها:

دانش شهروندی ; محتوای تولید شده توسط کاربر ؛ اطلاعات جغرافیایی داوطلبانه مقیاس فضایی ; کیفیت داده ها ؛ نمودارهای ورونوی ; چهار درخت ; گستره های بهینه شده RinkWatch _ FrogWatch

۱٫ معرفی

اطلاعات جغرافیایی داوطلبانه (VGI) [ ۱ ] که به طور کامل یا جزئی توسط شهروندان تولید شده است، نشان داده شده است که دارای ارزش علمی، اجتماعی و فرهنگی است. روش‌هایی برای باز کردن قفل این مقدار از طریق یادگیری ماشینی [ ۲ ]، داده کاوی [ ۳ ] و سایر روش‌های محاسباتی [ ۴ ، ایجاد شده است . ۵]]. داده هایی که کاربران به طور هدفمند یا غیرفعال به وب سایت ها و سرویس ها کمک می کنند (به عنوان مثال، یوتیوب، فیس بوک، توییتر، ویکی پدیا) اغلب برای برنامه های مختلف، از جمله برخی که اطلاعات جغرافیایی در آنها مهم است (مانند نقشه های توییت) تغییر کاربری داده می شوند. یک چالش همیشگی این است که کیفیت این داده‌ها از مکان به مکان متفاوت است، زیرا افراد انتخاب می‌کنند که کجا داده‌ها را تهیه کنند و به این دلیل که افراد غیرمتخصص در تخصص، انگیزه و روش‌های جمع‌آوری داده‌ها متفاوت هستند [۶، ۷ ] .]. به ویژه، ماهیت نامنظم فرآیندهای تألیف داده های غیررسمی، الگوهای نمونه گیری را ایجاد می کند که اغلب با حوزه های مطالعاتی طبیعی یا اداری به خوبی تعریف شده (گستره ها) برای تجزیه و تحلیل مطابقت ندارد. ما این موضوع را از طریق لنز ویژگی کیفیت داده جدید به نام «جامعیت داده‌های مکانی» بررسی می‌کنیم که به عنوان «توزیع یکنواخت مشاهدات داده‌ها از نظر پوشش و تراکم متناسب با نیازهای تحلیلی در یک منطقه جغرافیایی» تعریف می‌کنیم. جامعیت داده های مکانی برای تجزیه و تحلیل مبتنی بر کار/زمینه VGI از اهمیت ویژه ای برخوردار است زیرا به افراد مربوط می شود.
کیفیت داده‌ها همواره یک بعد مهم در مطالعات داده‌های مکانی و GIS بوده است، با تحقیقات قابل توجه برای پیشبرد درک صحت داده‌های مکانی [ ۸ ، ۹ ، ۱۰ ]، انتشار خطا [ ۱۱ ]، استانداردهای مستندسازی داده‌ها [ ۱۲ ]، و اهمیت مفاهیم معناشناسی و تناسب برای استفاده [ ۱۳ ، ۱۴]. در این مقاله، ما یک شاخص جدید ارائه می‌کنیم که برای کاهش عدم قطعیت‌های ضمنی در ناتوانی در کنترل نمونه‌گیری با شناسایی مناطق مطالعه امکان‌پذیر در مجموعه داده‌های VGI بر اساس ارزیابی یک شاخص ترکیبی جامعیت داده‌های مکانی (S-COM) بدون اشاره به داده های خارجی هدف کلیدی با شاخص S-COM ترسیم یک زیرمنطقه یا مناطق امکان پذیر است که فقط از داده های موجود در مجموعه داده VGI استفاده می کند، فاقد سایر منابع اطلاعاتی معتبر یا متا است و امکان درک سریع اکتشافی کلید فضایی زیربنایی را فراهم می کند. کیفیت مجموعه داده (به عنوان مثال، مقیاس و میزان بهینه برای تجزیه و تحلیل غنی از داده). هنگامی که اطلاعات کمی در مورد فرآیند تألیف داده‌ها که منجر به ایجاد مجموعه داده VGI می‌شود، وجود دارد، ارزیابی یکنواختی مشارکت‌ها برای شناسایی مقیاس فضایی مربوطه برای مطالعه ضروری است. زمانی که پدیده‌های جغرافیایی مورد بررسی به خودی خود مبهم و نامطمئن هستند، مانند آنچه افراد به عنوان «مرکز شهر» در نظر می‌گیرند، این یک ملاحظات مهم است. ما قبلا نشان داده‌ایم که چگونه انتخاب دانه فضایی برای تجزیه و تحلیل را می‌توان با توجه به پارامترهای کیفیت داده‌های عمومی برای VGI بهینه کرد.۱۵ ]. در اینجا، ما بر روی آن کار می‌سازیم تا نشان دهیم که چگونه وسعت فضایی را می‌توان بر اساس یک شاخص از پیش تعریف‌شده مطابق با اهداف کلی یک مطالعه بهینه کرد. همانطور که VGI در تحقیقات برجسته تر می شود، ابزارهایی برای کمک به محققان در اندازه گیری سریع دانه ها و گستره های قابل مطالعه مورد نیاز خواهد بود، به ویژه داده هایی با ویژگی های زمانی که اندازه دانه ممکن است بر اساس برش های زمانی متفاوت باشد (یعنی جریان داده های مکانی). علاوه بر این، الگوهای چند مقیاسی در VGI و حساسیت به تنظیمات ناحیه ای (MAUP) را می توان از طریق الگوریتم های ارائه شده در اینجا بررسی کرد.
داده‌های دو پروژه علمی شهروندی، RinkWatch و FrogWatch، برای نشان دادن زمینه‌های مختلف استفاده می‌شوند که در آن یافتن گستره‌های عملی و واحدهای تجمیع اولین مرحله ضروری تجزیه و تحلیل مجموعه داده‌های نقطه VGI است. این دو پروژه از نقشه‌ها و رابط‌های مبتنی بر وب برای درخواست گزارش شهروندان از مشاهدات فردی از شرایط پیست یخ (RinkWatch) و مشاهده قورباغه یا وزغ (FrogWatch) استفاده می‌کنند. در حالی که این ابتکارات اهداف مشخصی دارند، هر دو به ترتیب برای سنجش تغییرات محلی متغیرهای محیطی مانند دما و کیفیت زیستگاه استفاده می‌شوند.

۲٫ پس زمینه

از نظر VGI بدون مجموعه داده مرجع که بتوان آن را با آن مقایسه کرد، ارزیابی کیفیت داده ها معنایی وابسته به اهداف محققین پیدا می کند. با VGI [ ۱ ]، کیفیت داده اغلب ناهمگن است زیرا یک مجموعه داده منفرد معمولاً از مشارکت بسیاری از کاربرانی تشکیل می شود که اغلب در مجموعه مهارت ها، انگیزه ها و زمینه های مورد علاقه متفاوت هستند [۱۶ ، ۱۷ ، ۱۸ ، ۱۹ ]]. برای محققانی که علاقه مند به استفاده از این داده ها برای درک فرآیندهای فضایی هستند، محدودیت بزرگتر این است که آنها فاقد کنترل و دانش در مورد فرآیندهای جمع آوری داده های VGI هستند. در حالی که اکثر روش‌های تجزیه و تحلیل داده‌ها فرض می‌کنند که داده‌ها نماینده هستند و با استفاده از یک طرح مطالعه جمع‌آوری می‌شوند، داوطلبان معمولاً تصمیم می‌گیرند که کجا و چه زمانی می‌خواهند داده‌ها را جمع‌آوری کنند، از چه روش‌ها یا ابزارهایی استفاده شود، و اینکه آیا مشاهدات فردی آنها با آنچه یک محقق ممکن است در یک مطالعه نیاز داشته باشد مطابقت دارد یا خیر. طراحی نمونه گیری
دیکنسون [ ۲۰ ] هنگامی که با این مجموعه داده های جدید یا نسبتاً ناشناخته مواجه می شود، مانند زمینه علم شهروندی، چندین جنبه کیفیت داده از داده های مشارکتی کاربر را ذکر می کند که می تواند مشکل ساز باشد، از جمله: شکاف دانش بین گردآورندگان داده های متخصص و آماتور، جمعیت شناسی محدود. نمایندگی، و چالش حفظ علاقه داوطلبان در دوره های زمانی طولانی. در بسیاری از موارد، تجزیه و تحلیل VGI حتی می‌تواند نماینده مقادیر پرت به جای نمونه معرف در نظر گرفته شود [ ۲۱ ، ۲۲ ]. بیشتر VGI توسط اقلیت فعالی از کاربران ایجاد می شود، پدیده ای که گاهی اوقات به عنوان قانون ۹۰-۹-۱ توصیف می شود [ ۲۳]]. انگیزه ها، آرزوها، و ویژگی های کاربران درگیر در ایجاد این مجموعه داده ها ممکن است به طور قابل توجهی با جمعیت گسترده تر [ ۱۶ ] متفاوت باشد، و به طور منفعلانه صداهای انتقادی را که از دسترسی به فناوری و منابع مورد نیاز برای مشارکت محروم هستند حذف می کند [ ۲۴ ]. این ویژگی‌های تجزیه و تحلیل داده‌های VGI مشابه آنچه در ادبیات داده‌های بزرگ گزارش شده است، که در آن تحقیقات از نظر تمرکز مشکل، روش‌ها و موقعیت جغرافیایی بیش از حد داده‌محور توصیف شده است [۲۵، ۲۶ ، ۲۷ ، ۲۸ ] است .]. برای مثال، تصادفی نیست که بیشتر فعالیت‌های تجاری و تحقیقات آکادمیک مربوط به VGI، به‌ویژه اشکال جغرافیایی اجتماعی (به عنوان مثال، توییتر) و نقشه خیابان باز تقریباً همه جا حاضر (OSM)، در هسته‌های شهرهای بزرگ و نزدیک به مکان‌های برجسته متمرکز هستند. معمولاً مناطقی با بیشترین حجم داده [ ۲۳ ، ۲۹ ، ۳۰ ]. در حالی که بسیاری از مطالعات کیفیت این داده ها را تجزیه و تحلیل کرده اند و اغلب کیفیت آنها را قابل مقایسه با جایگزین های تولید شده توسط متخصصان می دانند [ ۱۰ ، ۲۳ ، ۳۱]]، به ندرت جنبه «انتخاب مکان» یا وسعت مطالعه این مطالعات به صراحت مورد توجه قرار می گیرد. در عوض، تحلیل‌ها تمایل دارند با ارجاع به مناطق اداری موجود (مثلاً مرزهای شهر) یا محدوده‌های مطالعاتی از پیش تعریف‌شده (مثلاً مناطق زیست‌محیطی) و رویکردهای اکتشافی برای ارزیابی مناسب بودن منابع VGI از نظر پوشش داده‌های جغرافیایی استفاده شوند. و توزیع
نیاز به مطالعه این انتخاب ضمنی از گستره های مطالعه از پیش تعریف شده برای پوشش و توزیع داده های VGI زمانی آشکار می شود که مسئله مقیاس فضایی در تحلیل VGI در نظر گرفته شود [۳۲ ، ۳۳ ، ۳۴ ، ۳۵ ] . VGI مبتنی بر نقطه، مانند عکس‌های جغرافیایی و توییت‌ها، اغلب در واحدهای منطقه‌ای (مثلاً محله‌ها، شهرها، مناطق) جمع‌آوری می‌شوند و خلاصه‌ای از محتوای آن‌ها برای تشخیص ادراکات غالب از رویدادها، مکان‌ها یا سایر اشکال حس شهروندان تولید می‌شود. [ ۳۶ ، ۳۷]. با این حال، عدم کنترل مستقیم جمع‌آوری داده‌های VGI، عدم قطعیت‌هایی را در رابطه با اینکه کدام واحدهای جغرافیایی تجزیه و تحلیل مناسب هستند، انواع تحلیل‌هایی که داده‌ها برای آن مناسب هستند، نقش تحرک و محل سکونت [۳۸]، و مناطق مورد مطالعه امکان پذیر است را معرفی می‌کند . برای روش های تحلیل از پیش انتخاب شده
هنگامی که یک منطقه مورد مطالعه با پوشش غیر یکنواخت انتخاب می‌شود، الگوریتم‌هایی برای یافتن یک زیرمجموعه خاص از داده‌ها به ترسیم زیر حوزه‌های امکان‌پذیر جدید (یعنی گستره/دانه‌های غنی از داده بر اساس پارامترها و معیارهای تحقیق) برای یک مطالعه متمرکزتر کمک می‌کنند. . متأسفانه، اکثر تحقیقات بر ارزیابی VGI در مقایسه با مجموعه داده های بیرونی (مانند مجموعه داده های مرجع معتبر، مجموعه های ابرداده وب سایت) متمرکز شده اند. این منجر به کمبود تحقیق در استفاده از خود مجموعه داده (یعنی ذاتا) برای سنجش کیفیت شده است. فراخوان محققین برای شکل‌گیری الگوی جدیدی از ارزیابی کیفیت درونی [ ۶ ، ۳۹ ] شروع به شکل‌گیری کرده است.
سناراتنه و همکاران [ ۶ ] بر اساس پیشنهاد Goodchild و Li [ ۴۰ ] از سه رویکرد به کیفیت VGI با افزودن “داده کاوی” به لیست ساخته شده است. مطالعه متا آنها در مورد تحقیقات ارزیابی کیفیت VGI نشان داد که تعداد کمی از محققان به طور فعال بر روی ارزیابی VGI بدون استفاده از مجموعه داده های مرجع معتبر کار می کنند. این مطالعات هنوز کیفیت را از طریق مقایسه با ابرداده ارائه شده از طریق رسانه ای که در آن داده ها جمع آوری شده است (به عنوان مثال، داده های رتبه کاربر OSM، تعداد ویرایش ها) مورد بررسی قرار می دهند. هیچ یک از ۵۰ مطالعه ای که آنها گزارش کردند کیفیت مجموعه داده VGI را از طریق استفاده از خود مجموعه داده ارزیابی نکردند – همه آنها به داده های دیگری برای مقایسه ارجاع دادند. در حالی که ارزیابی کیفیت VGI مبتنی بر تصویر در حال حرکت به سمت معیارهای کیفیت مبتنی بر ضمنی است [۶ ، ۴۱ ، ۴۲ ]، نیاز قطعی به انتقال ارزیابی کیفیت VGI مبتنی بر نقطه از روش‌های مقایسه مرجع سنتی برای پاسخ به انبوهی از پیکربندی‌های مختلف داده‌هایی که VGI ممکن است تولید کند، وجود دارد.

۳٫ روش ها

در این مقاله، ما عبارت جامعیت فضایی را برای اندازه گیری ترکیبی از سه عنصر کیفیت داده VGI که ​​برای ترسیم مناطق مطالعه امکان پذیر مناسب هستند، اعمال می کنیم: پوشش، ناهمگونی کاربر و تراکم. این مولفه ها در مقیاس ۰ تا ۱ بیان می شوند و به صورت ضربی ترکیب می شوند تا یک شاخص کلی نهایی S-COM به دست آید. وزن نسبی مولفه ها را می توان برای منعکس کردن تفاوت در پارامترهای مطالعه تغییر داد [ ۱۵]، مانند فقدان داده های منحصر به فرد کاربر. اولین مؤلفه شاخص S-COM، پوشش، وسعت و دانه های نامزد منطقه مورد مطالعه کلی را برای کیفیت های فضایی مورد نظر از نظر مشاهدات، مانند خوشه بندی داده های مشابه یا پراکندگی نقاط بدون ویژگی ارزیابی می کند. پوشش بسیار مهم است زیرا VGI ذاتاً به دلیل علایق کاربران، بی توجهی به طرح های تحقیقاتی یا مشخصات فنی ناهموار است. این مناطق فرعی کاندید را می توان در مراحل مقدماتی مطالعه انتخاب کرد و توسط شاخص S-COM ارزیابی کرد یا می تواند زیر واحدهایی باشد که توسط خود فرآیند به شکلی بدون نظارت تعریف شده است. تعریف “پوشش” می تواند متفاوت باشد، و امکان غربالگری سایت های بالقوه بر اساس حداقل آستانه مشاهدات خاص برنامه را فراهم می کند. مثلا، با توجه به مجموعه داده VGI از مرکز شهر یک شهر بزرگ که مایلیم در آن احساسات بازدیدکنندگانی مانند گردشگران را بسنجیم، می‌خواهیم پوشش را به حداقل برسانیم زیرا فعالیت‌های توریستی به شدت خوشه‌بندی می‌شوند و در کل شهر پراکنده نمی‌شوند. در این مقاله، پوشش به عنوان نسبت داده‌های جمع‌آوری‌شده به واحدهای منطقه (به عنوان مثال، شبکه‌های مستطیلی، بخش‌های سرشماری)، که به عنوان سلول برای اهداف این مقاله برچسب‌گذاری شده‌اند، با حداقل تعداد مشاهدات مشخص شده به تعداد کل سلول‌ها محاسبه می‌شود. منطقه مورد مطالعه این سلول‌ها می‌توانند شبکه‌های شبکه‌ای یا نامنظم Voronoi یا واحدهای جغرافیایی معتبر مانند یک سرشماری باشند. رویکردهای کلی برای تعیین پارامتر آستانه حداقل می تواند ماهیت آماری داشته باشد: بررسی توزیع از طریق هیستوگرام یا حذف درصد معینی از دم پایینی توزیع. حداقل آستانه همچنین می تواند بر اساس عوامل دیگری مانند حفظ حریم خصوصی جغرافیایی شرکت کنندگان باشد.
دومین معیار مؤلفه S-COM ناهمگونی کاربر است که نسبت مشاهدات را به تعداد مشارکت کنندگان منحصر به فرد در هر واحد تحلیل می سنجد. این نسبت با در نظر گرفتن تعداد کل ارسال‌های کاربر و تعداد کاربران منحصربه‌فرد در هر سلول تقسیم بر تعداد کل سلول‌ها محاسبه می‌شود (و بنابراین می‌توان آن را به عنوان یک معیار تراکم کاربر در نظر گرفت). در زمینه تحلیل موضوعی داده‌های جغرافیایی اجتماعی، ناهمگونی بالای کاربر ممکن است نشان‌دهنده اطمینان بیشتر در یک الگو یا روند شناسایی‌شده (یعنی قانون لینوس) باشد [ ۴۰ ، ۴۳ ].
مؤلفه نهایی یک اندازه گیری چگالی فضایی است که شباهت بین تعداد داده های انباشته را ارزیابی می کند که در نمودار پراکندگی موران تجسم شده است. تخمین میزان توزیع یکنواخت مقادیر در یک منطقه مورد مطالعه با ارزیابی واریانس در ربع‌های نمودار پراکندگی انجام می‌شود. این با مقادیر اندازه‌گیری‌شده در محور X و مقادیر عقب‌افتاده فضایی در محور Y تعریف می‌شود، که بزرگ‌ترین و کوچک‌ترین ربع‌ها را بر اساس مساحت می‌گیرد و محدوده‌ای را محاسبه می‌کند که ۰ نشان‌دهنده شباهت کامل است. به این ترتیب، چگالی برای یافتن مناطق مشابه هم در فضای جغرافیایی و هم در فضای داده استفاده می شود ( شکل ۱ را ببینید.). نقاط داده دایره شده در نمودار پراکندگی موران (محور Y) با مناطق سایه دار روی نقشه (سمت چپ) مطابقت دارد. این زیر ناحیه از نقشه از نظر ویژگی های S-COM “مشابه” با مقدار شاخص ۰٫۸۱۶ پیدا شد. پنجره سمت چپ (نمودار ورونوی) بزرگنمایی می شود تا چند ضلعی های انتخاب شده را در مقایسه با قسمت سمت راست با مجموعه کامل نقاط داده، بهتر برجسته کند. چگالی به گونه ای فرموله می شود که مقادیر نزدیک به ۱ یکنواختی در ربع پراکندگی موران و در نتیجه شباهت توزیع داده ها (یعنی نزدیک به میانگین) را نشان می دهد. مقادیر نزدیک به صفر نشان‌دهنده واریانس بالا در ربع‌های پراکنده موران است و نقاط پرت فضایی یا فضایی در نظر گرفته می‌شوند. از آنجایی که این رویکرد می‌تواند به موارد پرت حساس باشد، از آستانه‌های دم می‌توان برای کاهش تأثیر آن‌ها بر اندازه‌گیری چگالی فضایی استفاده کرد.
برای ترسیم نواحی فرعی امکان پذیر در یک منطقه مطالعه کلی، هم از تسلیحات منظم و هم نامنظم استفاده می شود. روش تسلاسیون منظم از یک رویکرد چهاردرختی و یک الگوریتم بازگشتی استفاده می‌کند که تعیین می‌کند آیا چند ضلعی‌های مجاور باید ادغام شوند تا یک چند ضلعی والد «جامع‌تر» ایجاد شود. روش تسلاسیون نامنظم فقط از الگوریتم بازگشتی استفاده می کند و هر چند ضلعی مجاور را برای بهبود شاخص S-COM آزمایش می کند. هر دو الگوریتم از شاخص S-COM برای ارزیابی مناطق فرعی کاندید استفاده می کنند و برای هر پیکربندی آزمایش شده مقداری بین ۰ و ۱ برمی گردانند.
رویکرد شبکه‌بندی چهار درختی به دلیل توانایی آن در ایجاد وضوح متغیر به صورت بازگشتی انتخاب شد. Quadtree یک بافت منظم است که به طور مداوم مناطق را به چهار ناحیه مساوی تقسیم می کند تا زمانی که به آستانه همگنی برسد ( شکل ۲ ) [ ۴۴,۴۵,۴۶ ] .]. اولین تکرار (مقدار متریک محاسبه شده ۳) به چهار گره تقسیم می شود. مقادیر متریک گره سمت راست بالا و پایین سمت چپ (۵ و ۷) از مقدار متریک گره والد (۳) بیشتر است و بنابراین بیشتر تقسیم می شوند. در تکرار سوم، ربع بالا سمت راست هیچ گره‌ای با مقادیر متریک بالاتر از گره والد ندارد، بنابراین تقسیم آن متوقف می‌شود. با این حال، پایین سمت چپ ادامه می‌یابد تا زمانی که به شرایطی برسد که تمام گره‌های فرزند مقادیر متریک کمتری نسبت به والد داشته باشند. سپس الگوریتم گره ها را از پایین ترین شاخه می گیرد و آنها را ادغام می کند. مقدار متریک را برای آنها پیدا می کند (در این مورد ۸) و آن مقدار را با مقدار گره والد (۷) بررسی می کند. اگر مقدار بالاتر باشد، چند ضلعی ادغام شده به جای چند ضلعی والد کامل به بالای درخت ارسال می شود. این مثال دو چند ضلعی با مقادیر متریک ۸ و ۵ برگرداند.۴۶ ] توضیح داد که این نوع ساختار داده می تواند سرعت پرس و جو را با تقسیم مداوم یک ناحیه مطالعه ناهمگن تا زمانی که مقادیر داده های همگن پیدا شود، افزایش دهد. نمونه هایی از استفاده از چهار درخت را می توان در بازیابی تصویر [ ۴۷ ، ۴۸ ] و مدل سازی محیطی [ ۴۹ ، ۵۰ ] یافت .
رویکرد تسلاسیون نامنظم از الگوریتمی استفاده می کند که به طور مکرر چند ضلعی های مجاور را از یک چند ضلعی دانه ادغام می کند ( شکل ۳)). این مجموعه‌های Voronoi از واحد تجزیه و تحلیل ایجاد می‌شوند، در مورد RinkWatch، اسکله‌های منفرد با خوانش‌های محلی در سکوها. الگوریتم روی هر چند ضلعی موجود در ناحیه مورد نظر تکرار می شود و هر یک را به عنوان یک دانه در نظر می گیرد. همسایگان چند ضلعی دانه برای یافتن یک چند ضلعی همسایه که بالاترین مقدار شاخص کلی S-COM را هنگام ترکیب با مقدار دانه ایجاد می کند، ارزیابی می شوند. اگر این مقدار بیشتر از دانه فعلی باشد، دانه با چند ضلعی جدید ادغام شده جایگزین می شود. این فرآیند تا زمانی تکرار می شود که هیچ چند ضلعی مجاور برای ایجاد مقدار شاخص S-COM بالاتر پیدا نشود. مجاورت به صورت غیر بازگشتی با استفاده از یک ماتریس مجاورت جهانی مشابه الگوریتم AMEOBA [ ۵۱] تعیین می شود.]. الگوریتم هر همسایه (سبز) را در اطراف چند ضلعی ادغام شده (قرمز) بررسی می کند.

۴٫ منابع داده و منطقه مطالعه

ابتکارات علمی شهروندی در سال‌های اخیر محبوبیت زیادی پیدا کرده است، زیرا توسعه و استقرار برنامه‌های جمع‌آوری داده‌ها از طریق وب‌سایت‌های سازگار با موبایل و تلفن‌های همراه به طور قابل توجهی افزایش یافته است. پروژه‌هایی مانند RinkWatch، FrogWatch، و OakMapper.org [ ۵۲ ] نشان می‌دهند که چگونه برنامه‌های ساده داده‌های جغرافیایی می‌توانند مشاهدات شهروندان را در موضوعات مختلف اجتماعی مهار کنند. پروژه RinkWatch برای بهره برداری از محبوبیت اسکیت در فضای باز با استخدام شهروندان برای مشارکت در گزارشی مبتنی بر وب در مورد کیفیت و در دسترس بودن یخ در پیست های خانگی خود طراحی شد [۵۳ ]]. مهمتر از آن، تغییرات مشاهده شده در دسترس بودن اسکیت در فضای باز می تواند انگیزه مشارکت عمومی بیشتر در تغییرات آب و هوا و علم آب و هوا باشد. هدف FrogWatch جلب مشارکت شهروندان در مجموعه مشاهدات مکان قورباغه است. مشابه RinkWatch، FrogWatch هم دارای اهداف علمی حفاظتی و هم اهداف آموزشی است.
مطالعه موردی ارزیابی داده‌های RinkWatch برای شناسایی مناطق مطالعه امکان‌پذیر بر روی منطقه Kitchener/Waterloo (KW) در جنوب انتاریو، کانادا در طول زمستان‌های ۲۰۱۳ و ۲۰۱۴ متمرکز شد. یک مطالعه امکان پذیر برای داده های RinkWatch در مقایسه با سایر پروژه های علمی شهروندی کمی منحصر به فرد خواهد بود. به عنوان مثال، OSM اغلب دارای چندین کاربر است که در هر مکان به داده ها کمک می کنند زیرا برخی ویژگی های جدید را اضافه می کنند در حالی که برخی دیگر ممکن است روی بهبود داده های موجود تمرکز کنند. در مقابل، RinkWatch بر نظارت بر زمین‌های یخ متمرکز است، که بیشتر آنها توسط صاحبان خانه‌های خصوصی ایجاد و نگهداری می‌شوند. در مجموع ۹۸۵ پیست (کاربران منحصر به فرد) در طول دوره مطالعه دو ساله به طور کلی ثبت شد، با ۲۲۶۶۱ قرائت فردی از شرایط یخ (نقاط داده) مشخص شده است. منطقه KW برای مطالعه موردی انتخاب شد و دارای جمعیت تخمینی ۵۳۵ است.۵۴ ]. این منطقه به دلیل مشارکت بالای پروژه RinkWatch علاوه بر آشنایی این منطقه برای محققان انتخاب شد. بیست و یک پیست در منطقه KW در این تجزیه و تحلیل بر اساس فیلتر هر پیست دارای بیش از ۲۰ خوانش وضعیت یخ (سه هفته متوالی) استفاده می شود. این به حذف داده های جعلی یا مخرب از تجزیه و تحلیل کمک می کند [ ۳۱ ].
داده‌های FrogWatch برای منطقه کلان‌شهری سرشماری تورنتو (CMA) جمع‌آوری شد که شامل شهر تورنتو و همچنین شهرهای مجاور (مانند می‌سیساگا، برامپتون، مارکهام) و تعدادی شهرک و دهکده کم‌جمعیت‌تر و دارای جمعیتی حدود ۶ نفر است. میلیون در سال ۲۰۱۴ [ ۵۵ ]. شاخص S-COM در CMA تورنتو برای شناسایی مناطقی که می‌توان تلاش‌های حفاظتی را برای کاهش تعداد قورباغه‌های کشته شده توسط ترافیک جاده‌ها متمرکز کرد، استفاده شد. همه مشاهده‌های قورباغه از FrogWatch در فاصله ۵۰۰ متری از هر خیابان، جاده، خیابان، بزرگراه یا بزرگراه برای تجزیه و تحلیل انتخاب شدند که منجر به مشاهده ۱۱۰۸ قورباغه یا وزغ در دوره ۱۹۹۹ تا ۲۰۱۴ شد و سال ۲۰۱۵ به بعد کاهش زیادی در مشارکت نشان داد.

۵٫ مطالعه موردی

سه نوع روش تجمیع برای داده‌های RinkWatch اعمال شد: شبکه‌ها (چهاردرخت)، بخش‌های سرشماری، و چند ضلعی‌های Voronoi ( شکل ۳ را ببینید).). پیاده سازی چهار درختی مورد استفاده در این تحقیق بازگشتی بود به طوری که هر سلول تا زمانی که مقادیر شاخص هر چهار گره فرزند کمتر از مقدار شاخص گره والد به اضافه یک تلورانس بازگشتی کوچک باشد (۰٫۰۵ در مورد این پیاده سازی، که مقدار شاخص بین ۰ و ۱). اگر مقدار هر گره فرزند از مقدار شاخص گره والد آن به اضافه تحمل بیشتر باشد، بازگشت به سطح عمیق تری منتقل می شود. الگوریتم کوچکترین واحدهای امکان پذیر را در سراسر منطقه مورد مطالعه پیدا می کند و سلول های شبکه مجاور را ادغام می کند، مگر زمانی که یک سلول شبکه ایزوله (یعنی جزیره ای) مواجه می شود. در پایان اجرای الگوریتم، چند ضلعی با بیشترین مساحت و بالاترین مقدار شاخص S-COM به عنوان یک ناحیه امکان پذیر شناسایی می شود ( شکل ۳) .، اگرچه می توان آن را برای بازگرداندن چندین منطقه امکان پذیر اصلاح کرد.
داده‌های FrogWatch ابتدا قبل از اجرای تجزیه و تحلیل، به داده‌های چند ضلعی ادغام شدند، یک نیاز رایج برای داده‌های علوم شهروندی، به‌ویژه زمانی که به داده‌های گونه‌های بالقوه در خطر انقراض مربوط می‌شود. شبکه ای با هر سلول به ابعاد ۱۰ × ۱۰ کیلومتر در منطقه ایجاد شد و مشاهده قورباغه در ۵۰۰ متری یک جاده، خیابان، خیابان، بزرگراه یا بزرگراه پیدا شد و در سلول شبکه ای که در آن افتادند جمع شدند. این کار برای شبیه‌سازی مطالعه‌ای انجام شد که تمرکز منابع برای تلاش‌های حفاظت از قورباغه در شهر تورنتو را با نگاه کردن به مناطقی که اغلب قورباغه‌ها در نزدیکی جاده‌های پر قاچاق مشاهده می‌شوند، ارزیابی می‌کرد.
تمام نقاط داده در هر چند ضلعی برای هر دو مطالعه موردی برای تعیین مقادیر شاخص S-COM با شاخص نرمال شده توسط ناحیه چند ضلعی تجمیع شدند. خطوط چند ضلعی معتبر مورد استفاده، مسیرهای سرشماری و مناطق انتشار بودند که هر دو به عنوان داده های سرشماری منتشر شده در این واحدهای جغرافیایی انتخاب شدند و اغلب در علوم اجتماعی استفاده می شدند. چند ضلعی های Voronoi برای RinkWatch و یک شبکه برای FrogWatch به دلیل ویژگی های غیر استاندارد آنها انتخاب شدند. وزن اجزای شاخص برای تجزیه و تحلیل برای داده‌های RinkWatch متفاوت بود: ۵۰٪ تراکم و پوشش، و ۳۳٪ تراکم، پوشش، و ناهمگونی کاربر. از این به بعد به ترتیب وزن ۵۰۵ و وزن ۳۳۳ نامیده می شود. وزن دهی ۵۰۵ برای تجزیه و تحلیل استفاده شد زیرا ناهمگونی کاربر جزء کمتر مفید در نظر گرفته شد. این به دلیل این واقعیت است که ناهمگونی کاربر نسبت نقاط داده به کاربران منحصر به فرد را اندازه‌گیری می‌کند در حالی که مطالعه موردی از حداقل ۲۰ نقطه داده برای هر کاربر برای گنجاندن استفاده می‌کند، که باعث ایجاد یک مقدار ناهمگونی کاربر S-COM کوچک می‌شود. علاوه بر این، از آنجایی که داده‌های FrogWatch شامل اطلاعات کاربر نمی‌شد، تنها وزن مورد استفاده ۵۰۵ بود (۵۰٪ تراکم و ۵۰٪ پوشش). از مجموعه داده FrogWatch برای کمک به درک اثربخشی و محدودیت های SCOM هنگام استفاده بر روی یک مجموعه داده پراکنده استفاده شد.

۶٫ نتایج

۶٫۱٫ RinkWatch

در مقایسه با تسلیحات نامنظم، تفاوت های متعددی بین تسلیحات معمولی وجود داشت. تسلیحات نامنظم عموماً مقادیر شاخص S-COM بالاتر و تعداد داده‌های همگن بیشتری را در مقایسه با نواحی شبکه‌بندی شده به دست می‌آورند که چندین نقطه پرت شدید را در خود جای داده‌اند ( شکل ۴ ). الگوریتم جداسازی منظم نواحی امکان‌پذیر را با مقادیر شاخص S-COM بسیار پایین (۰٫۱۴۸/۰٫۲۱۶ برای ورودی‌های شاخص ۳۳۳/۵۰۵) در مقایسه با تسلیحات نامنظم (دستگاه‌های سرشماری) و فهرست‌بندی جغرافیایی (چند ضلعی‌های Voronoi) برگرداند. مقادیر بسیار مشابهی را نشان داد (به ترتیب ۰٫۹۶۸/۰٫۹۹۹۷ و ۰٫۶۵۶/۰٫۶۸۰) ( شکل ۴ ).
ناحیه شبکه‌بندی‌شده ( شکل ۴ الف) ناحیه‌ای با تعداد مشابهی از خوانش‌های وضعیت یخ پیدا کرد، حتی اگر همین ناحیه حاوی تعداد بسیار بزرگ‌تری است که معیارهای مورد نیاز برای تجزیه و تحلیل قابلیت اسکیت‌پذیری را که قبلاً توضیح داده شد، برآورده نمی‌کند. مقدار شاخص S-COM نیز برای هر دو وزن ۵۰۵ و ۳۳۳ بسیار پایین است. پوشش نقش زیادی در مقادیر پایین‌تر ایفا می‌کند، زیرا سطح شبکه با طراحی مستطیل شکل است و فضای خالی زیادی باقی می‌گذارد. علاوه بر این، افزودن مقادیر پرت بزرگ به فهرست شمارش ها ناهمگونی کاربر را کاهش می دهد.
تجزیه و تحلیل های چند ضلعی نامنظم به طور کلی مقادیر شاخص S-COM بالاتری را یافت ( شکل ۴ b,c). تجزیه و تحلیل دستگاه سرشماری چهار چند ضلعی را با تعداد قرائت‌های مشابه شناسایی کرد. مقادیر شاخص چند ضلعی فردی با مساحت چند ضلعی ها نرمال شد. تجزیه و تحلیل چند ضلعی Voronoi همان منطقه را شناسایی کرد. ناهمگونی کاربر مقادیر شاخص هر دوی این تحلیل‌ها را کاهش داد زیرا هر نقطه جمع‌آوری شده فقط یک کاربر منحصر به فرد (رینک) دارد. مناطق انتشار مورد آزمایش قرار گرفتند، اما ثابت شد که وضوح بسیار خوبی برای تجزیه و تحلیل این مجموعه داده دارند. به طور کلی، الگوریتم مجاورت مقادیر شاخص S-COM بالاتری نسبت به الگوریتم چهار درختی ارائه می‌دهد.
تجزیه و تحلیل درون‌یابی اسپلاین، سطح اسپلاین بسیار صاف‌تری را نشان می‌دهد که نسبت به سطح ایجاد شده از کل مجموعه داده (تعداد قرائت‌ها ≥ ۲۰) ایجاد شده است ( شکل ۵ و شکل ۶ )، به ما این امکان را می‌دهد که تغییرپذیری در ناحیه محلی را برای اسکیت‌پذیری بهتر ارزیابی کنیم. در حالی که تغییرات محلی تفاوت‌هایی را با ایستگاه‌های رسمی داده‌های آب و هوا (واقع در فرودگاه در منطقه KW) و در میان مناطق مختلف منطقه KW (به عنوان مثال، روستایی در مقابل شهری) نشان می‌دهد، تغییرات با استفاده از کل مجموعه داده برای مناطق مورد مطالعه نشان داده شده است. غیر قابل استفاده است ( شکل ۵ ب و شکل ۶ب). اگرچه سطوح زیادی از کاربران وجود دارد، از افرادی که برای چندین دهه پیست می‌سازند تا افرادی که برای اولین بار یاد می‌گیرند، نباید میزان تغییرپذیری در اسکیت‌پذیری پیست‌ها همانطور که در تصاویر سمت چپ نشان داده شده است وجود داشته باشد. نواحی امکان پذیری که با استفاده از هر دو وزنه (۵۰۵ و ۳۳۳) یافت شدند، سطوح بسیار صاف‌تری نسبت به ناحیه کلی با مقادیر مشابهی از قابلیت اسکیت نشان می‌دهند. نقاط پرت عمده در منطقه امکان پذیر گنجانده نشدند. شکل ۵ وزن ۵۰۵ را نشان می دهد که وزن ۳۳۳ ( شکل ۶ ) نتایج مشابهی را نشان می دهد. لازم به ذکر است که یک اسپلاین بهترین سطح را بر اساس برازش یک سطح صاف با داده ها ایجاد می کند که باعث ایجاد مقادیر زیر ۰٪ و بیش از ۱۰۰٪ می شود.

۶٫۲٫ FrogWatch

تجزیه و تحلیل داده‌های FrogWatch نسبت به تجزیه و تحلیل داده‌های RinkWatch به دلیل کمبود اطلاعات کاربر/گردآورنده، محدودتر بود و ارزیابی کیفیت را محدود می‌کرد، مانند بررسی اینکه آیا داده‌های یافت شده در یک منطقه توسط یک کاربر یا تعداد زیادی کاربر جمع‌آوری شده‌اند. الگوریتم مجاورت چند ضلعی مورد استفاده با داده‌های FrogWatch، مناطق وسیعی از تعداد داده‌های مشابه قورباغه‌ها را در منطقه مورد مطالعه (۱۰×۱۰ کیلومتر بر سلول) قرار داد. شکل ۷ امکان پذیرترین منطقه مورد مطالعه را بر اساس معیارهای پوشش زیاد و شباهت داده ها نشان می دهد. هیچ حداقل تعداد شمارش برای این کارآزمایی اعمال نشد. دو نمودار پراکندگی موران در شکل ۷ یافت شده استج ناهمگونی ناحیه امکان پذیر محاسبه شده توسط الگوریتم را نشان می دهد. پوشش در ۰٫۰۵۶ کم بود، در حالی که چگالی بالا بود (۰٫۸۸۴)، با مقدار شاخص کلی S-COM 0.470. پوشش تحت تأثیر تعداد زیادی سلول با تعداد کم بود. این سلول‌های کم شمار به دلیل محدودیت مجاورت الگوریتم به چند ضلعی منطقه مورد مطالعه نهایی وصل شدند. یک مقدار تاخیر بزرگتر می تواند به الگوریتم اجازه دهد تا مجاورت را در مرتبه های مختلف محاسبه کند (یعنی اجازه می دهد چند ضلعی ها حتی اگر با n از هم جدا شده باشند گنجانده شوند.چند ضلعی های خالی)، اگرچه این یک چند ضلعی بیش از حد بزرگ برای منطقه مطالعه کوچک مورد استفاده ایجاد می کند. مقادیر بافر را می توان برای ترکیب چندین ناحیه از مقادیر شاخص S-COM که در محدوده مقادیر قرار می گیرند استفاده کرد و امکان یافتن مناطق امکان پذیر بزرگتر را فراهم کرد. سلول با ۳۶ مشاهده قورباغه در یک منطقه مطالعاتی امکان‌پذیر با مقدار شاخص S-COM مشابه تصویر ۷ گنجانده شد و در صورت اعمال محدوده‌ها، در “بهترین” کلی گنجانده شد. یکی از سلول ها با تعداد ۱۴۲ قورباغه مشاهده شد ( شکل ۷آ). مشخص شد که اینها همه در یک موقعیت قرار دارند و احتمالاً به دلیل بارگذاری انبوه همه مشاهدات در منطقه است. این یکی از مشکلات کار با VGI را برجسته می کند. الگوریتم از این سلول برای یافتن بالاترین مقدار شاخص S-COM استفاده نکرد زیرا مؤلفه چگالی برای یافتن مقادیر پرت مقادیر بزرگ در فضاهای مشابه تنظیم شده بود اما نه تنها در یک سلول. نمودار پراکندگی موران وسط (b) چند ضلعی را در رابطه با کل منطقه مورد مطالعه نشان می دهد، در حالی که (c) ناهمگونی ناحیه امکان پذیر محاسبه شده توسط الگوریتم (محور Y = تاخیر فضایی، محور X = تعداد قورباغه ها) را نشان می دهد.

۷٫ بحث

تحقیقات قبلی نشان داده است که تجزیه و تحلیل VGI در دانه‌های مختلف می‌تواند به نتایج متفاوتی منجر شود [ ۲۹ ، ۵۶ ]. در اینجا، هدف ما استفاده از شاخص کیفیت داده توصیف شده در لارنس و همکاران بود. [ ۱۵] برای تعریف وسعت مطالعه بر اساس ویژگی های فضایی ذاتی در الگوهای نقطه VGI. نتایج نشان داد که روش‌ها قادر به یافتن زیرمنطقه‌هایی بودند که با معیارهای از پیش تعریف‌شده برای مطالعه موردی VGI اسکیت‌پذیری RinkWatch و تلاش‌های حفاظتی برای FrogWatch مطابقت داشتند. این معیارها شامل شباهت در تعداد داده‌ها توسط هر مشارکت کننده منحصر به فرد در مورد RinkWatch، و مجاورت/شباهت فضایی و حداقل تعداد داده‌ها در هر دو مطالعه موردی بود. فیلتر کردن نقاط پرت، چه برای حذف، چه برای مطالعه بیشتر، و حفظ ارتباط فضایی در تجزیه و تحلیل فضایی الگوهای نقطه VGI ممکن است یک مرحله پیش پردازش مهم برای مطالعات آینده داده‌های مشارکت‌کننده کاربر باشد.
مقادیر شاخص S-COM نشان داد که تفاوت بین گستره های فضایی مختلف می تواند بسیار شدید باشد. اولین روش بهینه‌سازی مورد استفاده، الگوریتم شبکه‌بندی چهاردرختی بود. در حالی که نتیجه منطقه مورد مطالعه یک زیرمجموعه معقول از داده های کلی را در بر می گیرد که با معیارهای مورد نیاز برای تجزیه و تحلیل قابلیت اسکیت مطابقت دارد، نمی تواند بر کمبود ذاتی شبکه های استاندارد مورد استفاده غلبه کند. منطقه عملی یافت شده برای داده‌های RinkWatch شامل تعداد زیادی از تعداد قرائت‌های جمع‌آوری شده بود که بسیار بیشتر از شمارش‌های اطراف بود و یک سوگیری در تجزیه و تحلیل قابلیت اسکیت ایجاد می‌کرد، زیرا یک پیست با ۳۹۴ مشارکت بسیار دقیق‌تر از میانگین پیست با ۷۳ مشارکت است. در حالی که می تواند برای یافتن پرکارترین مشارکت کنندگان کاربرد داشته باشد،۳۴ ، ۴۰ ، ۵۷ ، ۵۸ ، ۵۹ ، ۶۰ ]، این موضوع تمرکز این مقاله نبود. شاخص S-COM، به عنوان معیار جامعیت فضایی، به این معنا قابل گسترش است که وزن اجزا را می توان برای اهداف مطالعه تنظیم کرد. تجزیه و تحلیل FrogWatch از این جهت متفاوت بود که منطقه کلی برای نقاط دورافتاده یا غلظت زیاد قورباغه ها تجزیه و تحلیل شد، که امکان تعیین مناطق امکان پذیر برای تلاش های حفاظتی را فراهم می کرد.
مناطق مورد مطالعه چند ضلعی نامنظم (دستگاه های سرشماری، مناطق انتشار، و چند ضلعی های Voronoi) مقادیر شاخص S-COM بهتری را ارائه می دهند. مسیر سرشماری و مناطق مورد مطالعه چند ضلعی Voronoi برای تجزیه و تحلیل درون یابی فضایی بسیار مساعدتر بود. مسیر سرشماری و مناطق مورد مطالعه Voronoi نشان داد که بهترین مناطق را از همه انواع مختلف مناطق مورد آزمایش آزمایش شده، نشان می‌دهد که سازگاری خوبی با معیارهای مورد نیاز برای تجزیه و تحلیل نهایی اسکیت‌پذیری دارد. تفاوت بسیار کمی بین استفاده از وزن مؤلفه شاخص ۳۳۳ در مقایسه با وزن ۵۰۵ وجود داشت. تجزیه و تحلیل قابلیت اسکیت با استفاده از درون یابی اسپلاین به تجسم تفاوت بین استفاده از منطقه مطالعه کامل در مقابل منطقه امکان پذیر Voronoi کمک می کند. شکل ۵ و شکل ۶نشان می‌دهد که قابلیت اسکیت‌بازی در محدوده نشان‌داده‌شده به اندازه‌ای نیست که مجموعه کامل امتیازات ما تصور می‌کنیم. مقدار ۱۰۰% (سمت راست پایین شکل ۵ ) یک مقدار بسیار مشکوک است که باید بیشتر مورد تجزیه و تحلیل قرار گیرد و به احتمال زیاد از تجزیه و تحلیل حذف شود.
تجزیه و تحلیل FrogWatch بیشتر به نشان دادن کارایی شاخص S-COM در تعیین مناطق فرعی در یک منطقه مطالعاتی اولیه کمک می کند. در حالی که یک بررسی بصری سطحی از منطقه مورد مطالعه ممکن است ثابت کند که مناطق تعداد زیادی از قورباغه ها را روشن می کند، شاخص مورد استفاده در این مقاله انتخاب منطقه فرعی مطالعه را کمی بیشتر می کند. با این حال، مجموعه داده FrogWatch در در دسترس نبودن اطلاعات کاربر یا دانش متا متفاوت بود که در استفاده از داده ها مشکل ایجاد می کرد [ ۶۱ ، ۶۲ ، ۶۳ ، ۶۴ ]، اگرچه شاخص S-COM هنوز هم می توانست یک زیر منطقه مناسب پیدا کند. بر اساس شرایط مطالعه (غلظت زیاد قورباغه).
سه معیار متریک S-COM را می توان با استفاده از رویکردهای مختلف تکرار کرد. DBSCAN یک تکنیک خوشه بندی شناخته شده است که می تواند مناطقی با پوشش مشابه را پیدا کند. میراحسان و همکاران [ ۶۵ ] ناهمگنی کاربر-کاربر کاربران سلولی بی سیم را با استفاده از ضریب تغییرات نواحی سلول Voronoi و طول لبه سلول Delaunay حاصل محاسبه کرد. با این حال، این مطالعه از داده های OSM استفاده کرد. ایده های مشابهی در فنگ و همکاران ارائه شده است. [ ۶۶ ] با مجموعه داده های بسیار ناهمگن اما پر سر و صدا سر و کار دارد، با این حال دوباره از داده های خارجی برای تأیید ناهمگنی استفاده می کند. اندازه گیری تراکم و پوشش S-COM به دستورالعمل های ISO داده های جغرافیایی برای کامل بودن تقریب می زند که به طور گسترده مورد مطالعه قرار گرفته است [ ۱۰ ، ۱۳ ،۳۱ ، ۶۷] از نظر ارزیابی های کیفی. متریک S-COM اجازه می دهد تا سه معیار آن در الگوریتم های مختلف (به عنوان مثال، Voronoi، بخش سرشماری، چهار درخت) ترکیب شوند، همانطور که در این مقاله نشان داده شده است. این روش دو مزیت نسبت به روش های فعلی دارد. اول و مهمتر از همه، فقط از طریق خود مجموعه داده محاسبه می شود. ثانیاً، از هر سه معیار در محاسبات در هر مرحله استفاده می کند، برخلاف محاسبه هر اندازه به طور جداگانه و سپس تلاش برای ترکیب آنها در یک حد بهینه. صرف نظر از اینکه از VGI مکان‌یابی شده برای تجزیه و تحلیل الگوهای فعالیت روزانه یا احساسات استفاده می‌شود یا از داده‌های علوم شهروندی برای بررسی فراوانی یک دوزیست استفاده می‌شود، ویژگی‌های فضایی داده‌ها باید مورد بازجویی قرار گیرند، و روش توسعه‌یافته در اینجا قوی است. اشکال مختلف مطالعات موضوع-ابژه
نیاز به روش‌هایی برای یافتن گستره‌های مطالعه و شناسایی مقیاس‌های فضایی خاص به VGI محدود نمی‌شود. به عنوان مثال، گالپرن [ ۶۸ ] خاطرنشان کرد که دانه فضایی بهینه معمولاً قبل از تجزیه و تحلیل ژنتیکی منظر ناشناخته است و مثالی از نگاه کردن به دانه‌های مختلف برای فیلتر کردن تغییرات بی‌اهمیت در چشم‌انداز جریان ژنی ارگانیسم با دامنه وسیع ارائه می‌کند. از آنجایی که درک این منابع مختلف VGI هنوز در مراحل ابتدایی است، یک رویکرد برای استفاده از مجموعه داده VGI بدون تمرکز چند مقیاسی ممکن است اطلاعات مهم را پنهان یا نادیده گرفته شود. سستر و همکاران [ ۶۹] بحث کرد که چه تعداد از خطوطی که ممکن است در VGI یافت شوند رسمی نیستند و ممکن است دارای مرزهای نیمه دائمی یا مرزهای مبهم باشند، مانند مورد توصیفات محاوره ای محله های شهری به عنوان “بالای شهر”، “منطقه دانشگاه” یا موارد دیگر. مرزبندی های فرهنگی تعریف شده الگوریتم های خوشه بندی مدرن (به عنوان مثال، DBScan، KMeans) همچنین می توانند الگوهای اضافی را در داده ها ارائه دهند که این الگوریتم ها نمی توانند پیدا کنند. با این حال، بسیاری از الگوریتم‌های خوشه‌بندی بدون نظارت، توانایی تنظیم حساسیت به مراکز اولیه خوشه‌ها را ارائه نمی‌دهند و به احتمال زیاد حداقل‌های محلی بهینه را با چندین پارامتر ذهنی بیشتر با داده‌های پرت پیدا نمی‌کنند [۷۰ ، ۷۱ ] .
به طور کلی، استفاده از شاخص S-COM در شناسایی مناطق زیرمطالعه ای که شباهت را نشان می دادند، از نظر مکانی به هم متصل بودند و دارای حداقل تعداد داده بودند، موفقیت آمیز بود. یافتن منطقه مطالعه مناسب بدون مرزهای از پیش تعریف شده می تواند چالش برانگیز باشد [ ۷۲ ، ۷۳]. داده های VGI توسط کاربران بر اساس معیارهای شخصی یا مرتبط با پروژه ایجاد می شود که ممکن است با نیازهای محققان مطابقت نداشته باشد. نتایج حاصل از مطالعات موردی RinkWatch و FrogWatch نشان داده‌اند که زیر حوزه‌های امکان‌پذیر را می‌توان از طریق الگوریتم‌های ساده با استفاده از یک شاخص از پیش تعریف‌شده یافت، که امکان مطالعه آسان‌تر و سریع‌تر داده‌ها یا مقایسه گستره‌های مختلف بر اساس شرایط از پیش تعریف‌شده را فراهم می‌کند. از طریق این الگوریتم‌ها، ما می‌توانیم به درک بهتری از نحوه استفاده از VGI برای تجزیه و تحلیل، به ویژه استفاده از آن برای مصرف عمومی از جمع‌آوری اطلاعات بلادرنگ و انتشار فوری دست یابیم [۶۹ ]]. در حالی که این مقاله با استفاده از دانه‌های مختلف و رویکردهای امکان‌سنجی بر روی امکان‌پذیرترین حد تمرکز داشت، تغییر وزن اجزای شاخص امکان پذیرش آن را در انواع دیگر مطالعات فراهم می‌کند. به عنوان مثال، الگوریتم می‌تواند حداقل آستانه‌ای برای مقادیر شاخصی که برمی‌گرداند داشته باشد، که امکان تجزیه و تحلیل بیشتر حوزه‌های مطالعاتی مورد علاقه (گستره‌ها) توسط محققان را فراهم می‌کند. ما پیش‌بینی می‌کنیم که این یافته‌ها پذیرش گسترده‌تر تجزیه و تحلیل چند مقیاسی VGI را تسهیل کرده و ارزیابی کیفیت داده‌های VGI را در جغرافیا و سایر رشته‌ها ارتقا دهد.

منابع

  1. Goodchild، MF Citizens به عنوان حسگر: دنیای جغرافیای داوطلبانه. ژئوژورنال ۲۰۰۷ ، ۶۹ ، ۲۱۱-۲۲۱٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  2. لی، دبلیو. Goodchild، MF; کلیسا، RL; ژو، بی. داده کاوی جغرافیایی در وب: کشف مکان های تاسیسات خدمات اضطراری. در مجموعه مقالات داده کاوی پیشرفته و برنامه های کاربردی، پکن، چین، ۱۷-۱۹ دسامبر ۲۰۱۱٫ Zhou, S., Zhang, S., Karypis, G., Eds. Springer: برلین/هایدلبرگ، آلمان، ۲۰۱۲; صص ۵۵۲-۵۶۳٫ [ Google Scholar ]
  3. الوود، اس. علم اطلاعات جغرافیایی: تجسم، روش‌های بصری و geoweb. Prog. هوم Geogr. ۲۰۱۱ ، ۳۵ ، ۴۰۱-۴۰۸٫ [ Google Scholar ] [ CrossRef ]
  4. گوتز، ام. Zipf، A. به سمت تعریف چارچوبی برای استخراج خودکار مدل‌های ۳D CityGML از اطلاعات جغرافیایی داوطلبانه. بین المللی J. 3 Inf. مدل. IJ3DIM ۲۰۱۲ ، ۱ ، ۱-۱۶٫ [ Google Scholar ] [ CrossRef ]
  5. تنی، ام. هال، گیگابایت؛ Sieber, RE یک سیستم سنجش جمعیت که ژئوتوپیک ها و منافع جامعه را از محتوای تولید شده توسط کاربر شناسایی می کند. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۹ ، ۳۳ ، ۱۴۹۷-۱۵۱۹٫ [ Google Scholar ] [ CrossRef ]
  6. سناراتنه، اچ. مبشری، ع. علی، ال. کاپینری، سی. هاکلی، ام. مروری بر روش‌های داوطلبانه ارزیابی کیفیت اطلاعات جغرافیایی. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۷ ، ۳۱ ، ۱۳۹-۱۶۷٫ [ Google Scholar ] [ CrossRef ]
  7. براون، جی. رودز، جی. لونی، دی. گلدینگی، آر. فیلدینگ، ک. گاروفانو، ن. هترینگتون، اس. هاپکینز، ام. گرین، جی. مک نامارا، اس. تأثیر طراحی نمونه بر کیفیت داده های مکانی در یک پروژه علمی شهروندی جغرافیایی. ترانس. GIS ۲۰۱۹ ، ۲۳ ، ۱۱۸۴-۱۲۰۳٫ [ Google Scholar ] [ CrossRef ]
  8. بارون، سی. نیس، پ. Zipf، A. چارچوبی جامع برای تحلیل کیفی OpenStreetMap ذاتی. ترانس. GIS ۲۰۱۴ ، ۱۸ ، ۸۷۷-۸۹۵٫ [ Google Scholar ] [ CrossRef ]
  9. مونی، پی. کورکوران، پ. Winstanley، AC به سمت معیارهای کیفیت برای OpenStreetMap. در مجموعه مقالات هجدهمین کنفرانس بین المللی SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی، سن خوزه، کالیفرنیا، ایالات متحده آمریکا، ۲ تا ۵ نوامبر ۲۰۱۰٫ انجمن ماشین‌های محاسباتی: سن خوزه، کالیفرنیا، ایالات متحده آمریکا، ۲۰۱۰٫ صص ۵۱۴-۵۱۷٫ [ Google Scholar ]
  10. Girres, J.-F. Touya, G. ارزیابی کیفیت مجموعه داده OpenStreetMap فرانسه. ترانس. GIS ۲۰۱۰ ، ۱۴ ، ۴۳۵-۴۵۹٫ [ Google Scholar ] [ CrossRef ]
  11. دیویلر، آر. استین، ا. Bédard، Y.; کریسمن، ن. فیشر، پی. Shi, W. سی سال تحقیق در مورد کیفیت داده های مکانی: دستاوردها، شکست ها و فرصت ها. ترانس. GIS ۲۰۱۰ ، ۱۴ ، ۳۸۷-۴۰۰٫ [ Google Scholar ] [ CrossRef ]
  12. ژانسولین، آر. Devillers, R. فصل ۲٫ کیفیت داده های مکانی: مفاهیم. در مبانی کیفیت داده های مکانی ; Devillers, R., Jeansoulin, R., Eds. ISTE: لندن، انگلستان، ۲۰۰۶; صص ۳۱-۴۲٫ [ Google Scholar ]
  13. بصیری، ع. هاکلی، م. فودی، جی. Mooney, P. کیفیت داده‌های جغرافیایی جمع‌سپاری شده: چالش‌ها و مسیرهای آینده. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۹ ، ۳۳ ، ۱۵۸۸-۱۵۹۳٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  14. لنسلی، جی. دی اسمیت، ام. گودچایلد، م. Longley، P. داده های بزرگ و تجزیه و تحلیل جغرافیایی. arXiv ۲۰۱۹ ، arXiv:1902.06672. [ Google Scholar ]
  15. لارنس، اچ. رابرتسون، سی. فیک، ر. نلسون، تی. شناسایی مناطق مطالعه بهینه و واحدهای تجمع فضایی برای VGI مبتنی بر نقطه از منابع متعدد. در پیشرفت در مدیریت و تجزیه و تحلیل داده های فضایی: مقالاتی را از شانزدهمین سمپوزیوم مدیریت داده های فضایی IGU انتخاب کنید . Harvey, F., Leung, Y., Eds. پیشرفت در علم اطلاعات جغرافیایی؛ انتشارات بین المللی Springer: چم، سوئیس، ۲۰۱۵; صص ۶۵-۸۴٫ شابک ۹۷۸-۳-۳۱۹-۱۹۹۵۰-۴٫ [ Google Scholar ]
  16. کلمن، دی. جورجیادو، ی. Labonte, J. اطلاعات جغرافیایی داوطلبانه: ماهیت و انگیزه تولیدکنندگان. بین المللی جی. اسپات. زیرساخت داده Res. ۲۰۰۹ ، ۴ ، ۳۳۲-۳۵۸٫ [ Google Scholar ]
  17. کلمن، DJ مشارکت‌های بالقوه و چالش‌های VGI برای برنامه‌های نقشه‌برداری پایه توپوگرافی معمولی. در جمع سپاری دانش جغرافیایی ; Sui, D., Elwood, S., Goodchild, M., Eds. Springer: Dordrecht، هلند، ۲۰۱۳; ص ۲۴۵-۲۶۳٫ [ Google Scholar ]
  18. بوداتوکی، NR; Haythornthwaite، C. انگیزه برای همکاری آزاد: مدل های جمعیت و جامعه و مورد OpenStreetMap. صبح. رفتار علمی ۲۰۱۳ ، ۵۷ ، ۵۴۸-۵۷۵٫ [ Google Scholar ] [ CrossRef ]
  19. رابرتسون، سی. Feick, R. تعریف کارشناسان محلی: تخصص جغرافیایی به عنوان مبنایی برای کیفیت اطلاعات جغرافیایی. در مجموعه مقالات سیزدهمین کنفرانس بین المللی تئوری اطلاعات فضایی (COSIT 2017)، لاکویلا، ایتالیا، ۴ تا ۸ سپتامبر ۲۰۱۷٫ کلمنتینی، ای.، دانلی، ام.، یوان، م.، کری، سی.، فوگلیارونی، پی.، بالاتوره، آ.، ویرایش. Schloss Dagstuhl–Leibniz-Zentrum fuer Informatik: Dagstuhl، آلمان، ۲۰۱۷; جلد ۸۶، ص ۲۲:۱–۲۲:۱۴٫ [ Google Scholar ]
  20. دیکینسون، جی ال. زاکربرگ، بی. Bonter، DN Citizen Science به عنوان یک ابزار تحقیق زیست محیطی: چالش ها و مزایا. آنو. کشیش اکول. تکامل. سیستم ۲۰۱۰ ، ۴۱ ، ۱۴۹-۱۷۲٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  21. هاکلی، ام. دانش شهروندی و اطلاعات جغرافیایی داوطلبانه: بررسی اجمالی و گونه‌شناسی مشارکت. در جمع سپاری دانش جغرافیایی ; Sui, D., Elwood, S., Goodchild, M., Eds. Springer: Dordrecht، هلند، ۲۰۱۳; صص ۱۰۵-۱۲۲٫ [ Google Scholar ]
  22. آنتونیو، وی. کاپینری، سی. Haklay، ME VGI و فراتر از آن: از داده تا نقشه برداری. در کتاب راهنمای نقشه برداری و کارتوگرافی راتلج ; Kent, A., Vujakovic, P., Eds. Routledge: Abingdon، انگلستان، ۲۰۱۷; صص ۴۷۵-۴۸۸٫ [ Google Scholar ]
  23. نیس، پ. زیلسترا، دی. Zipf، A. تکامل شبکه خیابانی نقشه‌های crowdsourced: OpenStreetMap در آلمان ۲۰۰۷-۲۰۱۱٫ اینترنت آینده ۲۰۱۲ ، ۴ ، ۱-۲۱٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  24. چپکیویچ، م. یانکوفسکی، پ. Młodkowski، M. ژئوپرسشنامه ها در برنامه ریزی شهری: روش های استخدام، مشارکت شرکت کنندگان و کیفیت داده ها. کارتوگر. Geogr. Inf. علمی ۲۰۱۷ ، ۴۴ ، ۵۵۱-۵۶۷٫ [ Google Scholar ] [ CrossRef ]
  25. هی، SI; جورج، دی.بی. مویس، CL; Brownstein، JS فرصت های داده های بزرگ برای نظارت جهانی بیماری های عفونی. PLoS Med. ۲۰۱۳ ، ۱۰ ، e1001413. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  26. کیچین، آر. داده های بزرگ و جغرافیای انسانی: فرصت ها، چالش ها و خطرات. دیالوگ هام Geogr. ۲۰۱۳ ، ۳ ، ۲۶۲-۲۶۷٫ [ Google Scholar ] [ CrossRef ]
  27. Goodchild، MF کیفیت داده های بزرگ (جغرافیایی). دیالوگ هام Geogr. ۲۰۱۳ ، ۳ ، ۲۸۰-۲۸۴٫ [ Google Scholar ] [ CrossRef ]
  28. لازر، دی. کندی، آر. کینگ، جی. Vespignani، A. تمثیل آنفولانزای گوگل: تله ها در تجزیه و تحلیل داده های بزرگ. Science ۲۰۱۴ ، ۳۴۳ ، ۱۲۰۳-۱۲۰۵٫ [ Google Scholar ] [ CrossRef ]
  29. لی، ال. Goodchild، MF; Xu، B. الگوهای مکانی، زمانی و اجتماعی-اقتصادی در استفاده از توییتر و فلیکر. کارتوگر. Geogr. Inf. علمی ۲۰۱۳ ، ۴۰ ، ۶۱-۷۷٫ [ Google Scholar ] [ CrossRef ]
  30. هچت، بی. استفنز، ام. داستان شهرها: سوگیری های شهری در اطلاعات جغرافیایی داوطلبانه. در مجموعه مقالات هشتمین کنفرانس بین المللی AAAI در وبلاگ ها و رسانه های اجتماعی، ان آربور، MI، ایالات متحده، ۱ تا ۴ ژوئن ۲۰۱۴٫ صص ۱۹۷-۲۰۵٫ [ Google Scholar ]
  31. Haklay, M. اطلاعات جغرافیایی داوطلبانه چقدر خوب است؟ مطالعه تطبیقی ​​مجموعه داده‌های OpenStreetMap و Ordnance Survey. محیط زیست طرح. B طرح. دس ۲۰۱۰ ، ۳۷ ، ۶۸۲-۷۰۳٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  32. نیس، پ. Zielstra، D. تحولات اخیر و روندهای آینده در تحقیقات داوطلبانه اطلاعات جغرافیایی: مورد OpenStreetMap. اینترنت آینده ۲۰۱۴ ، ۶ ، ۷۶-۱۰۶٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  33. جفری، سی. اوزونوف، ا. پاگانو، ام. تأثیر تجمع فضایی بر عملکرد هنگام ترسیم خطر بیماری. بین المللی J. Health Geogr. ۲۰۱۴ ، ۱۳ ، ۹٫ [ Google Scholar ] [ CrossRef ] [ PubMed ] [ نسخه سبز ]
  34. هولنشتاین، ال. Purves، R. کاوش مکان از طریق محتوای تولید شده توسط کاربر: استفاده از برچسب های Flickr برای توصیف هسته های شهر. جی. اسپات. Inf. علمی ۲۰۱۰ ، ۲۰۱۰ ، ۲۱-۴۸٫ [ Google Scholar ]
  35. فیک، ر. رابرتسون، سی. رویکرد چند مقیاسی برای کاوش مکان‌های شهری در عکس‌های دارای برچسب جغرافیایی. محاسبه کنید. محیط زیست سیستم شهری ۲۰۱۵ ، ۵۳ ، ۹۶-۱۰۹٫ [ Google Scholar ] [ CrossRef ]
  36. درونگس، سی. Purves، RS از متن تا منظره: مکان یابی، شناسایی و نقشه برداری استفاده از ویژگی های منظره در یک مجموعه آلپ سوئیس. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۴ ، ۲۸ ، ۱۲۷۲-۱۲۹۳٫ [ Google Scholar ] [ CrossRef ]
  37. شلتون، تی. پورتویس، ا. گراهام، ام. Zook, M. نقشه برداری از سایه های داده های طوفان سندی: کشف ابعاد اجتماعی فضایی “داده های بزرگ”. Geoforum ۲۰۱۴ ، ۵۲ ، ۱۶۷-۱۷۹٫ [ Google Scholar ] [ CrossRef ]
  38. رابرتسون، سی. فیک، آر. استنتاج و تجزیه و تحلیل در سراسر پشتیبانی های فضایی در عصر داده های بزرگ: مشاهدات نقطه ای نامشخص و زمینه های جغرافیایی. ترانس. GIS ۲۰۱۸ ، ۲۲ ، ۴۵۵-۴۷۶٫ [ Google Scholar ] [ CrossRef ]
  39. آنتونیو، وی. Skopeliti، A. اندازه گیری ها و شاخص های کیفیت VGI: یک مرور کلی. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی حاضر. ISPRS Geospatial Week ۲۰۱۵ ، II-3/W5 ، ۳۴۵-۳۵۱٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  40. Goodchild، MF; Li, L. اطمینان از کیفیت اطلاعات جغرافیایی داوطلبانه. تف کردن آمار ۲۰۱۲ ، ۱ ، ۱۱۰-۱۲۰٫ [ Google Scholar ] [ CrossRef ]
  41. فوکس، جی. آندرینکو، ن. آندرینکو، جی. Bothe، S. Stange, H. ردیابی سیل صدمین سالگرد آلمان در جریان توییت ها: اولین درس های آموخته شده. در مجموعه مقالات دومین کارگاه بین المللی ACM SIGSPATIAL در مورد اطلاعات جغرافیایی جمع آوری شده و داوطلبانه، اورلاندو، فلوریدا، ایالات متحده آمریکا، ۵ نوامبر ۲۰۱۳٫ انجمن ماشین‌های محاسباتی: نیویورک، نیویورک، ایالات متحده آمریکا، ۲۰۱۳٫ صص ۳۱-۳۸٫ [ Google Scholar ]
  42. فودی، جنرال موتورز; ببینید، L. فریتز، اس. ون در ولده، م. پرگر، سی. شیل، سی. بوید، دی اس؛ Comber, A. نقشه برداری دقیق ویژگی از اطلاعات جغرافیایی داوطلبانه: مسائل کمیت و کیفیت داوطلب. کارتوگر. J. ۲۰۱۵ ، ۵۲ ، ۳۳۶-۳۴۴٫ [ Google Scholar ] [ CrossRef ]
  43. هاکلی، م. بسیوکا، اس. آنتونیو، وی. Ather، A. برای نقشه برداری خوب یک منطقه به چند داوطلب نیاز است؟ اعتبار قانون لینوس برای اطلاعات جغرافیایی داوطلبانه کارتوگر. J. ۲۰۱۰ , ۴۷ , ۳۱۵-۳۲۲٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  44. بریسابوا، NR; سردیرا-پنا، ا. دی برناردو، جی. ناوارو، جی. پدریرا، او. گسترش بازنمایی های جمع و جور عمومی قابل پرس و جو به برنامه های GIS. Inf. علمی ۲۰۲۰ ، ۵۰۶ ، ۱۹۶-۲۱۶٫ [ Google Scholar ] [ CrossRef ]
  45. گیگی، تی. گونزالس نوا، جی. لادرا، اس. ناوارو، جی. Seco, D. چهار درخت فشرده سریعتر. در مجموعه مقالات کنفرانس فشرده سازی داده ۲۰۱۵، Snowbird، UT، ایالات متحده آمریکا، ۷-۹ آوریل ۲۰۱۵٫ انجمن کامپیوتر IEEE: واشنگتن، دی سی، ایالات متحده آمریکا، ۲۰۱۵; صص ۹۳-۱۰۲٫ [ Google Scholar ]
  46. بروتر، پی. Weibel, R. تعمیم بیدرنگ داده های نقطه ای در نقشه برداری موبایل و وب با استفاده از چهار درخت. کارتوگر. Geogr. Inf. علمی ۲۰۱۳ ، ۴۰ ، ۲۷۱-۲۸۱٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  47. راماناتان، وی. میشرا، س. مدل فضای برداری توسعه یافته مبتنی بر تجزیه Quadtree برای بازیابی تصویر میترا، P. در مجموعه مقالات کارگاه IEEE 2011 در مورد کاربردهای بینایی کامپیوتری (WACV)، کونا، HI، ایالات متحده آمریکا، ۵ تا ۷ ژانویه ۲۰۱۱٫ انجمن کامپیوتر IEEE: واشنگتن، دی سی، ایالات متحده آمریکا، ۲۰۱۱; صص ۱۳۹-۱۴۴٫ [ Google Scholar ]
  48. ژانگ، سی. چن، آر. زو، ال. لیو، ا. لین، ی. Huang, F. چهار درخت اطلاعات سلسله مراتبی: جستجوی تصویر زمانی مکانی کارآمد برای جریان چند رسانه ای. چندتایی. ابزارهای کاربردی ۲۰۱۹ ، ۷۸ ، ۳۰۵۶۱–۳۰۵۸۳٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  49. Popinet، مدلسازی سونامی تطبیقی ​​چهار درختی S. اوشن دین. ۲۰۱۱ ، ۶۱ ، ۱۲۶۱-۱۲۸۵٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  50. کیو، ال. دو، ز. زو، س. Fan, Y. یک سیستم مدیریت یکپارچه سیل مبتنی بر پیوند مدل های زیست محیطی و داده های مربوط به بلایا. محیط زیست مدل. نرم افزار ۲۰۱۷ ، ۹۱ ، ۱۱۱-۱۲۶٫ [ Google Scholar ] [ CrossRef ]
  51. Valles، G. AMOEBA: A Multidirectional Optimum Based Ecotope Algorithm ; بسته R; CRAN: تورنتو، ON، کانادا، ۲۰۱۴٫ [ Google Scholar ]
  52. کانرز، جی پی؛ لی، اس. کلی، ام. علم شهروندی در عصر نئوجغرافی: استفاده از اطلاعات جغرافیایی داوطلبانه برای نظارت بر محیط زیست. ان دانشیار صبح. Geogr. ۲۰۱۲ ، ۱۰۲ ، ۱۲۶۷-۱۲۸۹٫ [ Google Scholar ] [ CrossRef ]
  53. رابرتسون، سی. مک لمن، آر. لارنس، اچ. زمستان برای اسکیت زدن خیلی گرم است؟ سیتیزن-ساینس تنوع در دسترس بودن اسکیت در فضای باز را در کانادا گزارش کرده است. می توان. Geogr. جئوگراف می تواند. ۲۰۱۵ ، ۵۹ ، ۳۸۳-۳۹۰٫ [ Google Scholar ] [ CrossRef ]
  54. آمار کانادا داده های آب و هوایی تاریخی. در دسترس آنلاین: http://climate.weather.gc.ca/ (در ۱۲ دسامبر ۲۰۱۹ قابل دسترسی است).
  55. آمار کانادا جمعیت کلانشهرهای سرشماری. در دسترس آنلاین: http://www.statcan.gc.ca/tables-tableaux/sum-som/l01/cst01/demo05a-eng.htm (در ۲۶ مارس ۲۰۱۷ قابل دسترسی است).
  56. Mackaness، WA; چودری، او. ارزیابی صحت روش‌ها برای استخراج معناشناسی مکان از برچسب‌های فلیکر. ترانس. GIS ۲۰۱۳ ، ۱۷ ، ۵۴۴-۵۶۲٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  57. Truong، QT; دی رانز، سی. Touya, G. تجزیه و تحلیل شبکه های همکاری در OpenStreetMap از طریق کاوی چند گراف اجتماعی وزن دار. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۹ ، ۳۳ ، ۱۶۵۱-۱۶۸۲٫ [ Google Scholar ] [ CrossRef ]
  58. پوروز، آر. ادواردز، آ. Wood, J. توصیف مکان از طریق محتوای تولید شده توسط کاربر. اولین دوشنبه ۲۰۱۱ ۱۶ . [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  59. الوود، اس. گودچایلد، م. Sui, D. چشم انداز تحقیقات VGI و پارادایم چهارم در حال ظهور. در جمع سپاری دانش جغرافیایی ; Sui, D., Elwood, S., Goodchild, M., Eds. Springer: Dordrecht، هلند، ۲۰۱۳; صص ۳۶۱-۳۷۵٫ [ Google Scholar ]
  60. Mooney, P. درک فعالیت مشارکت کنندگان در پروژه های VGI. چگونه، چرا، کجا و چه زمانی اطلاعات جغرافیایی را ارائه می کنند؟ در مجموعه مقالات بیست و ششمین کنفرانس بین المللی کارتوگرافی (ICC)، درسدن، آلمان، ۲۵ تا ۳۰ اوت ۲۰۱۳٫ [ Google Scholar ]
  61. گاردنر، ز. مونی، پی. دی ساباتا، اس. Dowthwaite، L. کمیت کردن مشارکت جنسیتی در OpenStreetMap: پاسخ به نظریه‌های بازنمایی زن (تحت) در نقشه‌برداری جمع‌سپاری. جئوژورنال ۲۰۱۹ ، ۱-۱۸٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  62. مک لافرتی، اس. اشنایدر، دی. آبلت، کی. قرار دادن اطلاعات داوطلبانه سلامت جغرافیایی: سوگیری اجتماعی- فضایی در داده‌های گزارش ساس ۳۱۱ برای شهر نیویورک. Health Place ۲۰۲۰ , ۶۲ , ۱۰۲۲۸۲٫ [ Google Scholar ] [ CrossRef ]
  63. باستین، ال. Shade، S. Schill, C. مدیریت داده و ابرداده برای قابلیت استفاده مجدد بهتر VGI. در نقشه برداری و سنسور شهروند ; Foody, G., See, L., Fritz, S., Mooney, P., Olteanu-Raimond, A.-M., Fonte, C., Antoniou, V., Eds.; Ubiquity Press: لندن، بریتانیا، ۲۰۱۷؛ ص ۲۴۹-۲۷۲٫ [ Google Scholar ]
  64. براون، جی. مروری بر اثرات نمونه‌گیری و سوگیری پاسخ در نقشه‌برداری مشارکتی اینترنتی (PPGIS/PGIS/VGI). ترانس. GIS ۲۰۱۷ ، ۲۱ ، ۳۹-۵۶٫ [ Google Scholar ] [ CrossRef ]
  65. میراحسان، م. شونن، آر. Szyszkowicz، SS; Yanikomeroglu، H. اندازه گیری ناهمگونی فضایی کاربران در فضای باز در شبکه های سلولی بی سیم بر اساس نقشه های شهری باز. در مجموعه مقالات کنفرانس بین المللی ارتباطات IEEE در سال ۲۰۱۵ (ICC)، لندن، بریتانیا، ۸ تا ۱۲ ژوئن ۲۰۱۵؛ انجمن کامپیوتر IEEE: واشنگتن، دی سی، ایالات متحده آمریکا، ۲۰۱۵; صص ۲۸۳۴-۲۸۳۸٫ [ Google Scholar ]
  66. فنگ، جی. ژانگ، ام. وانگ، اچ. یانگ، ز. ژانگ، سی. لی، ی. Jin, D. Dplink: پیوند هویت کاربر از طریق شبکه عصبی عمیق از داده های تحرک ناهمگن. در مجموعه مقالات کنفرانس وب جهانی، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، ۱۳ تا ۱۷ مه ۲۰۱۹؛ صص ۴۵۹-۴۶۹٫ [ Google Scholar ]
  67. زیلسترا، دی. Zipf، A. مطالعه مقایسه ای داده های جغرافیایی اختصاصی و اطلاعات جغرافیایی داوطلبانه برای آلمان. در مجموعه مقالات سیزدهمین کنفرانس بین المللی AGILE در علم اطلاعات جغرافیایی، گیماراس، پرتغال، ۱۱-۱۴ مه ۲۰۱۰٫ جلد ۲۰۱۰٫ [ Google Scholar ]
  68. گالپرن، پی. مانسو، م. ویلسون، P. دانه های اتصال: تجزیه و تحلیل در مقیاس های فضایی چندگانه در ژنتیک منظر. مول. Ecol. ۲۰۱۲ ، ۲۱ ، ۳۹۹۶-۴۰۰۹٫ [ Google Scholar ] [ CrossRef ]
  69. سستر، ام. جوکار ارسنجانی، ج. کلامر، آر. بورگاردت، دی. هاونرت، جی.-اچ. یکپارچه سازی و تعمیم اطلاعات جغرافیایی داوطلبانه. در چکیده اطلاعات جغرافیایی در یک دنیای غنی از داده ها: روش ها و کاربردهای تعمیم نقشه . Burghardt, D., Duchêne, C., Mackaness, W., Eds.; یادداشت های سخنرانی در اطلاعات جغرافیایی و نقشه برداری. انتشارات بین المللی Springer: چم، سوئیس، ۲۰۱۴; صص ۱۱۹-۱۵۵٫ [ Google Scholar ]
  70. Nayini، SEY; گراوند، س. مروسی، ع. یک روش جدید خوشه‌بندی مبتنی بر آستانه برای حل نقاط ضعف K-means. در مجموعه مقالات کنفرانس بین المللی انرژی، ارتباطات، تجزیه و تحلیل داده ها و محاسبات نرم (ICECDS)، چنای، تامیل نادو، هند، ۱ تا ۲ اوت ۲۰۱۷ در سال ۲۰۱۷؛ انجمن کامپیوتر IEEE: واشنگتن، دی سی، ایالات متحده آمریکا، ۲۰۱۷؛ ص ۴۷-۵۲٫ [ Google Scholar ]
  71. پاتل، KMA؛ Thakral, P. بهترین الگوریتم های خوشه بندی در داده کاوی. در مجموعه مقالات کنفرانس بین المللی ارتباطات و پردازش سیگنال ۲۰۱۶ (ICCSP)، Melmaruvathur، تامیل نادو، هند، ۶-۸ آوریل ۲۰۱۶؛ انجمن کامپیوتر IEEE: واشنگتن، دی سی، ایالات متحده آمریکا، ۲۰۱۶؛ صفحات ۲۰۴۲–۲۰۴۶٫ [ Google Scholar ]
  72. براون، جی. کلی، م. ویتال، دی. کدام «عمومی»؟ اثرات نمونه گیری در مشارکت عمومی GIS (PPGIS) و سیستم های اطلاعات جغرافیایی داوطلبانه (VGI) برای مدیریت اراضی عمومی. جی. محیط زیست. طرح. مدیریت ۲۰۱۴ ، ۵۷ ، ۱۹۰-۲۱۴٫ [ Google Scholar ] [ CrossRef ]
  73. Fonte, CC; آنتونیو، وی. باستین، ال. استیما، ج. ارسنجانی، ج. بایاس، J.-CL; ببینید، L. Vatseva, R. ارزیابی کیفیت داده های VGI. در نقشه برداری و سنسور شهروند ; Foody, G., See, L., Fritz, S., Mooney, P., Olteanu-Raimond, A.-M., Fonte, C., Antoniou, V., Eds.; Ubiquity Press: لندن، بریتانیا، ۲۰۱۷؛ صص ۱۳۷-۱۶۳٫ [ Google Scholar ]
شکل ۱٫ Tessellation Voronoi از داده های آزمایش عمومی ایجاد شده است.
شکل ۲٫ ( الف ) ایجاد شاخه چهار درختی توجه: مقادیر متریک به عنوان اعداد کامل برای اهداف تصویری نشان داده شده است. مقادیر متریک معمولاً بین ۰ و ۱ قرار می گیرند. ( ب ) مقادیر بازگشتی چهاردرخت.
شکل ۳٫ الگوریتم مجاورت چند ضلعی.
شکل ۴٫ سه نوع تسلاسیون: ( الف ) چند ضلعی های شبکه ای چهاردرخت در سمت چپ، ( ب ) در مرکز سرشماری، و ( ج ) چند ضلعی های ورونوی در سمت راست استفاده می شوند .
شکل ۵٫ با استفاده از چند ضلعی های Voronoi، یک سطح درون یابی اسپلاین بر اساس قابلیت اسکیت پیست مناسب است. سطوح چپ ( a ) مناطق بهینه با سطوح سمت راست ( b ) منطقه مورد مطالعه کامل را نشان می دهد. وزن اجزای شاخص پوشش ۳۳ درصد، ناهمگونی کاربر ۳۳ درصد و تراکم ۳۳ درصد است.
شکل ۶٫ با استفاده از چند ضلعی های Voronoi، یک سطح درون یابی اسپلاین بر اساس قابلیت اسکیت سواری مناسب است. سطوح چپ ( a ) مناطق بهینه با سطوح سمت راست ( b ) منطقه مورد مطالعه کامل را نشان می دهد. وزن اجزای شاخص پوشش ۵۰٪، ناهمگنی کاربر ۰٪ و تراکم ۵۰٪ است.
شکل ۷٫ امکان پذیرترین منطقه مطالعه بر اساس معیارهای پوشش بزرگ و شباهت داده ها. ( الف ) میزان بهینه؛ ( ب ) نمودار پراکنده موران I با شبکه های بهینه دایره شده. ( ج ) نمودار پراکندگی موران I بر روی شبکه های بهینه متمرکز شده است.

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

خانهدربارهتماسارتباط با ما