خلاصه
رسانه های اجتماعی و سایر اشکال اطلاعات جغرافیایی داوطلبانه (VGI) اغلب به عنوان منبع داده های بزرگ و دقیق برای تحقیق استفاده می شوند. در حالی که استفاده از دادههای رسانههای اجتماعی با ارجاع جغرافیایی برای اهداف گستردهای رایج شده است، مقیاسهای مربوطه که این دادهها بر روی آنها اعمال میشوند معمولاً ناشناخته است. برای اینکه محققین از VGI به طور مناسب استفاده کنند (به عنوان مثال، ادغام واحدهای منطقه ای (مثلاً محله ها) برای استخراج اطلاعات کلیدی روند یا جمعیت شناختی)، روش های کلی برای ارزیابی کیفیت مورد نیاز است، به ویژه، ارتباط صریح کیفیت داده ها و مقیاس های فضایی مربوطه، به عنوان مثال. هیچ استاندارد یا کنترل نمونه پذیرفته شده ای وجود ندارد. ما یک معیار کیفیت داده، شاخص جامعیت فضایی (S-COM) را ارائه می دهیم. که می تواند مناطق مطالعاتی امکان پذیر یا گستره های فضایی را بر اساس کیفیت VGI ناهموار و پویا از نظر جغرافیایی ارجاع دهد. این رویکرد حساس به مقیاس برای تجزیه و تحلیل VGI بر روی دانه های مختلف با داده های دو طرح علمی شهروندی نشان داده شده است. شاخص S-COM را می توان هم برای ارزیابی وسعت مطالعه امکان پذیر بر اساس پوشش، ناهمگونی کاربر و تراکم و هم برای یافتن مناطق مطالعات فرعی امکان پذیر از یک منطقه بزرگتر و نامشخص استفاده کرد. نتایج، حوزههای مطالعه فرعی VGI را برای تجزیه و تحلیل متمرکز شناسایی کرد، که امکان پذیرش گستردهتر روششناسی مشابه در تحلیلهای چند مقیاسی VGI را فراهم کرد. شاخص S-COM را می توان هم برای ارزیابی وسعت مطالعه امکان پذیر بر اساس پوشش، ناهمگونی کاربر و تراکم و هم برای یافتن مناطق مطالعات فرعی امکان پذیر از یک منطقه بزرگتر و نامشخص استفاده کرد. نتایج، حوزههای مطالعه فرعی VGI را برای تجزیه و تحلیل متمرکز شناسایی کرد، که امکان پذیرش گستردهتر روششناسی مشابه در تحلیلهای چند مقیاسی VGI را فراهم کرد. شاخص S-COM را می توان هم برای ارزیابی وسعت مطالعه امکان پذیر بر اساس پوشش، ناهمگونی کاربر و تراکم و هم برای یافتن مناطق مطالعات فرعی امکان پذیر از یک منطقه بزرگتر و نامشخص استفاده کرد. نتایج، حوزههای مطالعه فرعی VGI را برای تجزیه و تحلیل متمرکز شناسایی کرد، که امکان پذیرش گستردهتر روششناسی مشابه در تحلیلهای چند مقیاسی VGI را فراهم کرد.
کلید واژه ها:
دانش شهروندی ; محتوای تولید شده توسط کاربر ؛ اطلاعات جغرافیایی داوطلبانه مقیاس فضایی ; کیفیت داده ها ؛ نمودارهای ورونوی ; چهار درخت ; گستره های بهینه شده RinkWatch _ FrogWatch
۱٫ معرفی
اطلاعات جغرافیایی داوطلبانه (VGI) [ ۱ ] که به طور کامل یا جزئی توسط شهروندان تولید شده است، نشان داده شده است که دارای ارزش علمی، اجتماعی و فرهنگی است. روشهایی برای باز کردن قفل این مقدار از طریق یادگیری ماشینی [ ۲ ]، داده کاوی [ ۳ ] و سایر روشهای محاسباتی [ ۴ ، ایجاد شده است . ۵]]. داده هایی که کاربران به طور هدفمند یا غیرفعال به وب سایت ها و سرویس ها کمک می کنند (به عنوان مثال، یوتیوب، فیس بوک، توییتر، ویکی پدیا) اغلب برای برنامه های مختلف، از جمله برخی که اطلاعات جغرافیایی در آنها مهم است (مانند نقشه های توییت) تغییر کاربری داده می شوند. یک چالش همیشگی این است که کیفیت این دادهها از مکان به مکان متفاوت است، زیرا افراد انتخاب میکنند که کجا دادهها را تهیه کنند و به این دلیل که افراد غیرمتخصص در تخصص، انگیزه و روشهای جمعآوری دادهها متفاوت هستند [۶، ۷ ] .]. به ویژه، ماهیت نامنظم فرآیندهای تألیف داده های غیررسمی، الگوهای نمونه گیری را ایجاد می کند که اغلب با حوزه های مطالعاتی طبیعی یا اداری به خوبی تعریف شده (گستره ها) برای تجزیه و تحلیل مطابقت ندارد. ما این موضوع را از طریق لنز ویژگی کیفیت داده جدید به نام «جامعیت دادههای مکانی» بررسی میکنیم که به عنوان «توزیع یکنواخت مشاهدات دادهها از نظر پوشش و تراکم متناسب با نیازهای تحلیلی در یک منطقه جغرافیایی» تعریف میکنیم. جامعیت داده های مکانی برای تجزیه و تحلیل مبتنی بر کار/زمینه VGI از اهمیت ویژه ای برخوردار است زیرا به افراد مربوط می شود.
کیفیت دادهها همواره یک بعد مهم در مطالعات دادههای مکانی و GIS بوده است، با تحقیقات قابل توجه برای پیشبرد درک صحت دادههای مکانی [ ۸ ، ۹ ، ۱۰ ]، انتشار خطا [ ۱۱ ]، استانداردهای مستندسازی دادهها [ ۱۲ ]، و اهمیت مفاهیم معناشناسی و تناسب برای استفاده [ ۱۳ ، ۱۴]. در این مقاله، ما یک شاخص جدید ارائه میکنیم که برای کاهش عدم قطعیتهای ضمنی در ناتوانی در کنترل نمونهگیری با شناسایی مناطق مطالعه امکانپذیر در مجموعه دادههای VGI بر اساس ارزیابی یک شاخص ترکیبی جامعیت دادههای مکانی (S-COM) بدون اشاره به داده های خارجی هدف کلیدی با شاخص S-COM ترسیم یک زیرمنطقه یا مناطق امکان پذیر است که فقط از داده های موجود در مجموعه داده VGI استفاده می کند، فاقد سایر منابع اطلاعاتی معتبر یا متا است و امکان درک سریع اکتشافی کلید فضایی زیربنایی را فراهم می کند. کیفیت مجموعه داده (به عنوان مثال، مقیاس و میزان بهینه برای تجزیه و تحلیل غنی از داده). هنگامی که اطلاعات کمی در مورد فرآیند تألیف دادهها که منجر به ایجاد مجموعه داده VGI میشود، وجود دارد، ارزیابی یکنواختی مشارکتها برای شناسایی مقیاس فضایی مربوطه برای مطالعه ضروری است. زمانی که پدیدههای جغرافیایی مورد بررسی به خودی خود مبهم و نامطمئن هستند، مانند آنچه افراد به عنوان «مرکز شهر» در نظر میگیرند، این یک ملاحظات مهم است. ما قبلا نشان دادهایم که چگونه انتخاب دانه فضایی برای تجزیه و تحلیل را میتوان با توجه به پارامترهای کیفیت دادههای عمومی برای VGI بهینه کرد.۱۵ ]. در اینجا، ما بر روی آن کار میسازیم تا نشان دهیم که چگونه وسعت فضایی را میتوان بر اساس یک شاخص از پیش تعریفشده مطابق با اهداف کلی یک مطالعه بهینه کرد. همانطور که VGI در تحقیقات برجسته تر می شود، ابزارهایی برای کمک به محققان در اندازه گیری سریع دانه ها و گستره های قابل مطالعه مورد نیاز خواهد بود، به ویژه داده هایی با ویژگی های زمانی که اندازه دانه ممکن است بر اساس برش های زمانی متفاوت باشد (یعنی جریان داده های مکانی). علاوه بر این، الگوهای چند مقیاسی در VGI و حساسیت به تنظیمات ناحیه ای (MAUP) را می توان از طریق الگوریتم های ارائه شده در اینجا بررسی کرد.
دادههای دو پروژه علمی شهروندی، RinkWatch و FrogWatch، برای نشان دادن زمینههای مختلف استفاده میشوند که در آن یافتن گسترههای عملی و واحدهای تجمیع اولین مرحله ضروری تجزیه و تحلیل مجموعه دادههای نقطه VGI است. این دو پروژه از نقشهها و رابطهای مبتنی بر وب برای درخواست گزارش شهروندان از مشاهدات فردی از شرایط پیست یخ (RinkWatch) و مشاهده قورباغه یا وزغ (FrogWatch) استفاده میکنند. در حالی که این ابتکارات اهداف مشخصی دارند، هر دو به ترتیب برای سنجش تغییرات محلی متغیرهای محیطی مانند دما و کیفیت زیستگاه استفاده میشوند.
۲٫ پس زمینه
از نظر VGI بدون مجموعه داده مرجع که بتوان آن را با آن مقایسه کرد، ارزیابی کیفیت داده ها معنایی وابسته به اهداف محققین پیدا می کند. با VGI [ ۱ ]، کیفیت داده اغلب ناهمگن است زیرا یک مجموعه داده منفرد معمولاً از مشارکت بسیاری از کاربرانی تشکیل می شود که اغلب در مجموعه مهارت ها، انگیزه ها و زمینه های مورد علاقه متفاوت هستند [۱۶ ، ۱۷ ، ۱۸ ، ۱۹ ]]. برای محققانی که علاقه مند به استفاده از این داده ها برای درک فرآیندهای فضایی هستند، محدودیت بزرگتر این است که آنها فاقد کنترل و دانش در مورد فرآیندهای جمع آوری داده های VGI هستند. در حالی که اکثر روشهای تجزیه و تحلیل دادهها فرض میکنند که دادهها نماینده هستند و با استفاده از یک طرح مطالعه جمعآوری میشوند، داوطلبان معمولاً تصمیم میگیرند که کجا و چه زمانی میخواهند دادهها را جمعآوری کنند، از چه روشها یا ابزارهایی استفاده شود، و اینکه آیا مشاهدات فردی آنها با آنچه یک محقق ممکن است در یک مطالعه نیاز داشته باشد مطابقت دارد یا خیر. طراحی نمونه گیری
دیکنسون [ ۲۰ ] هنگامی که با این مجموعه داده های جدید یا نسبتاً ناشناخته مواجه می شود، مانند زمینه علم شهروندی، چندین جنبه کیفیت داده از داده های مشارکتی کاربر را ذکر می کند که می تواند مشکل ساز باشد، از جمله: شکاف دانش بین گردآورندگان داده های متخصص و آماتور، جمعیت شناسی محدود. نمایندگی، و چالش حفظ علاقه داوطلبان در دوره های زمانی طولانی. در بسیاری از موارد، تجزیه و تحلیل VGI حتی میتواند نماینده مقادیر پرت به جای نمونه معرف در نظر گرفته شود [ ۲۱ ، ۲۲ ]. بیشتر VGI توسط اقلیت فعالی از کاربران ایجاد می شود، پدیده ای که گاهی اوقات به عنوان قانون ۹۰-۹-۱ توصیف می شود [ ۲۳]]. انگیزه ها، آرزوها، و ویژگی های کاربران درگیر در ایجاد این مجموعه داده ها ممکن است به طور قابل توجهی با جمعیت گسترده تر [ ۱۶ ] متفاوت باشد، و به طور منفعلانه صداهای انتقادی را که از دسترسی به فناوری و منابع مورد نیاز برای مشارکت محروم هستند حذف می کند [ ۲۴ ]. این ویژگیهای تجزیه و تحلیل دادههای VGI مشابه آنچه در ادبیات دادههای بزرگ گزارش شده است، که در آن تحقیقات از نظر تمرکز مشکل، روشها و موقعیت جغرافیایی بیش از حد دادهمحور توصیف شده است [۲۵، ۲۶ ، ۲۷ ، ۲۸ ] است .]. برای مثال، تصادفی نیست که بیشتر فعالیتهای تجاری و تحقیقات آکادمیک مربوط به VGI، بهویژه اشکال جغرافیایی اجتماعی (به عنوان مثال، توییتر) و نقشه خیابان باز تقریباً همه جا حاضر (OSM)، در هستههای شهرهای بزرگ و نزدیک به مکانهای برجسته متمرکز هستند. معمولاً مناطقی با بیشترین حجم داده [ ۲۳ ، ۲۹ ، ۳۰ ]. در حالی که بسیاری از مطالعات کیفیت این داده ها را تجزیه و تحلیل کرده اند و اغلب کیفیت آنها را قابل مقایسه با جایگزین های تولید شده توسط متخصصان می دانند [ ۱۰ ، ۲۳ ، ۳۱]]، به ندرت جنبه «انتخاب مکان» یا وسعت مطالعه این مطالعات به صراحت مورد توجه قرار می گیرد. در عوض، تحلیلها تمایل دارند با ارجاع به مناطق اداری موجود (مثلاً مرزهای شهر) یا محدودههای مطالعاتی از پیش تعریفشده (مثلاً مناطق زیستمحیطی) و رویکردهای اکتشافی برای ارزیابی مناسب بودن منابع VGI از نظر پوشش دادههای جغرافیایی استفاده شوند. و توزیع
نیاز به مطالعه این انتخاب ضمنی از گستره های مطالعه از پیش تعریف شده برای پوشش و توزیع داده های VGI زمانی آشکار می شود که مسئله مقیاس فضایی در تحلیل VGI در نظر گرفته شود [۳۲ ، ۳۳ ، ۳۴ ، ۳۵ ] . VGI مبتنی بر نقطه، مانند عکسهای جغرافیایی و توییتها، اغلب در واحدهای منطقهای (مثلاً محلهها، شهرها، مناطق) جمعآوری میشوند و خلاصهای از محتوای آنها برای تشخیص ادراکات غالب از رویدادها، مکانها یا سایر اشکال حس شهروندان تولید میشود. [ ۳۶ ، ۳۷]. با این حال، عدم کنترل مستقیم جمعآوری دادههای VGI، عدم قطعیتهایی را در رابطه با اینکه کدام واحدهای جغرافیایی تجزیه و تحلیل مناسب هستند، انواع تحلیلهایی که دادهها برای آن مناسب هستند، نقش تحرک و محل سکونت [۳۸]، و مناطق مورد مطالعه امکان پذیر است را معرفی میکند . برای روش های تحلیل از پیش انتخاب شده
هنگامی که یک منطقه مورد مطالعه با پوشش غیر یکنواخت انتخاب میشود، الگوریتمهایی برای یافتن یک زیرمجموعه خاص از دادهها به ترسیم زیر حوزههای امکانپذیر جدید (یعنی گستره/دانههای غنی از داده بر اساس پارامترها و معیارهای تحقیق) برای یک مطالعه متمرکزتر کمک میکنند. . متأسفانه، اکثر تحقیقات بر ارزیابی VGI در مقایسه با مجموعه داده های بیرونی (مانند مجموعه داده های مرجع معتبر، مجموعه های ابرداده وب سایت) متمرکز شده اند. این منجر به کمبود تحقیق در استفاده از خود مجموعه داده (یعنی ذاتا) برای سنجش کیفیت شده است. فراخوان محققین برای شکلگیری الگوی جدیدی از ارزیابی کیفیت درونی [ ۶ ، ۳۹ ] شروع به شکلگیری کرده است.
سناراتنه و همکاران [ ۶ ] بر اساس پیشنهاد Goodchild و Li [ ۴۰ ] از سه رویکرد به کیفیت VGI با افزودن “داده کاوی” به لیست ساخته شده است. مطالعه متا آنها در مورد تحقیقات ارزیابی کیفیت VGI نشان داد که تعداد کمی از محققان به طور فعال بر روی ارزیابی VGI بدون استفاده از مجموعه داده های مرجع معتبر کار می کنند. این مطالعات هنوز کیفیت را از طریق مقایسه با ابرداده ارائه شده از طریق رسانه ای که در آن داده ها جمع آوری شده است (به عنوان مثال، داده های رتبه کاربر OSM، تعداد ویرایش ها) مورد بررسی قرار می دهند. هیچ یک از ۵۰ مطالعه ای که آنها گزارش کردند کیفیت مجموعه داده VGI را از طریق استفاده از خود مجموعه داده ارزیابی نکردند – همه آنها به داده های دیگری برای مقایسه ارجاع دادند. در حالی که ارزیابی کیفیت VGI مبتنی بر تصویر در حال حرکت به سمت معیارهای کیفیت مبتنی بر ضمنی است [۶ ، ۴۱ ، ۴۲ ]، نیاز قطعی به انتقال ارزیابی کیفیت VGI مبتنی بر نقطه از روشهای مقایسه مرجع سنتی برای پاسخ به انبوهی از پیکربندیهای مختلف دادههایی که VGI ممکن است تولید کند، وجود دارد.
۳٫ روش ها
در این مقاله، ما عبارت جامعیت فضایی را برای اندازه گیری ترکیبی از سه عنصر کیفیت داده VGI که برای ترسیم مناطق مطالعه امکان پذیر مناسب هستند، اعمال می کنیم: پوشش، ناهمگونی کاربر و تراکم. این مولفه ها در مقیاس ۰ تا ۱ بیان می شوند و به صورت ضربی ترکیب می شوند تا یک شاخص کلی نهایی S-COM به دست آید. وزن نسبی مولفه ها را می توان برای منعکس کردن تفاوت در پارامترهای مطالعه تغییر داد [ ۱۵]، مانند فقدان داده های منحصر به فرد کاربر. اولین مؤلفه شاخص S-COM، پوشش، وسعت و دانه های نامزد منطقه مورد مطالعه کلی را برای کیفیت های فضایی مورد نظر از نظر مشاهدات، مانند خوشه بندی داده های مشابه یا پراکندگی نقاط بدون ویژگی ارزیابی می کند. پوشش بسیار مهم است زیرا VGI ذاتاً به دلیل علایق کاربران، بی توجهی به طرح های تحقیقاتی یا مشخصات فنی ناهموار است. این مناطق فرعی کاندید را می توان در مراحل مقدماتی مطالعه انتخاب کرد و توسط شاخص S-COM ارزیابی کرد یا می تواند زیر واحدهایی باشد که توسط خود فرآیند به شکلی بدون نظارت تعریف شده است. تعریف “پوشش” می تواند متفاوت باشد، و امکان غربالگری سایت های بالقوه بر اساس حداقل آستانه مشاهدات خاص برنامه را فراهم می کند. مثلا، با توجه به مجموعه داده VGI از مرکز شهر یک شهر بزرگ که مایلیم در آن احساسات بازدیدکنندگانی مانند گردشگران را بسنجیم، میخواهیم پوشش را به حداقل برسانیم زیرا فعالیتهای توریستی به شدت خوشهبندی میشوند و در کل شهر پراکنده نمیشوند. در این مقاله، پوشش به عنوان نسبت دادههای جمعآوریشده به واحدهای منطقه (به عنوان مثال، شبکههای مستطیلی، بخشهای سرشماری)، که به عنوان سلول برای اهداف این مقاله برچسبگذاری شدهاند، با حداقل تعداد مشاهدات مشخص شده به تعداد کل سلولها محاسبه میشود. منطقه مورد مطالعه این سلولها میتوانند شبکههای شبکهای یا نامنظم Voronoi یا واحدهای جغرافیایی معتبر مانند یک سرشماری باشند. رویکردهای کلی برای تعیین پارامتر آستانه حداقل می تواند ماهیت آماری داشته باشد: بررسی توزیع از طریق هیستوگرام یا حذف درصد معینی از دم پایینی توزیع. حداقل آستانه همچنین می تواند بر اساس عوامل دیگری مانند حفظ حریم خصوصی جغرافیایی شرکت کنندگان باشد.
دومین معیار مؤلفه S-COM ناهمگونی کاربر است که نسبت مشاهدات را به تعداد مشارکت کنندگان منحصر به فرد در هر واحد تحلیل می سنجد. این نسبت با در نظر گرفتن تعداد کل ارسالهای کاربر و تعداد کاربران منحصربهفرد در هر سلول تقسیم بر تعداد کل سلولها محاسبه میشود (و بنابراین میتوان آن را به عنوان یک معیار تراکم کاربر در نظر گرفت). در زمینه تحلیل موضوعی دادههای جغرافیایی اجتماعی، ناهمگونی بالای کاربر ممکن است نشاندهنده اطمینان بیشتر در یک الگو یا روند شناساییشده (یعنی قانون لینوس) باشد [ ۴۰ ، ۴۳ ].
مؤلفه نهایی یک اندازه گیری چگالی فضایی است که شباهت بین تعداد داده های انباشته را ارزیابی می کند که در نمودار پراکندگی موران تجسم شده است. تخمین میزان توزیع یکنواخت مقادیر در یک منطقه مورد مطالعه با ارزیابی واریانس در ربعهای نمودار پراکندگی انجام میشود. این با مقادیر اندازهگیریشده در محور X و مقادیر عقبافتاده فضایی در محور Y تعریف میشود، که بزرگترین و کوچکترین ربعها را بر اساس مساحت میگیرد و محدودهای را محاسبه میکند که ۰ نشاندهنده شباهت کامل است. به این ترتیب، چگالی برای یافتن مناطق مشابه هم در فضای جغرافیایی و هم در فضای داده استفاده می شود ( شکل ۱ را ببینید.). نقاط داده دایره شده در نمودار پراکندگی موران (محور Y) با مناطق سایه دار روی نقشه (سمت چپ) مطابقت دارد. این زیر ناحیه از نقشه از نظر ویژگی های S-COM “مشابه” با مقدار شاخص ۰٫۸۱۶ پیدا شد. پنجره سمت چپ (نمودار ورونوی) بزرگنمایی می شود تا چند ضلعی های انتخاب شده را در مقایسه با قسمت سمت راست با مجموعه کامل نقاط داده، بهتر برجسته کند. چگالی به گونه ای فرموله می شود که مقادیر نزدیک به ۱ یکنواختی در ربع پراکندگی موران و در نتیجه شباهت توزیع داده ها (یعنی نزدیک به میانگین) را نشان می دهد. مقادیر نزدیک به صفر نشاندهنده واریانس بالا در ربعهای پراکنده موران است و نقاط پرت فضایی یا فضایی در نظر گرفته میشوند. از آنجایی که این رویکرد میتواند به موارد پرت حساس باشد، از آستانههای دم میتوان برای کاهش تأثیر آنها بر اندازهگیری چگالی فضایی استفاده کرد.
برای ترسیم نواحی فرعی امکان پذیر در یک منطقه مطالعه کلی، هم از تسلیحات منظم و هم نامنظم استفاده می شود. روش تسلاسیون منظم از یک رویکرد چهاردرختی و یک الگوریتم بازگشتی استفاده میکند که تعیین میکند آیا چند ضلعیهای مجاور باید ادغام شوند تا یک چند ضلعی والد «جامعتر» ایجاد شود. روش تسلاسیون نامنظم فقط از الگوریتم بازگشتی استفاده می کند و هر چند ضلعی مجاور را برای بهبود شاخص S-COM آزمایش می کند. هر دو الگوریتم از شاخص S-COM برای ارزیابی مناطق فرعی کاندید استفاده می کنند و برای هر پیکربندی آزمایش شده مقداری بین ۰ و ۱ برمی گردانند.
رویکرد شبکهبندی چهار درختی به دلیل توانایی آن در ایجاد وضوح متغیر به صورت بازگشتی انتخاب شد. Quadtree یک بافت منظم است که به طور مداوم مناطق را به چهار ناحیه مساوی تقسیم می کند تا زمانی که به آستانه همگنی برسد ( شکل ۲ ) [ ۴۴,۴۵,۴۶ ] .]. اولین تکرار (مقدار متریک محاسبه شده ۳) به چهار گره تقسیم می شود. مقادیر متریک گره سمت راست بالا و پایین سمت چپ (۵ و ۷) از مقدار متریک گره والد (۳) بیشتر است و بنابراین بیشتر تقسیم می شوند. در تکرار سوم، ربع بالا سمت راست هیچ گرهای با مقادیر متریک بالاتر از گره والد ندارد، بنابراین تقسیم آن متوقف میشود. با این حال، پایین سمت چپ ادامه مییابد تا زمانی که به شرایطی برسد که تمام گرههای فرزند مقادیر متریک کمتری نسبت به والد داشته باشند. سپس الگوریتم گره ها را از پایین ترین شاخه می گیرد و آنها را ادغام می کند. مقدار متریک را برای آنها پیدا می کند (در این مورد ۸) و آن مقدار را با مقدار گره والد (۷) بررسی می کند. اگر مقدار بالاتر باشد، چند ضلعی ادغام شده به جای چند ضلعی والد کامل به بالای درخت ارسال می شود. این مثال دو چند ضلعی با مقادیر متریک ۸ و ۵ برگرداند.۴۶ ] توضیح داد که این نوع ساختار داده می تواند سرعت پرس و جو را با تقسیم مداوم یک ناحیه مطالعه ناهمگن تا زمانی که مقادیر داده های همگن پیدا شود، افزایش دهد. نمونه هایی از استفاده از چهار درخت را می توان در بازیابی تصویر [ ۴۷ ، ۴۸ ] و مدل سازی محیطی [ ۴۹ ، ۵۰ ] یافت .
رویکرد تسلاسیون نامنظم از الگوریتمی استفاده می کند که به طور مکرر چند ضلعی های مجاور را از یک چند ضلعی دانه ادغام می کند ( شکل ۳)). این مجموعههای Voronoi از واحد تجزیه و تحلیل ایجاد میشوند، در مورد RinkWatch، اسکلههای منفرد با خوانشهای محلی در سکوها. الگوریتم روی هر چند ضلعی موجود در ناحیه مورد نظر تکرار می شود و هر یک را به عنوان یک دانه در نظر می گیرد. همسایگان چند ضلعی دانه برای یافتن یک چند ضلعی همسایه که بالاترین مقدار شاخص کلی S-COM را هنگام ترکیب با مقدار دانه ایجاد می کند، ارزیابی می شوند. اگر این مقدار بیشتر از دانه فعلی باشد، دانه با چند ضلعی جدید ادغام شده جایگزین می شود. این فرآیند تا زمانی تکرار می شود که هیچ چند ضلعی مجاور برای ایجاد مقدار شاخص S-COM بالاتر پیدا نشود. مجاورت به صورت غیر بازگشتی با استفاده از یک ماتریس مجاورت جهانی مشابه الگوریتم AMEOBA [ ۵۱] تعیین می شود.]. الگوریتم هر همسایه (سبز) را در اطراف چند ضلعی ادغام شده (قرمز) بررسی می کند.
۴٫ منابع داده و منطقه مطالعه
ابتکارات علمی شهروندی در سالهای اخیر محبوبیت زیادی پیدا کرده است، زیرا توسعه و استقرار برنامههای جمعآوری دادهها از طریق وبسایتهای سازگار با موبایل و تلفنهای همراه به طور قابل توجهی افزایش یافته است. پروژههایی مانند RinkWatch، FrogWatch، و OakMapper.org [ ۵۲ ] نشان میدهند که چگونه برنامههای ساده دادههای جغرافیایی میتوانند مشاهدات شهروندان را در موضوعات مختلف اجتماعی مهار کنند. پروژه RinkWatch برای بهره برداری از محبوبیت اسکیت در فضای باز با استخدام شهروندان برای مشارکت در گزارشی مبتنی بر وب در مورد کیفیت و در دسترس بودن یخ در پیست های خانگی خود طراحی شد [۵۳ ]]. مهمتر از آن، تغییرات مشاهده شده در دسترس بودن اسکیت در فضای باز می تواند انگیزه مشارکت عمومی بیشتر در تغییرات آب و هوا و علم آب و هوا باشد. هدف FrogWatch جلب مشارکت شهروندان در مجموعه مشاهدات مکان قورباغه است. مشابه RinkWatch، FrogWatch هم دارای اهداف علمی حفاظتی و هم اهداف آموزشی است.
مطالعه موردی ارزیابی دادههای RinkWatch برای شناسایی مناطق مطالعه امکانپذیر بر روی منطقه Kitchener/Waterloo (KW) در جنوب انتاریو، کانادا در طول زمستانهای ۲۰۱۳ و ۲۰۱۴ متمرکز شد. یک مطالعه امکان پذیر برای داده های RinkWatch در مقایسه با سایر پروژه های علمی شهروندی کمی منحصر به فرد خواهد بود. به عنوان مثال، OSM اغلب دارای چندین کاربر است که در هر مکان به داده ها کمک می کنند زیرا برخی ویژگی های جدید را اضافه می کنند در حالی که برخی دیگر ممکن است روی بهبود داده های موجود تمرکز کنند. در مقابل، RinkWatch بر نظارت بر زمینهای یخ متمرکز است، که بیشتر آنها توسط صاحبان خانههای خصوصی ایجاد و نگهداری میشوند. در مجموع ۹۸۵ پیست (کاربران منحصر به فرد) در طول دوره مطالعه دو ساله به طور کلی ثبت شد، با ۲۲۶۶۱ قرائت فردی از شرایط یخ (نقاط داده) مشخص شده است. منطقه KW برای مطالعه موردی انتخاب شد و دارای جمعیت تخمینی ۵۳۵ است.۵۴ ]. این منطقه به دلیل مشارکت بالای پروژه RinkWatch علاوه بر آشنایی این منطقه برای محققان انتخاب شد. بیست و یک پیست در منطقه KW در این تجزیه و تحلیل بر اساس فیلتر هر پیست دارای بیش از ۲۰ خوانش وضعیت یخ (سه هفته متوالی) استفاده می شود. این به حذف داده های جعلی یا مخرب از تجزیه و تحلیل کمک می کند [ ۳۱ ].
دادههای FrogWatch برای منطقه کلانشهری سرشماری تورنتو (CMA) جمعآوری شد که شامل شهر تورنتو و همچنین شهرهای مجاور (مانند میسیساگا، برامپتون، مارکهام) و تعدادی شهرک و دهکده کمجمعیتتر و دارای جمعیتی حدود ۶ نفر است. میلیون در سال ۲۰۱۴ [ ۵۵ ]. شاخص S-COM در CMA تورنتو برای شناسایی مناطقی که میتوان تلاشهای حفاظتی را برای کاهش تعداد قورباغههای کشته شده توسط ترافیک جادهها متمرکز کرد، استفاده شد. همه مشاهدههای قورباغه از FrogWatch در فاصله ۵۰۰ متری از هر خیابان، جاده، خیابان، بزرگراه یا بزرگراه برای تجزیه و تحلیل انتخاب شدند که منجر به مشاهده ۱۱۰۸ قورباغه یا وزغ در دوره ۱۹۹۹ تا ۲۰۱۴ شد و سال ۲۰۱۵ به بعد کاهش زیادی در مشارکت نشان داد.
۵٫ مطالعه موردی
سه نوع روش تجمیع برای دادههای RinkWatch اعمال شد: شبکهها (چهاردرخت)، بخشهای سرشماری، و چند ضلعیهای Voronoi ( شکل ۳ را ببینید).). پیاده سازی چهار درختی مورد استفاده در این تحقیق بازگشتی بود به طوری که هر سلول تا زمانی که مقادیر شاخص هر چهار گره فرزند کمتر از مقدار شاخص گره والد به اضافه یک تلورانس بازگشتی کوچک باشد (۰٫۰۵ در مورد این پیاده سازی، که مقدار شاخص بین ۰ و ۱). اگر مقدار هر گره فرزند از مقدار شاخص گره والد آن به اضافه تحمل بیشتر باشد، بازگشت به سطح عمیق تری منتقل می شود. الگوریتم کوچکترین واحدهای امکان پذیر را در سراسر منطقه مورد مطالعه پیدا می کند و سلول های شبکه مجاور را ادغام می کند، مگر زمانی که یک سلول شبکه ایزوله (یعنی جزیره ای) مواجه می شود. در پایان اجرای الگوریتم، چند ضلعی با بیشترین مساحت و بالاترین مقدار شاخص S-COM به عنوان یک ناحیه امکان پذیر شناسایی می شود ( شکل ۳) .، اگرچه می توان آن را برای بازگرداندن چندین منطقه امکان پذیر اصلاح کرد.
دادههای FrogWatch ابتدا قبل از اجرای تجزیه و تحلیل، به دادههای چند ضلعی ادغام شدند، یک نیاز رایج برای دادههای علوم شهروندی، بهویژه زمانی که به دادههای گونههای بالقوه در خطر انقراض مربوط میشود. شبکه ای با هر سلول به ابعاد ۱۰ × ۱۰ کیلومتر در منطقه ایجاد شد و مشاهده قورباغه در ۵۰۰ متری یک جاده، خیابان، خیابان، بزرگراه یا بزرگراه پیدا شد و در سلول شبکه ای که در آن افتادند جمع شدند. این کار برای شبیهسازی مطالعهای انجام شد که تمرکز منابع برای تلاشهای حفاظت از قورباغه در شهر تورنتو را با نگاه کردن به مناطقی که اغلب قورباغهها در نزدیکی جادههای پر قاچاق مشاهده میشوند، ارزیابی میکرد.
تمام نقاط داده در هر چند ضلعی برای هر دو مطالعه موردی برای تعیین مقادیر شاخص S-COM با شاخص نرمال شده توسط ناحیه چند ضلعی تجمیع شدند. خطوط چند ضلعی معتبر مورد استفاده، مسیرهای سرشماری و مناطق انتشار بودند که هر دو به عنوان داده های سرشماری منتشر شده در این واحدهای جغرافیایی انتخاب شدند و اغلب در علوم اجتماعی استفاده می شدند. چند ضلعی های Voronoi برای RinkWatch و یک شبکه برای FrogWatch به دلیل ویژگی های غیر استاندارد آنها انتخاب شدند. وزن اجزای شاخص برای تجزیه و تحلیل برای دادههای RinkWatch متفاوت بود: ۵۰٪ تراکم و پوشش، و ۳۳٪ تراکم، پوشش، و ناهمگونی کاربر. از این به بعد به ترتیب وزن ۵۰۵ و وزن ۳۳۳ نامیده می شود. وزن دهی ۵۰۵ برای تجزیه و تحلیل استفاده شد زیرا ناهمگونی کاربر جزء کمتر مفید در نظر گرفته شد. این به دلیل این واقعیت است که ناهمگونی کاربر نسبت نقاط داده به کاربران منحصر به فرد را اندازهگیری میکند در حالی که مطالعه موردی از حداقل ۲۰ نقطه داده برای هر کاربر برای گنجاندن استفاده میکند، که باعث ایجاد یک مقدار ناهمگونی کاربر S-COM کوچک میشود. علاوه بر این، از آنجایی که دادههای FrogWatch شامل اطلاعات کاربر نمیشد، تنها وزن مورد استفاده ۵۰۵ بود (۵۰٪ تراکم و ۵۰٪ پوشش). از مجموعه داده FrogWatch برای کمک به درک اثربخشی و محدودیت های SCOM هنگام استفاده بر روی یک مجموعه داده پراکنده استفاده شد.
۶٫ نتایج
۶٫۱٫ RinkWatch
در مقایسه با تسلیحات نامنظم، تفاوت های متعددی بین تسلیحات معمولی وجود داشت. تسلیحات نامنظم عموماً مقادیر شاخص S-COM بالاتر و تعداد دادههای همگن بیشتری را در مقایسه با نواحی شبکهبندی شده به دست میآورند که چندین نقطه پرت شدید را در خود جای دادهاند ( شکل ۴ ). الگوریتم جداسازی منظم نواحی امکانپذیر را با مقادیر شاخص S-COM بسیار پایین (۰٫۱۴۸/۰٫۲۱۶ برای ورودیهای شاخص ۳۳۳/۵۰۵) در مقایسه با تسلیحات نامنظم (دستگاههای سرشماری) و فهرستبندی جغرافیایی (چند ضلعیهای Voronoi) برگرداند. مقادیر بسیار مشابهی را نشان داد (به ترتیب ۰٫۹۶۸/۰٫۹۹۹۷ و ۰٫۶۵۶/۰٫۶۸۰) ( شکل ۴ ).
ناحیه شبکهبندیشده ( شکل ۴ الف) ناحیهای با تعداد مشابهی از خوانشهای وضعیت یخ پیدا کرد، حتی اگر همین ناحیه حاوی تعداد بسیار بزرگتری است که معیارهای مورد نیاز برای تجزیه و تحلیل قابلیت اسکیتپذیری را که قبلاً توضیح داده شد، برآورده نمیکند. مقدار شاخص S-COM نیز برای هر دو وزن ۵۰۵ و ۳۳۳ بسیار پایین است. پوشش نقش زیادی در مقادیر پایینتر ایفا میکند، زیرا سطح شبکه با طراحی مستطیل شکل است و فضای خالی زیادی باقی میگذارد. علاوه بر این، افزودن مقادیر پرت بزرگ به فهرست شمارش ها ناهمگونی کاربر را کاهش می دهد.
تجزیه و تحلیل های چند ضلعی نامنظم به طور کلی مقادیر شاخص S-COM بالاتری را یافت ( شکل ۴ b,c). تجزیه و تحلیل دستگاه سرشماری چهار چند ضلعی را با تعداد قرائتهای مشابه شناسایی کرد. مقادیر شاخص چند ضلعی فردی با مساحت چند ضلعی ها نرمال شد. تجزیه و تحلیل چند ضلعی Voronoi همان منطقه را شناسایی کرد. ناهمگونی کاربر مقادیر شاخص هر دوی این تحلیلها را کاهش داد زیرا هر نقطه جمعآوری شده فقط یک کاربر منحصر به فرد (رینک) دارد. مناطق انتشار مورد آزمایش قرار گرفتند، اما ثابت شد که وضوح بسیار خوبی برای تجزیه و تحلیل این مجموعه داده دارند. به طور کلی، الگوریتم مجاورت مقادیر شاخص S-COM بالاتری نسبت به الگوریتم چهار درختی ارائه میدهد.
تجزیه و تحلیل درونیابی اسپلاین، سطح اسپلاین بسیار صافتری را نشان میدهد که نسبت به سطح ایجاد شده از کل مجموعه داده (تعداد قرائتها ≥ ۲۰) ایجاد شده است ( شکل ۵ و شکل ۶ )، به ما این امکان را میدهد که تغییرپذیری در ناحیه محلی را برای اسکیتپذیری بهتر ارزیابی کنیم. در حالی که تغییرات محلی تفاوتهایی را با ایستگاههای رسمی دادههای آب و هوا (واقع در فرودگاه در منطقه KW) و در میان مناطق مختلف منطقه KW (به عنوان مثال، روستایی در مقابل شهری) نشان میدهد، تغییرات با استفاده از کل مجموعه داده برای مناطق مورد مطالعه نشان داده شده است. غیر قابل استفاده است ( شکل ۵ ب و شکل ۶ب). اگرچه سطوح زیادی از کاربران وجود دارد، از افرادی که برای چندین دهه پیست میسازند تا افرادی که برای اولین بار یاد میگیرند، نباید میزان تغییرپذیری در اسکیتپذیری پیستها همانطور که در تصاویر سمت چپ نشان داده شده است وجود داشته باشد. نواحی امکان پذیری که با استفاده از هر دو وزنه (۵۰۵ و ۳۳۳) یافت شدند، سطوح بسیار صافتری نسبت به ناحیه کلی با مقادیر مشابهی از قابلیت اسکیت نشان میدهند. نقاط پرت عمده در منطقه امکان پذیر گنجانده نشدند. شکل ۵ وزن ۵۰۵ را نشان می دهد که وزن ۳۳۳ ( شکل ۶ ) نتایج مشابهی را نشان می دهد. لازم به ذکر است که یک اسپلاین بهترین سطح را بر اساس برازش یک سطح صاف با داده ها ایجاد می کند که باعث ایجاد مقادیر زیر ۰٪ و بیش از ۱۰۰٪ می شود.
۶٫۲٫ FrogWatch
تجزیه و تحلیل دادههای FrogWatch نسبت به تجزیه و تحلیل دادههای RinkWatch به دلیل کمبود اطلاعات کاربر/گردآورنده، محدودتر بود و ارزیابی کیفیت را محدود میکرد، مانند بررسی اینکه آیا دادههای یافت شده در یک منطقه توسط یک کاربر یا تعداد زیادی کاربر جمعآوری شدهاند. الگوریتم مجاورت چند ضلعی مورد استفاده با دادههای FrogWatch، مناطق وسیعی از تعداد دادههای مشابه قورباغهها را در منطقه مورد مطالعه (۱۰×۱۰ کیلومتر بر سلول) قرار داد. شکل ۷ امکان پذیرترین منطقه مورد مطالعه را بر اساس معیارهای پوشش زیاد و شباهت داده ها نشان می دهد. هیچ حداقل تعداد شمارش برای این کارآزمایی اعمال نشد. دو نمودار پراکندگی موران در شکل ۷ یافت شده استج ناهمگونی ناحیه امکان پذیر محاسبه شده توسط الگوریتم را نشان می دهد. پوشش در ۰٫۰۵۶ کم بود، در حالی که چگالی بالا بود (۰٫۸۸۴)، با مقدار شاخص کلی S-COM 0.470. پوشش تحت تأثیر تعداد زیادی سلول با تعداد کم بود. این سلولهای کم شمار به دلیل محدودیت مجاورت الگوریتم به چند ضلعی منطقه مورد مطالعه نهایی وصل شدند. یک مقدار تاخیر بزرگتر می تواند به الگوریتم اجازه دهد تا مجاورت را در مرتبه های مختلف محاسبه کند (یعنی اجازه می دهد چند ضلعی ها حتی اگر با n از هم جدا شده باشند گنجانده شوند.چند ضلعی های خالی)، اگرچه این یک چند ضلعی بیش از حد بزرگ برای منطقه مطالعه کوچک مورد استفاده ایجاد می کند. مقادیر بافر را می توان برای ترکیب چندین ناحیه از مقادیر شاخص S-COM که در محدوده مقادیر قرار می گیرند استفاده کرد و امکان یافتن مناطق امکان پذیر بزرگتر را فراهم کرد. سلول با ۳۶ مشاهده قورباغه در یک منطقه مطالعاتی امکانپذیر با مقدار شاخص S-COM مشابه تصویر ۷ گنجانده شد و در صورت اعمال محدودهها، در “بهترین” کلی گنجانده شد. یکی از سلول ها با تعداد ۱۴۲ قورباغه مشاهده شد ( شکل ۷آ). مشخص شد که اینها همه در یک موقعیت قرار دارند و احتمالاً به دلیل بارگذاری انبوه همه مشاهدات در منطقه است. این یکی از مشکلات کار با VGI را برجسته می کند. الگوریتم از این سلول برای یافتن بالاترین مقدار شاخص S-COM استفاده نکرد زیرا مؤلفه چگالی برای یافتن مقادیر پرت مقادیر بزرگ در فضاهای مشابه تنظیم شده بود اما نه تنها در یک سلول. نمودار پراکندگی موران وسط (b) چند ضلعی را در رابطه با کل منطقه مورد مطالعه نشان می دهد، در حالی که (c) ناهمگونی ناحیه امکان پذیر محاسبه شده توسط الگوریتم (محور Y = تاخیر فضایی، محور X = تعداد قورباغه ها) را نشان می دهد.
۷٫ بحث
تحقیقات قبلی نشان داده است که تجزیه و تحلیل VGI در دانههای مختلف میتواند به نتایج متفاوتی منجر شود [ ۲۹ ، ۵۶ ]. در اینجا، هدف ما استفاده از شاخص کیفیت داده توصیف شده در لارنس و همکاران بود. [ ۱۵] برای تعریف وسعت مطالعه بر اساس ویژگی های فضایی ذاتی در الگوهای نقطه VGI. نتایج نشان داد که روشها قادر به یافتن زیرمنطقههایی بودند که با معیارهای از پیش تعریفشده برای مطالعه موردی VGI اسکیتپذیری RinkWatch و تلاشهای حفاظتی برای FrogWatch مطابقت داشتند. این معیارها شامل شباهت در تعداد دادهها توسط هر مشارکت کننده منحصر به فرد در مورد RinkWatch، و مجاورت/شباهت فضایی و حداقل تعداد دادهها در هر دو مطالعه موردی بود. فیلتر کردن نقاط پرت، چه برای حذف، چه برای مطالعه بیشتر، و حفظ ارتباط فضایی در تجزیه و تحلیل فضایی الگوهای نقطه VGI ممکن است یک مرحله پیش پردازش مهم برای مطالعات آینده دادههای مشارکتکننده کاربر باشد.
مقادیر شاخص S-COM نشان داد که تفاوت بین گستره های فضایی مختلف می تواند بسیار شدید باشد. اولین روش بهینهسازی مورد استفاده، الگوریتم شبکهبندی چهاردرختی بود. در حالی که نتیجه منطقه مورد مطالعه یک زیرمجموعه معقول از داده های کلی را در بر می گیرد که با معیارهای مورد نیاز برای تجزیه و تحلیل قابلیت اسکیت مطابقت دارد، نمی تواند بر کمبود ذاتی شبکه های استاندارد مورد استفاده غلبه کند. منطقه عملی یافت شده برای دادههای RinkWatch شامل تعداد زیادی از تعداد قرائتهای جمعآوری شده بود که بسیار بیشتر از شمارشهای اطراف بود و یک سوگیری در تجزیه و تحلیل قابلیت اسکیت ایجاد میکرد، زیرا یک پیست با ۳۹۴ مشارکت بسیار دقیقتر از میانگین پیست با ۷۳ مشارکت است. در حالی که می تواند برای یافتن پرکارترین مشارکت کنندگان کاربرد داشته باشد،۳۴ ، ۴۰ ، ۵۷ ، ۵۸ ، ۵۹ ، ۶۰ ]، این موضوع تمرکز این مقاله نبود. شاخص S-COM، به عنوان معیار جامعیت فضایی، به این معنا قابل گسترش است که وزن اجزا را می توان برای اهداف مطالعه تنظیم کرد. تجزیه و تحلیل FrogWatch از این جهت متفاوت بود که منطقه کلی برای نقاط دورافتاده یا غلظت زیاد قورباغه ها تجزیه و تحلیل شد، که امکان تعیین مناطق امکان پذیر برای تلاش های حفاظتی را فراهم می کرد.
مناطق مورد مطالعه چند ضلعی نامنظم (دستگاه های سرشماری، مناطق انتشار، و چند ضلعی های Voronoi) مقادیر شاخص S-COM بهتری را ارائه می دهند. مسیر سرشماری و مناطق مورد مطالعه چند ضلعی Voronoi برای تجزیه و تحلیل درون یابی فضایی بسیار مساعدتر بود. مسیر سرشماری و مناطق مورد مطالعه Voronoi نشان داد که بهترین مناطق را از همه انواع مختلف مناطق مورد آزمایش آزمایش شده، نشان میدهد که سازگاری خوبی با معیارهای مورد نیاز برای تجزیه و تحلیل نهایی اسکیتپذیری دارد. تفاوت بسیار کمی بین استفاده از وزن مؤلفه شاخص ۳۳۳ در مقایسه با وزن ۵۰۵ وجود داشت. تجزیه و تحلیل قابلیت اسکیت با استفاده از درون یابی اسپلاین به تجسم تفاوت بین استفاده از منطقه مطالعه کامل در مقابل منطقه امکان پذیر Voronoi کمک می کند. شکل ۵ و شکل ۶نشان میدهد که قابلیت اسکیتبازی در محدوده نشاندادهشده به اندازهای نیست که مجموعه کامل امتیازات ما تصور میکنیم. مقدار ۱۰۰% (سمت راست پایین شکل ۵ ) یک مقدار بسیار مشکوک است که باید بیشتر مورد تجزیه و تحلیل قرار گیرد و به احتمال زیاد از تجزیه و تحلیل حذف شود.
تجزیه و تحلیل FrogWatch بیشتر به نشان دادن کارایی شاخص S-COM در تعیین مناطق فرعی در یک منطقه مطالعاتی اولیه کمک می کند. در حالی که یک بررسی بصری سطحی از منطقه مورد مطالعه ممکن است ثابت کند که مناطق تعداد زیادی از قورباغه ها را روشن می کند، شاخص مورد استفاده در این مقاله انتخاب منطقه فرعی مطالعه را کمی بیشتر می کند. با این حال، مجموعه داده FrogWatch در در دسترس نبودن اطلاعات کاربر یا دانش متا متفاوت بود که در استفاده از داده ها مشکل ایجاد می کرد [ ۶۱ ، ۶۲ ، ۶۳ ، ۶۴ ]، اگرچه شاخص S-COM هنوز هم می توانست یک زیر منطقه مناسب پیدا کند. بر اساس شرایط مطالعه (غلظت زیاد قورباغه).
سه معیار متریک S-COM را می توان با استفاده از رویکردهای مختلف تکرار کرد. DBSCAN یک تکنیک خوشه بندی شناخته شده است که می تواند مناطقی با پوشش مشابه را پیدا کند. میراحسان و همکاران [ ۶۵ ] ناهمگنی کاربر-کاربر کاربران سلولی بی سیم را با استفاده از ضریب تغییرات نواحی سلول Voronoi و طول لبه سلول Delaunay حاصل محاسبه کرد. با این حال، این مطالعه از داده های OSM استفاده کرد. ایده های مشابهی در فنگ و همکاران ارائه شده است. [ ۶۶ ] با مجموعه داده های بسیار ناهمگن اما پر سر و صدا سر و کار دارد، با این حال دوباره از داده های خارجی برای تأیید ناهمگنی استفاده می کند. اندازه گیری تراکم و پوشش S-COM به دستورالعمل های ISO داده های جغرافیایی برای کامل بودن تقریب می زند که به طور گسترده مورد مطالعه قرار گرفته است [ ۱۰ ، ۱۳ ،۳۱ ، ۶۷] از نظر ارزیابی های کیفی. متریک S-COM اجازه می دهد تا سه معیار آن در الگوریتم های مختلف (به عنوان مثال، Voronoi، بخش سرشماری، چهار درخت) ترکیب شوند، همانطور که در این مقاله نشان داده شده است. این روش دو مزیت نسبت به روش های فعلی دارد. اول و مهمتر از همه، فقط از طریق خود مجموعه داده محاسبه می شود. ثانیاً، از هر سه معیار در محاسبات در هر مرحله استفاده می کند، برخلاف محاسبه هر اندازه به طور جداگانه و سپس تلاش برای ترکیب آنها در یک حد بهینه. صرف نظر از اینکه از VGI مکانیابی شده برای تجزیه و تحلیل الگوهای فعالیت روزانه یا احساسات استفاده میشود یا از دادههای علوم شهروندی برای بررسی فراوانی یک دوزیست استفاده میشود، ویژگیهای فضایی دادهها باید مورد بازجویی قرار گیرند، و روش توسعهیافته در اینجا قوی است. اشکال مختلف مطالعات موضوع-ابژه
نیاز به روشهایی برای یافتن گسترههای مطالعه و شناسایی مقیاسهای فضایی خاص به VGI محدود نمیشود. به عنوان مثال، گالپرن [ ۶۸ ] خاطرنشان کرد که دانه فضایی بهینه معمولاً قبل از تجزیه و تحلیل ژنتیکی منظر ناشناخته است و مثالی از نگاه کردن به دانههای مختلف برای فیلتر کردن تغییرات بیاهمیت در چشمانداز جریان ژنی ارگانیسم با دامنه وسیع ارائه میکند. از آنجایی که درک این منابع مختلف VGI هنوز در مراحل ابتدایی است، یک رویکرد برای استفاده از مجموعه داده VGI بدون تمرکز چند مقیاسی ممکن است اطلاعات مهم را پنهان یا نادیده گرفته شود. سستر و همکاران [ ۶۹] بحث کرد که چه تعداد از خطوطی که ممکن است در VGI یافت شوند رسمی نیستند و ممکن است دارای مرزهای نیمه دائمی یا مرزهای مبهم باشند، مانند مورد توصیفات محاوره ای محله های شهری به عنوان “بالای شهر”، “منطقه دانشگاه” یا موارد دیگر. مرزبندی های فرهنگی تعریف شده الگوریتم های خوشه بندی مدرن (به عنوان مثال، DBScan، KMeans) همچنین می توانند الگوهای اضافی را در داده ها ارائه دهند که این الگوریتم ها نمی توانند پیدا کنند. با این حال، بسیاری از الگوریتمهای خوشهبندی بدون نظارت، توانایی تنظیم حساسیت به مراکز اولیه خوشهها را ارائه نمیدهند و به احتمال زیاد حداقلهای محلی بهینه را با چندین پارامتر ذهنی بیشتر با دادههای پرت پیدا نمیکنند [۷۰ ، ۷۱ ] .
به طور کلی، استفاده از شاخص S-COM در شناسایی مناطق زیرمطالعه ای که شباهت را نشان می دادند، از نظر مکانی به هم متصل بودند و دارای حداقل تعداد داده بودند، موفقیت آمیز بود. یافتن منطقه مطالعه مناسب بدون مرزهای از پیش تعریف شده می تواند چالش برانگیز باشد [ ۷۲ ، ۷۳]. داده های VGI توسط کاربران بر اساس معیارهای شخصی یا مرتبط با پروژه ایجاد می شود که ممکن است با نیازهای محققان مطابقت نداشته باشد. نتایج حاصل از مطالعات موردی RinkWatch و FrogWatch نشان دادهاند که زیر حوزههای امکانپذیر را میتوان از طریق الگوریتمهای ساده با استفاده از یک شاخص از پیش تعریفشده یافت، که امکان مطالعه آسانتر و سریعتر دادهها یا مقایسه گسترههای مختلف بر اساس شرایط از پیش تعریفشده را فراهم میکند. از طریق این الگوریتمها، ما میتوانیم به درک بهتری از نحوه استفاده از VGI برای تجزیه و تحلیل، به ویژه استفاده از آن برای مصرف عمومی از جمعآوری اطلاعات بلادرنگ و انتشار فوری دست یابیم [۶۹ ]]. در حالی که این مقاله با استفاده از دانههای مختلف و رویکردهای امکانسنجی بر روی امکانپذیرترین حد تمرکز داشت، تغییر وزن اجزای شاخص امکان پذیرش آن را در انواع دیگر مطالعات فراهم میکند. به عنوان مثال، الگوریتم میتواند حداقل آستانهای برای مقادیر شاخصی که برمیگرداند داشته باشد، که امکان تجزیه و تحلیل بیشتر حوزههای مطالعاتی مورد علاقه (گسترهها) توسط محققان را فراهم میکند. ما پیشبینی میکنیم که این یافتهها پذیرش گستردهتر تجزیه و تحلیل چند مقیاسی VGI را تسهیل کرده و ارزیابی کیفیت دادههای VGI را در جغرافیا و سایر رشتهها ارتقا دهد.
منابع
- Goodchild، MF Citizens به عنوان حسگر: دنیای جغرافیای داوطلبانه. ژئوژورنال ۲۰۰۷ ، ۶۹ ، ۲۱۱-۲۲۱٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- لی، دبلیو. Goodchild، MF; کلیسا، RL; ژو، بی. داده کاوی جغرافیایی در وب: کشف مکان های تاسیسات خدمات اضطراری. در مجموعه مقالات داده کاوی پیشرفته و برنامه های کاربردی، پکن، چین، ۱۷-۱۹ دسامبر ۲۰۱۱٫ Zhou, S., Zhang, S., Karypis, G., Eds. Springer: برلین/هایدلبرگ، آلمان، ۲۰۱۲; صص ۵۵۲-۵۶۳٫ [ Google Scholar ]
- الوود، اس. علم اطلاعات جغرافیایی: تجسم، روشهای بصری و geoweb. Prog. هوم Geogr. ۲۰۱۱ ، ۳۵ ، ۴۰۱-۴۰۸٫ [ Google Scholar ] [ CrossRef ]
- گوتز، ام. Zipf، A. به سمت تعریف چارچوبی برای استخراج خودکار مدلهای ۳D CityGML از اطلاعات جغرافیایی داوطلبانه. بین المللی J. 3 Inf. مدل. IJ3DIM ۲۰۱۲ ، ۱ ، ۱-۱۶٫ [ Google Scholar ] [ CrossRef ]
- تنی، ام. هال، گیگابایت؛ Sieber, RE یک سیستم سنجش جمعیت که ژئوتوپیک ها و منافع جامعه را از محتوای تولید شده توسط کاربر شناسایی می کند. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۹ ، ۳۳ ، ۱۴۹۷-۱۵۱۹٫ [ Google Scholar ] [ CrossRef ]
- سناراتنه، اچ. مبشری، ع. علی، ال. کاپینری، سی. هاکلی، ام. مروری بر روشهای داوطلبانه ارزیابی کیفیت اطلاعات جغرافیایی. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۷ ، ۳۱ ، ۱۳۹-۱۶۷٫ [ Google Scholar ] [ CrossRef ]
- براون، جی. رودز، جی. لونی، دی. گلدینگی، آر. فیلدینگ، ک. گاروفانو، ن. هترینگتون، اس. هاپکینز، ام. گرین، جی. مک نامارا، اس. تأثیر طراحی نمونه بر کیفیت داده های مکانی در یک پروژه علمی شهروندی جغرافیایی. ترانس. GIS ۲۰۱۹ ، ۲۳ ، ۱۱۸۴-۱۲۰۳٫ [ Google Scholar ] [ CrossRef ]
- بارون، سی. نیس، پ. Zipf، A. چارچوبی جامع برای تحلیل کیفی OpenStreetMap ذاتی. ترانس. GIS ۲۰۱۴ ، ۱۸ ، ۸۷۷-۸۹۵٫ [ Google Scholar ] [ CrossRef ]
- مونی، پی. کورکوران، پ. Winstanley، AC به سمت معیارهای کیفیت برای OpenStreetMap. در مجموعه مقالات هجدهمین کنفرانس بین المللی SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی، سن خوزه، کالیفرنیا، ایالات متحده آمریکا، ۲ تا ۵ نوامبر ۲۰۱۰٫ انجمن ماشینهای محاسباتی: سن خوزه، کالیفرنیا، ایالات متحده آمریکا، ۲۰۱۰٫ صص ۵۱۴-۵۱۷٫ [ Google Scholar ]
- Girres, J.-F. Touya, G. ارزیابی کیفیت مجموعه داده OpenStreetMap فرانسه. ترانس. GIS ۲۰۱۰ ، ۱۴ ، ۴۳۵-۴۵۹٫ [ Google Scholar ] [ CrossRef ]
- دیویلر، آر. استین، ا. Bédard، Y.; کریسمن، ن. فیشر، پی. Shi, W. سی سال تحقیق در مورد کیفیت داده های مکانی: دستاوردها، شکست ها و فرصت ها. ترانس. GIS ۲۰۱۰ ، ۱۴ ، ۳۸۷-۴۰۰٫ [ Google Scholar ] [ CrossRef ]
- ژانسولین، آر. Devillers, R. فصل ۲٫ کیفیت داده های مکانی: مفاهیم. در مبانی کیفیت داده های مکانی ; Devillers, R., Jeansoulin, R., Eds. ISTE: لندن، انگلستان، ۲۰۰۶; صص ۳۱-۴۲٫ [ Google Scholar ]
- بصیری، ع. هاکلی، م. فودی، جی. Mooney, P. کیفیت دادههای جغرافیایی جمعسپاری شده: چالشها و مسیرهای آینده. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۹ ، ۳۳ ، ۱۵۸۸-۱۵۹۳٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- لنسلی، جی. دی اسمیت، ام. گودچایلد، م. Longley، P. داده های بزرگ و تجزیه و تحلیل جغرافیایی. arXiv ۲۰۱۹ ، arXiv:1902.06672. [ Google Scholar ]
- لارنس، اچ. رابرتسون، سی. فیک، ر. نلسون، تی. شناسایی مناطق مطالعه بهینه و واحدهای تجمع فضایی برای VGI مبتنی بر نقطه از منابع متعدد. در پیشرفت در مدیریت و تجزیه و تحلیل داده های فضایی: مقالاتی را از شانزدهمین سمپوزیوم مدیریت داده های فضایی IGU انتخاب کنید . Harvey, F., Leung, Y., Eds. پیشرفت در علم اطلاعات جغرافیایی؛ انتشارات بین المللی Springer: چم، سوئیس، ۲۰۱۵; صص ۶۵-۸۴٫ شابک ۹۷۸-۳-۳۱۹-۱۹۹۵۰-۴٫ [ Google Scholar ]
- کلمن، دی. جورجیادو، ی. Labonte, J. اطلاعات جغرافیایی داوطلبانه: ماهیت و انگیزه تولیدکنندگان. بین المللی جی. اسپات. زیرساخت داده Res. ۲۰۰۹ ، ۴ ، ۳۳۲-۳۵۸٫ [ Google Scholar ]
- کلمن، DJ مشارکتهای بالقوه و چالشهای VGI برای برنامههای نقشهبرداری پایه توپوگرافی معمولی. در جمع سپاری دانش جغرافیایی ; Sui, D., Elwood, S., Goodchild, M., Eds. Springer: Dordrecht، هلند، ۲۰۱۳; ص ۲۴۵-۲۶۳٫ [ Google Scholar ]
- بوداتوکی، NR; Haythornthwaite، C. انگیزه برای همکاری آزاد: مدل های جمعیت و جامعه و مورد OpenStreetMap. صبح. رفتار علمی ۲۰۱۳ ، ۵۷ ، ۵۴۸-۵۷۵٫ [ Google Scholar ] [ CrossRef ]
- رابرتسون، سی. Feick, R. تعریف کارشناسان محلی: تخصص جغرافیایی به عنوان مبنایی برای کیفیت اطلاعات جغرافیایی. در مجموعه مقالات سیزدهمین کنفرانس بین المللی تئوری اطلاعات فضایی (COSIT 2017)، لاکویلا، ایتالیا، ۴ تا ۸ سپتامبر ۲۰۱۷٫ کلمنتینی، ای.، دانلی، ام.، یوان، م.، کری، سی.، فوگلیارونی، پی.، بالاتوره، آ.، ویرایش. Schloss Dagstuhl–Leibniz-Zentrum fuer Informatik: Dagstuhl، آلمان، ۲۰۱۷; جلد ۸۶، ص ۲۲:۱–۲۲:۱۴٫ [ Google Scholar ]
- دیکینسون، جی ال. زاکربرگ، بی. Bonter، DN Citizen Science به عنوان یک ابزار تحقیق زیست محیطی: چالش ها و مزایا. آنو. کشیش اکول. تکامل. سیستم ۲۰۱۰ ، ۴۱ ، ۱۴۹-۱۷۲٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- هاکلی، ام. دانش شهروندی و اطلاعات جغرافیایی داوطلبانه: بررسی اجمالی و گونهشناسی مشارکت. در جمع سپاری دانش جغرافیایی ; Sui, D., Elwood, S., Goodchild, M., Eds. Springer: Dordrecht، هلند، ۲۰۱۳; صص ۱۰۵-۱۲۲٫ [ Google Scholar ]
- آنتونیو، وی. کاپینری، سی. Haklay، ME VGI و فراتر از آن: از داده تا نقشه برداری. در کتاب راهنمای نقشه برداری و کارتوگرافی راتلج ; Kent, A., Vujakovic, P., Eds. Routledge: Abingdon، انگلستان، ۲۰۱۷; صص ۴۷۵-۴۸۸٫ [ Google Scholar ]
- نیس، پ. زیلسترا، دی. Zipf، A. تکامل شبکه خیابانی نقشههای crowdsourced: OpenStreetMap در آلمان ۲۰۰۷-۲۰۱۱٫ اینترنت آینده ۲۰۱۲ ، ۴ ، ۱-۲۱٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- چپکیویچ، م. یانکوفسکی، پ. Młodkowski، M. ژئوپرسشنامه ها در برنامه ریزی شهری: روش های استخدام، مشارکت شرکت کنندگان و کیفیت داده ها. کارتوگر. Geogr. Inf. علمی ۲۰۱۷ ، ۴۴ ، ۵۵۱-۵۶۷٫ [ Google Scholar ] [ CrossRef ]
- هی، SI; جورج، دی.بی. مویس، CL; Brownstein، JS فرصت های داده های بزرگ برای نظارت جهانی بیماری های عفونی. PLoS Med. ۲۰۱۳ ، ۱۰ ، e1001413. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- کیچین، آر. داده های بزرگ و جغرافیای انسانی: فرصت ها، چالش ها و خطرات. دیالوگ هام Geogr. ۲۰۱۳ ، ۳ ، ۲۶۲-۲۶۷٫ [ Google Scholar ] [ CrossRef ]
- Goodchild، MF کیفیت داده های بزرگ (جغرافیایی). دیالوگ هام Geogr. ۲۰۱۳ ، ۳ ، ۲۸۰-۲۸۴٫ [ Google Scholar ] [ CrossRef ]
- لازر، دی. کندی، آر. کینگ، جی. Vespignani، A. تمثیل آنفولانزای گوگل: تله ها در تجزیه و تحلیل داده های بزرگ. Science ۲۰۱۴ ، ۳۴۳ ، ۱۲۰۳-۱۲۰۵٫ [ Google Scholar ] [ CrossRef ]
- لی، ال. Goodchild، MF; Xu، B. الگوهای مکانی، زمانی و اجتماعی-اقتصادی در استفاده از توییتر و فلیکر. کارتوگر. Geogr. Inf. علمی ۲۰۱۳ ، ۴۰ ، ۶۱-۷۷٫ [ Google Scholar ] [ CrossRef ]
- هچت، بی. استفنز، ام. داستان شهرها: سوگیری های شهری در اطلاعات جغرافیایی داوطلبانه. در مجموعه مقالات هشتمین کنفرانس بین المللی AAAI در وبلاگ ها و رسانه های اجتماعی، ان آربور، MI، ایالات متحده، ۱ تا ۴ ژوئن ۲۰۱۴٫ صص ۱۹۷-۲۰۵٫ [ Google Scholar ]
- Haklay, M. اطلاعات جغرافیایی داوطلبانه چقدر خوب است؟ مطالعه تطبیقی مجموعه دادههای OpenStreetMap و Ordnance Survey. محیط زیست طرح. B طرح. دس ۲۰۱۰ ، ۳۷ ، ۶۸۲-۷۰۳٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- نیس، پ. Zielstra، D. تحولات اخیر و روندهای آینده در تحقیقات داوطلبانه اطلاعات جغرافیایی: مورد OpenStreetMap. اینترنت آینده ۲۰۱۴ ، ۶ ، ۷۶-۱۰۶٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- جفری، سی. اوزونوف، ا. پاگانو، ام. تأثیر تجمع فضایی بر عملکرد هنگام ترسیم خطر بیماری. بین المللی J. Health Geogr. ۲۰۱۴ ، ۱۳ ، ۹٫ [ Google Scholar ] [ CrossRef ] [ PubMed ] [ نسخه سبز ]
- هولنشتاین، ال. Purves، R. کاوش مکان از طریق محتوای تولید شده توسط کاربر: استفاده از برچسب های Flickr برای توصیف هسته های شهر. جی. اسپات. Inf. علمی ۲۰۱۰ ، ۲۰۱۰ ، ۲۱-۴۸٫ [ Google Scholar ]
- فیک، ر. رابرتسون، سی. رویکرد چند مقیاسی برای کاوش مکانهای شهری در عکسهای دارای برچسب جغرافیایی. محاسبه کنید. محیط زیست سیستم شهری ۲۰۱۵ ، ۵۳ ، ۹۶-۱۰۹٫ [ Google Scholar ] [ CrossRef ]
- درونگس، سی. Purves، RS از متن تا منظره: مکان یابی، شناسایی و نقشه برداری استفاده از ویژگی های منظره در یک مجموعه آلپ سوئیس. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۴ ، ۲۸ ، ۱۲۷۲-۱۲۹۳٫ [ Google Scholar ] [ CrossRef ]
- شلتون، تی. پورتویس، ا. گراهام، ام. Zook, M. نقشه برداری از سایه های داده های طوفان سندی: کشف ابعاد اجتماعی فضایی “داده های بزرگ”. Geoforum ۲۰۱۴ ، ۵۲ ، ۱۶۷-۱۷۹٫ [ Google Scholar ] [ CrossRef ]
- رابرتسون، سی. فیک، آر. استنتاج و تجزیه و تحلیل در سراسر پشتیبانی های فضایی در عصر داده های بزرگ: مشاهدات نقطه ای نامشخص و زمینه های جغرافیایی. ترانس. GIS ۲۰۱۸ ، ۲۲ ، ۴۵۵-۴۷۶٫ [ Google Scholar ] [ CrossRef ]
- آنتونیو، وی. Skopeliti، A. اندازه گیری ها و شاخص های کیفیت VGI: یک مرور کلی. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی حاضر. ISPRS Geospatial Week ۲۰۱۵ ، II-3/W5 ، ۳۴۵-۳۵۱٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- Goodchild، MF; Li, L. اطمینان از کیفیت اطلاعات جغرافیایی داوطلبانه. تف کردن آمار ۲۰۱۲ ، ۱ ، ۱۱۰-۱۲۰٫ [ Google Scholar ] [ CrossRef ]
- فوکس، جی. آندرینکو، ن. آندرینکو، جی. Bothe، S. Stange, H. ردیابی سیل صدمین سالگرد آلمان در جریان توییت ها: اولین درس های آموخته شده. در مجموعه مقالات دومین کارگاه بین المللی ACM SIGSPATIAL در مورد اطلاعات جغرافیایی جمع آوری شده و داوطلبانه، اورلاندو، فلوریدا، ایالات متحده آمریکا، ۵ نوامبر ۲۰۱۳٫ انجمن ماشینهای محاسباتی: نیویورک، نیویورک، ایالات متحده آمریکا، ۲۰۱۳٫ صص ۳۱-۳۸٫ [ Google Scholar ]
- فودی، جنرال موتورز; ببینید، L. فریتز، اس. ون در ولده، م. پرگر، سی. شیل، سی. بوید، دی اس؛ Comber, A. نقشه برداری دقیق ویژگی از اطلاعات جغرافیایی داوطلبانه: مسائل کمیت و کیفیت داوطلب. کارتوگر. J. ۲۰۱۵ ، ۵۲ ، ۳۳۶-۳۴۴٫ [ Google Scholar ] [ CrossRef ]
- هاکلی، م. بسیوکا، اس. آنتونیو، وی. Ather، A. برای نقشه برداری خوب یک منطقه به چند داوطلب نیاز است؟ اعتبار قانون لینوس برای اطلاعات جغرافیایی داوطلبانه کارتوگر. J. ۲۰۱۰ , ۴۷ , ۳۱۵-۳۲۲٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- بریسابوا، NR; سردیرا-پنا، ا. دی برناردو، جی. ناوارو، جی. پدریرا، او. گسترش بازنمایی های جمع و جور عمومی قابل پرس و جو به برنامه های GIS. Inf. علمی ۲۰۲۰ ، ۵۰۶ ، ۱۹۶-۲۱۶٫ [ Google Scholar ] [ CrossRef ]
- گیگی، تی. گونزالس نوا، جی. لادرا، اس. ناوارو، جی. Seco, D. چهار درخت فشرده سریعتر. در مجموعه مقالات کنفرانس فشرده سازی داده ۲۰۱۵، Snowbird، UT، ایالات متحده آمریکا، ۷-۹ آوریل ۲۰۱۵٫ انجمن کامپیوتر IEEE: واشنگتن، دی سی، ایالات متحده آمریکا، ۲۰۱۵; صص ۹۳-۱۰۲٫ [ Google Scholar ]
- بروتر، پی. Weibel, R. تعمیم بیدرنگ داده های نقطه ای در نقشه برداری موبایل و وب با استفاده از چهار درخت. کارتوگر. Geogr. Inf. علمی ۲۰۱۳ ، ۴۰ ، ۲۷۱-۲۸۱٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- راماناتان، وی. میشرا، س. مدل فضای برداری توسعه یافته مبتنی بر تجزیه Quadtree برای بازیابی تصویر میترا، P. در مجموعه مقالات کارگاه IEEE 2011 در مورد کاربردهای بینایی کامپیوتری (WACV)، کونا، HI، ایالات متحده آمریکا، ۵ تا ۷ ژانویه ۲۰۱۱٫ انجمن کامپیوتر IEEE: واشنگتن، دی سی، ایالات متحده آمریکا، ۲۰۱۱; صص ۱۳۹-۱۴۴٫ [ Google Scholar ]
- ژانگ، سی. چن، آر. زو، ال. لیو، ا. لین، ی. Huang, F. چهار درخت اطلاعات سلسله مراتبی: جستجوی تصویر زمانی مکانی کارآمد برای جریان چند رسانه ای. چندتایی. ابزارهای کاربردی ۲۰۱۹ ، ۷۸ ، ۳۰۵۶۱–۳۰۵۸۳٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- Popinet، مدلسازی سونامی تطبیقی چهار درختی S. اوشن دین. ۲۰۱۱ ، ۶۱ ، ۱۲۶۱-۱۲۸۵٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- کیو، ال. دو، ز. زو، س. Fan, Y. یک سیستم مدیریت یکپارچه سیل مبتنی بر پیوند مدل های زیست محیطی و داده های مربوط به بلایا. محیط زیست مدل. نرم افزار ۲۰۱۷ ، ۹۱ ، ۱۱۱-۱۲۶٫ [ Google Scholar ] [ CrossRef ]
- Valles، G. AMOEBA: A Multidirectional Optimum Based Ecotope Algorithm ; بسته R; CRAN: تورنتو، ON، کانادا، ۲۰۱۴٫ [ Google Scholar ]
- کانرز، جی پی؛ لی، اس. کلی، ام. علم شهروندی در عصر نئوجغرافی: استفاده از اطلاعات جغرافیایی داوطلبانه برای نظارت بر محیط زیست. ان دانشیار صبح. Geogr. ۲۰۱۲ ، ۱۰۲ ، ۱۲۶۷-۱۲۸۹٫ [ Google Scholar ] [ CrossRef ]
- رابرتسون، سی. مک لمن، آر. لارنس، اچ. زمستان برای اسکیت زدن خیلی گرم است؟ سیتیزن-ساینس تنوع در دسترس بودن اسکیت در فضای باز را در کانادا گزارش کرده است. می توان. Geogr. جئوگراف می تواند. ۲۰۱۵ ، ۵۹ ، ۳۸۳-۳۹۰٫ [ Google Scholar ] [ CrossRef ]
- آمار کانادا داده های آب و هوایی تاریخی. در دسترس آنلاین: http://climate.weather.gc.ca/ (در ۱۲ دسامبر ۲۰۱۹ قابل دسترسی است).
- آمار کانادا جمعیت کلانشهرهای سرشماری. در دسترس آنلاین: http://www.statcan.gc.ca/tables-tableaux/sum-som/l01/cst01/demo05a-eng.htm (در ۲۶ مارس ۲۰۱۷ قابل دسترسی است).
- Mackaness، WA; چودری، او. ارزیابی صحت روشها برای استخراج معناشناسی مکان از برچسبهای فلیکر. ترانس. GIS ۲۰۱۳ ، ۱۷ ، ۵۴۴-۵۶۲٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- Truong، QT; دی رانز، سی. Touya, G. تجزیه و تحلیل شبکه های همکاری در OpenStreetMap از طریق کاوی چند گراف اجتماعی وزن دار. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۹ ، ۳۳ ، ۱۶۵۱-۱۶۸۲٫ [ Google Scholar ] [ CrossRef ]
- پوروز، آر. ادواردز، آ. Wood, J. توصیف مکان از طریق محتوای تولید شده توسط کاربر. اولین دوشنبه ۲۰۱۱ ۱۶ . [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- الوود، اس. گودچایلد، م. Sui, D. چشم انداز تحقیقات VGI و پارادایم چهارم در حال ظهور. در جمع سپاری دانش جغرافیایی ; Sui, D., Elwood, S., Goodchild, M., Eds. Springer: Dordrecht، هلند، ۲۰۱۳; صص ۳۶۱-۳۷۵٫ [ Google Scholar ]
- Mooney, P. درک فعالیت مشارکت کنندگان در پروژه های VGI. چگونه، چرا، کجا و چه زمانی اطلاعات جغرافیایی را ارائه می کنند؟ در مجموعه مقالات بیست و ششمین کنفرانس بین المللی کارتوگرافی (ICC)، درسدن، آلمان، ۲۵ تا ۳۰ اوت ۲۰۱۳٫ [ Google Scholar ]
- گاردنر، ز. مونی، پی. دی ساباتا، اس. Dowthwaite، L. کمیت کردن مشارکت جنسیتی در OpenStreetMap: پاسخ به نظریههای بازنمایی زن (تحت) در نقشهبرداری جمعسپاری. جئوژورنال ۲۰۱۹ ، ۱-۱۸٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- مک لافرتی، اس. اشنایدر، دی. آبلت، کی. قرار دادن اطلاعات داوطلبانه سلامت جغرافیایی: سوگیری اجتماعی- فضایی در دادههای گزارش ساس ۳۱۱ برای شهر نیویورک. Health Place ۲۰۲۰ , ۶۲ , ۱۰۲۲۸۲٫ [ Google Scholar ] [ CrossRef ]
- باستین، ال. Shade، S. Schill, C. مدیریت داده و ابرداده برای قابلیت استفاده مجدد بهتر VGI. در نقشه برداری و سنسور شهروند ; Foody, G., See, L., Fritz, S., Mooney, P., Olteanu-Raimond, A.-M., Fonte, C., Antoniou, V., Eds.; Ubiquity Press: لندن، بریتانیا، ۲۰۱۷؛ ص ۲۴۹-۲۷۲٫ [ Google Scholar ]
- براون، جی. مروری بر اثرات نمونهگیری و سوگیری پاسخ در نقشهبرداری مشارکتی اینترنتی (PPGIS/PGIS/VGI). ترانس. GIS ۲۰۱۷ ، ۲۱ ، ۳۹-۵۶٫ [ Google Scholar ] [ CrossRef ]
- میراحسان، م. شونن، آر. Szyszkowicz، SS; Yanikomeroglu، H. اندازه گیری ناهمگونی فضایی کاربران در فضای باز در شبکه های سلولی بی سیم بر اساس نقشه های شهری باز. در مجموعه مقالات کنفرانس بین المللی ارتباطات IEEE در سال ۲۰۱۵ (ICC)، لندن، بریتانیا، ۸ تا ۱۲ ژوئن ۲۰۱۵؛ انجمن کامپیوتر IEEE: واشنگتن، دی سی، ایالات متحده آمریکا، ۲۰۱۵; صص ۲۸۳۴-۲۸۳۸٫ [ Google Scholar ]
- فنگ، جی. ژانگ، ام. وانگ، اچ. یانگ، ز. ژانگ، سی. لی، ی. Jin, D. Dplink: پیوند هویت کاربر از طریق شبکه عصبی عمیق از داده های تحرک ناهمگن. در مجموعه مقالات کنفرانس وب جهانی، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، ۱۳ تا ۱۷ مه ۲۰۱۹؛ صص ۴۵۹-۴۶۹٫ [ Google Scholar ]
- زیلسترا، دی. Zipf، A. مطالعه مقایسه ای داده های جغرافیایی اختصاصی و اطلاعات جغرافیایی داوطلبانه برای آلمان. در مجموعه مقالات سیزدهمین کنفرانس بین المللی AGILE در علم اطلاعات جغرافیایی، گیماراس، پرتغال، ۱۱-۱۴ مه ۲۰۱۰٫ جلد ۲۰۱۰٫ [ Google Scholar ]
- گالپرن، پی. مانسو، م. ویلسون، P. دانه های اتصال: تجزیه و تحلیل در مقیاس های فضایی چندگانه در ژنتیک منظر. مول. Ecol. ۲۰۱۲ ، ۲۱ ، ۳۹۹۶-۴۰۰۹٫ [ Google Scholar ] [ CrossRef ]
- سستر، ام. جوکار ارسنجانی، ج. کلامر، آر. بورگاردت، دی. هاونرت، جی.-اچ. یکپارچه سازی و تعمیم اطلاعات جغرافیایی داوطلبانه. در چکیده اطلاعات جغرافیایی در یک دنیای غنی از داده ها: روش ها و کاربردهای تعمیم نقشه . Burghardt, D., Duchêne, C., Mackaness, W., Eds.; یادداشت های سخنرانی در اطلاعات جغرافیایی و نقشه برداری. انتشارات بین المللی Springer: چم، سوئیس، ۲۰۱۴; صص ۱۱۹-۱۵۵٫ [ Google Scholar ]
- Nayini، SEY; گراوند، س. مروسی، ع. یک روش جدید خوشهبندی مبتنی بر آستانه برای حل نقاط ضعف K-means. در مجموعه مقالات کنفرانس بین المللی انرژی، ارتباطات، تجزیه و تحلیل داده ها و محاسبات نرم (ICECDS)، چنای، تامیل نادو، هند، ۱ تا ۲ اوت ۲۰۱۷ در سال ۲۰۱۷؛ انجمن کامپیوتر IEEE: واشنگتن، دی سی، ایالات متحده آمریکا، ۲۰۱۷؛ ص ۴۷-۵۲٫ [ Google Scholar ]
- پاتل، KMA؛ Thakral, P. بهترین الگوریتم های خوشه بندی در داده کاوی. در مجموعه مقالات کنفرانس بین المللی ارتباطات و پردازش سیگنال ۲۰۱۶ (ICCSP)، Melmaruvathur، تامیل نادو، هند، ۶-۸ آوریل ۲۰۱۶؛ انجمن کامپیوتر IEEE: واشنگتن، دی سی، ایالات متحده آمریکا، ۲۰۱۶؛ صفحات ۲۰۴۲–۲۰۴۶٫ [ Google Scholar ]
- براون، جی. کلی، م. ویتال، دی. کدام «عمومی»؟ اثرات نمونه گیری در مشارکت عمومی GIS (PPGIS) و سیستم های اطلاعات جغرافیایی داوطلبانه (VGI) برای مدیریت اراضی عمومی. جی. محیط زیست. طرح. مدیریت ۲۰۱۴ ، ۵۷ ، ۱۹۰-۲۱۴٫ [ Google Scholar ] [ CrossRef ]
- Fonte, CC; آنتونیو، وی. باستین، ال. استیما، ج. ارسنجانی، ج. بایاس، J.-CL; ببینید، L. Vatseva, R. ارزیابی کیفیت داده های VGI. در نقشه برداری و سنسور شهروند ; Foody, G., See, L., Fritz, S., Mooney, P., Olteanu-Raimond, A.-M., Fonte, C., Antoniou, V., Eds.; Ubiquity Press: لندن، بریتانیا، ۲۰۱۷؛ صص ۱۳۷-۱۶۳٫ [ Google Scholar ]
شکل ۱٫ Tessellation Voronoi از داده های آزمایش عمومی ایجاد شده است.
شکل ۲٫ ( الف ) ایجاد شاخه چهار درختی توجه: مقادیر متریک به عنوان اعداد کامل برای اهداف تصویری نشان داده شده است. مقادیر متریک معمولاً بین ۰ و ۱ قرار می گیرند. ( ب ) مقادیر بازگشتی چهاردرخت.
شکل ۳٫ الگوریتم مجاورت چند ضلعی.
شکل ۴٫ سه نوع تسلاسیون: ( الف ) چند ضلعی های شبکه ای چهاردرخت در سمت چپ، ( ب ) در مرکز سرشماری، و ( ج ) چند ضلعی های ورونوی در سمت راست استفاده می شوند .
شکل ۵٫ با استفاده از چند ضلعی های Voronoi، یک سطح درون یابی اسپلاین بر اساس قابلیت اسکیت پیست مناسب است. سطوح چپ ( a ) مناطق بهینه با سطوح سمت راست ( b ) منطقه مورد مطالعه کامل را نشان می دهد. وزن اجزای شاخص پوشش ۳۳ درصد، ناهمگونی کاربر ۳۳ درصد و تراکم ۳۳ درصد است.
شکل ۶٫ با استفاده از چند ضلعی های Voronoi، یک سطح درون یابی اسپلاین بر اساس قابلیت اسکیت سواری مناسب است. سطوح چپ ( a ) مناطق بهینه با سطوح سمت راست ( b ) منطقه مورد مطالعه کامل را نشان می دهد. وزن اجزای شاخص پوشش ۵۰٪، ناهمگنی کاربر ۰٪ و تراکم ۵۰٪ است.
شکل ۷٫ امکان پذیرترین منطقه مطالعه بر اساس معیارهای پوشش بزرگ و شباهت داده ها. ( الف ) میزان بهینه؛ ( ب ) نمودار پراکنده موران I با شبکه های بهینه دایره شده. ( ج ) نمودار پراکندگی موران I بر روی شبکه های بهینه متمرکز شده است.
بدون دیدگاه