مقدمه

حوزه علم مکان‌یابی شامل مسائل مختلفی است که با هدف تعیین پیکربندی فضایی بهینه سیستم‌های خدماتی انجام می‌شود . ۱٫ مسئله مکان‌یابی هاب سلسله مراتبی (HHLP)، که اغلب در شبکه‌های حمل و نقل و ارتباطات استفاده می‌شود، یکی از حوزه‌های مسئله کلیدی در حوزه علم مکان‌یابی است. علاوه بر این، مسئله میانه هاب با تخصیص واحد (SA-H-MP) زیرحوزه‌ای از HHLP است که مجموعه‌ای از گره‌ها را به گره‌های تقاضا، گره‌های هاب و گره‌های هاب مرکزی سازماندهی می‌کند. ۲ ، ۳٫ اگرچه فرمول‌بندی‌های ریاضی و استراتژی‌های حل مختلفی برای HHLP و انواع آن در دسترس است، اما این حوزه مسئله فاقد دسترسی به مجموعه داده‌های معیار در مقیاس بزرگ و دنیای واقعی است که می‌توانند این حوزه تحقیقاتی را غنی کنند. تحقیقات در این زیرحوزه از علم مکان‌یابی عمدتاً به مجموعه داده‌های مصنوعی کوچک بستگی دارد، بنابراین ارتباط آنها با محیط‌های دنیای واقعی محدود است.

چندین مجموعه داده معیار کلاسیک، به ویژه مجموعه داده‌های هیئت هوانوردی غیرنظامی (CAB)، شبکه ترکیه (TN) و پست استرالیا (AP) نقش محوری در تحقیقات در حوزه مسئله مکان‌یابی هاب (HLP) ایفا کرده‌اند [ ۴ ، ۵ ، ۶] . این مجموعه داده‌ها به طور گسترده برای اعتبارسنجی فرمول‌های الگوریتمی و استراتژی‌های راه‌حل در زیردامنه‌های مختلف مورد استفاده قرار گرفته‌اند. با این حال، علیرغم برجستگی آنها، از محدودیت‌های مهمی رنج می‌برند که مناسب بودن آنها را برای HHLP محدود می‌کند. به طور خاص، این مجموعه داده‌ها در ابتدا برای پشتیبانی از ساختارهای هاب n لایه طراحی نشده بودند و ماهیت نسبتاً کوچک، ایستا و تجمیعی آنها، مقیاس‌پذیری و واقع‌گرایی را به ویژه در محیط‌های شهری محدود می‌کند. علاوه بر این، دانه‌بندی سطح ملی آنها، کاربرد محدودی را در چالش‌های برنامه‌ریزی شهری در سطح شهر مانند منطقه‌بندی، لجستیک اضطراری یا ارائه خدمات هوشمند ارائه می‌دهد. این مقاله با معرفی یک مجموعه داده معیار مقیاس‌پذیر، تکرارپذیر و شهری مبتنی بر داده‌های واقعی در سطح ساختمان از شهرهای هند – برای پشتیبانی از تحقیقات تجربی در فرمول‌های گسترده‌تر HHLP – به این شکاف‌ها می‌پردازد.

مدل SA-H-MP که رسماً توسط یامان ۷ معرفی شد ، شامل گره‌های تقاضا، گره‌های هاب (تسهیلات میانی) و گره‌های هاب مرکزی (هاب‌های سطح بالا) است که برای تشکیل یک شبکه n لایه‌ای ۸ کنار هم قرار گرفته‌اند . هدف اصلی SA-H-MP تعیین مکان بهینه هاب‌ها و هاب‌های مرکزی برای به حداقل رساندن هزینه کلی مسیریابی بین هر دو گره تقاضا است. SA-H-MP از یک مدل عدد صحیح مختلط استفاده می‌کند که در آن گره‌های تقاضا یا مستقیماً به یک هاب یا یک گره هاب مرکزی اختصاص داده می‌شوند و هر گره هاب به یک گره هاب مرکزی واحد ۲ اختصاص داده می‌شود . در نتیجه، در SA-H-MP هر گره لایه پایین‌تر حداکثر به یک گره لایه بالاتر متصل است. در این مرحله، می‌خواهیم اشاره کنیم که اصطلاحاتی مانند گره تقاضا، گره هاب و گره مرکزی ممکن است در متون مختلف متفاوت باشند، اما این اصطلاحات با قراردادهای نامگذاری پذیرفته شده در مدل‌های HHLP مطابقت دارند. برای درک جامع از فرمول‌بندی ریاضی مسائل SA-HM، لطفاً به «پیوست» مراجعه کنید. فرمول ریاضی، پیچیدگی‌های شبکه SA-H-MP را تشریح می‌کند و نمایش دقیقی از ساختار سه لایه آن را تسهیل می‌کند.

لازم به ذکر است که این مقاله یک راه‌حل الگوریتمی جدید برای HHLP پیشنهاد نمی‌کند، بلکه رویکردی جدید برای ساخت مجموعه داده‌های معیار برای SA-H-MP با استفاده از داده‌های بلادرنگ استخراج‌شده از OpenStreetMap و سیستم اطلاعات جغرافیایی کوانتومی (QGIS) ارائه می‌دهد. بر اساس روش پیشنهادی، دو مجموعه داده استاندارد به همراه این مقاله ارائه شده است. مجموعه داده‌ها بر اساس دو شهر بزرگ هند – کلکته و بمبئی – تهیه شده‌اند تا مقیاس‌پذیری و واقع‌گرایی آنها نشان داده شود. مجموعه داده‌های حاصل، همراه با راه‌حل دقیق آنها برای فرمول‌بندی مسئله SA-H-MP، برای پشتیبانی از تحقیقات آینده در HHLP و حوزه‌های مرتبط، در دسترس عموم قرار گرفته‌اند.

با ارائه یک چارچوب استاندارد و واقع‌بینانه برای ساخت مجموعه داده‌های معیار با استفاده از اطلاعات مکانی، هدف کار ما پرداختن به یک شکاف حیاتی در ادبیات HHLP و تسهیل مجموعه داده‌های قوی‌تر و قابل مقایسه‌تر برای تحقیقات آینده است. با وجود پیشرفت‌های حاصل شده در حوزه SA-H-MP، بسیاری از مطالعات بر روی شبکه‌هایی با حداکثر ۲۰۰ گره متمرکز شده‌اند که نمایش سناریوهای دنیای واقعی را محدود می‌کند. این محدودیت، نیاز به یک مخزن داده بلادرنگ اختصاص داده شده به اهداف تحقیقاتی را برجسته می‌کند و کمک ارزشمندی به جامعه ارائه می‌دهد. با توجه به در دسترس نبودن مجموعه داده‌ها برای پرجمعیت‌ترین شهرهای جهان، ما مجموعه داده‌هایی را به طور خاص برای کلکته و بمبئی، که دو کلان‌شهر پرجمعیت در هند هستند، ایجاد کرده‌ایم. روش شرح داده شده در این مقاله می‌تواند به عنوان مدلی برای تولید مجموعه داده‌های اضافی قابل مقایسه با این مجموعه داده‌های جدید عمل کند.

ممکن است مشخص شود که چندین کار در مورد HHLP شامل مطالعات محاسباتی و تولید نمونه است، اما اکثر آنها خود را به مجموعه داده‌های کوچک، مصنوعی یا تجمیعی محدود می‌کنند. برعکس، کار ما یک رویکرد گام به گام سیستماتیک برای توسعه مجموعه داده‌های معیار معتبر و در مقیاس بزرگ که به طور خاص برای SA-H-MP با استفاده از اطلاعات مکانی واقعی کلان‌شهرها طراحی شده‌اند، ارائه می‌دهد. این مطالعه نمونه‌های معیار را با استفاده از داده‌های جامع سطح ساختمان که با استفاده از OpenStreetMap و QGIS جمع‌آوری شده‌اند، تولید می‌کند. مجموعه داده‌های حاصل مقیاس‌پذیر، قابل تکرار و به طور خاص برای مدل‌های HHLP تنظیم شده‌اند. با انتشار عمومی داده‌ها و راه‌حل‌های دقیق به دست آمده با استفاده از IBM®ILOG®CPLEX®، هدف ما پر کردن شکاف حیاتی در ادبیات و پشتیبانی از تحقیقات تجربی دقیق در این زمینه است.

این مدل شامل شناسایی مجموعه‌ای مناسب از ارائه‌دهندگان خدمات، یعنی مرکز اصلی و گره‌های مرکزی است که از آنجا می‌توان خدمات را به طور مؤثر به گره‌های تقاضا پراکنده کرد. چیدمان فضایی به گونه‌ای طراحی شده است که با تقاضای ایجاد شده توسط مشتریان همسو باشد و شامل مجموعه‌ای از نقاط تقاضا باشد که نشان‌دهنده مکان‌های مشتری و مراکز خدماتی است که تقاضای خدمات ایجاد شده توسط مشتریان را تخمین می‌زنند. این کار با ارائه روشی برای تولید مجموعه داده‌ها و امکان‌پذیر کردن مطالعات آینده در مورد ساخت مدل و بهبود الگوریتمی در این حوزه، یک نیاز قابل توجه در ادبیات HHLP را هدف قرار می‌دهد. رویکردها و مجموعه داده‌های پیشنهادی نه تنها برای تسهیل تحقیقات HHLP مرسوم در نظر گرفته شده‌اند، بلکه می‌توانند برای بررسی محدودیت‌های موردی از جمله تراکم شهری، قوانین منطقه‌بندی به ویژه در چارچوب شهرهای پرجمعیت هند نیز مورد استفاده قرار گیرند.

ترکیبی از QGIS و OpenStreetMap برای ساخت مجموعه داده‌های گسترده ما مورد استفاده قرار گرفت که برای محاسبه راه‌حل بهینه یا دقیق برای مدل SA-H-MP ۹ ، ۱۰ به کار گرفته می‌شوند. تا آنجا که ما می‌دانیم، این مطالعه تلاش اولیه برای تولید مجموعه داده‌های بزرگ با استفاده از QGIS و OpenStreetMap برای SA-H-MP است. این مجموعه داده نه تنها برای مدل SA-H-MP، بلکه برای سایر مدل‌های HHLP نیز طراحی شده است.

بررسی ادبیات

اگرچه HLP در ابتدا با ایده‌ای برای افزایش بهره‌وری در شبکه‌های حمل و نقل و مخابرات مطرح شد، اما در سال‌های اخیر، دامنه آن از طراحی شبکه مرسوم هاب و اسپوک به طرح‌های پیچیده با محدودیت‌های معمول در دنیای واقعی تکامل یافته است. اوکلی معماری پایه مکان‌یابی هاب را پیشنهاد کرد که در آن هاب‌ها به عنوان گره‌های اتصال عمل می‌کنند تا با گروه‌بندی گره‌ها در یک شبکه، هزینه‌های کلی حمل و نقل را کاهش دهند . ۱۱ به طور مشابه، کمپبل و متعاقباً آلومور و کارا، چندین مدل از جمله مسائل میانه p-هاب، مرکز p-هاب و پوشش هاب را برای حل چالش‌های واقع‌بینانه‌تر در این حوزه پیشنهاد کردند. ۱۲ ، ۱۳ .

در سال‌های اخیر، مطالعات کامل بسیاری به بهبود بیشتر این رشته کمک کرده‌اند. فراهانی و همکارانش مطالعه‌ای دقیق از مدل‌های HLP، طبقه‌بندی‌ها و کاربردهای عملی آنها ارائه می‌دهند و همچنین بر نیاز به مجموعه داده‌های بلادرنگ برای پر کردن شکاف بین تئوری و پیاده‌سازی عملی تأکید می‌کنند . ۱۴٫ کنترراس و اوکلی در کار خود، مروری جامع بر مدل‌سازی مکان‌یابی هاب در کتابچه راهنمای علوم مکان‌یابی ارائه می‌دهند که دیدگاه‌های کلاسیک و مدرن را با هم ترکیب می‌کند . ۱۵٫ اخیراً، آلومور و همکارانش تغییر الگوی مدل‌های HLP به روندهای مدل‌سازی معاصرتر را مورد بحث قرار می‌دهند و بر ضرورت نمونه‌های داده واقع‌گرایانه و مقیاس‌پذیر برای اعتبارسنجی تجربی تأکید می‌کنند. ۱۶٫ بنابراین، این مطالعات توجه را به اجماع فزاینده در مورد نیاز به مجموعه داده‌های با کیفیت بالا و در دسترس عموم در دنیای واقعی برای ارزیابی اثربخشی و استحکام HLPها جلب می‌کنند. سهم ما در این مقاله نیز همین هدف را دنبال می‌کند تا روشی برای تولید مجموعه داده‌های معیار در مقیاس بزرگ که به ویژه برای مدل‌های HHLP ایجاد شده‌اند، ارائه دهد و در نتیجه، ستون فقرات تجربی این حوزه را تقویت کند.

بررسی‌های انجام شده توسط ساهین و سورال و داوری و همکاران، درک دقیق‌تری از مدل‌های HHLP و کاربردهای دنیای واقعی آنها ارائه می‌دهد [۱۷ ، ۱۸] . بر اساس این پایه، HHLP از معماری دو سطحی هاب-اسپوک پایه خود به یک معماری چند لایه که معمولاً به صورت هاب مرکزی و گره‌های هاب مرتب شده است، گسترش می‌یابد. این معماری چند لایه، سیستم‌های بلادرنگ در مقیاس بزرگ مانند خدمات پستی و عملیات هواپیمایی را به طور دقیق شبیه‌سازی می‌کند. برای هدف قرار دادن یک دامنه مسئله n لایه خاص تحت HHLP، ما با SA-H-MP کار کرده‌ایم که رسماً توسط یامان [ ۷] معرفی شد .

مجموعه داده‌های معیار مانند CAB، TN و AP پایه تجربی طیف وسیعی از مطالعات HLP را تشکیل داده‌اند. این مجموعه داده‌ها بر اساس شبکه‌های حمل و نقل قدیمی یا مسیرهای پستی ساخته شده‌اند و برای معماری‌های کلاسیک hub-spoke ۷ ، ۱۳ مناسب هستند . با این حال، کاربرد آنها در زمینه‌های سلسله مراتبی، شهری یا جغرافیایی مدرن محدود است. نکته قابل توجه این است که آنها فاقد وضوح ساختاری برای مدل‌سازی سلسله مراتب لایه‌ای موجود در SA-H-MP و فرمول‌های مشابه هستند. علاوه بر این، اندازه و دامنه ثابت این مجموعه داده‌ها مانع از سازگاری آنها با سناریوهایی می‌شود که نیاز به پهنه‌بندی دقیق یا نقشه‌برداری جمعیتی در زمان واقعی دارند. چندین بررسی اخیر بر نیاز به مجموعه داده‌های معیار واقع‌گرایانه‌تر و مقیاس‌پذیرتر که منعکس کننده محدودیت‌های در حال تحول دنیای واقعی باشند، تأکید کرده‌اند ۱۴ ، ۱۵٫ مجموعه داده‌های شهری پیشنهادی هند (IUD) ما مستقیماً با ارائه یک مجموعه داده مبتنی بر شهر با وضوح بالا با استفاده از توزیع ساختمان‌های واقعی از کلکته و بمبئی، به این نیاز پاسخ می‌دهد و مدل‌سازی دقیق‌تر و اعتبارسنجی الگوریتمی را در مطالعات HHLP امکان‌پذیر می‌سازد.

از آنجایی که این مقاله به مجموعه داده‌های HHLP می‌پردازد، بنابراین باید برخی از مجموعه داده‌های معیار محبوب که اغلب در این حوزه استفاده می‌شوند را برجسته کنیم. چندین مجموعه داده معیار از لحاظ تاریخی از تحقیقات در HLPها پشتیبانی کرده‌اند، به ویژه مجموعه داده‌های CAB، TN و AP ۷ ، ۱۳ ، ۱۹٫ برای هر دو مسئله مکان‌یابی هاب کلاسیک و سلسله مراتبی، این مجموعه داده‌ها به عنوان استاندارد در بسیاری از مطالعات عمل کرده‌اند. با این حال، این مجموعه داده‌ها معمولاً مبتنی بر شبکه‌های حمل و نقل قدیمی یا ساختارهای مصنوعی هستند و تراکم شهری و پیچیدگی‌های مشاهده شده در شهرهای به سرعت در حال رشد، به ویژه در کشورهای در حال توسعه مانند هند را منعکس نمی‌کنند. کار ما با ایجاد مجموعه داده‌های جدید در مقیاس بزرگ دنیای واقعی بر اساس توزیع واقعی ساختمان‌ها در کلان‌شهرهایی مانند کلکته و بمبئی، این شکاف را برطرف می‌کند.

مجموعه داده‌ها

مجموعه داده‌های ارائه شده در این مطالعه بر اساس طرح‌های جغرافیایی کلکته و بمبئی، دو شهر بزرگ هند، تهیه شده‌اند. این انتخاب با توجه به اهمیت این کلان‌شهرها، که نمایانگر مناظر شهری متنوع در مناطق شرقی و غربی کشور هستند، توجیه می‌شود. کلکته، به عنوان پایتخت بنگال غربی، به عنوان یک قطب فرهنگی پرجمعیت شناخته می‌شود، در حالی که بمبئی، پایتخت ماهاراشترا، به عنوان مرکز مالی هند مشهور است. تجزیه و تحلیل این شهرها بینش‌های ارزشمندی در مورد پیکربندی‌های فضایی ارائه می‌دهد که می‌تواند در محیط‌های شهری متنوع اعمال شود و آنها را به معیارهای مناسبی برای جامعه تحقیقاتی تبدیل کند.

کلکته با مساحتی بالغ بر ۱۴۸۰ کیلومتر مربع و جمعیتی بالغ بر ۴,۴۹۶,۶۹۴ نفر، یکی از پرجمعیت‌ترین کلان‌شهرهای جمهوری هند است. ۲۰. شکل  ۱ الف، بخش‌های شرکت شهرداری کلکته (KMC) را نشان می‌دهد. ما همچنین داده‌هایی در مورد بمبئی، یکی دیگر از کلان‌شهرهای بسیار مشهور هند، به دست آورده‌ایم . ۲۱ و مجموعه داده‌ها را برای هر دو شهر ایجاد کرده‌ایم. بمبئی در ساحل کونکان واقع شده و دارای یک بندر طبیعی قابل توجه است. بمبئی به عنوان قطب مالی و تجاری هند عمل می‌کند. بخش‌های شرکت شهرداری بمبئی در شکل  ۱ ب نشان داده شده است و اطلاعات اولیه در مورد منطقه جغرافیایی که معیارهای ما را تشکیل می‌دهد، در جدول ۱ نشان داده شده است .

شکل ۱
شکل ۱

بخش‌هایی از شرکت شهرداری.

جدول ۱ اطلاعات جمعیت‌شناختی کلکته و بمبئی.

سیستم‌های خدماتی اغلب حوزه‌های گسترده‌ای را در بر می‌گیرند که برای طراحی مؤثر و ارزیابی کیفیت، به داده‌های قابل توجهی نیاز دارند. مشتریان معمولاً توسط مجموعه‌ای از نقاط تقاضا نمایش داده می‌شوند که تصویری فضایی از توزیع آنها ارائه می‌دهد. در سناریوهایی که یک سیستم خدماتی برای ارائه خدمات به کل جامعه طراحی شده است، فرض بر این است که همه شهروندان مشتری هستند و تقاضا برای خدمات با جمعیت همبستگی دارد. با این حال، اگر سیستم زیرمجموعه خاصی از جمعیت را هدف قرار دهد (مثلاً کودکان در یک سن خاص)، استخراج تقاضا صرفاً از داده‌های مربوط به کل جمعیت ممکن است نتایج گمراه‌کننده‌ای به همراه داشته باشد . ۲۲

در این مطالعه، ما همبستگی بین تقاضای مصرف‌کننده و تراکم ساختمان‌ها در یک شهر را برقرار می‌کنیم و فرض می‌کنیم که افزایش تراکم ساختمان با تعداد بیشتر مشتریان بالقوه در منطقه مطابقت دارد. با در نظر گرفتن هر سازه در یک منطقه شهری به عنوان یک نقطه تقاضای بالقوه، تعداد کل نقاط تقاضا هنگام مدل‌سازی شبکه‌های خدمات شهری قابل توجه خواهد بود. با استفاده از QGIS، در مجموع ۱۹۲۱۵۸ و ۷۴۲۷۴ سازه را به ترتیب در کلکته و بمبئی شناسایی کردیم. کل مجموعه به چندین زیر واحد، از ۱۰۰ واحد تا ۲۰۰۰ واحد، تقسیم شده است. واحدهای مورد بررسی را می‌توان به عنوان مناطق مفهوم‌سازی کرد و از الگوریتم خوشه‌بندی معروف K-means برای ساخت این مناطق استفاده شده است. بخش زیر مقایسه‌ای بین مجموعه داده‌های ما و چندین معیار شناخته شده در ادبیات ارائه می‌دهد و ویژگی‌ها و سهم متمایز IUD را برجسته می‌کند.

مقایسه با مجموعه داده‌های معیار موجود

همانطور که در بخش « مرور ادبیات » ذکر شد، چندین مجموعه داده معیار شناخته شده، به ویژه مجموعه داده‌های CAB، TN و AP، در HLPها استفاده شده‌اند. مطالعات انجام شده توسط یامان، آلومور و همکاران، و دوکانچی و کارا نشان می‌دهد که این مجموعه داده‌ها به طور گسترده برای انواع مختلف مدل‌های HHLP استفاده شده‌اند ۷ ، ۱۳ ، ۱۹٫ یک مطالعه تطبیقی ​​​​دقیق توسط ستیاوان و همکاران، نقاط قوت و ضعف این مجموعه داده‌ها را در ارزیابی فرمولاسیون‌های HLPهای مختلف نشان می‌دهد ۲۳٫ اگرچه ما اهمیت اساسی این مجموعه داده‌ها را می‌دانیم، اما سهم ما از نظر مقیاس، جزئیات و موارد استفاده مورد نظر به طور قابل توجهی متفاوت است. ویژگی‌های کلیدی متمایز IUD به شرح زیر است:

  1. ۱.ویژگی‌های کلان‌شهری IUD ذاتاً نشان‌دهنده تراکم ناهمگن شهری است که از اطلاعات مکانی-فضایی در سطح ساختمان به صورت بلادرنگ از OpenStreetMap و QGIS برای دو شهر پرجمعیت هند، کلکته و بمبئی، ساخته شده و توزیع واقعی زیرساخت‌های ساختمانی در این شهرها را منعکس می‌کند. این ویژگی‌ها امکان مدل‌سازی چالش‌های خاص سیستم‌های خدمات شهری مانند لجستیک اضطراری یا مداخلات بهداشت عمومی را فراهم می‌کنند.
  2. ۲.پیکربندی‌های مقیاس‌پذیر مجموعه داده‌های ما درجات مختلفی از جزئیات، از ۱۰۰ تا ۲۰۰۰ منطقه، را ارائه می‌دهند. این امر به محققان اجازه می‌دهد تا الگوریتم‌ها و راه‌حل‌های پیشنهادی خود را در اندازه‌های مختلف نمونه ارزیابی کنند، که با مجموعه داده‌های معیار مرسوم ثابت و در مقیاس کوچک، انعطاف‌پذیری کمتری دارد.
  3. ۳.ویژگی هاب سلسله مراتبی اگرچه مجموعه داده‌های معیار کلاسیک در مطالعات مختلف مکان‌یابی هاب مورد استفاده قرار گرفته‌اند، اما در ابتدا برای پشتیبانی از ساختارهای سلسله مراتبی n لایه طراحی نشده‌اند. این مجموعه داده‌ها عموماً شبکه‌های هاب-اسپوک تک لایه را نشان می‌دهند و برای تطبیق با HHLPها نیاز به تطبیق گسترده‌ای شامل فرضیات مصنوعی دارند. در مقابل، IUD به طور خاص برای مدل‌های هاب سلسله مراتبی ساخته شده است. این مدل از داده‌های مکانی-فضایی در سطح ساختمان در دنیای واقعی برای ایجاد ساختارهای مبتنی بر منطقه چند لایه استفاده می‌کند که مستقیماً با فرمول‌های سلسله مراتبی همسو هستند. در نتیجه، IUD منجر به دقت مدل‌سازی بیشتر، آسان‌تر شدن پیش‌پردازش و بهبود واقع‌گرایی برای برنامه‌های کاربردی شامل شبکه‌های خدماتی پیچیده، مانند لجستیک اضطراری و برنامه‌ریزی شهری می‌شود.
  4. ۴.سازگاری و تکرارپذیری فرآیند تولید مجموعه داده‌های ما کاملاً مستند و قابل تکرار است. برنامه‌ریزی شهری پویا و طراحی شبکه خدمات، این رویکرد را ایده‌آل می‌داند زیرا می‌تواند به راحتی برای سایر شهرها اصلاح شود یا با ویژگی‌های حساس به زمان (مانند تغییرات جمعیت، روند تقاضا) به‌روزرسانی شود.

این ویژگی‌ها، IUD ما را به یک افزونه‌ی مفید و نه جایگزین برای مجموعه داده‌های معیار کلاسیک، به ویژه برای محققانی که روی HHLPها و همچنین لجستیک شهری مدرن کار می‌کنند، تبدیل می‌کند. مجموعه داده‌های IUD به ویژه برای برنامه‌ریزی شهر هوشمند مفید است، جایی که خدمات شهری از طریق رویکردهای مبتنی بر داده، زیرساخت‌های دیجیتال و تجزیه و تحلیل مکانی بهینه می‌شوند. جزئیات و سازگاری مجموعه داده‌ها، آن را برای کاربردهایی مانند لجستیک اضطراری، مکان‌یابی امکانات عمومی و منطقه‌بندی حمل و نقل در محیط‌های شهری متصل به دیجیتال مناسب می‌کند.

برای برجسته کردن ویژگی‌ها و سهم متمایز IUD در زمینه مسائل مکان‌یابی هاب سلسله مراتبی، خلاصه‌ای مقایسه‌ای از مجموعه داده‌های معیار رایج ارائه می‌دهیم. جدول ۲ ، IUD را با مجموعه داده‌های CAB، TN و AP در ابعاد مختلف مقایسه می‌کند. این مقایسه، اهمیت IUD را برای کاربردهای مدل‌سازی واقع‌گرایانه، مقیاس‌پذیر و متمرکز بر شهر برجسته می‌کند.

جدول ۲٫ تحلیل مقایسه‌ای مجموعه داده‌های معیار در مسئله مکان‌یابی هاب سلسله مراتبی.

نرم‌افزار، سخت‌افزار، روش و نتایج

این بخش رویه‌های مربوط به ابزارهای نرم‌افزاری و سخت‌افزاری مورد استفاده برای ایجاد مجموعه داده‌ها و به دست آوردن نتایج برای مسائل SA-H-MP را پوشش می‌دهد.

نرم‌افزار و سخت‌افزار

این ویژگی‌ها، IUD ما را به یک افزونه‌ی مفید و نه جایگزینی برای مجموعه داده‌های معیار کلاسیک، به ویژه برای محققانی که روی HHLPها و همچنین لجستیک شهری مدرن و برنامه‌ریزی شهر هوشمند کار می‌کنند، تبدیل می‌کند. برای روشن‌تر شدن بیشتر تمایزات بین مجموعه داده‌ها و برجسته کردن سهم منحصر به فرد IUD، خلاصه‌ای مقایسه‌ای را در جدول ۲ ارائه می‌دهیم . این جدول تجزیه و تحلیل مقایسه‌ای مختصری از ویژگی‌های کلیدی بین مجموعه داده‌های CAB، TN، AP و IUD ارائه می‌دهد. مجموعه داده‌های ارائه شده و راه‌حل دقیق آن برای فرمول‌بندی SA-H-MP حاصل از تولید و پردازش داده‌ها با استفاده از سیستم اطلاعات جغرافیایی کوانتومی (QGIS)، OpenStreetMap (OSM) و IBM ILOG CPLEX است. این ابزارها به طور جمعی در ایجاد و تجزیه و تحلیل مجموعه داده‌ها نقش دارند و رویکردی جامع را برای رسیدگی به اهداف تحقیق تضمین می‌کنند. تمام آزمایش‌ها بر روی Lenovo thinkcentre- m ۹۰۰ با پردازنده Intel ® Core TM i7-6700 با فرکانس ۳٫۴۰ گیگاهرتز و ۳۲ گیگابایت رم انجام شده است.

روش‌ها

در این بخش، فرآیند تولید مجموعه داده‌های معیار به تفصیل شرح داده شده است. برای حل مسئله SA-H-MP، مجموعه داده‌ها باید از دو ماتریس تشکیل شده باشد. یک ماتریس باید شامل هزینه‌های حمل و نقل بین تمام جفت گره‌ها باشد، در حالی که ماتریس دیگر باید فرکانس ارتباط بین هر جفت گره را به صورت وزن نشان دهد. مراحل تولید مجموعه داده‌ها به شرح زیر است. مراحل ذکر شده در شکل  ۲ نشان داده شده است . ماتریس‌های هزینه و وزن تولید شده در مراحل ۳ و ۵، به ترتیب، برای حل SA-H-MP استفاده می‌شوند.

  1. ۱.بازیابی اطلاعات از QGIS اطلاعات مربوط به تمام ساختمان‌های یک شهر خاص با استفاده از ابزار QuickOSM در QGIS بازیابی می‌شود. در این آزمایش، ساختمان‌ها به عنوان چندچندضلعی در نظر گرفته می‌شوند و مکان‌های آنها سپس با استفاده از ابزار Polygon Centroids در QGIS از چندچندضلعی به مختصات نقطه‌ای تبدیل می‌شوند. این ابزار نقطه‌ای را در مرکز هندسی چندضلعی قرار می‌دهد و ویژگی‌های چندضلعی را حفظ می‌کند (شکل  ۲ الف).
  2. ۲.اعمال تکنیک خوشه‌بندی برای تهیه ماتریس مرکز ثقل برای هر منطقه تکنیک خوشه‌بندی معروف K-means برای تقسیم همه ساختمان‌ها به چندین منطقه (مثلاً X ) اعمال می‌شود. تعداد مناطق در نظر گرفته شده ۱۰۰، ۳۰۰، ۴۰۰، ۵۰۰، ۶۰۰، ۸۰۰، ۹۰۰، ۱۰۰۰ و ۲۰۰۰ است. این رویکرد یک ماتریس مرکز ثقل تولید می‌کند که منعکس کننده مرکز ثقل همه این مناطق X است. به عنوان مثال، وجود ۱۰۰ منطقه نشان می‌دهد که ساختمان‌های شهر در ۱۰۰ خوشه طبقه‌بندی شده‌اند. مرکز ثقل هر منطقه مربوط به یک نقطه یا ساختمان خاص است که ممکن است به عنوان یک گره تقاضا، قطب یا مرکز اصلی برای کل منطقه عمل کند (شکل  ۲ ب).
  3. ۳.تولید ماتریس هزینه با صفر کردن عناصر قطری، یک ماتریس متقارن تولید می‌شود که شامل فاصله بین هر جفت از مراکز هر یک از مناطق X است. فاصله اقلیدسی بین هر جفت از بردارها در ماتریس مرکز محاسبه می‌شود. این ماتریس فاصله به عنوان ماتریس هزینه عمل می‌کند. همانطور که در شکل  ۲c نشان داده شده است ، فاصله مرکز از همه خوشه‌های دیگر نشان داده شده است و فاصله آن به صورت نشان داده شده است ، که در آن j شاخص همه خوشه‌های دیگر است. به این ترتیب، ماتریس هزینه برای همه خوشه‌ها پر می‌شود.
  4. ۴.نگاشت مرکز ثقل ساختمان‌ها بر اساس فاصله بین مختصات ساختمان‌ها و بردارهای ماتریس مرکز ثقل، هر ساختمان به نزدیکترین مرکز ثقل اختصاص داده می‌شود. تعداد تمام ساختمان‌های نگاشت شده نسبت به هر مرکز ثقل در ماتریس شمارش ذخیره می‌شود (فرض کنید این ماتریس شمارش تک بعدی C باشد ). ماتریس شمارش نشان داده شده در شکل  ۲d ، تعداد ساختمان‌ها را در خوشه‌های ۱، ۲ و ۳ (همه خوشه‌ها) ذخیره می‌کند.
  5. ۵.تولید ماتریس وزن ماتریس شمارش C برای تولید ماتریس وزن ( W ) استفاده می‌شود که مجموع تعداد تمام ساختمان‌هایی را که توسط تمام جفت‌های مراکز موجود در ماتریس مرکز داده می‌شوند، ذخیره می‌کند. همانطور که در شکل  ۲d از C نشان داده شده است، ما ماتریس وزن متقارن با را تولید می‌کنیم که در آن i و j شاخص‌های خوشه‌ها هستند. در ماتریس وزن، عناصر قطری صفر فرض می‌شوند زیرا در یک خوشه، ارتباط بین گره‌ها شامل شبکه معمولی SA-H-MP نمی‌شود، بلکه می‌تواند در داخل خوشه حل شود.
شکل ۲
شکل ۲

مراحل تولید مجموعه داده

نتایج

در این بخش، ما مراکز ثقل مورد استفاده برای تقسیم کل مناطق کلکته و بمبئی به تعداد مختلفی از مناطق، به ویژه مناطق ۱۰۰، ۳۰۰، ۴۰۰، ۵۰۰، ۱۰۰۰ و ۲۰۰۰ را نشان می‌دهیم. تفکیک منطقه‌ای مربوطه کلکته و بمبئی به ترتیب در شکل‌های  ۳ الف تا و ۴ الف تا و ارائه شده است. شکل  ۵ تصویر بزرگنمایی شده‌ای از بخش شمالی شهر کلکته پس از تقسیم به ۱۰۰ منطقه را نشان می‌دهد. جدول ۳ راه‌حل‌های دقیق به‌دست‌آمده با استفاده از IBM ILOG CPLEX را برای مناطق ۱۰۰، ۳۰۰، ۴۰۰، ۵۰۰ و ۱۰۰۰ در شهرهای کلکته و بمبئی نشان می‌دهد. نتایج جدول ۳ برای مراجعه سریع محققانی که قصد استفاده از این مجموعه داده‌ها و پیاده‌سازی الگوریتم‌های خود را دارند، ارائه شده است. نتایج بهینه برای توابع هدف در اینجا همراه با زمان مورد نیاز برای دستیابی به این نتایج ارائه شده است.

شکل ۳
شکل ۳

شهر کلکته به مناطقی تقسیم شده است که نقاط، نشان‌دهنده‌ی مراکز این مناطق هستند.

شکل ۴
شکل ۴

شهر بمبئی به مناطقی تقسیم شده است که نقاط، نشان‌دهنده‌ی مراکز ثقل این مناطق هستند.

شکل ۵
شکل ۵

بخش شمالی شهر کلکته برای شکل  ۳ الف بزرگنمایی شده است.

جدول ۳٫ جواب‌های تابع هدف به‌دست‌آمده با استفاده از CPLEX برای کلکته و بمبئی.

سازماندهی فایل

در این مقاله، ما نه مجموعه داده معیار مختلف را با در نظر گرفتن مناطق ۱۰۰، ۳۰۰، ۴۰۰، ۵۰۰، ۶۰۰، ۸۰۰، ۹۰۰، ۱۰۰۰ و ۲۰۰۰ برای شهرهای کلکته و بمبئی ارائه می‌دهیم. هزینه و وزن همه معیارها برای هر دو شهر محاسبه شده است. فایل‌های shapefile که می‌توانند در یک ابزار GIS باز شوند و فایل‌های متنی csv قابل ویرایش برای همه معیارها در وب‌سایت زیر موجود است: https://data.mendeley.com/datasets/sttdkdd2vz/1 . نحوه چیدمان فایل‌ها در زیر مورد بحث قرار گرفته است:

  1. ۱.پوشه BuildingShape شامل دو پوشه KolkataBuildingShape و MumbaiBuildingShape است. این پوشه‌ها shapefile و فایل‌های مرتبط با آن را که به ترتیب اطلاعات مربوط به تمام ساختمان‌های کلکته و بمبئی را ذخیره می‌کنند، ذخیره می‌کنند.
  2. ۲.پوشه WeightMatrix شامل دو زیرپوشه WeightMatrixKolkata و WeigthMatrixMumbai است. پوشه WeightMatrixKolkata شامل نه فایل csv است که وزن مربوط به همه گره‌ها را پس از تفکیک شهر کلکته بین مناطق مختلف ذخیره می‌کند. هر فایل csv شامل یک ماتریس دوبعدی است که وزن/تعداد گره‌های مورد نیاز ارائه شده توسط هر جفت گره/مرکزوار را ذخیره می‌کند. به طور مشابه، پوشه WeigthMatrixMumbai نه فایل csv حاوی وزن برای نه منطقه مختلف شهر بمبئی را ذخیره می‌کند.
  3. ۳.پوشه CostMatrix شامل دو زیرپوشه CostMatrixKolkata و CostMatrixMumbai است. پوشه CostMatrixKolkata شامل نه فایل csv است که هزینه مربوط به همه گره‌ها را پس از تفکیک شهر کلکته بین مناطق مختلف ذخیره می‌کند. هر فایل csv شامل یک ماتریس دوبعدی است که شامل هزینه/فاصله بین هر جفت گره/مرکزوار است. به طور مشابه، پوشه CostMatrixMumbai نه فایل csv را ذخیره می‌کند که شامل هزینه نه منطقه مختلف شهر بمبئی است.
  4. ۴.نتایج پوشه شامل راه‌حل دقیق برای مناطق ۱۰۰، ۳۰۰، ۴۰۰، ۵۰۰ و ۱۰۰۰ با ترکیبات مختلف هاب مرکزی، تعداد هاب و همچنین برای ترکیبات و

کاربردها و نحوه استفاده از مجموعه داده‌ها

مجموعه داده‌های معیار توسعه‌یافته در این مطالعه به عنوان یک منبع اساسی برای محققانی که در حوزه HHLP، به ویژه SA-H-MP، کار می‌کنند، عمل می‌کنند. در زیر، چندین کاربرد بالقوه این مجموعه داده‌ها را شرح می‌دهیم:

  1. ۱.الگوریتم‌های بهینه‌سازی معیار: محققان می‌توانند از مجموعه داده‌های ارائه شده برای ارزیابی اثربخشی الگوریتم‌های جدید از پیش موجود که برای پرداختن به HHLPهای مختلف طراحی شده‌اند، استفاده کنند. راه‌حل‌های دقیق تولید شده توسط IBM ILOG CPLEX، مراجع پایه قوی برای ارزیابی کیفیت راه‌حل‌ها و کارایی الگوریتم‌ها فراهم می‌کند.
  2. ۲.آزمایش مقیاس‌پذیری و پایداری: با این نمونه‌های موجود از ۱۰۰ تا ۲۰۰۰ منطقه، کاربران می‌توانند ارزیابی کنند که الگوریتم‌های پیشنهادی آنها با اندازه و پیچیدگی‌های مختلف مسئله چقدر خوب کار می‌کنند. این امر به ویژه برای ارزیابی عملکرد الگوریتم‌ها در مجموعه داده‌های مکانی دنیای واقعی مفید است.
  3. ۳.طراحی سیستم خدمات شهری: از آنجایی که این مجموعه داده‌های بزرگ مبتنی بر طرح‌های واقعی کلان‌شهرها هستند، بنابراین می‌توان از آنها در مطالعات عملی مانند خدمات اورژانسی، مسیریابی لجستیک و غیره استفاده کرد.
  4. ۴.آزمایش بین مدلی: اگرچه مجموعه داده‌ها با در نظر گرفتن مدل SA-H-MP ساخته شده‌اند، اما با مدل‌های مختلف HHLP دیگر نیز قابل تطبیق است. محققانی که روی مدل‌هایی با محدودیت‌های اضافی مانند بودجه، پوشش و غیره کار می‌کنند، می‌توانند این مجموعه داده‌های مکانی را برای آزمایش‌های خود سفارشی کنند.
  5. ۵.منبع آموزشی و تربیتی: مجموعه داده‌های کامل به همراه فایل‌های پشتیبان (shapefileها، ماتریس‌ها و راه‌حل‌های دقیق) به عنوان یک مطالعه موردی در دنیای واقعی برای آموزش علوم مکان‌یابی و تحقیق در عملیات در محیط‌های دانشگاهی عمل می‌کند.

نتیجه‌گیری

HHLP و طبقه‌بندی‌های مختلف آن فاقد مجموعه داده‌هایی هستند که بتوان از آنها برای آزمایش مدل‌های ریاضی پیشنهادی محققان استفاده کرد. این مطالعه روشی را برای ایجاد مجموعه داده‌های معیار با داده‌های جغرافیایی و جمعیتی واقعی ارائه می‌دهد و به عدم دسترسی به مجموعه داده‌های دنیای واقعی در مقیاس بزرگ در حوزه HHLP می‌پردازد. با استفاده از روش پیشنهادی، ما مجموعه داده‌هایی را بر اساس کلکته و بمبئی، دو شهر پرجمعیت هند، با استفاده از داده‌های سطح ساختمان ایجاد کرده‌ایم. نمونه‌هایی از ۱۰۰ تا ۲۰۰۰ منطقه تولید می‌شوند و همه این مجموعه داده‌ها و راه‌حل‌های دقیق آنها در حوزه عمومی برای جامعه محققان در دسترس قرار می‌گیرد. رویکرد ما قصد دارد به عنوان یک مخزن داده و به عنوان یک چارچوب روش‌شناختی عمل کند که می‌تواند برای تولید مجموعه داده‌ها برای سایر مکان‌های جغرافیایی نیز مورد استفاده قرار گیرد. این کار الگوریتم‌ها، محدودیت‌ها یا مدل‌های جدیدی را پیشنهاد نمی‌کند، بلکه به مسئله قدیمی کمبود مجموعه داده‌ها در حوزه علوم مکان می‌پردازد. این مقاله یک روش دقیق برای تولید مجموعه داده‌ها و برخی مجموعه داده‌های معیار برای ارزیابی الگوریتم‌های موجود یا جدید در حوزه HHLPها ارائه کرده است. با این وجود، این مطالعه هنگام نقشه‌برداری از جمعیت با ساختمان‌ها، مساحت تحت پوشش ساختمان‌ها را در نظر نگرفته است، یعنی ما به همه ساختمان‌ها وزن یکسانی اختصاص داده‌ایم، که ممکن است واقعاً منعکس‌کننده وضعیت واقعی نباشد. در کلان‌شهرهایی مانند کلکته یا بمبئی، یک ساختمان بلندمرتبه ممکن است تراکم جمعیت بیشتری را در مقایسه با ساختمان‌های کوچک‌تر متعدد در خود جای دهد. این مسائل تحقیقاتی جذاب و چالش‌برانگیز را می‌توان در آینده بررسی کرد.