بررسی الگوهای سفر انسانی از دیدگاه جریان معنایی فعالیت: مطالعه موردی در جاده کمربندی پنجم در پکن با استفاده از داده‌های مسیر تاکسی

داده‌های عظیم مسیر تاکسی را می‌توان به راحتی در عصر داده‌های بزرگ به‌دست آورد، که برای آشکار کردن اطلاعات مکانی-زمانی رفتار سفر انسان مفید است، اما از معناشناسی فعالیت غفلت می‌کند. معناشناسی فعالیت، فعالیت‌های روزانه و اهداف سفر افراد را منعکس می‌کند و منجر به درک عمیق‌تر الگوهای سفر انسان می‌شود. بیشتر تحلیل‌های ادبیات موجود درباره معناشناسی فعالیت عمدتاً بر ویژگی‌های مقصد تمرکز دارند. با این حال، حرکت از مبدا به مقصد را می توان به عنوان جریان نشان داد. این جریان می تواند به طور کامل فعالیت معنایی را نشان دهد و تعامل فضایی بین مبدا و مقصد را توصیف کند. بنابراین، در این مقاله، ما یک چارچوب دو لایه را برای استنباط معنایی فعالیت هر سفر تاکسی پیشنهاد کردیم و جریان معنایی فعالیت مشابه را تعمیم دادیم تا الگوهای سفر انسانی را آشکار کنیم. ما استنتاج فعالیت را در لایه اول با ترکیبی از مدل بهبود یافته Word2vec و رتبه‌بندی احتمال بازدید مبتنی بر قوانین بیزی معرفی کردیم. سپس، یک روش خوشه‌بندی جریان برای کشف رفتارهای سفر انسان بر اساس شباهت معنایی فعالیت و توزیع فضایی استفاده می‌شود. یک مطالعه موردی در جاده کمربندی پنجم در پکن اتخاذ شده است و نتایج نشان می‌دهد که روش ما برای استنباط فعالیت سفر تاکسی مؤثر است. شش معناشناسی فعالیت و چهار معناشناسی فعالیت به ترتیب در مبدا و مقصد شناسایی شده اند. ما همچنین دریافتیم که تفاوت‌هایی در انتقال فعالیت از مبدا به مقصد در دوره‌های متمایز وجود دارد.

کلید واژه ها:

فعالیت معنایی ; استنتاج فعالیت ; قوانین بیزی ؛ خوشه بندی جریان ; رفتارهای سفر مسیر تاکسی

۱٫ مقدمه

با توسعه سریع فناوری‌های اطلاعات و ارتباطات (ICT) و استفاده گسترده از دستگاه‌های آگاه از موقعیت مکانی، دسترسی فزاینده‌ای به داده‌های حرکتی، مانند داده‌های مسیر GPS خودرو، داده‌های سوابق تلفن همراه و داده‌های بررسی رسانه‌های اجتماعی وجود دارد. که می تواند وضوح مکانی و زمانی بالایی را برای مشاهده الگوهای سفر انسان در سطح فردی ارائه دهد [ ۱ ]. اگرچه چنین داده‌های ریزدانه تحرک انسان شامل مکان دقیق و اطلاعات زمانی است، اطلاعات معنایی مربوط به الگوهای سفر و انواع فعالیت معمولاً وجود ندارد [ ۲ ، ۳ ، ۴ ، ۵ ]]. اطلاعات فعالیت روزانه برای درک رفتارهای سفر انسان حیاتی است زیرا تقاضاهای سفر از نیازهای افراد برای شرکت در فعالیت ها سرچشمه می گیرد [ ۶ ، ۷ ، ۸ ]. پیش از این، تجزیه و تحلیل مبتنی بر فعالیت در ادبیات، از نظرسنجی‌های سنتی سفر مشتق می‌شد که یادآوری مصاحبه‌شوندگان از اطلاعات سفر و فعالیت [ ۲ ، ۹ ، ۱۰ ]، یعنی زمان و مکان پاسخ‌دهنده چه فعالیت‌هایی را انجام می‌داد، ثبت می‌کرد. چنین نظرسنجی های سفر نیز پرهزینه و زمان بر هستند. در مقابل، داده های عظیم ردیابی GPS می توانند به طور موثر فعالیت های افراد را در زمان واقعی و فضای واقعی ثبت کنند [ ۱۱ ، ۱۲]. تاکسی ها نقش مهمی در سیستم های حمل و نقل عمومی در کلان شهرها دارند. علاوه بر این، داده‌های مسیر تاکسی یک منبع اطلاعاتی غنی است که برای آشکار کردن الگوهای سفر [ ۱۳ ، ۱۴ ، ۱۵ ، ۱۶ ]، شناسایی عملکردهای شهری [ ۱۷ ، ۱۸ ، ۱۹ ، ۲۰ ، ۲۱ ] و کشف ساختار شهری استفاده می‌شود [ ۲۲ ، ۲۳ ، ۲۴]. با این حال، بسیاری از مطالعات موجود بر روی ویژگی‌های مکانی و زمانی داده‌های مسیر تاکسی تمرکز کرده‌اند در حالی که ویژگی‌های معنایی فعالیت را نادیده می‌گیرند. بنابراین، شناسایی معناشناسی فعالیت و استنباط اهداف سفر از داده‌های مسیر تاکسی یک موضوع تحقیقاتی ضروری است که می‌تواند به درک عمیق‌تری از الگوهای سفر انسان منجر شود.
اطلاعات نقطه مورد علاقه (POI) از داده های قدرتمندی برای شناسایی معنایی فعالیت ها پشتیبانی می کند. کار قبلی روش‌هایی را برای استنباط معنایی فعالیت با مرتبط کردن یک نقطه توقف با یک POI نامزد پیشنهاد کرده است. برخی از مطالعات بر روی فاصله جغرافیایی بین نقاط توقف و POIهای نامزد متمرکز شدند. به عنوان مثال، Xie و همکاران. [ ۲۵ ] یک معیار مبتنی بر فاصله را برای پیوستن به نقاط خروج تاکسی با نزدیکترین نقطه نقطه پیشنهاد کرد. Phithakkitnukoon و همکاران. [ ۲۶ ] یک معیار مبتنی بر شمارش را برای مرتبط کردن بیشترین تعداد POIهای گرفته شده در هر شبکه با معنای فعالیت نقطه توقف تاکسی پیشنهاد کرد. یو و همکاران [ ۲۷] یک شعاع بافر ساده را بر اساس مرکز خرید تعریف کرد و نقطه توقف نزدیک مراکز خرید را به عنوان سفرهای معنایی خرید در نظر گرفت. علاوه بر این، یک اندازه‌گیری احتمال برای بازتاب معنایی فعالیت استفاده شده است. به عنوان مثال، Furletti و همکاران. [ ۲۸ ] یک محدودیت مکانی-زمانی را تعریف کرد که منجر به انتخاب POIهای نامزد در حداکثر فاصله راه رفتن شد و احتمال بازدید را بر اساس مدل جاذبه و ساعات باز محاسبه کرد. هوانگ و همکاران [ ۲۹ ] رویکردی با استفاده از جذابیت مکانی-زمانی POI، که با اندازه POI محاسبه شد، برای شناسایی فعالیت از مسیر ارائه کرد. گونگ و همکاران [ ۲] یک چارچوب استنتاج فعالیت بیزی را معرفی کرد که هم محدودیت های مکانی و هم زمانی را در نظر می گیرد. گونگ و همکاران [ ۳ ] کار گونگ [ ۲ ] را با استفاده از خوشه بندی فضایی-زمانی، احتمال بیزی و شبیه سازی مونت کارلو گسترش داد. لی و همکاران [ ۳۰ ] چارچوبی را برای استنباط هدف سفر ارائه کرد که عوامل جامعی از جمله مسافت، زمان، محیط، نسبت نوع فعالیت و ظرفیت خدمات POI را در نظر گرفت.
این مطالعات عمدتاً بر محدودیت‌های مکانی و زمانی برای انتخاب POI نامزد با حداکثر احتمال بازدید به منظور استنتاج معنایی فعالیت متکی بودند. با این حال، بافت جغرافیایی نادیده گرفته شد، که منجر به برخی اشتباهات در استنتاج معنایی فعالیت شد. به عنوان مثال، یک تاکسی در یک منطقه فرودگاه باید به عنوان “حمل و نقل” برچسب گذاری شود. با این حال، این مکان توسط چندین رستوران وابسته داخلی احاطه شده است، و گاهی اوقات به اشتباه به عنوان “ناهارخوری” استنباط می شود، به خصوص در زمان ناهار.
برای در نظر گرفتن بافت جغرافیایی، برخی از محققین [ ۵ ، ۱۰ ، ۳۱ ، ۳۲ ، ۳۳ ] تکنیک‌های جاسازی کلمه را برای نمایش ویژگی‌ها در یک فضای برداری ترکیب کردند. یائو و همکاران [ ۳۴ ] ابتدا یک روش جدید برای ادغام POI با مدل Google Word2Vec [ ۳۵ ] پیشنهاد کرد، بردار مشخصه هر دسته POI را بر اساس کوتاه‌ترین مسیر محاسبه کرد و سپس از بردارها و یک روش خوشه‌بندی k-means برای استخراج مناطق عملکردی استفاده کرد. با این حال، ساختار فضای جغرافیایی تفاوت اساسی با زبان طبیعی دارد. POI ها در شهرها در فضای جغرافیایی توزیع شده اند و POI های نزدیک به شدت به یکدیگر مرتبط هستند [۳۶ ]. بنابراین، تبدیل POI به داده های توالی به طور مستقیم دارای محدودیت هایی در توضیح تعاملات فضایی بین POI است. برای حل مشکل فوق، یان و همکاران. [ ۳۷] تأثیر فاصله را برای گسترش مدل Word2Vec به مدل Place2Vec در نظر گرفت. با این حال، مطالعات ذکر شده در بالا، تغییرات پویای فعالیت جذب POI در زمان‌های مختلف هنگام تبدیل POI به یک سند متوالی را در نظر نمی‌گیرند. به عنوان مثال، افرادی که با تاکسی به یک مرکز خرید می‌روند، می‌توانند به عنوان فعالیت «خرید» در عصر و به عنوان فعالیت «کار» در صبح زود برچسب گذاری شوند. بنابراین، اگر تخلیه فرد در صبح زود یا عصر در همان مکان باشد، داده های توالی باید متفاوت باشد. تنها با در نظر گرفتن تأثیر فاصله، دنباله یکسان خواهد بود و نمی تواند پویایی فعالیت را نشان دهد.
علاوه بر این، کار قبلی فعالیت‌های سفر را تنها با استفاده از موقعیت‌های تخلیه و اطلاعات زمانی از داده‌های مسیر تاکسی استنباط کرده است. با این حال، مکان‌های تحویل و اطلاعات زمان نیز ارتباط نزدیکی با اهداف سفر دارند. به عنوان مثال، فعالیت‌های «خانه» از نقطه تحویل و فعالیت‌های «کار» از نقطه خروج می‌تواند به تمرکز بر استخراج الگوهای سفر یک فرد برای فعالیت‌های رفت‌وآمد کمک کند. حرکت بین نقطه تحویل تاکسی و نقطه سقوط را می توان به عنوان یک جریان جغرافیایی در نظر گرفت و نشان دهنده تعامل فضایی بین دو مکان است. برای مثال، Żochowska و همکاران. [ ۳۸] یک روش مبتنی بر GIS را برای ارزیابی ادغام فضایی ایستگاه‌های اشتراک‌گذاری دوچرخه پیشنهاد کرد و جریان ترافیک بین ایستگاه‌ها را برای توصیف تقاضا برای دوچرخه‌سواری به اشتراک‌گذاشته شد. خوشه‌بندی جریان می‌تواند جریان‌های عظیم در سطح فردی را به طور مؤثر اداره کند و ارتباطات فضایی و روندهای تحرک را تعمیم دهد. کاوش معناشناسی فعالیت از منظر جریان به شدت با ویژگی‌های مبدا و مقصد مرتبط است، بینشی در مورد سفر کامل ارائه می‌دهد و الگوهای سفر انسان را بهتر آشکار می‌کند.
برای رفع شکاف های پژوهشی ذکر شده، هدف اصلی این مقاله ایجاد یک چارچوب دو لایه برای کشف الگوهای سفر انسان از منظر جریان معنایی فعالیت بود. ما داده‌های مسیر تاکسی و داده‌های POI را برای استنباط معنایی فعالیت هر سفر تاکسی، و تعمیم جریان معنایی فعالیت مشابه برای آشکار کردن رفتارهای سفر انسان، یکپارچه کردیم. در این چارچوب، معنایی فعالیت در لایه اول به دست می آید. به طور خاص، ما رتبه‌بندی مبتنی بر احتمال بازدید بیزی را با بسط مدل استنتاج بیزی گونگ [ ۲ ] محاسبه کردیم.]. سپس، فناوری جاسازی کلمه (مدل Word2vec بهبودیافته) برای ساختن نمایش نهفته بردارهای هر نقطه برداشت و رها کردن استفاده شد. در مرحله بعد، از بردارها و روش خوشه بندی انتشار قرابت برای حاشیه نویسی معنایی فعالیت استفاده کردیم. در لایه دوم، یک روش خوشه‌بندی جریان مبتنی بر فعالیت برای کشف الگوهای سفر فضایی-زمانی جریان‌های معنایی فعالیت مختلف، که می‌تواند برای برنامه‌ریزی و مدیریت حمل‌ونقل استفاده شود، اعمال می‌شود. به طور خلاصه، مشارکت های این کار به شرح زیر برجسته می شود:
  • ما یک چارچوب دو لایه را برای آشکار کردن مؤثر الگوهای سفر انسانی بر اساس جریان‌های معنایی فعالیت پیشنهاد می‌کنیم، که می‌تواند تعامل فضایی بین مبدا و مقصد را توصیف کند و معنای فعالیت‌های مبدا و مقصد را نشان دهد.
  • ما بافت جغرافیایی و پویایی فعالیت را در نظر می گیریم، یک مدل Word2vec بهبود یافته و رتبه بندی احتمال بازدید مبتنی بر قوانین بیزی را هنگام ساختن نمایش برداری پنهان هر نقطه انتخاب و نقطه رها کردن، در نظر می گیریم.
ساختار باقی مانده این مقاله به شرح زیر است. بخش ۲ منطقه مورد مطالعه و مجموعه داده ها را معرفی می کند. بخش ۳ روش های چارچوب دو لایه پیشنهادی را ارائه می کند. در بخش ۴ ، حاشیه‌نویسی معنایی فعالیت، نتایج اعتبارسنجی مدل و پوشش الگوهای جریان معنایی فعالیت را مورد بحث قرار می‌دهیم. تمام نام مکان های ذکر شده در بخش ۴ با شکل A1 پیوست A مطابقت دارد . در نهایت، نتایج این مقاله ترسیم می‌شود و جهت‌گیری‌های تحقیقاتی آتی در بخش ۵ مورد بحث قرار می‌گیرد .

۲٫ منطقه مطالعه و توصیف داده ها

۲٫۱٫ منطقه مطالعه

این تحقیق بر روی مطالعه موردی پکن که پایتخت چین و مرکز سیاسی، فرهنگی و آموزشی است، تمرکز دارد. منطقه درون جاده حلقه پنجم پکن به عنوان منطقه تحقیقاتی انتخاب شد ( شکل ۱ ). تا پایان سال ۲۰۲۰، مساحت منطقه در جاده کمربندی پنجم تقریباً ۶۶۸٫۶۵ کیلومتر مربع بود .شامل شش ولسوالی و جمعیت ساکن بیش از ۱۰ میلیون نفر. منطقه ای مناسب با کارکردهای شهری کامل و شامل اکثریت رفتارهای مسافرتی انسان است. سیستم حمل و نقل عمومی در پکن شامل اتوبوس، مترو، تاکسی و دوچرخه است. گزارش پنجمین نظرسنجی جامع ترافیک شهری در پکن اشاره می‌کند که حمل‌ونقل عمومی ۴۸٫۰ درصد از سفرها را در منطقه اصلی شهری آن تامین می‌کند. خدمات تاکسی گزینه مهمی برای سفر افراد است که حدود ۱۰ درصد از سفرهای درون شهری را تشکیل می دهد. سفر با تاکسی مسیرهای انعطاف پذیری را ارائه می دهد و نسبت به سایر روش های حمل و نقل از نظر زمان کارآمدتر است [ ۳۹ ، ۴۰ ].

۲٫۲٫ مجموعه داده ها

داده‌های مسیر تاکسی در جاده کمربندی پنجم پکن از ۱۶ می (دوشنبه) تا ۲۰ می (جمعه) در سال ۲۰۱۶ جمع‌آوری شد. وضعیت تاکسی‌ها تقریباً هر ۱۰ ثانیه به‌طور خودکار توسط GPS نمونه‌برداری می‌شود و دقت موقعیت تقریباً ۱۰ متر است. شناسه منحصربه‌فرد تاکسی‌ها، طول جغرافیایی، عرض جغرافیایی، مهرهای زمانی، سرعت، جهت‌گیری، و اینکه آیا مسافران در حال جابجایی هستند، در داده‌های خط سیر تاکسی‌ها گنجانده شده است. با این حال، در مقایسه با مسیر تاکسی خام، برای هر سفر تاکسی نگران مبدا و موقعیت مقصد هستیم. از این رو، ما داده‌های خط سیر خام را با داده‌های سفر مبدأ-مقصد تاکسی (O-D) با تکیه بر وضعیت مسافران به‌عنوان سوار و تحویل جمع‌آوری کردیم.
در همین حال، پیش پردازش داده ها ضروری است. ابتدا نقطه نامعتبر ناشی از خطاهای موقعیت یابی یا خطاهای انتقال را حذف کردیم. ثانیاً داده های سفر غیر منطقی را که کمتر از ۵۰۰ متر یا بیشتر از ۱۰۰ کیلومتر بود حذف کردیم. ثالثاً سرعت غیرعادی تاکسی بیش از ۱۲۰ کیلومتر بر ساعت نیز حذف شد. پس از تمیز کردن، تقریباً ۰٫۹۲ میلیون سفر تاکسی با ویژگی های نشان داده شده در جدول ۱ به دست آوردیم .
داده های POI از Gaode Map، یک شرکت ناوبری در چین جمع آوری شده است. مجموعه داده شامل ۵۱۳۵۴۹ POI است. ویژگی های هر POI شامل شناسه، نام، طول جغرافیایی، عرض جغرافیایی و دسته است. با در نظر گرفتن ویژگی های سفر تاکسی و عملکردهای شهری، POI های اولیه را به ۱۰ دسته، از جمله خانه، محل کار، حمل و نقل، غذاخوری، تفریح ​​در روز، تفریح ​​شبانه، جاذبه توریستی، هتل، مدرسه، و خدمات پزشکی مجدداً طبقه بندی کردیم ( جدول ۲ ).
داده های نظرسنجی سفر، زمان سوار شدن و پیاده شدن مسافران تاکسی، آدرس و هدف سفر را ثبت می کند. داده‌ها از مجموع ۲۱۱۲ سفر فردی در پکن از سپتامبر ۲۰۱۶ تا ژانویه ۲۰۱۷ جمع‌آوری شد و به عنوان حقیقت اصلی برای آشکار کردن اثربخشی مدل پیشنهادی در این مقاله استفاده شد.

۳٫ روش

۳٫۱٫ مفروضات روش پیشنهادی

برای آشکار کردن الگوهای سفر انسان از منظر جریان معنایی فعالیت، یک چارچوب دو لایه پیشنهاد کردیم. نمودار جریان روش پیشنهادی در شکل ۲ نشان داده شده است و می توان آن را به دو بخش تقسیم کرد. در لایه اول، از داده‌های سفر O-D تاکسی و داده‌های POI برای شناسایی معنایی فعالیت و استنتاج اهداف سفر استفاده کردیم (به بخش ۳٫۲ مراجعه کنید ). در لایه دوم، یک روش خوشه‌بندی جریان برای گروه‌بندی جریان معنایی فعالیت مشابه (به بخش ۳٫۳ مراجعه کنید ) و کشف توزیع‌های مکانی-زمانی سفرها استفاده می‌شود.

۳٫۲٫ استنتاج فعالیت

استنتاج فعالیت در مجموع دارای چهار فرآیند است. ما ابتدا مناطق برداشت (PA) و مناطق تخلیه (DA) را ایجاد کردیم و POIهای نامزد را انتخاب کردیم ( بخش ۳٫۲٫۱ ). دوم، قوانین بیزی ( بخش ۳٫۲٫۲ ) برای محاسبه احتمال بازدید از هر POI نامزد استفاده شد. با این حال، معناشناسی فعالیت هر سفر نه تنها به احتمال بازدید از POI نامزد واحد بستگی دارد، بلکه به بافت جغرافیایی و روابط هم‌وقوع فضایی نیز متکی است [ ۳۷ ، ۴۱ ]. بنابراین، بر اساس رتبه‌بندی احتمال بازدید از هر POI نامزد، ثالثاً، ما از مدل بهبود یافته Word2vec برای ساختن نمایش برداری پنهان هر نقطه برداشت و نقطه رها کردن استفاده کردیم.بخش ۳٫۲٫۳ ). در نهایت، ما از الگوریتم خوشه‌بندی انتشار قرابت [ ۴۲ ] برای خوشه‌بندی نقاط جمع‌آوری/نقاط سقوط مشابه و حاشیه‌نویسی معنایی فعالیت ( بخش ۳٫۲٫۴ ) استفاده کردیم.

۳٫۲٫۱٫ منطقه تحویل / تحویل

داده های مسیر تاکسی شامل نقطه سوار شدن و خروج است. با این حال، مکان ثبت شده، محل فعالیت واقعی نیست. بنابراین، ما نمی توانیم از این نقاط به عنوان مبدا یا مقصد به طور مستقیم استفاده کنیم. به عنوان مثال، هنگامی که کاربران از خانه به نقاط دیدنی می روند، باید برای سوار شدن به تاکسی به کنار جاده بروند و سپس باید تاکسی را در پارکینگ رها کرده و به مقصد واقعی بروند. اگرچه مردم تمایل دارند تا در نزدیکی تاکسی سوار شوند و رانندگان همیشه مسافران را تا جایی که ممکن است نزدیک به مقصدشان رها می کنند، مبدا یا مقصد دقیق نامشخص است. با توجه به وجود چندین نقطه نامزد توزیع شده در اطراف محل تحویل یا تحویل، بنابراین، منطقه تحویل (PA) و منطقه تخلیه (DA) برای انتخاب “POI های کاندید” تعریف شد. در این مطالعه، ما وضعیت واقعی جاده را در نظر می گیریم،  δ. فاصله پیاده‌روی در زمان واقعی با استفاده از رابط برنامه‌نویسی نقشه‌های Gaode (API) به دست آمد. همانطور که در شکل ۳ نشان داده شده است ، از آنجایی که جاده های دو طرفه وجود دارد، POI های یک طرف احتمال بازدید بالاتری نسبت به طرف مقابل دارند. درصدی از نقاط تحویل و نقاط رهاسازی که می تواند حداقل یک POI نامزد با a پیدا کند δاز ۵ متر تا ۲۵۰ متر در شکل ۴ نشان داده شده است. منحنی زمانی که حداکثر آستانه فاصله راه رفتن ثابت می ماند δبه حدود ۱۰۰ متر رسید. بنابراین، برای تعریف PA و DA در این مطالعه، حداکثر آستانه مسافت پیاده‌روی را ۱۰۰ متر برای هر دو نقطه برداشت و رها کردن قرار دادیم.
۳٫۲٫۲٫ احتمال بازدید مبتنی بر قوانین بیزی

قوانین بیزی به طور گسترده برای محاسبه احتمال بازدید از POIهای نامزد استفاده شد [ ۲ ، ۳ ، ۳۰ ]. در این مطالعه، تابع احتمال بازدید برای هر POI کاندید است پمنi = ۱، ۲، ۳، ……، n) به صورت زیر نمایش داده می شود:

پ(پمن، y) ،t)=پy) |پمن، ت ) ∗ص(پمن) ∗P( t )پy) ،ت)

جایی که پ(پمن، y) ،ت)نشان دهنده احتمال بازدید یا بازدید مسافر تاکسی است پمناگر مسافر در محل سوار یا پیاده شود ، y) در زمان تیپy) |پمن، تی )نشان دهنده احتمال این است که شخصی در آن مکان وارد یا از تاکسی خارج شود ، y)اگر او بازدید کرده باشد یا تصمیم به بازدید داشته باشد پمندر زمان تیپ(پمنت )احتمال بازدید است پمندر زمان t . پ( t )احتمال بازدید در زمان است تیپy) ،ت)احتمال این است که مسافر تاکسی در آن مکان به تاکسی وارد یا از آن خارج شود ، y) در زمان تی. با توجه به POI نامزد، مکان و زمان تحویل یا تحویل به صورت مشروط مستقل است پمنو فاصله بین نقطه تحویل یا رها کردن و POI نامزد پمننمایش اثر فروپاشی فاصله بنابراین، تابع احتمال [ ۲ ] می شود:

پ(پمن، y) ،t)=آمند، y) ،پمن)– β∗ پ(پمنت )n۱آjد، y) ،پj)– β∗ پ(پjت ) 

جایی که آمنجذابیت POI نامزد است پمن. پارامتر دفاصله پیاده روی در زمان واقعی از محل تحویل یا تحویل است ، y)به POI نامزد پمنو βپارامتر فروپاشی فاصله است. پ(پمنت )احتمال بازدید است پمندر زمان t . در مقایسه با روش گونگ [ ۲ ] که تعیین کرد آمناز ۱ تا ۴ به صورت دستی، با توجه به توصیه کارشناسان، ما از روش فرکانس معکوس سند فرکانس (TF-IDF) [ ۴۳ ، ۴۴ ] برای انعکاس جذابیت استفاده می کنیم. در این مطالعه ما اتخاذ می کنیم β۱٫۵ _که با ادبیات موجود مطابقت دارد [ ۳ ، ۴۵ ، ۴۶ ]. علاوه بر این، پ(پمنت )متاثر از پویایی فعالیت است. به عنوان مثال، احتمال بازدید از یک رستوران از ساعت ۱۱:۰۰ تا ۱۳:۰۰ بیشتر از احتمال بازدید از محل کار در آن ساعت در روزهای هفته است. به همین ترتیب، احتمال بازدید از محل کار بیشتر از احتمال رفتن به رستوران از ساعت ۸:۰۰ تا ۱۰:۰۰ در روزهای هفته است. از این رو، داده‌های ورود به شبکه‌های اجتماعی در اینجا برای انعکاس حیاتی انواع مختلف POI نامزد استفاده می‌شود. سرانجام، پ(پمن، y) ،ت)از ۰ تا ۱ متغیر است و احتمال بازدید همه POIهای نامزد برابر با ۱ در مجموع است. در شکل ۳ما یک نمودار شماتیک از استنتاج فعالیت مبتنی بر قوانین بیزی ارائه می کنیم. POIهای غیر کاندید (با رنگ بنفش مشخص شده) که خارج از فضای قابل راه رفتن یا بسته هستند در نظر گرفته نمی شوند. برای POI های کاندید (که با رنگ سبز مشخص شده اند)، اندازه دایره ها جذابیت آنها را نشان می دهد. اگر فقط فاکتور فاصله را در نظر بگیریم، رستوران شماره ۱ نزدیکترین POI نامزد است. اگر فقط فاکتور زمان را در نظر بگیریم، رستوران شماره ۱ و رستوران شماره ۲ مکان هایی هستند که افراد به احتمال زیاد به آنجا می روند زیرا در یک روز هفته زمان ناهار است. اگر فقط با توجه به جذابیت POI ها، احتمال بازدید از هتل بیشتر از بقیه است. با این حال، با در نظر گرفتن فاکتورهای جامع از جمله مسافت، زمان و جذابیت POI، رتبه بندی POI های کاندید رستوران شماره ۱، هتل، مرکز خرید، رستوران شماره ۲ خواهد بود.

۳٫۲٫۳٫ مدل Word2vec
جاسازی‌های کلمه به طور فزاینده‌ای در پردازش زبان طبیعی (NLP) محبوب شده‌اند و در واقع نوع خاصی از نمایش کلمه توزیع‌شده هستند که با استفاده از شبکه‌های عصبی ساخته می‌شوند که عمدتاً پس از سال ۲۰۱۳ با معرفی مدل Word2vec رایج شدند [ ۳۵ ]. مدل Word2vec معمولاً به عنوان یک روش بدون نظارت قاب بندی می شود، زیرا نیازی به حاشیه نویسی دستی از داده های آموزشی ندارد. مدل Word2vec می‌تواند کلمات را به فضاهای برداری متراکم و کم‌بعدی بر اساس روابط بافتی در اسناد نشان دهد و کلمات بافت مشابه به نقاط نزدیک نگاشت می‌شوند. بنابراین، فاصله بین دو بردار کلمه را می توان برای اندازه گیری شباهت معنایی آنها استفاده کرد (به عنوان مثال، “قایق” – “کشتی”) [ ۴۷ ]]. Word2vec در دو معماری مدل ارائه می شود، مدل Continuous Bags-of-Words (CBOW) و مدل Skip-Gram. مدل CBOW کلمات هدف را با استفاده از کلمات بافت اطراف خود پیش‌بینی می‌کند، در حالی که مدل Skip-Gram با توجه به کلمات هدف، کلمات بافت اطراف را پیش‌بینی می‌کند.
همانطور که در شکل ۳ نشان داده شده است، معنایی فعالیت سفر باید بر اساس حداکثر احتمال بازدید قوانین بیزی به عنوان “ناهارخوری” استنتاج شود. با این حال، بافت جغرافیایی در اینجا نادیده گرفته شده است. مطالعات کمی روابط همزمانی پنهان را در بین POIهای نامزد مختلف و نحوه تعامل فضایی آنها با یکدیگر برای حمایت از فعالیت سفر بررسی کرده اند. به عنوان مثال، فعالیت «اسکان در هتل»، هم‌وقوع فضایی بین «هتل»، «رستوران» و «بار» و غیره است. ایستگاه راه‌آهن شامل تعداد زیادی رستوران است و هم‌وقوع فضایی در میان این انواع POI منعکس‌کننده است. فعالیت حمل و نقل. مزیت مدل Word2vec در گرفتن این زمینه فضایی و روابط همزمان است.
در این مقاله، ما روابط مشابهی بین PA/DA و اسناد ایجاد می کنیم. یک سند متنی از کلمات تشکیل شده است، در حالی که یک PA/DA از نقطه تحویل/نقطه خروج و POIهای نامزد تشکیل شده است. بنابراین، در قیاس با استفاده مدل Word2vec از مواد متنی، ما PA/DA را به عنوان سند، «نقطه توقف تاکسی» داخلی (نقطه تحویل یا نقطه خروج) را به عنوان کلمات هدف، و «داخلی» را به عنوان کلمات هدف در نظر می گیریم. نامزد POI» به عنوان کلمات زمینه. فرضیه پشت این بیان می کند که: «نقطه توقف تاکسی» در زمینه های یکسان ظاهر می شود و معنای معنایی فعالیت یکسانی دارد. بنابراین، مدل CBOW را انتخاب کردیم. جزئیات این روش در [ ۳۵ ] شرح داده شده است.
از آنجایی که ساختار فضای جغرافیایی به طور قابل توجهی با زبان طبیعی متفاوت است، ما به جای فاصله اقلیدسی، رتبه‌بندی مبتنی بر احتمالات بیزی را اضافه می‌کنیم تا دنباله‌ای از هر نقطه انتخاب و نقطه سقوط بسازیم. مزیت استفاده از رتبه‌بندی مبتنی بر احتمال بازدید بیزی این است که بر پویایی فعالیت تأکید می‌کنیم. در مقایسه با استفاده از رتبه‌بندی مبتنی بر فاصله، توالی اطراف «POIهای نامزد» (کلمات متنی) تا «نقطه توقف تاکسی» (کلمات هدف) در طول یک روز متفاوت است. نمودار شماتیک در شکل ۳ را در نظر بگیریدبه عنوان مثال. هنگام استفاده از رتبه‌بندی مبتنی بر احتمال، «هتل» نزدیک‌ترین کلمه متنی به «نقطه توقف تاکسی» در نیمه‌شب و «رستوران» نزدیک‌ترین کلمه متنی به «نقطه توقف تاکسی» در ظهر است. در مقابل، هنگام استفاده از رتبه بندی بر اساس فاصله، “رستوران” همیشه نزدیک ترین کلمه متنی به “نقطه توقف تاکسی” در یک روز است. این بدان معنی است که تنها با در نظر گرفتن رتبه بندی بر اساس مسافت، توالی “نقاط توقف تاکسی” در یک روز یکسان خواهد بود و نمی تواند پویایی فعالیت را نشان دهد. در طی فرآیند ساخت مدل بهبود یافته Word2vec، بعد بردارهای کلمه را ۲۰۰، اندازه پنجره را ۵، تعداد تکرارها را برابر با ۲۰ و سایر پارامترها را روی مقادیر توصیه شده تنظیم کردیم.
پس از آموزش مدل، فاصله کسینوس بردارهای “نقطه توقف تاکسی” برای نشان دادن شباهت و مقادیر تشابه بالاتر محاسبه می شود که نشان دهنده تشابه معنایی فعالیت قوی تر است.
۳٫۲٫۴٫ حاشیه نویسی معنایی فعالیت
بر اساس شباهت به‌دست‌آمده از مدل بهبودیافته Word2vec، از الگوریتم انتشار Affinity برای خوشه‌بندی سفرهای مشابه در یک گروه و سپس حاشیه‌نویسی معنایی فعالیت برای هر سفر در سه مرحله استفاده می‌کنیم: (۱) حاشیه‌نویسی هر نقطه برداشت با یک فعالیت ; (۲) حاشیه نویسی هر نقطه رها کردن با یک فعالیت. (۳) پیوند دادن نوع فعالیت O-D برای غنی سازی معنایی فعالیت سفر. برای حاشیه نویسی معنایی فعالیت، جنبه های زیر را در نظر گرفتیم [ ۴۸ ]:
(۱)
چگالی داخلی (ID). منDمن ج=نمن ج/نj.
(۲)
چگالی خارجی (ED). EDمن ج=نمن ج/نمن.
(۳)
توزیع زمانی فعالیت های مختلف
جایی که نمن جتعداد است من تا ساعتPOI در h فعالیت، نمنتعداد است من تا ساعتPOI، و نjتعداد POI در است hفعالیت.

۳٫۳٫ خوشه بندی جریان

سفر O-D تاکسی یک جریان هدایت شده از مبدا به مقصد است که می تواند الگوهای سفر را آشکار کند. در این مقاله، یک جریان O-D تاکسی به‌عنوان یک شی هندسی به‌جای اینکه به‌عنوان یک نقطه برداشت و رها کردن جدا شده در نظر گرفته می‌شود. برخلاف فضای محلی سنتی، این جریان‌های O-D یک فضای جریان را تشکیل می‌دهند [ ۴۹ ، ۵۰ ] و بر تعاملات فضایی عناصر تأکید می‌کنند. مایکل باتی استدلال می کند که برای درک فضا، باید جریان ها را درک کنیم [ ۵۱ ]. بنابراین، ما الگوهای سفر مکانی و زمانی انسان را از منظر جریان بررسی می کنیم.
پس از حاشیه نویسی معنایی فعالیت، می توانیم جریان های معنایی فعالیت تاکسی را بدست آوریم. هر جریان معنایی فعالیت را می توان به صورت بیان کرد fمنoایکسمن، oyمن، oآمن، دایکسمن، دyمن، دآمن، دآمن، جایی که oایکسمن، oyمن)و دایکسمن، دyمن)به ترتیب مختصات فضایی نقطه برداشت و نقطه سقوط هستند و oآمنو دآمنبه ترتیب معناشناسی فعالیت مبدا و مقصد هستند. dآمنفعالیت معنایی است fمن.
در این مقاله، ما یک روش خوشه‌بندی جریان را بر اساس محدودیت‌های مکان نقاط O-D و معنایی فعالیت پیشنهاد کردیم. برای اندازه گیری شباهت فضایی و معنایی بین جریان های معنایی فعالیت باید سه اصل در نظر گرفته شود:
(۱)
جریان ها دارای فعالیت معنایی یکسانی هستند.
(۲)
جریان ها در مجاورت فضایی با یکدیگر هستند.
(۳)
طول و جهت جریان تقریباً برابر است.
شکل ۵ شش جریان را نشان می دهد. فقط f1و f2همه اصول را برآورده می کنند و مشابه هستند.

در رویکرد ما، یک استراتژی دو مرحله‌ای اتخاذ می‌شود که در آن خوشه‌بندی جریان فضایی پس از استنتاج فعالیت انجام می‌شود. برای خوشه‌بندی جریان فضایی، مسئله کلیدی اندازه‌گیری شباهت فضایی بین جریان‌ها است. برای محاسبه عدم تشابه فضایی از رابطه زیر استفاده می کنیم اسDمن جبین fمنو fj.

اسDمن ج=سدمن o2sدمن d2———–√

جایی که،

⎧⎩⎨⎪⎪⎪⎪سدمن o=دمن نیستم ( _Oمن،Oj)α × ( l enمن، enj)سدمن d=دمن نیستم ( _Dمن،Dj)α × ( l enمن، enj)

در معادلات، سدمن oو سدمن dنشان دهنده عدم تشابه فضایی منشاء بین fمنو fjو عدم تشابه فضایی مقصد بین fمنو fj، به ترتیب. دمن هستم _نشان دهنده فاصله اقلیدسی بین نقاط است. enمنو enjطول جریان را برمی گرداند fمنو fj، به ترتیب. αیک ضریب اندازه و حاصلضرب است αو طول کوتاهتر برابر با شعاع دایره مرزی است. انتخاب می کنیم α ۰٫۳که با کار موجود مطابقت دارد [ ۵۲ ، ۵۳ ]. کوچکتر اسDمن جیعنی هر چه جریان ها شبیه تر باشند. متعاقبا، یک چارچوب خوشه‌بندی تجمعی برای پیاده‌سازی خوشه‌بندی جریان استفاده می‌شود که جریان‌های معنایی و فضایی مشابه فعالیت را ادغام می‌کند تا سلسله مراتبی از خوشه‌های جریان را تشکیل دهد. فرآیند خوشه بندی جریان در الگوریتم ۱ نشان داده شده است. برای تنظیمات پارامتر دقیق تر، لطفاً به [ ۵۲ ] مراجعه کنید.

الگوریتم ۱ خوشه بندی فضایی جریان معنایی فعالیت
ورودی: f{fمن۱ ≤ ≤ n }– مجموعه ای از جریان های فعالیت؛ و
α– ضریب اندازه
خروجی: مجموعه ای از خوشه های فضایی و جریان فعالیت FC Fسیمن۱ ≤ ≤ m }.
مراحل:
۱٫ kd-tree را بر اساس نقطه میانی جریان بسازید.
۲٫ هر جریان را یک خوشه منحصر به فرد برای مقداردهی اولیه
خوشه های جریان اصلی بسازید: FC Fسیمن}و افسیمن{fمن}، ۱ ≤ ≤ n.
۳٫ برای هر جریان fمن، آن را پیدا کنید کمنجریان می یابد: کمنبا فاصله بین نقطه میانی محاسبه می شود fمنو جریان آن فاصله های میانی در محدوده ۲–√α ⋅ enمن. تولید می کنند کمن جفت جریان (fمن، fj)، جایی که ۱ ≤   کمن.
۴٫ برای هر جفت جریان (fمن،fj)،
۴٫۱ خوشه ها را پیدا کنید افسیمنو افسیjکه fمنو fjمتعلق به
۴٫۲ اگر افسیمنو افسیjخوشه های مختلف هستند،
۴٫۲٫۱ مقایسه معنایی فعالیت،
۴٫۲٫۲ اگر افسیمنو افسیj دارای همان فعالیت معنایی
۴٫۲٫۲٫۱ محاسبه اسDمن جبین افسیمنو افسیj.
۴٫۲٫۲٫۲ اگر اسDمن ج≤ ۱، دو خوشه را ادغام کنید: افسیمن← افسیمن∪ افسیjو افسی← افسی/ افسیj.

۴٫ نتایج

۴٫۱٫ نتایج حاشیه نویسی معنایی فعالیت

همانطور که در بخش ۳٫۲٫۴ ذکر شد ، مبدا و مقصد سفر تاکسی به ترتیب به شش خوشه معمولی و چهار خوشه معمولی تقسیم می شوند. نتایج جزئی برای ID و ED در جدول ۳ ارائه شده است و توزیع زمانی در شکل ۶ نشان داده شده است . بر اساس این نتایج، ما هر مبدأ یا مقصد را با معناشناسی فعالیت به شرح زیر شرح دادیم:
O1 و D1: مربوط به خانه. برای O1: اگرچه “ناهارخوری” مشخص ترین دسته POI با این مبدا است، “خانه” بالاترین ED را دارد. از شکل ۶ می بینیم که O1 بین ۶:۰۰ صبح تا ۸:۰۰ صبح به بالاترین نقطه می رسد، علاوه بر این، “Dining” و “Schooling” POI های کمکی برای مناطق مسکونی هستند. برای D1: “خانه” بیشتر با D1 مرتبط است (ED 99.1٪ است، و نسبت افرادی که به اوج D1 می رسند در شب اتفاق می افتد. بنابراین، ما O1 و D1 را به‌عنوان مرتبط با خانه یادداشت کردیم.
O2 و D2: مربوط به کار. برای O2: مشخص ترین دسته POI “Work” است که بالاترین ED را نیز دارد. برای D2: “ناهارخوری” و “کار” به عنوان محل کار در نظر گرفته می شود. همانطور که در شکل ۶ نشان داده شده است ، O2 در عصر به بالاترین حد خود رسید، در حالی که D2 در صبح به بالاترین حد خود رسید. بنابراین، ما O2 و D2 را به عنوان مرتبط با کار حاشیه نویسی کردیم.
O3 و D3: حمل و نقل. «ناهارخوری» و «حمل و نقل» معمولاً اتفاقات فضایی مشترک هستند، مانند ایستگاه‌های راه‌آهن و فرودگاه‌ها. “حمل و نقل” ED به ترتیب ۵۲٫۱٪ و ۸۳٫۵٪ در مبدا و مقصد است. هر دو O3 و D3 سرزندگی کمی در طول روز دارند. بنابراین، ما O3 و D3 را به عنوان حمل و نقل مشروح کردیم.
O4 و D4: مربوط به تفریح. هم در ID و هم در ED، “Dining” بیشترین نسبت POI را تشکیل می دهد. در O4: دو نوع POI زیر عبارتند از تفریحات شبانه و روزی، به طور مشابه، و پس از آن «هتل» و «تفریح ​​روزانه» در D4 هستند. شایان ذکر است که ED در بین این POI ها ثابت ماند. بنابراین، ما از “Recreation” برای جمع آوری این POI ها استفاده می کنیم.
O5: مربوط به هتل. محبوب ترین رده POI در O5 “Dining” است اما یک POI کمکی برای “Hotel” است. علاوه بر این، “هتل” بالاترین ED را دارد. بنابراین، ما O5 را به عنوان مرتبط با هتل شرح دادیم.
O6: مربوط به پزشکی. “خدمات پزشکی” نوع مهم POI در O6 است. در همین حال، “خدمات پزشکی” مرتبط با رستوران ها و هتل ها، به طور کلی برای بیماران ورودی است. بنابراین، ما O6 را به عنوان مرتبط با پزشکی شرح دادیم.

۴٫۲٫ مقایسه معناشناسی فعالیت استنباط شده از سه روش

ما روش پیشنهادی گونگ [ ۲ ] و یائو [ ۳۴ ] را به ترتیب به عنوان روش اول و روش دوم برای انجام آزمایش های مقایسه ای در نظر می گیریم. در این مطالعه، در مجموع ۲۱۱۲ داده پیمایش فعالیت مسافرتی فردی، مربوط به سفر تاکسی در پکن از سپتامبر ۲۰۱۶ تا ژانویه ۲۰۱۷، جمع‌آوری شد و به عنوان حقیقت اصلی برای آشکار کردن اثربخشی روش پیشنهادی ما (روش III) استفاده شد. ما نسبت فعالیت های تولید شده توسط سه روش ذکر شده در جدول ۴ را محاسبه کردیم . همانطور که از جدول ۴ مشاهده می شود، نتایج روش III به خوبی با داده های بررسی سفر مطابقت دارد. نسبت فعالیت های تفریحی در روش اول و روش دوم بسیار بیشتر از نظرسنجی سفر است. و فعالیت‌های حمل‌ونقل در روش اول و روش دوم بسیار کمتر از داده‌های نظرسنجی است که به ترتیب ۵۰/۳ و ۲۷/۲ درصد است. ما حدس می زنیم که این ناشی از کیفیت مجموعه داده POI است. در روش I، جذابیت POI ها به صورت دستی تنظیم می شود و POI ها به همان وزن در هنگام ساخت بردار در روش دوم مشخص می شوند. توالی POI در روش III تغییرات دینامیکی را در طول ساخت بردارها در نظر می گیرد. هنگام استفاده از داده های بررسی سفر به عنوان مرجع، متوجه می شویم که عملکرد روش III از دو روش دیگر بیشتر است. بدین ترتیب،

۴٫۳٫ توزیع فضایی فعالیت های مختلف سفر

نقاط مهم فعالیت های مختلف را با استفاده از روش تخمین چگالی هسته (KDE) ترسیم می کنیم. شکل ۷ توزیع چگالی فضایی هر فعالیت شناسایی شده مبدا را نشان می دهد. شکل ۷a,e نشان می‌دهد که حوزه‌های فعالیت‌های مرتبط با خانه و هتل که مربوط به اسکان روزانه هستند، به طور گسترده‌تری توزیع شده‌اند. به طور خاص، فعالیت های مرتبط با خانه در مناطق مسکونی عمده مانند Tuanjiehu، Dawanglu، Wangjing، Suzhoujie و Yuetan متمرکز شده است. در مقابل، فعالیت‌های مرتبط با هتل عمدتاً نزدیک به مراکز حمل‌ونقل (دونگژیمن، ایستگاه راه‌آهن غرب پکن و ایستگاه راه‌آهن پکن)، بیمارستان‌ها (بیمارستان سوم دانشگاه پکن و بیمارستان آنژن) و مناطق کاری و تجاری (Xidan، Dongdan و Wudaokou) توزیع می‌شوند. فعالیت های مرتبط با کار ( شکل ۷ب) عمدتاً در CBD (منطقه تجاری مرکزی)، Financial Street، Zhongguancun و Liangmaqiao واقع شده است. شرکت‌های با فناوری پیشرفته و مؤسسات تحقیقات علمی عمدتاً در ژونگ‌گوانچون متمرکز هستند، در حالی که لیانگ ماکیائو شامل منطقه سفارت است. الگوی فضایی فعالیت های مربوط به تفریح ​​( شکل ۷ د) تا حدی شبیه به فعالیت های مربوط به کار است. به جز برخی مکان‌های تجاری، عمدتاً در اطراف Sanlitun از جمله میدان‌های خرید و غذاخوری، بارها و یک استادیوم توزیع می‌شود. همانطور که در شکل ۷ نشان داده شده استج، ف، مناطق کانونی حمل و نقل و فعالیت های مرتبط با پزشکی در مکان های خاص متمرکز شده اند. در مورد فعالیت حمل و نقل، مقدار بسیار کمی است که در ایستگاه راه آهن غرب پکن و ایستگاه راه آهن پکن توزیع می شود. در مورد فعالیت های مرتبط با پزشکی، عمدتاً در اطراف بیمارستان ها و کلینیک های سطح سوم A متمرکز شده است، مانند بیمارستان سوم دانشگاه پکن، بیمارستان کالج پزشکی اتحادیه پکن، بیمارستان مردمی دانشگاه پکن، و بیمارستان کودکان پکن.
همانطور که در شکل ۸ نشان داده شده است، تفاوت هایی بین مقصد و مبدا وجود دارد. معناشناسی فعالیت مقاصد کمتر از مبدا است. چهار فعالیت در مقصد شناسایی شده است. در مقایسه با مبدا، فعالیت های مرتبط با خانه ( شکل ۸الف) در مقصد بسیار بیشتر متمرکز است. منطقه مسکونی Yongdingmen که در قسمت جنوبی منطقه مورد مطالعه قرار دارد، به جز Dawanglu، Wangjing، Suzhoujie و Yuetan، یک منطقه مسکونی متراکم است. برعکس، فعالیت های مربوط به تفریح ​​بیشتر از مبدا توزیع می شود. مکان های یکپارچه با عملکردهای چندگانه خرید، ناهار خوری و سرگرمی مانند سانلیتون، دونگدان، زیدان، خیابان مالی، ژونگگوانچون، وانگژینگ، گونگژوفن و پانجیایوان شناسایی شده اند. علاوه بر این، خیابان عابر پیاده Wangfujing، استادیوم ملی، کاخ Yonghe، ۷۹۸ Art District، و دیگر جاذبه‌های معروف همه در این مناطق ظاهر می‌شوند. فعالیت حمل و نقل ( شکل ۸ ج) و فعالیت مرتبط با کار ( شکل ۸ب) به ترتیب دارای توزیع فضایی مشابه با مبدا هستند. در مورد فعالیت های مربوط به کار، محل های کاری نزدیک ایستگاه راه آهن غرب پکن در مقصد کشف شده است. جالب است بدانید که ایستگاه راه‌آهن جنوبی پکن، کانون فعالیت حمل‌ونقل در مقصد است. با این حال، ما نتوانستیم ایستگاه راه آهن پکن جنوبی را به عنوان کانون حمل و نقل در مبدا شناسایی کنیم. دلیل آن ممکن است وجود پدیده‌ای باشد که مردم برای گرفتن تاکسی در ایستگاه راه‌آهن جنوبی پکن مشکل دارند. این نشان می دهد که اپراتورهای مربوطه باید به تقاضا برای اتصالات سفر تاکسی در اطراف ایستگاه راه آهن جنوبی پکن توجه کنند. این نتایج معقول به نظر می رسند، که ثابت می کند روش ما برای استنباط معنایی فعالیت سفرهای O-D تاکسی موثر است.

۴٫۴٫ الگوهای فضایی-زمانی جریان های معنایی فعالیت

برای به دست آوردن بهتر نتایج تجسم مکانی و زمانی، یک روز را به شش دوره معمولی تقسیم کردیم: سحر (۰۱:۰۰-۰۴:۵۹)، صبح زود (۰۵:۰۰-۰۸:۵۹)، صبح (۰۹:۰۰-۱۲:۵۹). ، بعد از ظهر (۱۳:۰۰–۱۶:۵۹)، عصر (۱۷:۰۰–۲۰:۵۹) و نیمه شب (۲۱:۰۰–۰۰:۵۹). نمودار سانکی ( شکل ۹ ) برای مشاهده انتقال فعالیت از مبدا به مقصد در شش دوره مجزا استفاده می شود. خوشه‌بندی جریان به ما امکان می‌دهد الگوهای سفر را با توجه به توزیع معنایی فضایی و فعالیت آن‌ها تحلیل کنیم. با نگاشت خوشه های جریان معنایی فعالیت بزرگ، متوجه می شویم که این پارامتر αتنظیم بر نتایج خوشه بندی تأثیر می گذارد. اگر پارامتر αبیش از حد بزرگ تنظیم شود، خوشه ها آشفته خواهند بود، در حالی که از دست دادن الگو زمانی رخ می دهد که پارامتر α کوچک است. در این مقاله، ۲۵ فعالیت برتر خوشه های جریان معنایی با α ۰٫۳برای کشف الگوهای سفر انسان حفظ می شوند.
همانطور که در شکل ۹ الف نشان داده شده است، بسیاری از جریان ها از فعالیت های مربوط به تفریح ​​به فعالیت های مرتبط با خانه در طول ساعت ۰۱:۰۰ تا ۰۴:۵۹ تغییر می کنند. ترکیب شکل ۱۰ الف، نشان می دهد که جریان معنایی فعالیت “تفریحی-خانه” عمدتاً از مجتمع ورزشی کارگران پکن به Shifoying، Dawanglu و Shuangjing، و از Sanlitun به Dawanglu، Hufangqiao و Shuangjing متمرکز است. در همین حال، اضافه کاری در این دوره در اطراف لیانگ ماکیائو و چاووای کشف می شود. بعد از کار، افراد عمدتاً از لیانگ ماکیائو به شوانگجینگ و از چاووای به بایزیوان به خانه باز می گردند. جریان جزئی «خانه-خانه» از بیکسینچیائو به ژویوانلو رخ داد، جایی که ممکن است یک رویداد اجتماعی یا مهمانی وجود داشته باشد.
شکل ۹ ب انتقال مشاهده شده بین خانه و محل کار و بین خانه و حمل و نقل را نشان می دهد که نشان دهنده رفت و آمد و سفر یا تجارت است. در شکل ۱۰ب، برای فعالیت «خانه-حمل و نقل»، مقصد در ایستگاه راه‌آهن غرب پکن و ایستگاه راه‌آهن جنوبی پکن توزیع می‌شود. مبداها پراکنده‌تر از مقصدها هستند و عمدتاً در اطراف چونگ‌ونمن، مالیاندائو، یوتان، هپینگلی و داوانگلو توزیع شده‌اند. طول جریان معنایی فعالیت «خانه-حمل و نقل» بسیار بیشتر از سایرین است. به دلیل غیرقابل تعویض بودن ایستگاه راه آهن، تأثیر مسافت در سفر کمتر قابل توجه است. در مورد فعالیت «خانه-کار»، خوشه‌های فضایی دو طرفه بزرگ بین Liangmaqiao و CBD وجود دارد. جریان رفت‌وآمدهای طولانی‌تر را می‌توان از Wangjing تا Dawanglu نیز شناسایی کرد.
از ساعت ۰۹:۰۰ تا ۱۲:۵۹، انتقال فعالیت از مبدا به مقصد دارای توزیع نسبتا یکنواختی است ( شکل ۹ ج). همانطور که در شکل ۱۰ نشان داده شده استج، مقاصد نیز در ایستگاه راه‌آهن جنوبی پکن و ایستگاه راه‌آهن غرب پکن متمرکز شده‌اند، در حالی که معنای فعالیت مبدا متنوع‌تر است، به جز جریان معنایی فعالیت «خانه-حمل و نقل»، و مبدا از Sanlihe و Xueyuanlu به پکن جنوبی. ایستگاه راه‌آهن مجموعه‌های جریان معنایی فعالیت «هتل-حمل‌ونقل» را نشان می‌دهد. خوشه‌های جریان رفت‌وآمدهای طولانی‌تر در این دوره ظاهر شدند، مانند از Sijiqing و Wangjing به Jianguomen، و از Sanlitun به Zhichunlu. برخی از خاستگاه‌های معنایی فعالیت‌های حمل‌ونقل از ایستگاه راه‌آهن پکن و ایستگاه راه‌آهن غرب پکن شروع می‌شوند و به ترتیب به مقصد فعالیت‌های مرتبط با کار (وانشولو) و مقصد فعالیت‌های مرتبط با تفریح ​​(کیانمن) ختم می‌شوند.
در دوره بعد از ظهر (۱۳:۰۰ تا ۱۶:۵۹)، مبدأ عمدتاً در نوع فعالیت “مرتبط با کار” متمرکز است، در حالی که مقصد عمدتاً در فعالیت های مربوط به کار و فعالیت های مرتبط با خانه متمرکز است ( شکل ۹ د) . در شکل ۱۰د، خوشه‌های جریان معنایی فعالیت «کار-کار» نیز وجود دارد، با ارتباطات دو طرفه بین Liangmaqiao و CBD. این نیز از Financial Street تا CBD قابل توجه است. مردم همچنین تمایل دارند فعالیت های «مربوط به تفریح» را در اطراف Wangjing انجام دهند و در اطراف CBD به خانه بازگردند. ما همچنین متوجه شدیم که برخی از افرادی که در Zhongguancun زندگی می کنند برای کار به CBD می روند، در حالی که برخی از افرادی که در اطراف CBD زندگی می کنند به Zhongguancun می روند. دلیل ممکن است این باشد که Zhongguncun شامل تعداد زیادی محل کار و موسسات تحقیقاتی مرتبط با فناوری اطلاعات است، در حالی که CBD عمدتاً شامل مکان های کاری مرتبط با تجارت است.
همانطور که در شکل ۹ نشان داده شده است ، زمانی که افراد خارج از وظیفه هستند و به خانه باز می گردند، فعالیت های مرتبط با کار و تفریح ​​در مبدا اصلی هستند، در حالی که مقاصد عمدتاً به فعالیت های مربوط به خانه مربوط می شوند. شکل ۱۰e نشان می‌دهد، پس از پایان کار، افرادی که در ژیچونلو کار می‌کنند، در فعالیت‌های تفریحی در مجتمع ورزشی کارگران پکن، منطقه‌ای معروف با میدان‌های خرید، رستوران‌ها، بارها و یک استادیوم شرکت خواهند کرد. خوشه‌های جریان معنایی فعالیت «تفریحی-خانه» عمدتاً از چاووای تا وانلیو، از زیدان تا داتونلو و از مجتمع ورزشی کارگران پکن تا وانگ‌جینگ توزیع می‌شوند. برخی افراد اضافه کار می کنند و بنابراین جریان رفت و آمد نیز در این دوره ظاهر می شود. به عنوان مثال، فعالیت «کار-خانه» از چاووای و داوانگلو تا وانگجینگ متمرکز است. انتقال فعالیت حمل و نقل از ایستگاه راه آهن غرب پکن به ایستگاه راه آهن پکن اتفاق افتاد.
همانطور که در شکل ۹ f نشان داده شده است، تغییرات فعالیت از مبدا به مقصد مشابه شکل ۹ e است. شکل ۱۰f نشان می‌دهد که خوشه‌های جریان معنایی فعالیت به طور گسترده‌تری از ساعت ۲۱:۰۰ تا ۰۰:۵۹ توزیع شده‌اند، به ویژه فعالیت «کار-خانه» و فعالیت «تفریح-خانه». به عنوان مثال، افرادی که در Chaoyangmen کار می کنند به منطقه مسکونی Yongle و افراد سرگرم کننده در Taiyanggong به منطقه مسکونی Lugu باز می گردند. CBD هم فعالیت های مربوط به کار و هم فعالیت های مربوط به تفریح ​​را در این دوره نشان می دهد. افرادی که اضافه کاری در CBD کار می کنند در اطراف ایستگاه راه آهن غرب پکن به خانه بازمی گردند، در حالی که خوشه جریان معنایی فعالیت، افراد سرگرم کننده در CBD را نشان می دهد که به خانه خود در سینجیکو باز می گردند. ما همچنین متوجه شدیم که افرادی که در Zhonguancun اضافه کاری کار می کنند در امتداد جاده حلقه چهارم به Shaoyaoju به خانه باز می گردند. این ممکن است مربوط به تعطیلی مترو باشد.
همه یافته ها با حقایق شناخته شده سازگار است. علاوه بر این، جالب است بدانید که مکان‌ها معنای فعالیت‌های مختلفی را در دوره‌های مختلف نشان می‌دهند، مانند Chaowai، CBD و ایستگاه راه‌آهن غرب پکن.

۵٫ بحث و نتیجه گیری

استنباط معنایی فعالیت سفر و خوشه‌بندی الگوهای جریان ممکن است به درک عمیق‌تر رفتار سفر و تحرک انسان کمک کند، که می‌تواند به برنامه‌ریزی و مدیریت حمل‌ونقل کمک کند. در این مقاله، ما یک چارچوب دو لایه را برای بررسی الگوهای سفر انسان از دیدگاه جریان معنایی فعالیت پیشنهاد کردیم.
در لایه اول، ما یک روش استنتاج فعالیت را برای استنتاج معنایی فعالیت سفر، بر اساس مدل بهبود یافته Word2vec و رتبه‌بندی احتمال بازدید مبتنی بر قوانین بیزی توسعه دادیم. نتایج نشان می‌دهد که مبدا و مقصد سفر تاکسی به ترتیب به شش و چهار خوشه معنایی فعالیت معمولی تقسیم می‌شوند. به طور خاص، فعالیت های مبدا مربوط به خانه، مربوط به کار، حمل و نقل، مربوط به تفریح، مرتبط با هتل، و مرتبط با پزشکی است، در حالی که فعالیت های مقصد مربوط به خانه، مرتبط با کار، حمل و نقل و تفریح ​​است. . سپس، معناشناسی فعالیت استنباط شده را از سه روش مقایسه کردیم. نسبت فعالیت روش ما نزدیک به نتایج داده های بررسی سفر است. توزیع فضایی نقاط مهم معنایی فعالیت های مختلف بیشتر نشان می دهد که روش ما برای استنتاج فعالیت سفر O-D تاکسی موثر است. روش ما بافت جغرافیایی و پویایی فعالیت را در نظر می گیرد و می تواند برخی از فعالیت های مهم را با نسبت کم POI اما جذابیت بالا (مانند ایستگاه راه آهن) بهتر استنباط کند و تغییرات فعالیت را در یک روز نشان می دهد.
بر اساس معناشناسی فعالیت به‌دست‌آمده، روش خوشه‌بندی جریان برای شناسایی خوشه‌های جریان معنایی فعالیت غالب و بررسی الگوهای سفر انسان در لایه دوم پیشنهاد شده‌است.
چندین نتیجه و یافته را می توان از الگوهای مکانی و زمانی فعالیت های مختلف در منطقه مورد مطالعه به دست آورد:
(۱) تفاوت‌هایی در انتقال فعالیت از مبدا به مقصد در دوره‌های متمایز وجود دارد. از ساعت ۰۱:۰۰ تا ۰۴:۵۹، “تفریح-خانه” فعالیت معنایی اصلی است. در این میان پدیده اضافه کاری در این دوره شناسایی می شود. در اوایل صبح (۰۵:۰۰ تا ۰۸:۵۹)، به دلیل اوج صبح، “خانه-کار” و “خانه-حمل و نقل” بخش زیادی از فعالیت مشاهده شده را اشغال کردند، که نشان دهنده رفت و آمد و جریان سفر یا تجارت است. از ساعت ۰۹:۰۰ تا ۱۲:۵۹، انتقال فعالیت از مبدا به مقصد، توزیع نسبتاً یکنواختی دارد. در بعد از ظهر (۱۳:۰۰ تا ۱۶:۵۹)، مبدا عمدتاً در فعالیت های مربوط به کار متمرکز بود، در حالی که مقاصد عمدتاً در فعالیت های مربوط به کار و فعالیت های مرتبط با خانه متمرکز بودند. از ساعت ۱۷:۰۰ الی ۲۰:۵۹ که مردم از خدمت خارج می شوند و به خانه باز می گردند. «کار – خانه» و «تفریح ​​– خانه» معناشناسی فعالیت اصلی هستند. در دوره نیمه شب (۲۱:۰۰-۰۰:۵۹)، تغییرات فعالیت از مبدا به مقصد مشابه دوره قبل است.
(۲) از ساعت ۰۱:۰۰ تا ۰۴:۵۹، جریان معنایی فعالیت در مجتمع ورزشی کارگران پکن و Sanlitun متمرکز است که با فعالیت های مربوط به تفریح ​​مشخص می شود و در برخی مناطق مسکونی مانند Shifoying و Dawanglu پراکنده است. در طول روز (۰۵:۰۰-۱۶:۵۹)، مقصد عمدتاً در ایستگاه راه‌آهن غرب پکن و ایستگاه راه‌آهن جنوبی پکن توزیع می‌شود، در حالی که مبدا پراکنده‌تر از مقصد است. علاوه بر این، خوشه‌های جریان معنایی فعالیت دو طرفه بزرگ بین Liangmaqiao و CBD وجود دارد که فعالیت «خانه-کار» و «کار-کار» را نشان می‌دهد. Zhongguancun و CBD نیز به‌عنوان خوشه‌های جریان معنایی فعالیت دوطرفه کشف شدند که فعالیت «خانه-کار» را نشان می‌دهند. از ساعت ۲۱:۰۰ الی ۰۰:۵۹
(۳) به دلیل غیرقابل جایگزینی ایستگاه راه آهن، فعالیت جریان های معنایی که در ایستگاه های راه آهن شروع یا به پایان می رسد بسیار طولانی تر از سایرین است. یکی از یافته‌های جالب این است که ما نتوانستیم ایستگاه راه‌آهن جنوبی پکن را به‌عنوان کانون حمل‌ونقل در مبدا شناسایی کنیم. شایان ذکر است که مردم برای گرفتن تاکسی در ایستگاه راه آهن جنوبی پکن مشکل دارند.
این تحقیق یک چشم انداز جریان معنایی فعالیت جدید برای درک الگوهای سفر انسان ارائه می دهد. با این حال، محدودیت هایی در رابطه با داده ها و رویکرد وجود دارد. در مرحله اول، ترکیب منابع داده های متعدد منجر به نتایج قابل اعتمادتر استنتاج فعالیت و الگوهای سفر انسان می شود. به عنوان یک مطالعه آینده، ما داده‌های منطقه مورد علاقه (AOI) را در روش درگیر خواهیم کرد، که می‌تواند به استنباط دقیق‌تر فعالیت سفر کمک کند. در همین حال، باید توجه داشت که داده‌های تاکسی ناگزیر با مسائل نمایندگی مواجه می‌شوند [ ۱۶ ]]. بنابراین، ادغام داده‌های سوابق تلفن همراه، داده‌های کارت هوشمند حمل‌ونقل، و داده‌های ورود به شبکه‌های اجتماعی، می‌تواند حالت‌های مختلف سفر را توصیف کند و الگوهای مختلف سفر انسان را به طور جامع‌تر نشان دهد. در مرحله دوم، یک روز را بر اساس یک فاصله زمانی ثابت ۴ ساعت به شش دوره تقسیم کردیم. با این حال، مقیاس زمانی بر الگوهای سفر انسان تأثیر خواهد گذاشت. بنابراین، در کار بیشتر، ما یک اندازه‌گیری واحد از شباهت معنایی فعالیت مکانی-زمانی برای خوشه‌بندی جریان‌های مشابه ایجاد خواهیم کرد. در نهایت، این مقاله سفر انسان را از منظر جریان بررسی کرد. با این حال، انتخاب مسیر بین مبدا و مقصد مشخص نیست. در کارهای آینده می توان به چارچوب مدل چهار مرحله ای [ ۵۴ ] اشاره کرد و رفتارهای سفر انسان را به طور کامل شرح داد.

پیوست اول

شکل A1. نام‌های اصلی در شناخت انسان در منطقه مورد مطالعه.

منابع

  1. لیو، ی. لیو، ایکس. گائو، اس. گونگ، ال. کانگ، سی. ژی، ی. چی، جی. شی، ال. حس اجتماعی: رویکردی جدید برای درک محیط های اجتماعی-اقتصادی ما. ان دانشیار صبح. Geogr. ۲۰۱۵ ، ۱۰۵ ، ۵۱۲-۵۳۰٫ [ Google Scholar ] [ CrossRef ]
  2. گونگ، ال. لیو، ایکس. وو، ال. لیو، ی. استنباط اهداف سفر و کشف الگوهای سفر از داده‌های مسیر تاکسی. کارتوگر. Geogr. Inf. علمی ۲۰۱۶ ، ۴۳ ، ۱۰۳-۱۱۴٫ [ Google Scholar ] [ CrossRef ]
  3. گونگ، اس. کارتلیج، جی. بای، آر. یو، ی. لی، کیو. Qiu، G. استخراج الگوهای فعالیت از داده‌های مسیر تاکسی: یک چارچوب دو لایه با استفاده از خوشه‌بندی مکانی-زمانی، احتمال بیزی و شبیه‌سازی مونت کارلو. بین المللی جی. جئوگر. Inf. علمی ۲۰۲۰ ، ۳۴ ، ۱۲۱۰-۱۲۳۴٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  4. اسلم، NS; زو، دی. چنگ، تی. ابراهیم، ​​آقا؛ ژانگ، ی. غنی‌سازی معنایی فعالیت‌های ثانویه با استفاده از داده‌های کارت هوشمند و نقطه علایق: مطالعه موردی در لندن. ان GIS ۲۰۲۱ ، ۲۷ ، ۲۹-۴۱٫ [ Google Scholar ] [ CrossRef ]
  5. لیو، جی. منگ، بی. وانگ، جی. چن، اس. تیان، بی. ژی، جی. بررسی الگوهای فضایی-زمانی فعالیت‌های روزانه ساکنان با استفاده از داده‌های رسانه‌های اجتماعی مبتنی بر متن: مطالعه موردی پکن، چین. ISPRS Int. J. Geo-Inf. ۲۰۲۱ ، ۱۰ ، ۳۸۹٫ [ Google Scholar ] [ CrossRef ]
  6. Bhat، CR; Koppelman، مدل سازی بر اساس فعالیت FS تقاضای سفر. در کتابچه راهنمای علوم حمل و نقل ; Springer: Boston, MA, USA, 2006; صص ۳۹-۶۵٫ [ Google Scholar ] [ CrossRef ]
  7. بیچم، آر. وود، جی. Bowerman, A. مطالعه رفتارهای رفت و آمد با استفاده از تجزیه و تحلیل بصری مشترک. محاسبه کنید. محیط زیست سیستم شهری ۲۰۱۴ ، ۴۷ ، ۵-۱۵٫ [ Google Scholar ] [ CrossRef ]
  8. وو، ال. ژی، ی. سویی، ز. لیو، ی. تحرک انسانی درون شهری و انتقال فعالیت: شواهدی از داده های ورود به شبکه های اجتماعی. PLoS ONE ۲۰۱۴ ، ۹ ، e97010. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  9. لیو، ی. بازبینی چندین مفهوم اساسی جغرافیایی: دیدگاه حس اجتماعی. Acta Geogr. گناه ۲۰۱۶ ، ۷۱ ، ۵۶۴-۵۷۵٫ [ Google Scholar ] [ CrossRef ]
  10. چن، سی. لیائو، سی. Xie، X. وانگ، ی. Zhao, J. Trip2Vec: یک رویکرد جاسازی عمیق برای خوشه بندی و پروفایل اهداف سفر تاکسی. پارس محاسبات همه جا حاضر. ۲۰۱۹ ، ۲۳ ، ۵۳-۶۶٫ [ Google Scholar ] [ CrossRef ]
  11. لیو، ی. یائو، ایکس. گونگ، ی. کانگ، سی. شی، ایکس. وانگ، اف. وانگ، جی. ژانگ، ی. ژائو، پی. زو، دی. و همکاران روش‌های تحلیلی و کاربردهای تعاملات فضایی در عصر داده‌های بزرگ. Acta Geogr. گناه ۲۰۲۰ ، ۷۵ ، ۱۵۲۳-۱۵۳۸٫ [ Google Scholar ] [ CrossRef ]
  12. وانگ، پی. فو، ی. لیو، جی. هو، دبلیو. آگاروال، سی. همگام سازی تحرک انسان و تشخیص هدف سفر با مخلوطی از فرآیندهای هاکس. در مجموعه مقالات بیست و سومین کنفرانس بین المللی ACM SIGKDD در مورد کشف دانش و داده کاوی، نیویورک، نیویورک، ایالات متحده آمریکا، ۱۳ تا ۱۷ اوت ۲۰۱۷؛ صص ۴۹۵-۵۰۳٫ [ Google Scholar ] [ CrossRef ]
  13. کانگ، سی. لیو، ی. وو، ال. ترسیم الگوهای اتصال فضایی درون شهری توسط فعالیت‌های سفر: مطالعه موردی پکن، چین. در مجموعه مقالات بیست و سومین کنفرانس بین المللی ژئوانفورماتیک ۲۰۱۵، ووهان، چین، ۱۹ تا ۲۱ ژوئن ۲۰۱۵٫ صص ۱-۷٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  14. یو، م. کانگ، سی. آندریس، سی. Qin، K. لیو، ی. منگ، کیو. درک تعامل بین پویایی اتوبوس، مترو و تاکسی سواری در شنژن، چین. ترانس. GIS ۲۰۱۸ ، ۲۲ ، ۸۵۵-۸۷۱٫ [ Google Scholar ] [ CrossRef ]
  15. گائو، ی. چنگ، جی. منگ، اچ. لیو، ی. اندازه گیری خودهمبستگی مکانی-زمانی در داده های سری زمانی تحرک جمعی انسان. ژئو اسپات. Inf. علمی ۲۰۱۹ ، ۲۲ ، ۱۶۶-۱۷۳٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  16. لیو، ی. کانگ، سی. گائو، اس. شیائو، ی. Tian, ​​Y. درک الگوهای سفر درون شهری از داده های مسیر تاکسی. جی. جئوگر. سیستم ۲۰۱۲ ، ۱۴ ، ۴۶۳-۴۸۳٫ [ Google Scholar ] [ CrossRef ]
  17. لیو، ایکس. کانگ، سی. گونگ، ال. لیو، ی. ترکیب الگوهای تعامل فضایی در طبقه بندی و درک کاربری زمین شهری. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۶ ، ۳۰ ، ۳۳۴-۳۵۰٫ [ Google Scholar ] [ CrossRef ]
  18. ژنگ، ی. لیو، ال. وانگ، ال. Xie, X. کشف مناطقی از عملکردهای مختلف در یک شهر با استفاده از تحرک انسان و POIs Jing. در مجموعه مقالات هجدهمین کنفرانس بین المللی ACM SIGKDD در مورد کشف دانش و داده کاوی، پکن، چین، ۱۲ تا ۱۶ اوت ۲۰۱۲٫ پ. ۲۴۷٫ [ Google Scholar ]
  19. تائو، اچ. وانگ، ک. ژو، ال. لی، X. بررسی مجدد منطقه شهری و استنباط عملکرد منطقه ای بر اساس تعامل مکانی-زمانی. بین المللی جی دیجیت. زمین ۲۰۱۹ ، ۱۲ ، ۲۹۳–۳۱۰٫ [ Google Scholar ] [ CrossRef ]
  20. هو، اس. گائو، اس. وو، ال. خو، ی. ژانگ، ز. کوی، اچ. گونگ، X. طبقه‌بندی تابع شهری در سطح بخش جاده با استفاده از داده‌های مسیر تاکسی: یک رویکرد شبکه عصبی کانولوشنال گراف. محاسبه کنید. محیط زیست سیستم شهری ۲۰۲۱ ، ۸۷ ، ۱۰۱۶۱۹٫ [ Google Scholar ] [ CrossRef ]
  21. یی، دی. یانگ، جی. لیو، جی. لیو، ی. Zhang, J. شناسایی کمی توابع شهری با آزمون دقیق فیشر و داده‌های POI به کار رفته در طبقه‌بندی نواحی شهری: مطالعه موردی در جاده کمربندی ششم در پکن. ISPRS Int. J. Geo-Inf. ۲۰۱۹ ، ۸ ، ۵۵۵٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  22. خو، جی. لی، ا. لی، دی. لیو، ی. دو، ی. پی، تی. ما، تی. ژو، سی. تفاوت توسعه شهری در چین از دیدگاه حمل و نقل مسافر در اطراف جشنواره بهار. Appl. Geogr. ۲۰۱۷ ، ۸۷ ، ۸۵-۹۶٫ [ Google Scholar ] [ CrossRef ]
  23. یانگ، جی. یی، دی. کیائو، بی. ژانگ، جی. ویژگی‌های تغییر مکانی-زمانی شبکه‌های تعاملی فضایی: مطالعه موردی در جاده کمربندی ششم پکن، چین. ISPRS Int. J. Geo-Inf. ۲۰۱۹ ، ۸ ، ۲۷۳٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  24. لیو، ایکس. گونگ، ال. گونگ، ی. لیو، ی. افشای الگوهای سفر و ساختار شهر با داده‌های سفر تاکسی. J. Transp. Geogr. ۲۰۱۵ ، ۴۳ ، ۷۸-۹۰٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  25. زی، ک. دنگ، ک. ژو، ایکس. از مسیرها تا فعالیت ها: رویکرد پیوستن مکانی-زمانی. در مجموعه مقالات کارگاه بین المللی ۲۰۰۹ در مورد شبکه های اجتماعی مبتنی بر مکان، سیاتل، WA، ایالات متحده آمریکا، ۳ نوامبر ۲۰۰۹; صص ۲۵-۳۲٫ [ Google Scholar ] [ CrossRef ]
  26. Phithakkitnukoon، S. هورانونت، تی. دی لورنزو، جی. شیباساکی، آر. Ratti, C. Activity-Aware Map: شناسایی الگوی فعالیت روزانه انسان با استفاده از داده های تلفن همراه. در مجموعه مقالات کارگاه بین المللی درک رفتار انسانی، استانبول، ترکیه، ۲۲ اوت ۲۰۱۰; ص ۱۴-۲۵٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  27. یو، ی. وانگ، اچ.-د. هو، بی. لی، Q.-Q. لی، ی.-جی. بله، AG کالیبراسیون اکتشافی یک مدل تعامل فضایی با استفاده از مسیرهای GPS تاکسی. محاسبه کنید. محیط زیست سیستم شهری ۲۰۱۱ ، ۳۶ ، ۱۴۰-۱۵۳٫ [ Google Scholar ] [ CrossRef ]
  28. فورلتی، بی. سینتیا، پی. رنسو، سی. اسپینسانتی، ال. استنتاج فعالیت های انسانی از مسیرهای GPS. در مجموعه مقالات دومین کارگاه بین المللی ACM SIGKDD در محاسبات شهری، نیویورک، نیویورک، ایالات متحده آمریکا، ۱۱ اوت ۲۰۱۳٫ صص ۱-۸٫ [ Google Scholar ] [ CrossRef ]
  29. هوانگ، ال. لی، کیو. Yue, Y. شناسایی فعالیت از مسیرهای GPS با استفاده از جذابیت POI زمانی مکانی. در مجموعه مقالات دومین کارگاه بین المللی ACM SIGSPATIAL در مورد شبکه های اجتماعی مبتنی بر مکان، سن خوزه، کالیفرنیا، ایالات متحده آمریکا، ۲ نوامبر ۲۰۱۰٫ ص ۲۷-۳۰٫ [ Google Scholar ] [ CrossRef ]
  30. لی، اس. ژوانگ، سی. تان، ز. گائو، اف. لای، ز. Wu, Z. استنباط اهداف سفر و کشف الگوهای فعالیت مکانی-زمانی از مجموعه داده دوچرخه مشترک بدون اسکله در شنژن، چین. J. Transp. Geogr. ۲۰۲۱ ، ۹۱ ، ۱۰۲۹۷۴٫ [ Google Scholar ] [ CrossRef ]
  31. لیو، ایکس. هوانگ، Q. گائو، اس. Xia, J. کشف دانش فعالیت: شناسایی فعالیت‌های جمعی و فردی با ردپای دیجیتال و داده‌های جغرافیایی منبع باز. محاسبه کنید. محیط زیست سیستم شهری ۲۰۲۱ ، ۸۵ ، ۱۰۱۵۵۱٫ [ Google Scholar ] [ CrossRef ]
  32. یائو، ز. فو، ی. لیو، بی. هو، دبلیو. Xiong، H. بازنمایی توابع شهری از طریق جاسازی منطقه با الگوهای تحرک انسانی. در مجموعه مقالات بیست و هفتمین کنفرانس مشترک بین المللی هوش مصنوعی (IJCAI-18)، استکهلم، سوئد، ۱۳ تا ۱۹ ژوئیه ۲۰۱۸؛ صص ۳۹۱۹–۳۹۲۵٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  33. ژای، دبلیو. بای، ایکس. شی، ی. هان، ی. پنگ، Z.-R. Gu, C. Beyond Word2vec: رویکردی برای استخراج و شناسایی منطقه عملکردی شهری با ترکیب Place2vec و POI. محاسبه کنید. محیط زیست سیستم شهری ۲۰۱۹ ، ۷۴ ، ۱-۱۲٫ [ Google Scholar ] [ CrossRef ]
  34. یائو، ی. لی، ایکس. لیو، ایکس. لیو، پی. لیانگ، ز. ژانگ، جی. Mai، K. سنجش توزیع فضایی کاربری زمین شهری با ادغام نقاط مورد علاقه و مدل Google Word2Vec. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۷ ، ۳۱ ، ۸۲۵-۸۴۸٫ [ Google Scholar ] [ CrossRef ]
  35. میکولوف، تی. چن، ک. کورادو، جی. Dean, J. برآورد کارآمد نمایش کلمات در فضای برداری. در مجموعه مقالات اولین کنفرانس بین المللی بازنمایی های یادگیری، ICLR 2013، Scottsdale، AZ، ​​ایالات متحده آمریکا، ۲-۴ مه ۲۰۱۳٫ [ Google Scholar ]
  36. Tobler, WR یک فیلم کامپیوتری شبیه سازی رشد شهری در منطقه دیترویت. اقتصاد Geogr. ۱۹۷۰ ، ۴۶ ، ۲۳۴-۲۴۰٫ [ Google Scholar ] [ CrossRef ]
  37. یان، بی. یانوویچ، ک. مای، جی. Gao, S. از ITDL تا Place2Vec – استدلال درباره شباهت و ارتباط نوع مکان با یادگیری جاسازی‌ها از زمینه‌های فضایی تقویت‌شده. در مجموعه مقالات بیست و پنجمین کنفرانس بین‌المللی ACM SIGSPATIAL در مورد پیشرفت‌ها در سیستم‌های اطلاعات جغرافیایی، ردوندو بیچ، کالیفرنیا، ایالات متحده آمریکا، ۷ تا ۱۰ نوامبر ۲۰۱۷؛ پ. ۳۵٫ [ Google Scholar ] [ CrossRef ]
  38. ژوچوسکا، آر. جاسینا، م. کلوس، ام. Soczówka، P. یک روش مبتنی بر GIS برای ارزیابی ادغام فضایی ایستگاه‌های اشتراک‌گذاری دوچرخه. پایداری ۲۰۲۱ ، ۱۳ ، ۳۸۹۴٫ [ Google Scholar ] [ CrossRef ]
  39. کمیسیون حمل و نقل شهرداری پکن (BMCT)؛ موسسه حمل و نقل پکن (BTI). پنجمین بررسی جامع ترافیک شهری در پکن ; کمیسیون حمل و نقل شهرداری پکن: پکن، چین، ۲۰۱۶٫
  40. وانگ، اچ. هوانگ، اچ. Ni، X. Zeng, W. آشکارسازی ویژگی‌های مکانی-زمانی و الگوهای سفر شهری: تجزیه و تحلیل و مطالعه تجسمی در مقیاس بزرگ با داده‌های GPS تاکسی. ISPRS Int. J. Geo-Inf. ۲۰۱۹ ، ۸ ، ۲۵۷٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  41. گائو، اس. یانوویچ، ک. کوکللیس، اچ. استخراج مناطق عملکردی شهری از نقاط مورد علاقه و فعالیت های انسانی در شبکه های اجتماعی مبتنی بر مکان. ترانس. GIS ۲۰۱۷ ، ۲۱ ، ۴۴۶-۴۶۷٫ [ Google Scholar ] [ CrossRef ]
  42. فری، بی جی؛ Dueck, D. خوشه بندی با ارسال پیام بین نقاط داده. Science ۲۰۰۷ , ۳۱۵ , ۹۷۲-۹۷۷٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  43. راموس، جی. ادن، جی. Edu, R. استفاده از TF-IDF برای تعیین ارتباط کلمه در پرس و جوهای سند. در مجموعه مقالات اولین کنفرانس آموزشی در مورد یادگیری ماشین، Piscataway، NJ، ایالات متحده، ۳-۸ دسامبر ۲۰۰۳٫ صص ۱۱۳۳-۱۱۴۲٫ [ Google Scholar ]
  44. لیو، ک. کیو، پی. گائو، اس. لو، اف. جیانگ، جی. یین، ال. بررسی ایستگاه های مترو شهری به عنوان مکان های شناختی در شهرها با استفاده از نقاط مورد علاقه. Cities ۲۰۲۰ , ۹۷ , ۱۰۲۵۶۱٫ [ Google Scholar ] [ CrossRef ]
  45. کانگ، سی. ما، ایکس. تانگ، دی. لیو، ی. الگوهای تحرک انسانی درون شهری: دیدگاه مورفولوژی شهری. فیزیک یک آمار مکانیک. برنامه آن است. ۲۰۱۲ ، ۳۹۱ ، ۱۷۰۲-۱۷۱۷٫ [ Google Scholar ] [ CrossRef ]
  46. گائو، اس. وانگ، ی. گائو، ی. لیو، ی. درک ویژگی‌های جریان ترافیک شهری: بازاندیشی در مرکزیت بین‌المللی. محیط زیست طرح. برنامه B دس ۲۰۱۳ ، ۴۰ ، ۱۳۵-۱۵۳٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  47. لیو، ک. گائو، اس. کیو، پی. لیو، ایکس. یان، بی. Lu, F. Road2Vec: اندازه گیری تعاملات ترافیک در سیستم جاده های شهری از مسیرهای سفر عظیم. ISPRS Int. J. Geo-Inf. ۲۰۱۷ ، ۶ ، ۳۲۱٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  48. لی، ا. هوانگ، ی. Axhausen، KW رویکردی برای نسبت دادن فعالیت های مقصد برای گنجاندن در معیارهای دسترسی دوچرخه. J. Transp. Geogr. ۲۰۲۰ , ۸۲ , ۱۰۲۵۶۶٫ [ Google Scholar ] [ CrossRef ]
  49. کاتلز، ام . شهر اطلاعاتی: فناوری اطلاعات، بازسازی اقتصادی، و فرآیند شهری-منطقه ای . Blackwell: نیویورک، نیویورک، ایالات متحده آمریکا، ۱۹۸۹; صص ۴۸۰-۴۸۲٫ [ Google Scholar ]
  50. پی، تی. لیو، ی. گوا، اس. شو، اچ. دو، ی. ما، تی. ژو، سی. اصل استخراج داده های جغرافیایی بزرگ. Acta Geogr. گناه ۲۰۱۹ ، ۷۴ ، ۵۸۶-۵۹۸٫ [ Google Scholar ] [ CrossRef ]
  51. Batty, M. The New Science of Cities ; انتشارات MIT: کمبریج، MA، ایالات متحده; لندن، بریتانیا، ۲۰۱۳٫ [ Google Scholar ]
  52. گائو، ایکس. لیو، ی. یی، دی. کین، جی. کو، س. هوانگ، ی. Zhang, J. یک روش خوشه‌بندی جریان فضایی بر اساس محدودیت مکان مبدا-مقصد. دسترسی IEEE ۲۰۲۰ ، ۸ ، ۲۱۶۰۶۹–۲۱۶۰۸۲٫ [ Google Scholar ] [ CrossRef ]
  53. یائو، ایکس. زو، دی. گائو، ی. وو، ال. ژانگ، پی. لیو، ی. روش خوشه‌بندی جریان مکانی-زمانی گام به گام برای کشف روندهای تحرک. دسترسی IEEE ۲۰۱۸ ، ۶ ، ۴۴۶۶۶–۴۴۶۷۵٫ [ Google Scholar ] [ CrossRef ]
  54. مک نالی، ام جی مدل چهار مرحله ای. UC Irvine: مرکز تجزیه و تحلیل سیستم های فعالیت. ۲۰۱۸٫ در دسترس آنلاین: https://escholarship.org/uc/item/0r75311t (دسترسی در ۱۵ دسامبر ۲۰۲۱).
شکل ۱٫ منطقه مورد مطالعه در جاده کمربندی پنجم در پکن.
شکل ۲٫ چارچوب روش پیشنهادی: استنتاج فعالیت (لایه اول). و خوشه بندی جریان (لایه دوم).
شکل ۳٫ نمودار شماتیک چارچوب استنتاج فعالیت.
شکل ۴٫ درصد مبدا و مقاصدی که حاوی حداقل یک POI در فواصل مختلف پیاده روی هستند.
شکل ۵٫ تصویر جریان های مشابه و غیر مشابه. رنگ های مختلف معنای فعالیت های مختلف را نشان می دهد. دایره های مرزی تمام جریان های مشابهی را که نقاط مبدأ و مقصد آنها در داخل دایره است، مشخص می کند. f3 غیر مشابه است f1در جهت f4غیر مشابه است f1در فعالیت معنایی. f5و f6غیر مشابه هستند f1در درازا. فقط f2شبیه است به f1.
شکل ۶٫ توزیع زمانی فعالیت های مختلف در مبدا ( الف ) و مقصد ( ب ).
شکل ۷٫ توزیع فضایی فعالیت های مختلف سفر (منشا).
شکل ۸٫ توزیع فضایی فعالیت های مختلف سفر (مقصد).
شکل ۹٫ انتقال فعالیت از مبدا به مقصد در دوره های مختلف.
شکل ۱۰٫ توزیع فضایی خوشه های جریان معنایی فعالیت تاکسی در دوره های مختلف. رنگ جریان نشان دهنده نوع معنایی فعالیت است و عرض جریان متناسب با عدد است. O1 و D1: فعالیت های مرتبط با خانه. O2 و D2: فعالیت های مرتبط با کار. O3 و D3: فعالیت حمل و نقل. O4 و D4: فعالیت های مربوط به تفریح. O5: فعالیت مرتبط با هتل؛ O6: فعالیت های مرتبط با پزشکی.

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

خانهدربارهتماسارتباط با ما