۱٫ مقدمه
با توسعه سریع فناوریهای اطلاعات و ارتباطات (ICT) و استفاده گسترده از دستگاههای آگاه از موقعیت مکانی، دسترسی فزایندهای به دادههای حرکتی، مانند دادههای مسیر GPS خودرو، دادههای سوابق تلفن همراه و دادههای بررسی رسانههای اجتماعی وجود دارد. که می تواند وضوح مکانی و زمانی بالایی را برای مشاهده الگوهای سفر انسان در سطح فردی ارائه دهد [ ۱ ]. اگرچه چنین دادههای ریزدانه تحرک انسان شامل مکان دقیق و اطلاعات زمانی است، اطلاعات معنایی مربوط به الگوهای سفر و انواع فعالیت معمولاً وجود ندارد [ ۲ ، ۳ ، ۴ ، ۵ ]]. اطلاعات فعالیت روزانه برای درک رفتارهای سفر انسان حیاتی است زیرا تقاضاهای سفر از نیازهای افراد برای شرکت در فعالیت ها سرچشمه می گیرد [ ۶ ، ۷ ، ۸ ]. پیش از این، تجزیه و تحلیل مبتنی بر فعالیت در ادبیات، از نظرسنجیهای سنتی سفر مشتق میشد که یادآوری مصاحبهشوندگان از اطلاعات سفر و فعالیت [ ۲ ، ۹ ، ۱۰ ]، یعنی زمان و مکان پاسخدهنده چه فعالیتهایی را انجام میداد، ثبت میکرد. چنین نظرسنجی های سفر نیز پرهزینه و زمان بر هستند. در مقابل، داده های عظیم ردیابی GPS می توانند به طور موثر فعالیت های افراد را در زمان واقعی و فضای واقعی ثبت کنند [ ۱۱ ، ۱۲]. تاکسی ها نقش مهمی در سیستم های حمل و نقل عمومی در کلان شهرها دارند. علاوه بر این، دادههای مسیر تاکسی یک منبع اطلاعاتی غنی است که برای آشکار کردن الگوهای سفر [ ۱۳ ، ۱۴ ، ۱۵ ، ۱۶ ]، شناسایی عملکردهای شهری [ ۱۷ ، ۱۸ ، ۱۹ ، ۲۰ ، ۲۱ ] و کشف ساختار شهری استفاده میشود [ ۲۲ ، ۲۳ ، ۲۴]. با این حال، بسیاری از مطالعات موجود بر روی ویژگیهای مکانی و زمانی دادههای مسیر تاکسی تمرکز کردهاند در حالی که ویژگیهای معنایی فعالیت را نادیده میگیرند. بنابراین، شناسایی معناشناسی فعالیت و استنباط اهداف سفر از دادههای مسیر تاکسی یک موضوع تحقیقاتی ضروری است که میتواند به درک عمیقتری از الگوهای سفر انسان منجر شود.
اطلاعات نقطه مورد علاقه (POI) از داده های قدرتمندی برای شناسایی معنایی فعالیت ها پشتیبانی می کند. کار قبلی روشهایی را برای استنباط معنایی فعالیت با مرتبط کردن یک نقطه توقف با یک POI نامزد پیشنهاد کرده است. برخی از مطالعات بر روی فاصله جغرافیایی بین نقاط توقف و POIهای نامزد متمرکز شدند. به عنوان مثال، Xie و همکاران. [ ۲۵ ] یک معیار مبتنی بر فاصله را برای پیوستن به نقاط خروج تاکسی با نزدیکترین نقطه نقطه پیشنهاد کرد. Phithakkitnukoon و همکاران. [ ۲۶ ] یک معیار مبتنی بر شمارش را برای مرتبط کردن بیشترین تعداد POIهای گرفته شده در هر شبکه با معنای فعالیت نقطه توقف تاکسی پیشنهاد کرد. یو و همکاران [ ۲۷] یک شعاع بافر ساده را بر اساس مرکز خرید تعریف کرد و نقطه توقف نزدیک مراکز خرید را به عنوان سفرهای معنایی خرید در نظر گرفت. علاوه بر این، یک اندازهگیری احتمال برای بازتاب معنایی فعالیت استفاده شده است. به عنوان مثال، Furletti و همکاران. [ ۲۸ ] یک محدودیت مکانی-زمانی را تعریف کرد که منجر به انتخاب POIهای نامزد در حداکثر فاصله راه رفتن شد و احتمال بازدید را بر اساس مدل جاذبه و ساعات باز محاسبه کرد. هوانگ و همکاران [ ۲۹ ] رویکردی با استفاده از جذابیت مکانی-زمانی POI، که با اندازه POI محاسبه شد، برای شناسایی فعالیت از مسیر ارائه کرد. گونگ و همکاران [ ۲] یک چارچوب استنتاج فعالیت بیزی را معرفی کرد که هم محدودیت های مکانی و هم زمانی را در نظر می گیرد. گونگ و همکاران [ ۳ ] کار گونگ [ ۲ ] را با استفاده از خوشه بندی فضایی-زمانی، احتمال بیزی و شبیه سازی مونت کارلو گسترش داد. لی و همکاران [ ۳۰ ] چارچوبی را برای استنباط هدف سفر ارائه کرد که عوامل جامعی از جمله مسافت، زمان، محیط، نسبت نوع فعالیت و ظرفیت خدمات POI را در نظر گرفت.
این مطالعات عمدتاً بر محدودیتهای مکانی و زمانی برای انتخاب POI نامزد با حداکثر احتمال بازدید به منظور استنتاج معنایی فعالیت متکی بودند. با این حال، بافت جغرافیایی نادیده گرفته شد، که منجر به برخی اشتباهات در استنتاج معنایی فعالیت شد. به عنوان مثال، یک تاکسی در یک منطقه فرودگاه باید به عنوان “حمل و نقل” برچسب گذاری شود. با این حال، این مکان توسط چندین رستوران وابسته داخلی احاطه شده است، و گاهی اوقات به اشتباه به عنوان “ناهارخوری” استنباط می شود، به خصوص در زمان ناهار.
برای در نظر گرفتن بافت جغرافیایی، برخی از محققین [ ۵ ، ۱۰ ، ۳۱ ، ۳۲ ، ۳۳ ] تکنیکهای جاسازی کلمه را برای نمایش ویژگیها در یک فضای برداری ترکیب کردند. یائو و همکاران [ ۳۴ ] ابتدا یک روش جدید برای ادغام POI با مدل Google Word2Vec [ ۳۵ ] پیشنهاد کرد، بردار مشخصه هر دسته POI را بر اساس کوتاهترین مسیر محاسبه کرد و سپس از بردارها و یک روش خوشهبندی k-means برای استخراج مناطق عملکردی استفاده کرد. با این حال، ساختار فضای جغرافیایی تفاوت اساسی با زبان طبیعی دارد. POI ها در شهرها در فضای جغرافیایی توزیع شده اند و POI های نزدیک به شدت به یکدیگر مرتبط هستند [۳۶ ]. بنابراین، تبدیل POI به داده های توالی به طور مستقیم دارای محدودیت هایی در توضیح تعاملات فضایی بین POI است. برای حل مشکل فوق، یان و همکاران. [ ۳۷] تأثیر فاصله را برای گسترش مدل Word2Vec به مدل Place2Vec در نظر گرفت. با این حال، مطالعات ذکر شده در بالا، تغییرات پویای فعالیت جذب POI در زمانهای مختلف هنگام تبدیل POI به یک سند متوالی را در نظر نمیگیرند. به عنوان مثال، افرادی که با تاکسی به یک مرکز خرید میروند، میتوانند به عنوان فعالیت «خرید» در عصر و به عنوان فعالیت «کار» در صبح زود برچسب گذاری شوند. بنابراین، اگر تخلیه فرد در صبح زود یا عصر در همان مکان باشد، داده های توالی باید متفاوت باشد. تنها با در نظر گرفتن تأثیر فاصله، دنباله یکسان خواهد بود و نمی تواند پویایی فعالیت را نشان دهد.
علاوه بر این، کار قبلی فعالیتهای سفر را تنها با استفاده از موقعیتهای تخلیه و اطلاعات زمانی از دادههای مسیر تاکسی استنباط کرده است. با این حال، مکانهای تحویل و اطلاعات زمان نیز ارتباط نزدیکی با اهداف سفر دارند. به عنوان مثال، فعالیتهای «خانه» از نقطه تحویل و فعالیتهای «کار» از نقطه خروج میتواند به تمرکز بر استخراج الگوهای سفر یک فرد برای فعالیتهای رفتوآمد کمک کند. حرکت بین نقطه تحویل تاکسی و نقطه سقوط را می توان به عنوان یک جریان جغرافیایی در نظر گرفت و نشان دهنده تعامل فضایی بین دو مکان است. برای مثال، Żochowska و همکاران. [ ۳۸] یک روش مبتنی بر GIS را برای ارزیابی ادغام فضایی ایستگاههای اشتراکگذاری دوچرخه پیشنهاد کرد و جریان ترافیک بین ایستگاهها را برای توصیف تقاضا برای دوچرخهسواری به اشتراکگذاشته شد. خوشهبندی جریان میتواند جریانهای عظیم در سطح فردی را به طور مؤثر اداره کند و ارتباطات فضایی و روندهای تحرک را تعمیم دهد. کاوش معناشناسی فعالیت از منظر جریان به شدت با ویژگیهای مبدا و مقصد مرتبط است، بینشی در مورد سفر کامل ارائه میدهد و الگوهای سفر انسان را بهتر آشکار میکند.
برای رفع شکاف های پژوهشی ذکر شده، هدف اصلی این مقاله ایجاد یک چارچوب دو لایه برای کشف الگوهای سفر انسان از منظر جریان معنایی فعالیت بود. ما دادههای مسیر تاکسی و دادههای POI را برای استنباط معنایی فعالیت هر سفر تاکسی، و تعمیم جریان معنایی فعالیت مشابه برای آشکار کردن رفتارهای سفر انسان، یکپارچه کردیم. در این چارچوب، معنایی فعالیت در لایه اول به دست می آید. به طور خاص، ما رتبهبندی مبتنی بر احتمال بازدید بیزی را با بسط مدل استنتاج بیزی گونگ [ ۲ ] محاسبه کردیم.]. سپس، فناوری جاسازی کلمه (مدل Word2vec بهبودیافته) برای ساختن نمایش نهفته بردارهای هر نقطه برداشت و رها کردن استفاده شد. در مرحله بعد، از بردارها و روش خوشه بندی انتشار قرابت برای حاشیه نویسی معنایی فعالیت استفاده کردیم. در لایه دوم، یک روش خوشهبندی جریان مبتنی بر فعالیت برای کشف الگوهای سفر فضایی-زمانی جریانهای معنایی فعالیت مختلف، که میتواند برای برنامهریزی و مدیریت حملونقل استفاده شود، اعمال میشود. به طور خلاصه، مشارکت های این کار به شرح زیر برجسته می شود:
-
ما یک چارچوب دو لایه را برای آشکار کردن مؤثر الگوهای سفر انسانی بر اساس جریانهای معنایی فعالیت پیشنهاد میکنیم، که میتواند تعامل فضایی بین مبدا و مقصد را توصیف کند و معنای فعالیتهای مبدا و مقصد را نشان دهد.
-
ما بافت جغرافیایی و پویایی فعالیت را در نظر می گیریم، یک مدل Word2vec بهبود یافته و رتبه بندی احتمال بازدید مبتنی بر قوانین بیزی را هنگام ساختن نمایش برداری پنهان هر نقطه انتخاب و نقطه رها کردن، در نظر می گیریم.
ساختار باقی مانده این مقاله به شرح زیر است. بخش ۲ منطقه مورد مطالعه و مجموعه داده ها را معرفی می کند. بخش ۳ روش های چارچوب دو لایه پیشنهادی را ارائه می کند. در بخش ۴ ، حاشیهنویسی معنایی فعالیت، نتایج اعتبارسنجی مدل و پوشش الگوهای جریان معنایی فعالیت را مورد بحث قرار میدهیم. تمام نام مکان های ذکر شده در بخش ۴ با شکل A1 پیوست A مطابقت دارد . در نهایت، نتایج این مقاله ترسیم میشود و جهتگیریهای تحقیقاتی آتی در بخش ۵ مورد بحث قرار میگیرد .
۲٫ منطقه مطالعه و توصیف داده ها
۲٫۱٫ منطقه مطالعه
این تحقیق بر روی مطالعه موردی پکن که پایتخت چین و مرکز سیاسی، فرهنگی و آموزشی است، تمرکز دارد. منطقه درون جاده حلقه پنجم پکن به عنوان منطقه تحقیقاتی انتخاب شد ( شکل ۱ ). تا پایان سال ۲۰۲۰، مساحت منطقه در جاده کمربندی پنجم تقریباً ۶۶۸٫۶۵ کیلومتر مربع بود .شامل شش ولسوالی و جمعیت ساکن بیش از ۱۰ میلیون نفر. منطقه ای مناسب با کارکردهای شهری کامل و شامل اکثریت رفتارهای مسافرتی انسان است. سیستم حمل و نقل عمومی در پکن شامل اتوبوس، مترو، تاکسی و دوچرخه است. گزارش پنجمین نظرسنجی جامع ترافیک شهری در پکن اشاره میکند که حملونقل عمومی ۴۸٫۰ درصد از سفرها را در منطقه اصلی شهری آن تامین میکند. خدمات تاکسی گزینه مهمی برای سفر افراد است که حدود ۱۰ درصد از سفرهای درون شهری را تشکیل می دهد. سفر با تاکسی مسیرهای انعطاف پذیری را ارائه می دهد و نسبت به سایر روش های حمل و نقل از نظر زمان کارآمدتر است [ ۳۹ ، ۴۰ ].
۲٫۲٫ مجموعه داده ها
دادههای مسیر تاکسی در جاده کمربندی پنجم پکن از ۱۶ می (دوشنبه) تا ۲۰ می (جمعه) در سال ۲۰۱۶ جمعآوری شد. وضعیت تاکسیها تقریباً هر ۱۰ ثانیه بهطور خودکار توسط GPS نمونهبرداری میشود و دقت موقعیت تقریباً ۱۰ متر است. شناسه منحصربهفرد تاکسیها، طول جغرافیایی، عرض جغرافیایی، مهرهای زمانی، سرعت، جهتگیری، و اینکه آیا مسافران در حال جابجایی هستند، در دادههای خط سیر تاکسیها گنجانده شده است. با این حال، در مقایسه با مسیر تاکسی خام، برای هر سفر تاکسی نگران مبدا و موقعیت مقصد هستیم. از این رو، ما دادههای خط سیر خام را با دادههای سفر مبدأ-مقصد تاکسی (O-D) با تکیه بر وضعیت مسافران بهعنوان سوار و تحویل جمعآوری کردیم.
در همین حال، پیش پردازش داده ها ضروری است. ابتدا نقطه نامعتبر ناشی از خطاهای موقعیت یابی یا خطاهای انتقال را حذف کردیم. ثانیاً داده های سفر غیر منطقی را که کمتر از ۵۰۰ متر یا بیشتر از ۱۰۰ کیلومتر بود حذف کردیم. ثالثاً سرعت غیرعادی تاکسی بیش از ۱۲۰ کیلومتر بر ساعت نیز حذف شد. پس از تمیز کردن، تقریباً ۰٫۹۲ میلیون سفر تاکسی با ویژگی های نشان داده شده در جدول ۱ به دست آوردیم .
داده های POI از Gaode Map، یک شرکت ناوبری در چین جمع آوری شده است. مجموعه داده شامل ۵۱۳۵۴۹ POI است. ویژگی های هر POI شامل شناسه، نام، طول جغرافیایی، عرض جغرافیایی و دسته است. با در نظر گرفتن ویژگی های سفر تاکسی و عملکردهای شهری، POI های اولیه را به ۱۰ دسته، از جمله خانه، محل کار، حمل و نقل، غذاخوری، تفریح در روز، تفریح شبانه، جاذبه توریستی، هتل، مدرسه، و خدمات پزشکی مجدداً طبقه بندی کردیم ( جدول ۲ ).
داده های نظرسنجی سفر، زمان سوار شدن و پیاده شدن مسافران تاکسی، آدرس و هدف سفر را ثبت می کند. دادهها از مجموع ۲۱۱۲ سفر فردی در پکن از سپتامبر ۲۰۱۶ تا ژانویه ۲۰۱۷ جمعآوری شد و به عنوان حقیقت اصلی برای آشکار کردن اثربخشی مدل پیشنهادی در این مقاله استفاده شد.
۳٫ روش
۳٫۱٫ مفروضات روش پیشنهادی
برای آشکار کردن الگوهای سفر انسان از منظر جریان معنایی فعالیت، یک چارچوب دو لایه پیشنهاد کردیم. نمودار جریان روش پیشنهادی در شکل ۲ نشان داده شده است و می توان آن را به دو بخش تقسیم کرد. در لایه اول، از دادههای سفر O-D تاکسی و دادههای POI برای شناسایی معنایی فعالیت و استنتاج اهداف سفر استفاده کردیم (به بخش ۳٫۲ مراجعه کنید ). در لایه دوم، یک روش خوشهبندی جریان برای گروهبندی جریان معنایی فعالیت مشابه (به بخش ۳٫۳ مراجعه کنید ) و کشف توزیعهای مکانی-زمانی سفرها استفاده میشود.
۳٫۲٫ استنتاج فعالیت
استنتاج فعالیت در مجموع دارای چهار فرآیند است. ما ابتدا مناطق برداشت (PA) و مناطق تخلیه (DA) را ایجاد کردیم و POIهای نامزد را انتخاب کردیم ( بخش ۳٫۲٫۱ ). دوم، قوانین بیزی ( بخش ۳٫۲٫۲ ) برای محاسبه احتمال بازدید از هر POI نامزد استفاده شد. با این حال، معناشناسی فعالیت هر سفر نه تنها به احتمال بازدید از POI نامزد واحد بستگی دارد، بلکه به بافت جغرافیایی و روابط هموقوع فضایی نیز متکی است [ ۳۷ ، ۴۱ ]. بنابراین، بر اساس رتبهبندی احتمال بازدید از هر POI نامزد، ثالثاً، ما از مدل بهبود یافته Word2vec برای ساختن نمایش برداری پنهان هر نقطه برداشت و نقطه رها کردن استفاده کردیم.بخش ۳٫۲٫۳ ). در نهایت، ما از الگوریتم خوشهبندی انتشار قرابت [ ۴۲ ] برای خوشهبندی نقاط جمعآوری/نقاط سقوط مشابه و حاشیهنویسی معنایی فعالیت ( بخش ۳٫۲٫۴ ) استفاده کردیم.
۳٫۲٫۱٫ منطقه تحویل / تحویل
داده های مسیر تاکسی شامل نقطه سوار شدن و خروج است. با این حال، مکان ثبت شده، محل فعالیت واقعی نیست. بنابراین، ما نمی توانیم از این نقاط به عنوان مبدا یا مقصد به طور مستقیم استفاده کنیم. به عنوان مثال، هنگامی که کاربران از خانه به نقاط دیدنی می روند، باید برای سوار شدن به تاکسی به کنار جاده بروند و سپس باید تاکسی را در پارکینگ رها کرده و به مقصد واقعی بروند. اگرچه مردم تمایل دارند تا در نزدیکی تاکسی سوار شوند و رانندگان همیشه مسافران را تا جایی که ممکن است نزدیک به مقصدشان رها می کنند، مبدا یا مقصد دقیق نامشخص است. با توجه به وجود چندین نقطه نامزد توزیع شده در اطراف محل تحویل یا تحویل، بنابراین، منطقه تحویل (PA) و منطقه تخلیه (DA) برای انتخاب “POI های کاندید” تعریف شد. در این مطالعه، ما وضعیت واقعی جاده را در نظر می گیریم، δ. فاصله پیادهروی در زمان واقعی با استفاده از رابط برنامهنویسی نقشههای Gaode (API) به دست آمد. همانطور که در شکل ۳ نشان داده شده است ، از آنجایی که جاده های دو طرفه وجود دارد، POI های یک طرف احتمال بازدید بالاتری نسبت به طرف مقابل دارند. درصدی از نقاط تحویل و نقاط رهاسازی که می تواند حداقل یک POI نامزد با a پیدا کند δاز ۵ متر تا ۲۵۰ متر در شکل ۴ نشان داده شده است. منحنی زمانی که حداکثر آستانه فاصله راه رفتن ثابت می ماند δبه حدود ۱۰۰ متر رسید. بنابراین، برای تعریف PA و DA در این مطالعه، حداکثر آستانه مسافت پیادهروی را ۱۰۰ متر برای هر دو نقطه برداشت و رها کردن قرار دادیم.
۳٫۲٫۲٫ احتمال بازدید مبتنی بر قوانین بیزی
قوانین بیزی به طور گسترده برای محاسبه احتمال بازدید از POIهای نامزد استفاده شد [ ۲ ، ۳ ، ۳۰ ]. در این مطالعه، تابع احتمال بازدید برای هر POI کاندید است پمن( i = ۱، ۲، ۳، ……، n) به صورت زیر نمایش داده می شود:
جایی که پr (پمن| ( x ، y) ،ت)نشان دهنده احتمال بازدید یا بازدید مسافر تاکسی است پمناگر مسافر در محل سوار یا پیاده شود ( x ، y) در زمان تی. پr ( ( x , y) |پمن، تی )نشان دهنده احتمال این است که شخصی در آن مکان وارد یا از تاکسی خارج شود ( x ، y)اگر او بازدید کرده باشد یا تصمیم به بازدید داشته باشد پمندر زمان تی. پr (پمن| ت )احتمال بازدید است پمندر زمان t . پr ( t )احتمال بازدید در زمان است تی. پr ( ( x , y) ،ت)احتمال این است که مسافر تاکسی در آن مکان به تاکسی وارد یا از آن خارج شود ( x ، y) در زمان تی. با توجه به POI نامزد، مکان و زمان تحویل یا تحویل به صورت مشروط مستقل است پمنو فاصله بین نقطه تحویل یا رها کردن و POI نامزد پمننمایش اثر فروپاشی فاصله بنابراین، تابع احتمال [ ۲ ] می شود:
جایی که آمنجذابیت POI نامزد است پمن. پارامتر دفاصله پیاده روی در زمان واقعی از محل تحویل یا تحویل است ( x ، y)به POI نامزد پمنو βپارامتر فروپاشی فاصله است. پr (پمن| ت )احتمال بازدید است پمندر زمان t . در مقایسه با روش گونگ [ ۲ ] که تعیین کرد آمناز ۱ تا ۴ به صورت دستی، با توجه به توصیه کارشناسان، ما از روش فرکانس معکوس سند فرکانس (TF-IDF) [ ۴۳ ، ۴۴ ] برای انعکاس جذابیت استفاده می کنیم. در این مطالعه ما اتخاذ می کنیم β= ۱٫۵ _که با ادبیات موجود مطابقت دارد [ ۳ ، ۴۵ ، ۴۶ ]. علاوه بر این، پr (پمن| ت )متاثر از پویایی فعالیت است. به عنوان مثال، احتمال بازدید از یک رستوران از ساعت ۱۱:۰۰ تا ۱۳:۰۰ بیشتر از احتمال بازدید از محل کار در آن ساعت در روزهای هفته است. به همین ترتیب، احتمال بازدید از محل کار بیشتر از احتمال رفتن به رستوران از ساعت ۸:۰۰ تا ۱۰:۰۰ در روزهای هفته است. از این رو، دادههای ورود به شبکههای اجتماعی در اینجا برای انعکاس حیاتی انواع مختلف POI نامزد استفاده میشود. سرانجام، پr (پمن| ( x ، y) ،ت)از ۰ تا ۱ متغیر است و احتمال بازدید همه POIهای نامزد برابر با ۱ در مجموع است. در شکل ۳ما یک نمودار شماتیک از استنتاج فعالیت مبتنی بر قوانین بیزی ارائه می کنیم. POIهای غیر کاندید (با رنگ بنفش مشخص شده) که خارج از فضای قابل راه رفتن یا بسته هستند در نظر گرفته نمی شوند. برای POI های کاندید (که با رنگ سبز مشخص شده اند)، اندازه دایره ها جذابیت آنها را نشان می دهد. اگر فقط فاکتور فاصله را در نظر بگیریم، رستوران شماره ۱ نزدیکترین POI نامزد است. اگر فقط فاکتور زمان را در نظر بگیریم، رستوران شماره ۱ و رستوران شماره ۲ مکان هایی هستند که افراد به احتمال زیاد به آنجا می روند زیرا در یک روز هفته زمان ناهار است. اگر فقط با توجه به جذابیت POI ها، احتمال بازدید از هتل بیشتر از بقیه است. با این حال، با در نظر گرفتن فاکتورهای جامع از جمله مسافت، زمان و جذابیت POI، رتبه بندی POI های کاندید رستوران شماره ۱، هتل، مرکز خرید، رستوران شماره ۲ خواهد بود.
۳٫۲٫۳٫ مدل Word2vec
جاسازیهای کلمه به طور فزایندهای در پردازش زبان طبیعی (NLP) محبوب شدهاند و در واقع نوع خاصی از نمایش کلمه توزیعشده هستند که با استفاده از شبکههای عصبی ساخته میشوند که عمدتاً پس از سال ۲۰۱۳ با معرفی مدل Word2vec رایج شدند [ ۳۵ ]. مدل Word2vec معمولاً به عنوان یک روش بدون نظارت قاب بندی می شود، زیرا نیازی به حاشیه نویسی دستی از داده های آموزشی ندارد. مدل Word2vec میتواند کلمات را به فضاهای برداری متراکم و کمبعدی بر اساس روابط بافتی در اسناد نشان دهد و کلمات بافت مشابه به نقاط نزدیک نگاشت میشوند. بنابراین، فاصله بین دو بردار کلمه را می توان برای اندازه گیری شباهت معنایی آنها استفاده کرد (به عنوان مثال، “قایق” – “کشتی”) [ ۴۷ ]]. Word2vec در دو معماری مدل ارائه می شود، مدل Continuous Bags-of-Words (CBOW) و مدل Skip-Gram. مدل CBOW کلمات هدف را با استفاده از کلمات بافت اطراف خود پیشبینی میکند، در حالی که مدل Skip-Gram با توجه به کلمات هدف، کلمات بافت اطراف را پیشبینی میکند.
همانطور که در شکل ۳ نشان داده شده است، معنایی فعالیت سفر باید بر اساس حداکثر احتمال بازدید قوانین بیزی به عنوان “ناهارخوری” استنتاج شود. با این حال، بافت جغرافیایی در اینجا نادیده گرفته شده است. مطالعات کمی روابط همزمانی پنهان را در بین POIهای نامزد مختلف و نحوه تعامل فضایی آنها با یکدیگر برای حمایت از فعالیت سفر بررسی کرده اند. به عنوان مثال، فعالیت «اسکان در هتل»، هموقوع فضایی بین «هتل»، «رستوران» و «بار» و غیره است. ایستگاه راهآهن شامل تعداد زیادی رستوران است و هموقوع فضایی در میان این انواع POI منعکسکننده است. فعالیت حمل و نقل. مزیت مدل Word2vec در گرفتن این زمینه فضایی و روابط همزمان است.
در این مقاله، ما روابط مشابهی بین PA/DA و اسناد ایجاد می کنیم. یک سند متنی از کلمات تشکیل شده است، در حالی که یک PA/DA از نقطه تحویل/نقطه خروج و POIهای نامزد تشکیل شده است. بنابراین، در قیاس با استفاده مدل Word2vec از مواد متنی، ما PA/DA را به عنوان سند، «نقطه توقف تاکسی» داخلی (نقطه تحویل یا نقطه خروج) را به عنوان کلمات هدف، و «داخلی» را به عنوان کلمات هدف در نظر می گیریم. نامزد POI» به عنوان کلمات زمینه. فرضیه پشت این بیان می کند که: «نقطه توقف تاکسی» در زمینه های یکسان ظاهر می شود و معنای معنایی فعالیت یکسانی دارد. بنابراین، مدل CBOW را انتخاب کردیم. جزئیات این روش در [ ۳۵ ] شرح داده شده است.
از آنجایی که ساختار فضای جغرافیایی به طور قابل توجهی با زبان طبیعی متفاوت است، ما به جای فاصله اقلیدسی، رتبهبندی مبتنی بر احتمالات بیزی را اضافه میکنیم تا دنبالهای از هر نقطه انتخاب و نقطه سقوط بسازیم. مزیت استفاده از رتبهبندی مبتنی بر احتمال بازدید بیزی این است که بر پویایی فعالیت تأکید میکنیم. در مقایسه با استفاده از رتبهبندی مبتنی بر فاصله، توالی اطراف «POIهای نامزد» (کلمات متنی) تا «نقطه توقف تاکسی» (کلمات هدف) در طول یک روز متفاوت است. نمودار شماتیک در شکل ۳ را در نظر بگیریدبه عنوان مثال. هنگام استفاده از رتبهبندی مبتنی بر احتمال، «هتل» نزدیکترین کلمه متنی به «نقطه توقف تاکسی» در نیمهشب و «رستوران» نزدیکترین کلمه متنی به «نقطه توقف تاکسی» در ظهر است. در مقابل، هنگام استفاده از رتبه بندی بر اساس فاصله، “رستوران” همیشه نزدیک ترین کلمه متنی به “نقطه توقف تاکسی” در یک روز است. این بدان معنی است که تنها با در نظر گرفتن رتبه بندی بر اساس مسافت، توالی “نقاط توقف تاکسی” در یک روز یکسان خواهد بود و نمی تواند پویایی فعالیت را نشان دهد. در طی فرآیند ساخت مدل بهبود یافته Word2vec، بعد بردارهای کلمه را ۲۰۰، اندازه پنجره را ۵، تعداد تکرارها را برابر با ۲۰ و سایر پارامترها را روی مقادیر توصیه شده تنظیم کردیم.
پس از آموزش مدل، فاصله کسینوس بردارهای “نقطه توقف تاکسی” برای نشان دادن شباهت و مقادیر تشابه بالاتر محاسبه می شود که نشان دهنده تشابه معنایی فعالیت قوی تر است.
۳٫۲٫۴٫ حاشیه نویسی معنایی فعالیت
بر اساس شباهت بهدستآمده از مدل بهبودیافته Word2vec، از الگوریتم انتشار Affinity برای خوشهبندی سفرهای مشابه در یک گروه و سپس حاشیهنویسی معنایی فعالیت برای هر سفر در سه مرحله استفاده میکنیم: (۱) حاشیهنویسی هر نقطه برداشت با یک فعالیت ; (۲) حاشیه نویسی هر نقطه رها کردن با یک فعالیت. (۳) پیوند دادن نوع فعالیت O-D برای غنی سازی معنایی فعالیت سفر. برای حاشیه نویسی معنایی فعالیت، جنبه های زیر را در نظر گرفتیم [ ۴۸ ]:
- (۱)
-
چگالی داخلی (ID). منDمن ج=نمن ج/نj.
- (۲)
-
چگالی خارجی (ED). EDمن ج=نمن ج/نمن.
- (۳)
-
توزیع زمانی فعالیت های مختلف
جایی که نمن جتعداد است من تا ساعتPOI در j t h فعالیت، نمنتعداد است من تا ساعتPOI، و نjتعداد POI در است j t hفعالیت.
۳٫۳٫ خوشه بندی جریان
سفر O-D تاکسی یک جریان هدایت شده از مبدا به مقصد است که می تواند الگوهای سفر را آشکار کند. در این مقاله، یک جریان O-D تاکسی بهعنوان یک شی هندسی بهجای اینکه بهعنوان یک نقطه برداشت و رها کردن جدا شده در نظر گرفته میشود. برخلاف فضای محلی سنتی، این جریانهای O-D یک فضای جریان را تشکیل میدهند [ ۴۹ ، ۵۰ ] و بر تعاملات فضایی عناصر تأکید میکنند. مایکل باتی استدلال می کند که برای درک فضا، باید جریان ها را درک کنیم [ ۵۱ ]. بنابراین، ما الگوهای سفر مکانی و زمانی انسان را از منظر جریان بررسی می کنیم.
پس از حاشیه نویسی معنایی فعالیت، می توانیم جریان های معنایی فعالیت تاکسی را بدست آوریم. هر جریان معنایی فعالیت را می توان به صورت بیان کرد fمن= oایکسمن، oyمن، oآمن، دایکسمن، دyمن، دآمن، o دآمن، جایی که ( oایکسمن، oyمن)و ( دایکسمن، دyمن)به ترتیب مختصات فضایی نقطه برداشت و نقطه سقوط هستند و oآمنو دآمنبه ترتیب معناشناسی فعالیت مبدا و مقصد هستند. o dآمنفعالیت معنایی است fمن.
در این مقاله، ما یک روش خوشهبندی جریان را بر اساس محدودیتهای مکان نقاط O-D و معنایی فعالیت پیشنهاد کردیم. برای اندازه گیری شباهت فضایی و معنایی بین جریان های معنایی فعالیت باید سه اصل در نظر گرفته شود:
- (۱)
-
جریان ها دارای فعالیت معنایی یکسانی هستند.
- (۲)
-
جریان ها در مجاورت فضایی با یکدیگر هستند.
- (۳)
-
طول و جهت جریان تقریباً برابر است.
شکل ۵ شش جریان را نشان می دهد. فقط f1و f2همه اصول را برآورده می کنند و مشابه هستند.
در رویکرد ما، یک استراتژی دو مرحلهای اتخاذ میشود که در آن خوشهبندی جریان فضایی پس از استنتاج فعالیت انجام میشود. برای خوشهبندی جریان فضایی، مسئله کلیدی اندازهگیری شباهت فضایی بین جریانها است. برای محاسبه عدم تشابه فضایی از رابطه زیر استفاده می کنیم اسDمن جبین fمنو fj.
جایی که،
در معادلات، سدمن j oو سدمن j dنشان دهنده عدم تشابه فضایی منشاء بین fمنو fjو عدم تشابه فضایی مقصد بین fمنو fj، به ترتیب. دمن هستم ( ) _نشان دهنده فاصله اقلیدسی بین نقاط است. l enمنو l enjطول جریان را برمی گرداند fمنو fj، به ترتیب. αیک ضریب اندازه و حاصلضرب است αو طول کوتاهتر برابر با شعاع دایره مرزی است. انتخاب می کنیم α = ۰٫۳که با کار موجود مطابقت دارد [ ۵۲ ، ۵۳ ]. کوچکتر اسDمن جیعنی هر چه جریان ها شبیه تر باشند. متعاقبا، یک چارچوب خوشهبندی تجمعی برای پیادهسازی خوشهبندی جریان استفاده میشود که جریانهای معنایی و فضایی مشابه فعالیت را ادغام میکند تا سلسله مراتبی از خوشههای جریان را تشکیل دهد. فرآیند خوشه بندی جریان در الگوریتم ۱ نشان داده شده است. برای تنظیمات پارامتر دقیق تر، لطفاً به [ ۵۲ ] مراجعه کنید.
الگوریتم ۱ خوشه بندی فضایی جریان معنایی فعالیت |
ورودی: f= {fمن| ۱ ≤ i ≤ n }– مجموعه ای از جریان های فعالیت؛ و
α– ضریب اندازه
خروجی: مجموعه ای از خوشه های فضایی و جریان فعالیت FC = { Fسیمن| ۱ ≤ i ≤ m }.
مراحل:
۱٫ kd-tree را بر اساس نقطه میانی جریان بسازید.
۲٫ هر جریان را یک خوشه منحصر به فرد برای مقداردهی اولیه
خوشه های جریان اصلی بسازید: FC = { Fسیمن}و افسیمن= {fمن}، ۱ ≤ i ≤ n.
۳٫ برای هر جریان fمن، آن را پیدا کنید کمنجریان می یابد: کمنبا فاصله بین نقطه میانی محاسبه می شود fمنو جریان آن فاصله های میانی در محدوده ۲–√α ⋅ l enمن. تولید می کنند کمن جفت جریان (fمن، fj)، جایی که ۱ ≤ j ≤ کمن.
۴٫ برای هر جفت جریان (fمن،fj)،
۴٫۱ خوشه ها را پیدا کنید افسیمنو افسیjکه fمنو fjمتعلق به
۴٫۲ اگر افسیمنو افسیjخوشه های مختلف هستند،
۴٫۲٫۱ مقایسه معنایی فعالیت،
۴٫۲٫۲ اگر افسیمنو افسیj دارای همان فعالیت معنایی
۴٫۲٫۲٫۱ محاسبه اسDمن جبین افسیمنو افسیj.
۴٫۲٫۲٫۲ اگر اسDمن ج≤ ۱، دو خوشه را ادغام کنید: افسیمن← افسیمن∪ افسیjو افسی← افسی/ افسیj. |
۴٫ نتایج
۴٫۱٫ نتایج حاشیه نویسی معنایی فعالیت
همانطور که در بخش ۳٫۲٫۴ ذکر شد ، مبدا و مقصد سفر تاکسی به ترتیب به شش خوشه معمولی و چهار خوشه معمولی تقسیم می شوند. نتایج جزئی برای ID و ED در جدول ۳ ارائه شده است و توزیع زمانی در شکل ۶ نشان داده شده است . بر اساس این نتایج، ما هر مبدأ یا مقصد را با معناشناسی فعالیت به شرح زیر شرح دادیم:
O1 و D1: مربوط به خانه. برای O1: اگرچه “ناهارخوری” مشخص ترین دسته POI با این مبدا است، “خانه” بالاترین ED را دارد. از شکل ۶ می بینیم که O1 بین ۶:۰۰ صبح تا ۸:۰۰ صبح به بالاترین نقطه می رسد، علاوه بر این، “Dining” و “Schooling” POI های کمکی برای مناطق مسکونی هستند. برای D1: “خانه” بیشتر با D1 مرتبط است (ED 99.1٪ است، و نسبت افرادی که به اوج D1 می رسند در شب اتفاق می افتد. بنابراین، ما O1 و D1 را بهعنوان مرتبط با خانه یادداشت کردیم.
O2 و D2: مربوط به کار. برای O2: مشخص ترین دسته POI “Work” است که بالاترین ED را نیز دارد. برای D2: “ناهارخوری” و “کار” به عنوان محل کار در نظر گرفته می شود. همانطور که در شکل ۶ نشان داده شده است ، O2 در عصر به بالاترین حد خود رسید، در حالی که D2 در صبح به بالاترین حد خود رسید. بنابراین، ما O2 و D2 را به عنوان مرتبط با کار حاشیه نویسی کردیم.
O3 و D3: حمل و نقل. «ناهارخوری» و «حمل و نقل» معمولاً اتفاقات فضایی مشترک هستند، مانند ایستگاههای راهآهن و فرودگاهها. “حمل و نقل” ED به ترتیب ۵۲٫۱٪ و ۸۳٫۵٪ در مبدا و مقصد است. هر دو O3 و D3 سرزندگی کمی در طول روز دارند. بنابراین، ما O3 و D3 را به عنوان حمل و نقل مشروح کردیم.
O4 و D4: مربوط به تفریح. هم در ID و هم در ED، “Dining” بیشترین نسبت POI را تشکیل می دهد. در O4: دو نوع POI زیر عبارتند از تفریحات شبانه و روزی، به طور مشابه، و پس از آن «هتل» و «تفریح روزانه» در D4 هستند. شایان ذکر است که ED در بین این POI ها ثابت ماند. بنابراین، ما از “Recreation” برای جمع آوری این POI ها استفاده می کنیم.
O5: مربوط به هتل. محبوب ترین رده POI در O5 “Dining” است اما یک POI کمکی برای “Hotel” است. علاوه بر این، “هتل” بالاترین ED را دارد. بنابراین، ما O5 را به عنوان مرتبط با هتل شرح دادیم.
O6: مربوط به پزشکی. “خدمات پزشکی” نوع مهم POI در O6 است. در همین حال، “خدمات پزشکی” مرتبط با رستوران ها و هتل ها، به طور کلی برای بیماران ورودی است. بنابراین، ما O6 را به عنوان مرتبط با پزشکی شرح دادیم.
۴٫۲٫ مقایسه معناشناسی فعالیت استنباط شده از سه روش
ما روش پیشنهادی گونگ [ ۲ ] و یائو [ ۳۴ ] را به ترتیب به عنوان روش اول و روش دوم برای انجام آزمایش های مقایسه ای در نظر می گیریم. در این مطالعه، در مجموع ۲۱۱۲ داده پیمایش فعالیت مسافرتی فردی، مربوط به سفر تاکسی در پکن از سپتامبر ۲۰۱۶ تا ژانویه ۲۰۱۷، جمعآوری شد و به عنوان حقیقت اصلی برای آشکار کردن اثربخشی روش پیشنهادی ما (روش III) استفاده شد. ما نسبت فعالیت های تولید شده توسط سه روش ذکر شده در جدول ۴ را محاسبه کردیم . همانطور که از جدول ۴ مشاهده می شود، نتایج روش III به خوبی با داده های بررسی سفر مطابقت دارد. نسبت فعالیت های تفریحی در روش اول و روش دوم بسیار بیشتر از نظرسنجی سفر است. و فعالیتهای حملونقل در روش اول و روش دوم بسیار کمتر از دادههای نظرسنجی است که به ترتیب ۵۰/۳ و ۲۷/۲ درصد است. ما حدس می زنیم که این ناشی از کیفیت مجموعه داده POI است. در روش I، جذابیت POI ها به صورت دستی تنظیم می شود و POI ها به همان وزن در هنگام ساخت بردار در روش دوم مشخص می شوند. توالی POI در روش III تغییرات دینامیکی را در طول ساخت بردارها در نظر می گیرد. هنگام استفاده از داده های بررسی سفر به عنوان مرجع، متوجه می شویم که عملکرد روش III از دو روش دیگر بیشتر است. بدین ترتیب،
۴٫۳٫ توزیع فضایی فعالیت های مختلف سفر
نقاط مهم فعالیت های مختلف را با استفاده از روش تخمین چگالی هسته (KDE) ترسیم می کنیم. شکل ۷ توزیع چگالی فضایی هر فعالیت شناسایی شده مبدا را نشان می دهد. شکل ۷a,e نشان میدهد که حوزههای فعالیتهای مرتبط با خانه و هتل که مربوط به اسکان روزانه هستند، به طور گستردهتری توزیع شدهاند. به طور خاص، فعالیت های مرتبط با خانه در مناطق مسکونی عمده مانند Tuanjiehu، Dawanglu، Wangjing، Suzhoujie و Yuetan متمرکز شده است. در مقابل، فعالیتهای مرتبط با هتل عمدتاً نزدیک به مراکز حملونقل (دونگژیمن، ایستگاه راهآهن غرب پکن و ایستگاه راهآهن پکن)، بیمارستانها (بیمارستان سوم دانشگاه پکن و بیمارستان آنژن) و مناطق کاری و تجاری (Xidan، Dongdan و Wudaokou) توزیع میشوند. فعالیت های مرتبط با کار ( شکل ۷ب) عمدتاً در CBD (منطقه تجاری مرکزی)، Financial Street، Zhongguancun و Liangmaqiao واقع شده است. شرکتهای با فناوری پیشرفته و مؤسسات تحقیقات علمی عمدتاً در ژونگگوانچون متمرکز هستند، در حالی که لیانگ ماکیائو شامل منطقه سفارت است. الگوی فضایی فعالیت های مربوط به تفریح ( شکل ۷ د) تا حدی شبیه به فعالیت های مربوط به کار است. به جز برخی مکانهای تجاری، عمدتاً در اطراف Sanlitun از جمله میدانهای خرید و غذاخوری، بارها و یک استادیوم توزیع میشود. همانطور که در شکل ۷ نشان داده شده استج، ف، مناطق کانونی حمل و نقل و فعالیت های مرتبط با پزشکی در مکان های خاص متمرکز شده اند. در مورد فعالیت حمل و نقل، مقدار بسیار کمی است که در ایستگاه راه آهن غرب پکن و ایستگاه راه آهن پکن توزیع می شود. در مورد فعالیت های مرتبط با پزشکی، عمدتاً در اطراف بیمارستان ها و کلینیک های سطح سوم A متمرکز شده است، مانند بیمارستان سوم دانشگاه پکن، بیمارستان کالج پزشکی اتحادیه پکن، بیمارستان مردمی دانشگاه پکن، و بیمارستان کودکان پکن.
همانطور که در شکل ۸ نشان داده شده است، تفاوت هایی بین مقصد و مبدا وجود دارد. معناشناسی فعالیت مقاصد کمتر از مبدا است. چهار فعالیت در مقصد شناسایی شده است. در مقایسه با مبدا، فعالیت های مرتبط با خانه ( شکل ۸الف) در مقصد بسیار بیشتر متمرکز است. منطقه مسکونی Yongdingmen که در قسمت جنوبی منطقه مورد مطالعه قرار دارد، به جز Dawanglu، Wangjing، Suzhoujie و Yuetan، یک منطقه مسکونی متراکم است. برعکس، فعالیت های مربوط به تفریح بیشتر از مبدا توزیع می شود. مکان های یکپارچه با عملکردهای چندگانه خرید، ناهار خوری و سرگرمی مانند سانلیتون، دونگدان، زیدان، خیابان مالی، ژونگگوانچون، وانگژینگ، گونگژوفن و پانجیایوان شناسایی شده اند. علاوه بر این، خیابان عابر پیاده Wangfujing، استادیوم ملی، کاخ Yonghe، ۷۹۸ Art District، و دیگر جاذبههای معروف همه در این مناطق ظاهر میشوند. فعالیت حمل و نقل ( شکل ۸ ج) و فعالیت مرتبط با کار ( شکل ۸ب) به ترتیب دارای توزیع فضایی مشابه با مبدا هستند. در مورد فعالیت های مربوط به کار، محل های کاری نزدیک ایستگاه راه آهن غرب پکن در مقصد کشف شده است. جالب است بدانید که ایستگاه راهآهن جنوبی پکن، کانون فعالیت حملونقل در مقصد است. با این حال، ما نتوانستیم ایستگاه راه آهن پکن جنوبی را به عنوان کانون حمل و نقل در مبدا شناسایی کنیم. دلیل آن ممکن است وجود پدیدهای باشد که مردم برای گرفتن تاکسی در ایستگاه راهآهن جنوبی پکن مشکل دارند. این نشان می دهد که اپراتورهای مربوطه باید به تقاضا برای اتصالات سفر تاکسی در اطراف ایستگاه راه آهن جنوبی پکن توجه کنند. این نتایج معقول به نظر می رسند، که ثابت می کند روش ما برای استنباط معنایی فعالیت سفرهای O-D تاکسی موثر است.
۴٫۴٫ الگوهای فضایی-زمانی جریان های معنایی فعالیت
برای به دست آوردن بهتر نتایج تجسم مکانی و زمانی، یک روز را به شش دوره معمولی تقسیم کردیم: سحر (۰۱:۰۰-۰۴:۵۹)، صبح زود (۰۵:۰۰-۰۸:۵۹)، صبح (۰۹:۰۰-۱۲:۵۹). ، بعد از ظهر (۱۳:۰۰–۱۶:۵۹)، عصر (۱۷:۰۰–۲۰:۵۹) و نیمه شب (۲۱:۰۰–۰۰:۵۹). نمودار سانکی ( شکل ۹ ) برای مشاهده انتقال فعالیت از مبدا به مقصد در شش دوره مجزا استفاده می شود. خوشهبندی جریان به ما امکان میدهد الگوهای سفر را با توجه به توزیع معنایی فضایی و فعالیت آنها تحلیل کنیم. با نگاشت خوشه های جریان معنایی فعالیت بزرگ، متوجه می شویم که این پارامتر αتنظیم بر نتایج خوشه بندی تأثیر می گذارد. اگر پارامتر αبیش از حد بزرگ تنظیم شود، خوشه ها آشفته خواهند بود، در حالی که از دست دادن الگو زمانی رخ می دهد که پارامتر α کوچک است. در این مقاله، ۲۵ فعالیت برتر خوشه های جریان معنایی با α = ۰٫۳برای کشف الگوهای سفر انسان حفظ می شوند.
همانطور که در شکل ۹ الف نشان داده شده است، بسیاری از جریان ها از فعالیت های مربوط به تفریح به فعالیت های مرتبط با خانه در طول ساعت ۰۱:۰۰ تا ۰۴:۵۹ تغییر می کنند. ترکیب شکل ۱۰ الف، نشان می دهد که جریان معنایی فعالیت “تفریحی-خانه” عمدتاً از مجتمع ورزشی کارگران پکن به Shifoying، Dawanglu و Shuangjing، و از Sanlitun به Dawanglu، Hufangqiao و Shuangjing متمرکز است. در همین حال، اضافه کاری در این دوره در اطراف لیانگ ماکیائو و چاووای کشف می شود. بعد از کار، افراد عمدتاً از لیانگ ماکیائو به شوانگجینگ و از چاووای به بایزیوان به خانه باز می گردند. جریان جزئی «خانه-خانه» از بیکسینچیائو به ژویوانلو رخ داد، جایی که ممکن است یک رویداد اجتماعی یا مهمانی وجود داشته باشد.
شکل ۹ ب انتقال مشاهده شده بین خانه و محل کار و بین خانه و حمل و نقل را نشان می دهد که نشان دهنده رفت و آمد و سفر یا تجارت است. در شکل ۱۰ب، برای فعالیت «خانه-حمل و نقل»، مقصد در ایستگاه راهآهن غرب پکن و ایستگاه راهآهن جنوبی پکن توزیع میشود. مبداها پراکندهتر از مقصدها هستند و عمدتاً در اطراف چونگونمن، مالیاندائو، یوتان، هپینگلی و داوانگلو توزیع شدهاند. طول جریان معنایی فعالیت «خانه-حمل و نقل» بسیار بیشتر از سایرین است. به دلیل غیرقابل تعویض بودن ایستگاه راه آهن، تأثیر مسافت در سفر کمتر قابل توجه است. در مورد فعالیت «خانه-کار»، خوشههای فضایی دو طرفه بزرگ بین Liangmaqiao و CBD وجود دارد. جریان رفتوآمدهای طولانیتر را میتوان از Wangjing تا Dawanglu نیز شناسایی کرد.
از ساعت ۰۹:۰۰ تا ۱۲:۵۹، انتقال فعالیت از مبدا به مقصد دارای توزیع نسبتا یکنواختی است ( شکل ۹ ج). همانطور که در شکل ۱۰ نشان داده شده استج، مقاصد نیز در ایستگاه راهآهن جنوبی پکن و ایستگاه راهآهن غرب پکن متمرکز شدهاند، در حالی که معنای فعالیت مبدا متنوعتر است، به جز جریان معنایی فعالیت «خانه-حمل و نقل»، و مبدا از Sanlihe و Xueyuanlu به پکن جنوبی. ایستگاه راهآهن مجموعههای جریان معنایی فعالیت «هتل-حملونقل» را نشان میدهد. خوشههای جریان رفتوآمدهای طولانیتر در این دوره ظاهر شدند، مانند از Sijiqing و Wangjing به Jianguomen، و از Sanlitun به Zhichunlu. برخی از خاستگاههای معنایی فعالیتهای حملونقل از ایستگاه راهآهن پکن و ایستگاه راهآهن غرب پکن شروع میشوند و به ترتیب به مقصد فعالیتهای مرتبط با کار (وانشولو) و مقصد فعالیتهای مرتبط با تفریح (کیانمن) ختم میشوند.
در دوره بعد از ظهر (۱۳:۰۰ تا ۱۶:۵۹)، مبدأ عمدتاً در نوع فعالیت “مرتبط با کار” متمرکز است، در حالی که مقصد عمدتاً در فعالیت های مربوط به کار و فعالیت های مرتبط با خانه متمرکز است ( شکل ۹ د) . در شکل ۱۰د، خوشههای جریان معنایی فعالیت «کار-کار» نیز وجود دارد، با ارتباطات دو طرفه بین Liangmaqiao و CBD. این نیز از Financial Street تا CBD قابل توجه است. مردم همچنین تمایل دارند فعالیت های «مربوط به تفریح» را در اطراف Wangjing انجام دهند و در اطراف CBD به خانه بازگردند. ما همچنین متوجه شدیم که برخی از افرادی که در Zhongguancun زندگی می کنند برای کار به CBD می روند، در حالی که برخی از افرادی که در اطراف CBD زندگی می کنند به Zhongguancun می روند. دلیل ممکن است این باشد که Zhongguncun شامل تعداد زیادی محل کار و موسسات تحقیقاتی مرتبط با فناوری اطلاعات است، در حالی که CBD عمدتاً شامل مکان های کاری مرتبط با تجارت است.
همانطور که در شکل ۹ نشان داده شده است ، زمانی که افراد خارج از وظیفه هستند و به خانه باز می گردند، فعالیت های مرتبط با کار و تفریح در مبدا اصلی هستند، در حالی که مقاصد عمدتاً به فعالیت های مربوط به خانه مربوط می شوند. شکل ۱۰e نشان میدهد، پس از پایان کار، افرادی که در ژیچونلو کار میکنند، در فعالیتهای تفریحی در مجتمع ورزشی کارگران پکن، منطقهای معروف با میدانهای خرید، رستورانها، بارها و یک استادیوم شرکت خواهند کرد. خوشههای جریان معنایی فعالیت «تفریحی-خانه» عمدتاً از چاووای تا وانلیو، از زیدان تا داتونلو و از مجتمع ورزشی کارگران پکن تا وانگجینگ توزیع میشوند. برخی افراد اضافه کار می کنند و بنابراین جریان رفت و آمد نیز در این دوره ظاهر می شود. به عنوان مثال، فعالیت «کار-خانه» از چاووای و داوانگلو تا وانگجینگ متمرکز است. انتقال فعالیت حمل و نقل از ایستگاه راه آهن غرب پکن به ایستگاه راه آهن پکن اتفاق افتاد.
همانطور که در شکل ۹ f نشان داده شده است، تغییرات فعالیت از مبدا به مقصد مشابه شکل ۹ e است. شکل ۱۰f نشان میدهد که خوشههای جریان معنایی فعالیت به طور گستردهتری از ساعت ۲۱:۰۰ تا ۰۰:۵۹ توزیع شدهاند، به ویژه فعالیت «کار-خانه» و فعالیت «تفریح-خانه». به عنوان مثال، افرادی که در Chaoyangmen کار می کنند به منطقه مسکونی Yongle و افراد سرگرم کننده در Taiyanggong به منطقه مسکونی Lugu باز می گردند. CBD هم فعالیت های مربوط به کار و هم فعالیت های مربوط به تفریح را در این دوره نشان می دهد. افرادی که اضافه کاری در CBD کار می کنند در اطراف ایستگاه راه آهن غرب پکن به خانه بازمی گردند، در حالی که خوشه جریان معنایی فعالیت، افراد سرگرم کننده در CBD را نشان می دهد که به خانه خود در سینجیکو باز می گردند. ما همچنین متوجه شدیم که افرادی که در Zhonguancun اضافه کاری کار می کنند در امتداد جاده حلقه چهارم به Shaoyaoju به خانه باز می گردند. این ممکن است مربوط به تعطیلی مترو باشد.
همه یافته ها با حقایق شناخته شده سازگار است. علاوه بر این، جالب است بدانید که مکانها معنای فعالیتهای مختلفی را در دورههای مختلف نشان میدهند، مانند Chaowai، CBD و ایستگاه راهآهن غرب پکن.
۵٫ بحث و نتیجه گیری
استنباط معنایی فعالیت سفر و خوشهبندی الگوهای جریان ممکن است به درک عمیقتر رفتار سفر و تحرک انسان کمک کند، که میتواند به برنامهریزی و مدیریت حملونقل کمک کند. در این مقاله، ما یک چارچوب دو لایه را برای بررسی الگوهای سفر انسان از دیدگاه جریان معنایی فعالیت پیشنهاد کردیم.
در لایه اول، ما یک روش استنتاج فعالیت را برای استنتاج معنایی فعالیت سفر، بر اساس مدل بهبود یافته Word2vec و رتبهبندی احتمال بازدید مبتنی بر قوانین بیزی توسعه دادیم. نتایج نشان میدهد که مبدا و مقصد سفر تاکسی به ترتیب به شش و چهار خوشه معنایی فعالیت معمولی تقسیم میشوند. به طور خاص، فعالیت های مبدا مربوط به خانه، مربوط به کار، حمل و نقل، مربوط به تفریح، مرتبط با هتل، و مرتبط با پزشکی است، در حالی که فعالیت های مقصد مربوط به خانه، مرتبط با کار، حمل و نقل و تفریح است. . سپس، معناشناسی فعالیت استنباط شده را از سه روش مقایسه کردیم. نسبت فعالیت روش ما نزدیک به نتایج داده های بررسی سفر است. توزیع فضایی نقاط مهم معنایی فعالیت های مختلف بیشتر نشان می دهد که روش ما برای استنتاج فعالیت سفر O-D تاکسی موثر است. روش ما بافت جغرافیایی و پویایی فعالیت را در نظر می گیرد و می تواند برخی از فعالیت های مهم را با نسبت کم POI اما جذابیت بالا (مانند ایستگاه راه آهن) بهتر استنباط کند و تغییرات فعالیت را در یک روز نشان می دهد.
بر اساس معناشناسی فعالیت بهدستآمده، روش خوشهبندی جریان برای شناسایی خوشههای جریان معنایی فعالیت غالب و بررسی الگوهای سفر انسان در لایه دوم پیشنهاد شدهاست.
چندین نتیجه و یافته را می توان از الگوهای مکانی و زمانی فعالیت های مختلف در منطقه مورد مطالعه به دست آورد:
(۱) تفاوتهایی در انتقال فعالیت از مبدا به مقصد در دورههای متمایز وجود دارد. از ساعت ۰۱:۰۰ تا ۰۴:۵۹، “تفریح-خانه” فعالیت معنایی اصلی است. در این میان پدیده اضافه کاری در این دوره شناسایی می شود. در اوایل صبح (۰۵:۰۰ تا ۰۸:۵۹)، به دلیل اوج صبح، “خانه-کار” و “خانه-حمل و نقل” بخش زیادی از فعالیت مشاهده شده را اشغال کردند، که نشان دهنده رفت و آمد و جریان سفر یا تجارت است. از ساعت ۰۹:۰۰ تا ۱۲:۵۹، انتقال فعالیت از مبدا به مقصد، توزیع نسبتاً یکنواختی دارد. در بعد از ظهر (۱۳:۰۰ تا ۱۶:۵۹)، مبدا عمدتاً در فعالیت های مربوط به کار متمرکز بود، در حالی که مقاصد عمدتاً در فعالیت های مربوط به کار و فعالیت های مرتبط با خانه متمرکز بودند. از ساعت ۱۷:۰۰ الی ۲۰:۵۹ که مردم از خدمت خارج می شوند و به خانه باز می گردند. «کار – خانه» و «تفریح – خانه» معناشناسی فعالیت اصلی هستند. در دوره نیمه شب (۲۱:۰۰-۰۰:۵۹)، تغییرات فعالیت از مبدا به مقصد مشابه دوره قبل است.
(۲) از ساعت ۰۱:۰۰ تا ۰۴:۵۹، جریان معنایی فعالیت در مجتمع ورزشی کارگران پکن و Sanlitun متمرکز است که با فعالیت های مربوط به تفریح مشخص می شود و در برخی مناطق مسکونی مانند Shifoying و Dawanglu پراکنده است. در طول روز (۰۵:۰۰-۱۶:۵۹)، مقصد عمدتاً در ایستگاه راهآهن غرب پکن و ایستگاه راهآهن جنوبی پکن توزیع میشود، در حالی که مبدا پراکندهتر از مقصد است. علاوه بر این، خوشههای جریان معنایی فعالیت دو طرفه بزرگ بین Liangmaqiao و CBD وجود دارد که فعالیت «خانه-کار» و «کار-کار» را نشان میدهد. Zhongguancun و CBD نیز بهعنوان خوشههای جریان معنایی فعالیت دوطرفه کشف شدند که فعالیت «خانه-کار» را نشان میدهند. از ساعت ۲۱:۰۰ الی ۰۰:۵۹
(۳) به دلیل غیرقابل جایگزینی ایستگاه راه آهن، فعالیت جریان های معنایی که در ایستگاه های راه آهن شروع یا به پایان می رسد بسیار طولانی تر از سایرین است. یکی از یافتههای جالب این است که ما نتوانستیم ایستگاه راهآهن جنوبی پکن را بهعنوان کانون حملونقل در مبدا شناسایی کنیم. شایان ذکر است که مردم برای گرفتن تاکسی در ایستگاه راه آهن جنوبی پکن مشکل دارند.
این تحقیق یک چشم انداز جریان معنایی فعالیت جدید برای درک الگوهای سفر انسان ارائه می دهد. با این حال، محدودیت هایی در رابطه با داده ها و رویکرد وجود دارد. در مرحله اول، ترکیب منابع داده های متعدد منجر به نتایج قابل اعتمادتر استنتاج فعالیت و الگوهای سفر انسان می شود. به عنوان یک مطالعه آینده، ما دادههای منطقه مورد علاقه (AOI) را در روش درگیر خواهیم کرد، که میتواند به استنباط دقیقتر فعالیت سفر کمک کند. در همین حال، باید توجه داشت که دادههای تاکسی ناگزیر با مسائل نمایندگی مواجه میشوند [ ۱۶ ]]. بنابراین، ادغام دادههای سوابق تلفن همراه، دادههای کارت هوشمند حملونقل، و دادههای ورود به شبکههای اجتماعی، میتواند حالتهای مختلف سفر را توصیف کند و الگوهای مختلف سفر انسان را به طور جامعتر نشان دهد. در مرحله دوم، یک روز را بر اساس یک فاصله زمانی ثابت ۴ ساعت به شش دوره تقسیم کردیم. با این حال، مقیاس زمانی بر الگوهای سفر انسان تأثیر خواهد گذاشت. بنابراین، در کار بیشتر، ما یک اندازهگیری واحد از شباهت معنایی فعالیت مکانی-زمانی برای خوشهبندی جریانهای مشابه ایجاد خواهیم کرد. در نهایت، این مقاله سفر انسان را از منظر جریان بررسی کرد. با این حال، انتخاب مسیر بین مبدا و مقصد مشخص نیست. در کارهای آینده می توان به چارچوب مدل چهار مرحله ای [ ۵۴ ] اشاره کرد و رفتارهای سفر انسان را به طور کامل شرح داد.