۱٫ معرفی
الگوهای سفر تاکسی ارتباط نزدیکی با ساختار فضایی شهری دارد. الگوهای سفر تاکسی شامل ساختار فضایی سفر و جریان سفر [ ۱ ] است. ساختار فضایی سفر، چارچوب اسکلتی ماتریس OD است، که در آن اسکلت به عنوان اتصال مقاصد از مبدا بیان میشود. جریان های سفر مربوط به سازه به عنوان متغیری گفته می شود که ویژگی های سفر مانند حجم و مسافت را توصیف می کند. از یک سو، تخصیص منابع در داخل شهر بر الگوهای سفر مردم تأثیر می گذارد. از سوی دیگر، بررسی الگوهای سفر با تاکسی و درک تقاضای سفر تاکسی می تواند به طور منطقی تخصیص منابع حمل و نقل و امکانات عمومی را هدایت کند [ ۲ ، ۳ ،۴ ]. توسعه فناوری اطلاعات و ارتباطات راه جدیدی برای رعایت ویژگی های سفر تاکسی فراهم می کند. مجموعه دادههای تاکسی، مانند دادههای تاکسی رقابت Kaggle، دادههای تاکسی نیویورک [ ۵ ، ۶ ] و دادههای تاکسی Xiamen، به طور فزایندهای در دسترس قرار گرفتهاند، و محققان بر اساس این مجموعه دادهها، تحقیقات عمیقی در مورد الگوهای سفر تاکسی انجام دادهاند، که هم به صورت نظری و هم کاربردی به دست میآیند. نتایج. با این حال، مطالعه موجود عمدتاً بر تجزیه و تحلیل ویژگی های کلی سفر تاکسی تمرکز دارد [ ۵ ، ۷ ، ۸]، و توجه کمی به ثبات بین روزی الگوهای مرتبط شده است، اگرچه این ممکن است بر تصمیم گیری علمی در زمینه های مرتبط تأثیر بگذارد. به عنوان مثال، اگر الگوی سفر تاکسی بین روزها به شدت تغییر کند، الگوی کلی سفر تنها با بخشی از داده ها منعکس نخواهد شد، که ممکن است منجر به دست کم گرفتن تقاضای سفر در هنگام تصمیم گیری برای تخصیص منابع عمومی مرتبط شود. مطالعه پایداری ساختار فضایی سفر تاکسی می تواند به درک بهتر الگوهای سفر تاکسی کمک کند و سوء استفاده احتمالی از داده های مرتبط را کاهش دهد.
داده های مسیر تاکسی حاوی اطلاعات سفر مسافران یک منبع داده مهم برای مطالعه الگوهای سفر تاکسی در مناطق شهری است. در مقایسه با اتوبوسهای عمومی یا مترو، تاکسیها معمولاً نیازهای سفر شخصی مردم را برآورده میکنند. در طول ده سال گذشته، سهم تاکسی به طور پیوسته در حدود ۱۰٪ از خدمات حمل و نقل عمومی شنژن باقی مانده است ، حتی اگر توسعه سریع فناوری اطلاعات و ارتباطات زندگی روزمره ما را عمیقاً تغییر داده است. بنابراین، تاکسی جزء ضروری سیستم حمل و نقل شهری است. دادههای مسیر تاکسی با اطلاعات سفر، مزایای پوشش فضایی وسیع، وضوح مکانی-زمانی بالا و نگرانیهای مربوط به حریم خصوصی کم را ارائه میکنند [ ۱۰ ]. این دادهها به طور گسترده برای استخراج شبکههای جادهای شهری استفاده شدهاند.۱۱ ، ۱۲ ]، الگوهای سفر ساکنان، و قوانین اساسی زیربنای این الگوها [ ۷ ، ۱۳ ، ۱۴ ]. نتایج مرتبط برای حمایت از بهینه سازی ساختار فضایی شهری و تخصیص مؤثر منابع عمومی استفاده شده است [ ۱۵ ، ۱۶ ].
دوره داده های مسیر تاکسی در مطالعات موجود از چند روز تا چند ماه متغیر است [ ۱۷ ، ۱۸ ]. با این حال، سفر تاکسی به دلیل عوامل محیطی (مانند آب و هوا) و عادات اجتماعی (یعنی روزهای کاری و تعطیلات) الگوهای زمانی متفاوتی را نشان می دهد. از این رو، زمانی که از بازه های زمانی مختلف برای داده ها استفاده می شود، ویژگی های مشتق شده از فعالیت های انسانی ممکن است بسیار متفاوت باشد. این اثر مرز زمانی مسئله واحد زمانی قابل تغییر (MTUP) است [ ۱۹ ]. بنابراین، پایداری الگوهای سفر یک موضوع اساسی در مطالعه تحرک انسان بر اساس جریان سفر تاکسی با استفاده از دادههای مسیر تاکسی و همچنین دادههای دیگر است.
در این راستا، این مقاله به دنبال پاسخ به دو سوال زیر است: (۱) تفاوت در ویژگی های سفر تاکسی بین روزها چیست، و (۲) تا چه حد یک مجموعه داده محدود می تواند ویژگی های کلی سفر تاکسی را منعکس کند؟ پاسخ به سوالات فوق می تواند درک ما را از الگوهای سفر تاکسی عمیق تر کند و راهنمایی های گمراه کننده برای برنامه ریزی شهری و استفاده از منابع عمومی را کاهش دهد.
بقیه مقاله به شرح زیر سازماندهی شده است. مطالعات مرتبط در بخش ۲ بررسی شده و روش شناسی در بخش ۳ شرح داده شده است . آماده سازی داده ها در بخش ۴ معرفی شده است . ما نتایج را مورد بحث قرار می دهیم و به ترتیب در بخش ۵ و بخش ۶ چندین نتیجه گیری می کنیم.
۲٫ مطالعات مرتبط
الگوهای سفر تاکسی نقش مهمی در زمینه برنامه ریزی شهری دارد. الگوهای سفر تاکسی منعکس کننده تقاضای روزانه سفر شهری است و از آنها برای هدایت یا بهینه سازی تخصیص منابع مرتبط استفاده می شود. داده های تاکسی می تواند به خوبی از تجزیه و تحلیل ویژگی های سفر تاکسی پشتیبانی کند. مجموعه داده های تاکسی از مطالعات موجود را می توان به دسته های زیر تقسیم کرد: (۱) مسابقات داده کاوی، مانند Kaggle ( www.kaggle.com در ۹ ژوئیه ۲۰۲۰ مشاهده شد). (۲) داده های باز پلتفرم های دولتی و رسمی، مانند کمیسیون تاکسی و لیموزین نیویورک؛ و (۳) پلت فرم های خدمات تاکسی تجاری، مانند پروژه DiDi GAIA ( outreach.didichuxing.com). دادههای تاکسی توسط تجهیزات GNSS (سیستم ناوبری ماهوارهای جهانی) ثبت میشوند و شامل چندین رکورد نمونهبرداری میشوند. هر رکورد یک نقطه مسیر را نشان میدهد، از جمله دادههای اولیه رانندگی مانند شناسه، مکان، مهر زمانی، وضعیت در حال اجرا، و غیره. در حال حاضر، تجزیه و تحلیل دادههای مسیر تاکسی عمدتاً بر حملونقل هوشمند [ ۲۰ ، ۲۱ ، ۲۲ ]، حفاظت از محیط زیست منابع متمرکز است. [ ۱۶ ، ۲۳ ]، برنامه ریزی شهری [ ۲۴ ] و ادراک اجتماعی. ویژگی های کشف شده بر اساس داده های تاکسی را می توان برای بهینه سازی سفر ساکنان شهری [ ۲۵ ]، استخراج ساختار عملکردی شهری [ ۲۴ ]، و کشف پویایی های اجتماعی [ ۲۶ ] به کار برد.]. به عنوان مثال، داده های OD استخراج شده از داده های مسیر تاکسی اغلب برای مطالعه قوانین سفر ساکنین و تحرک انسان [ ۲۷ ، ۲۸ ] و سپس برای بررسی ادراکات اجتماعی و پویایی های اجتماعی استفاده می شود. تعداد روزهای استفاده از داده های تاکسی در مطالعات موجود از یک روز تا چند ماه متفاوت است [ ۲۷ ، ۲۸ ]. الگوهای سفر تاکسی از روز به روز به دلیل عوامل محیطی (آب و هوا) و عادات اجتماعی (روزهای هفته، آخر هفته و تعطیلات) متفاوت است. بنابراین، هنگام استفاده از دادههای دورههای مختلف، تفاوتهای زیادی در ویژگیهای فعالیت سفر جمعیت وجود دارد، که یک اثر مرزی موقت مسئله واحد زمانی قابل تغییر (MTUP) است [ ۱۹ ].]. پایداری الگوهای سفر تاکسی یک موضوع اساسی در مطالعه تحرک انسان با استفاده از دادههای تاکسی و همچنین دادههای دیگر است.
ساختار فضایی سفر برای دستیابی به بینش در ساختار فضایی شهرها و بهینه سازی زیرساخت های شهری مهم است. داده های سفر تاکسی را می توان برای استخراج ساختار سفر استفاده کرد [ ۳ ، ۲۹ ]. جریان مبدا-مقصد (OD) استخراج شده از داده های مسیر تاکسی معمولاً برای استخراج الگوهای سفر استفاده می شود [ ۳۰ ]. برای مثال، ژو و همکاران. [ ۳۱ ] FCNL (مکان شبکه بحرانی عملکردی) را بر اساس تلاقی داده های مسیر استخراج کرد و دریافت که می توان از آن برای مطالعه رابطه بین ساختار فضایی شهری و تحلیل سفر انسان استفاده کرد. جریان OD استخراج شده بر اساس داده های تاکسی به عنوان ماتریس نقاط مبدا و مقصد تعریف می شود [ ۳۲]. با این حال، سفر تاکسی نه تنها شامل مکان های شروع و پایان، بلکه اطلاعات ویژگی های مرتبط با سفر آنها، مانند مهر زمان و وضعیت عملیات است. داده های OD دو بعدی اطلاعات واقعی سفر را نادیده می گیرند. بهارا و همکاران [ ۴ ] روشی را پیشنهاد میکند که اصول فاصله لونشتاین را که به طور سنتی برای مقایسه دنبالههای رشتهها استفاده میشود، اتخاذ میکند و آن را برای تعیین کمیت مقایسه ساختاری ماتریسهای OD گسترش میدهد. ساختار فضایی OD از منظر سفرهای توزیع شده از هر مبدأ (به عنوان مثال، بر اساس تولید سفر) تعریف میشود، که اطلاعاتی را که جریان OD میتواند بیان کند تا حد زیادی گسترش میدهد. به طور خلاصه، ساختارهای سفر تاکسی مبتنی بر OD به طور گسترده ای برای تجزیه و تحلیل رابطه بین تحرک سفر و کشف ساختارهای سفر استفاده می شود.
نظریه جریان جغرافیایی یک چارچوب نظری سیستماتیک برای تجزیه و تحلیل الگوهای سفر شهری فراهم می کند. از لحاظ نظری، فضای جریان جغرافیایی به معنای فضایی است که بر اساس حاصلضرب دکارتی صفحات دو بعدی که نقطه شروع و پایان جریان ها در آن قرار دارند، قابل تعریف است. در این فضا، جریان جغرافیایی یک بیان مختصات قطبی است که از سه عنصر مبدأ، جهت و طول تشکیل شده است. شو و همکاران [ ۳۳] وجود ۲۷ الگوی جریان جغرافیایی با اهمیت جغرافیایی واضح را بر اساس ترکیبی از ویژگیهای تودهای، تصادفی و حذف هر بعد عنصر فرض کرد. الگوی جریانهای جغرافیایی را میتوان به چندین ساختار مختلف از تجمع، همگرایی، پراکندگی و الگوهای خوشهای تقسیم کرد. به طور خاص، با توجه به ترکیب ویژگیهای آماری مختلف (یعنی ناهمگنی، همگنی و تصادفی) بین متغیرها در مدل مختصات قطبی، الگوهای فضایی جریانهای جغرافیایی به شش الگوی منفرد شامل تصادفی، خوشهای، همگرا و واگرا تقسیم میشوند. اجتماع، موازی (زاویه-خوشه ای) و مساوی (طول-خوشه ای). با تحلیل پدیده جریان جغرافیایی، ما می توانیم از یک طرفه بودن ویژگی های یک بعدی جلوگیری کنیم و درک جامع تری از پدیده های جغرافیایی، مانند تحرک سفر تاکسی ایجاد کنیم. تحقیقات موجود عمدتاً بر روی استخراج الگوهای جریان متمرکز است، و محققان کمتری برای تحلیل تحرک سفر تاکسی، به ویژه ثبات الگوهای جریان سفر در طول روز آمدهاند.
۳٫ روش شناسی
۳٫۱٫ ساخت ماتریس OD
ما از n واحد جغرافیایی از پیش تعریف شده برای گروه بندی OD هر سفر استفاده می کنیم. هر سفر را می توان به یک جفت OD تبدیل کرد و توسط آن شرح داد (Oمن، Dj)، جایی که Oمنو Djبه ترتیب ژئوکدهای واحدهای مربوط به مبدا و مقصد را نشان می دهد. سپس، ماتریس OD با n ردیف و n ستون را می توان با شمارش تعداد سفرهایی که در شروع شده است، ساخت. Oمنو در پایان یافت Dj. ماتریس OD می تواند حاوی اطلاعات ساختار فضایی سفر و جریان باشد [ ۱ ]. ساختار فضایی سفر، چارچوب اسکلتی ماتریس OD است، که در آن اسکلت به عنوان اتصال مقاصد از هر مبدا بیان میشود. جریان های سفر مربوط به سازه به عنوان متغیری گفته می شود که ویژگی های سفر مانند حجم و مسافت را توصیف می کند.
به عنوان مثال، شکل ۱ a ساختار فضایی ماتریس OD را نشان می دهد. در صورت وجود سابقه سفر بین Oمنو Dj ، مقدار ساختار فضایی را ۱ نسبت دادیم. اگر نه، آن را به عنوان ۰ نسبت می دهیم . شکل ۱ b جریان سفر ماتریس OD، مقدار هر یک را نشان می دهد. Oمنو Djبا مشخصه جریان سفر آنها تعیین می شود.
۳٫۲٫ اندازهگیری پایداری ساختار و جریان فضایی سفر
ما از شباهت بین ماتریس های OD روزهای مختلف برای مطالعه پایداری الگوهای سفر تاکسی بین روز استفاده می کنیم. به طور خاص، فاصله لونشتاین نرمال شده برای ماتریس های OD (NLOD) [ ۱ ] بر اساس گسترش فاصله لونشتاین برای کمی کردن تفاوت بین ماتریس های OD اتخاذ شده است. برای درک بهتر تفاوتهای بین دو ماتریس OD، دو نوع اندازهگیری شباهت را برای منعکس کردن ویژگی ساختار فضایی و ویژگی جریان (ساختار فضایی و حجم هر جفت OD) ایجاد کردیم.
- (۱)
-
شباهت ساختاری
ساختار سفر نشان دهنده ساختار فضایی سفرهای OD است. همانطور که معادلات (۱) و (۲) نشان می دهد، محاسبه شباهت ساختاری اسمنمتراستیآربین ماتریس های OD X و Y به محاسبه فاصله ویرایش تبدیل می شود اسLDبین مجموعههای ژئوکد مکان مقصد در ماتریسهای مختلف برای همان کد مکان اصلی. gایکسمنو gyمننشان دهنده ژئوکدهای مرتب شده نزولی مکان های مقصد است که از ژئوکد i-ام شروع شده است. برای کاهش اثرات OD با حجم ترافیک کم بر شباهت ساختاری، ژئوکدهای مقصد OD با تعداد جریان کمتر از ن۰در تولید حذف می شوند gایکسمنو gyمن.
جایی که اسنLDنرمال شده است اسLDاز ۰ تا ۱ و لهnتابع شمارش عناصر یک لیست است. اسLDفاصله لونشتاین را بین دنباله های ژئوکد ساخته شده توسط مکان های مبدا یا مقصد بر اساس واحدهای جغرافیایی از پیش تعریف شده محاسبه می کند. فاصله Levenshtein حداقل تعداد ویرایش های تک کاراکتر، از جمله درج، حذف، و جایگزینی، مورد نیاز برای تغییر یک رشته به رشته دیگر را اندازه گیری می کند. به طور خاص، رویکردها را می توان در ناوارو [ ۳۴ ] یافت. در این مطالعه، هر کاراکتر در اندازهگیری فاصله مبدأ Levenshtein با ژئوکد نشان داده میشود.
تشابه ساختاری می تواند شباهت را در ساختار فضایی سفر تاکسی بین روزهای مختلف اندازه گیری کند. همانطور که در بالا ذکر شد، یک عدد آستانه N0 برای کاهش اثرات OD ها با حجم ترافیک جریان بسیار کم اعمال می شود (به عنوان مثال، تنها یک سفر برای یک جفت OD خاص). بدیهی است که سطح شباهت بین ماتریس های مختلف به N0 بستگی دارد. حساسیت را در بخش های زیر آزمایش می کنیم.
- (۲)
-
شباهت جریان
در مقایسه با شباهت ساختاری، شباهت جریان اسمنمترافLOدبلیوهنگام محاسبه شباهت نرمال شده، تعداد سفرها را برای هر OD در نظر می گیرد افنLDبین دنباله های جریان OD fایکسمن،fyمناز ژئوکد i-ام شروع می شود (معادلات (۳) و (۴)). توجه داشته باشید که دنباله جریان شامل لیستی از جفت های ژئوکد-حجم است (gمنj،vمنj)، جایی که gمنjژئوکد را نشان می دهد j(از ۰ تا متر) از ژئوکد شروع می شود من، و vمنjتعداد را نشان می دهد (Oمن، Dj)سفرها تعداد سفرها vمنjدر محاسبه دو نقش دارد افنLD: وزن کردن فاصله لونشتاین بین fایکسمنو fyمن، به دست آوردن فاصله بهبود یافته افLD(fایکسمن،fyمن)و نرمال کردن فاصله بر اساس مجموع تعداد سفرها در دنباله جریان OD توسط تابع f_ستومترساختن افنLDمحدوده از ۰ تا ۱
کارکرد افLDنقش کلیدی در محاسبه شباهت جریان دارد. مسئله مهم این است که چگونه فاصله ویرایش را بر حسب حجم وزن کنیم. به طور خاص، برای هر جفت عنصر (gایکسمنj،vایکسمنj)و (gyمنj’،vyمنj’)که در fایکسمنو fyمنبه ترتیب فاصله لونشتاین وزنی L(j،j”)(معادله (۶)) این مرحله را می توان با قوانین زیر محاسبه کرد: (۱) اگر ژئوکد و حجم یکسان باشند، آخرین مقدار فاصله ویرایش تغییر نمی کند. (۲) در غیر این صورت، فاصله ویرایش حداقل مقدار از سه وضعیت زیر خواهد بود: (الف) L(j-1،j”-1)+آبس(vایکسمنj،vyمنj”) منf gایکسمنj=gyمنj”یعنی ژئوکد یکسان است و فقط حجم ترافیک باید تغییر کند. (ب) L(j-1،j”)+vایکسمنj منf gایکسمنj≠gایکسمنj’به این معنی که عنصر (gمنj،vمنj)که در fایکسمنباید اضافه شود و (ج) L(j،j”-1)+vyمنj’ منf gایکسمنj≠gایکسمنj’، به این معنی که عنصر ( gyمنj’،vyمنj’) که در fyمنباید حذف شود برای جزئیات بیشتر در مورد این رویکرد، به NLOD (Behara et al., 2020) [ ۴ ] مراجعه کنید.
۳٫۳٫ اندازه گیری پایداری هر جریان OD
ما روش ضریب تغییرات را برای اندازهگیری پایداری بین روز در حجم سفرهای بین مناطق مختلف اتخاذ کردیم. ضریب تغییرات VAR نسبت انحراف معیار است افVاسDبه میانگین افVم(معادلات (۷) – (۹)). Vآآررا می توان برای اندازه گیری پایداری عدد برای جفت های OD یکسان در روزهای مختلف تنظیم کرد.
جایی که افVمنjwحجم جریان در روز است wبین واحدهای جغرافیایی منو j، و دبلیوروزهای مجموعه داده است.
برای دسته بندی بهتر نوع جفت های OD تقسیم می کنیم افVممنjو پایداری با توجه به ترکیب چارک های حجم جریان و تغییرپذیری به ترتیب ( شکل ۲ ). قوانین خاص در معادلات (۱۰) و (۱۱) نشان داده شده است، که در آن Q1 و Q3 توابعی برای محاسبه چندک اول و سوم هستند. به عنوان مثال، HL در شکل ۲ ، OD ها را با حجم جریان نسبتاً بالا و پایداری کم نشان می دهد، به این معنی که تقاضای سفر این جفت OD بزرگ است اما در طول روز بسیار متفاوت است.
۴٫ داده ها
دو مجموعه داده برای تجزیه و تحلیل ویژگی های سفر تاکسی بین روز به تصویب رسید. منطقه مورد مطالعه ما شامل شن ژن در چین و نیویورک در ایالات متحده است. آنها هر دو شهری با اقتصاد و تجارت پر رونق هستند [ ۳۵ ]. توجه داشته باشید که مجموعه داده اول (DT1) شامل رکوردهای مسیر تاکسی خام است، در حالی که مجموعه داده دوم (DT2) شامل رکوردهای سفر OD به طور مستقیم است. مجموعه داده های مختلف با جریان های فرآیند داده های مختلف مطابقت دارند.
۴٫۱٫ مجموعه داده شنژن
اولین مجموعه داده (DT1) مربوط به شنژن است که در جنوب چین، جنوب گوانگدونگ و در مجاورت هنگ کنگ قرار دارد. از زمان تأسیس آن در سال ۱۹۷۹ به عنوان منطقه ویژه اقتصادی (SEZ) چین، شنژن به یکی از بزرگترین و مبتکرترین شهرهای چین تبدیل شده است [ ۳۶ ] و یکی از شهرهای بزرگ و پرجمعیت در جهان است که سریعترین رشد را دارد. در جنوب استوایی سرطان واقع شده است. شنژن دارای ۹ منطقه است که مساحت آن ۱۹۹۷٫۴۷ کیلومتر مربع است. شنژن دارای امکانات حمل و نقل کامل، مانند مترو، اتوبوس و تاکسی است، بنابراین برای ساکنان راحت است که سفر کنند، که شنژن را به منطقه موردی خوبی برای تحقیق الگوی سفر تبدیل می کند [ ۳۷ ].
دادههای خط سیر تاکسی خام شامل دادههای مسیر عملیاتی تقریباً ۱۷۰۰۰ تاکسی از ۱۶ سپتامبر تا ۲۸ اکتبر ۲۰۱۱ است. دادهها شامل شماره دستگاه، طول جغرافیایی، طول جغرافیایی، زمان موقعیتیابی، و وضعیت بار مسافر است (بار مسافر ۱، بار خالی ۰ است. همانطور که در جدول ۱ نشان داده شده است. ما از TAZ ها به عنوان واحدهای جغرافیایی برای تجزیه و تحلیل OD سفر مسافر استفاده می کنیم. شنژن را می توان به ۴۹۱ TAZ با مساحت متوسط ۳٫۹۸ تقسیم کرد کیلومتر۲( شکل ۳ ).
ما ابتدا یک تجزیه و تحلیل دادههای اکتشافی در مورد تعداد رکوردهای دادههای خام و تعداد وسایل نقلیه انجام میدهیم و دادههای دارای ناهنجاریهای آشکار (مانند دادههای از دست رفته در یک دوره خاص) DT1 را حذف میکنیم. برای کاهش تأثیر تغییرات در تعداد وسایل نقلیه، داده های مسیر شنژن ۷۲۸۹ وسیله نقلیه را انتخاب می کنیم که هر روز داده دارند. در نتیجه، ۲۰ روز داده نگهداری می شود، که تمام روزهای هفته و آخر هفته را پوشش می دهد، و هر نوع تاریخ (یعنی آخر هفته و روز هفته) حداقل دو روز داده را شامل می شود (برای تجزیه و تحلیل خاص به مکمل مراجعه کنید).
سپس، سفرهای OD برای هر وسیله نقلیه با توجه به الگوهای سوئیچ وضعیت بار مسافر استخراج می شود. تعداد OD در روز تقریباً ۴۲۸۶۰۰ است.
۴٫۲٫ مجموعه داده های نیویورک
مجموعه داده دوم (DT2) مربوط به شهر نیویورک (NYC)، یک شهر بین المللی مشهور در سراسر جهان در ایالات متحده است. شهر نیویورک یکی از بزرگترین شهرها و پرجمعیت ترین شهر بزرگ جهان است. دارای ۳۰۲٫۶ مایل مربع و پنج ناحیه از جمله بروکلین، کوئینز، منهتن، استاتن آیلند و برانکس است. شهر نیویورک یک مرکز فرهنگی، مالی و رسانه ای جهانی است که تأثیر قابل توجهی بر تجارت، مراقبت های بهداشتی و علوم زندگی دارد [ ۳۸ ]. نیویورک خدمات حمل و نقل خوبی دارد [ ۲۶ ]، و تاکسی سواری آن هسته اصلی ترافیک در شهر را تشکیل می دهد [ ۳۹ ].
در سالهای اخیر، ترویج سیاست دادههای باز در شهر نیویورک، راحتی و فرصتهای زیادی را برای محققان دادههای بزرگ فراهم کرده است [ ۴۰ ]. مجموعه دادهها توسط کمیسیون تاکسی و لیموزین نیویورک جمعآوری شده است و میتوانید آن را از وبسایت رسمی بارگیری کنید ( https://www1.nyc.gov/site/tlc/about/tlc-trip-record-data.page ، قابل دسترسی در ۱ دسامبر ۲۰۲۰). برای تجزیه و تحلیل ساختار فضایی سفر تاکسی در نیویورک، سوابق سفرهای با حجم بالا برای اجاره خودرو در ۱ و ۳۱ اوت ۲۰۱۹ را به عنوان DT2 انتخاب میکنیم. هر ردیف DT2 یک رکورد سفر را نشان میدهد، از جمله تاریخ تحویل، تاریخ تحویل، شناسه مکان تحویل و شناسه مکان تحویل ( جدول ۲)). علاوه بر این، ما مناطق تاکسی را که اداره تاکسی نیویورک ارائه کرده است به عنوان TAZ در نظر می گیریم. ۲۶۴ TAZ در این مطالعه وجود دارد و نیوآرک خارج از نیویورک در تجزیه و تحلیل زیر گنجانده شده است ( شکل ۴ ). از آنجایی که رکوردهای DT2 مستقیماً سفرهای OD هستند، ما داده ها را بیشتر پردازش نکردیم.
۵٫ نتایج
۵٫۱٫ مشخصات حجمی و مسافتی سفرهای بین روزی تاکسی
شکل ۵ حجم سفر روزانه و مسافت OD را بر حسب هفته نشان می دهد. فرکانس سفر روزانه بین ۲۰۰۰۰۰ تا ۲۷۰۰۰۰ در شنژن کاهش مییابد، با میانگین OD روزانه برای هر تاکسی بین ۲۷ تا ۳۷٫ فرکانس سفر روزانه نیویورک بین ۵۳۰۰۰۰ تا ۷۸۰۰۰۰ است که بیشتر از دو برابر شنژن است.
شکل ۶ مشخصات ساعتی جریان OD را نشان می دهد. داده های ۲۰ روزه شنژن الگوی توزیع ساعتی عمومی نسبتاً مشابهی را نشان می دهد ( شکل ۶ الف): فعالیت های سفر به تدریج از ۰ تا ۶ در اوایل صبح کاهش می یابد و به سرعت از ساعت ۶ تا ۹ در ساعات اوج صبح افزایش می یابد. هیچ الگوی اوج شب واضحی مشاهده نمی شود. هیچ تفاوت واضحی بین روزهای هفته و آخر هفته وجود ندارد. تنها یک کاهش ناگهانی در سفرهای OD تقریباً در ساعت ۱۸:۰۰ در ۳۰ سپتامبر مشاهده می شود که عمدتاً ناشی از شلوغی اوج شب قبل از تعطیلات ۷ روزه روز ملی چین است. در مقایسه با شنژن، توزیع ساعتی نیویورک دو نوع مختلف الگوی ساعتی ( شکل ۶b) را نشان میدهد که به ترتیب با الگوی روزهای هفته و الگوی آخر هفته مطابقت دارند.شکل ۷ ب).
شکل ۷ مشخصات توزیع ساعتی حجم سفر OD را از دوشنبه تا یکشنبه نشان می دهد. حجم سفر ساعتی در روزهای هفته و آخر هفته الگوهای مختلفی را در شنژن و نیویورک نشان می دهد. تعداد سفرها در شب های آخر هفته بیشتر از روزهای هفته است. یک پیک واضح صبح را می توان در ساعت ۹:۰۰ در روزهای هفته مشاهده کرد که عمدتاً توسط سفرهای رفت و آمد صبحگاهی هدایت می شود. این الگو در تعطیلات آخر هفته رعایت نمی شود. صبحهای اولیه از ساعت ۰:۰۰ تا ۶:۰۰ شنبه و یکشنبه تقاضای سفر بیشتری را نسبت به روزهای هفته نشان میدهد که عمدتاً ناشی از سفرهای مرتبط با افزایش فعالیتهای سرگرمی در تعطیلات آخر هفته است.
شب های جمعه (۲۰:۰۰ تا ۲۴:۰۰) تقاضای سفر بیشتری را نسبت به سایر دوره های شبانه روز هفته نشان می دهد و مشابه شنبه شب است. علاوه بر این، تقاضای سفر در روز یکشنبه پس از ساعت ۲۱:۰۰ کاهش قابل توجهی را نشان می دهد، اما حجم روز یکشنبه کمترین کاهش را داشته است. دلیل بالقوه این است که مردم تمایل دارند فعالیت های بیشتری را در شب های جمعه ترتیب دهند، زیرا این شب مستقیماً به آخر هفته منتهی می شود، در حالی که یکشنبه شب ها قبل از یک روز کاری است، و مردم ترجیح می دهند استراحت کنند تا خود را در خانه آماده کنند. این دو نتیجه حاکی از آن است که شب های جمعه و یکشنبه شب ها به ترتیب الگوهای متفاوتی نسبت به سایر روزهای هفته و روزهای آخر هفته دارند. ممکن است برای جلوگیری از تصمیم گیری گمراه کننده احتمالی مربوط به خدمات حمل و نقل، سیاست های جداگانه ای برای این دو دوره مورد نیاز باشد.
۵٫۲٫ تأثیر آستانه جریان بر شباهت در ماتریس جریان OD سفر
در شکل ۸ ، OD سفر تاکسی یک توزیع دم سنگین را نشان می دهد، به این معنی که تعداد زیادی از OD ها حجم کمی دارند. همانطور که در شکل ۷ a,c نشان داده شده است، تعداد OD ها با افزایش حجم OD به تدریج کاهش می یابد . به عنوان مثال، ۱۲۹۰۵ OD بین TAZ ها با کمتر از ۱۰ جریان در شنژن وجود دارد که ۷۸٪ از کل OD های TAZ را تشکیل می دهد، اما حجم تجمعی آنها فقط ۱۵٪ از کل جریان ها را تشکیل می دهد، همانطور که در شکل ۷ ب نشان داده شده است. در نیویورک، ۱۱۲۹۶ OD بین مناطق با کمتر از ۱۰ جریان در شنژن وجود دارد که ۶۲٪ از کل OD های منطقه را تشکیل می دهد، اما حجم تجمعی آنها تنها ۷٪ از کل جریان ها را تشکیل می دهد، همانطور که در نشان داده شده است. شکل ۷ نشان داده شده است.د این ODها کمک محدودی به تصویر کلی جریان سفر می کنند، اما منجر به تأثیرات آشکار بر توصیف الگوهای سفر می شود. معمولاً یک آستانه حجم ترافیک در مطالعات موجود [ ۴۱ ] برای حذف این ODها و کاهش اثرات منفی آنها اعمال می شود.
هنگام محاسبه شباهت ماتریس OD در این مقاله، متوجه شدیم که آستانه های مختلف بر نتیجه شباهت تأثیر دارند. برای انتخاب منطقی آستانه، ما تغییرات شباهت در ماتریس OD را بر اساس ساختار فضایی سفر و جریان سفر تحت آستانه های مختلف آزمایش کردیم ( شکل ۹ ). شباهت با آستانه افزایش می یابد. هنگامی که آستانه بزرگتر از ۱۰ باشد، نرخ رشد شباهت کاهش می یابد و در شنژن به ثبات می رسد. در این مطالعه، ما ODهایی را با حجم جریان بیشتر از ۱۰ برای تجزیه و تحلیل شباهتهای ساختاری و جریان انتخاب کردیم و آستانه NYC مانند شنژن باقی میماند.
۵٫۳٫ ثبات ساختار فضایی سفر و جریان بین روزهای هفته و آخر هفته
جدول ۳ و جدول ۴ شباهت ساختار فضایی سفر تاکسی ۲۰ روزه و شباهت جریان سازمان یافته بر اساس روز هفته در شنژن و جدول ۵ و جدول ۶ را نشان می دهد.شباهت ساختار فضایی سفر تاکسی ۳۱ روزه و شباهت جریان در نیویورک را نشان می دهد. متوجه شدیم که رنگ پسزمینه آبی تیره (شباهت کم) عمدتاً در گوشه سمت راست بالا و گوشه پایین سمت چپ توزیع شده است. این نشان می دهد که شباهت بین روزهای هفته و آخر هفته به طور قابل توجهی کمتر از شباهت بین روزهای هفته و بین روزهای آخر هفته است. در نتایج مربوط به شنبه و یکشنبه، رنگ پسزمینه جمعه روشنتر از روزهای دیگر است، به این معنی که شباهت بین جمعه و تعطیلات آخر هفته بیشتر از شباهت بین روزهای کاری دیگر و آخر هفته است. این یافته با الگوی خاصی که در ارائه شده همزمان است بخش ۵٫۱ مطابقت دارد. علاوه بر این، شباهت ساختاری بین روزها بیشتر از شباهت جریان است، که همچنین نشان می دهد که اندازه گیری شباهت با در نظر گرفتن جریان می تواند تفاوت های جزئی بین ماتریس OD ردیف را منعکس کند.
برای درک بهتر الگوهای سفر در روزهای مختلف، توزیع فضایی OD ها را برای سفر تاکسی بین واحدهای جغرافیایی و درون هر واحد جغرافیایی در روزهای هفته و آخر هفته تجسم می کنیم ( شکل ۱۰ و شکل ۱۱ ؛ توزیع دقیق در طول روز و هفته، OD آخر هفته می تواند در ضمیمه A و ضمیمه B یافت می شود ).
از منظر سفرهای داخلی در یک واحد جغرافیایی، برای OD با بیش از ۱۰ سفر، ۹۲٫۸۳٪ از TAZ ها حجم سفر داخلی در روزهای هفته بیشتر از آخر هفته ها در شنژن دارند. اینها عمدتاً محل های کار، از جمله پارک فناوری فناوری اطلاعات، مناطق صنعتی، وانکه، مرکز همایش و نمایشگاه و سایر مناطق هستند ( شکل ۱۰ ج). تنها ۲۰ TAZ وجود دارد که تعداد سفرهای داخل TAZ در تعطیلات آخر هفته بیشتر از روزهای هفته است. اینها عمدتاً مناطق تفریحی مانند خلیج شنژن، خلیج میشا، پارک نمایشگاه گل و مرکز سیلو لیک تایمز هستند. شکل ۱۰).د). با این حال، ۵۱٪ از TAZ ها حجم سفر داخلی در تعطیلات آخر هفته بیشتر از روزهای هفته در نیویورک دارند. مناطقی که تفاوت های زیادی دارند عمدتاً پارک ها و مناطق مسکونی از جمله پارک راکاوی، پارک Pelham Bay و مناطق دیگر هستند.
از منظر سفر بین واحدهای جغرافیایی برای OD با بیش از ۱۰ سفر، ۶۵٪ از جریان سفر بین TAZ در روزهای هفته بیشتر از آخر هفته ها در شنژن است. این TAZ ها عمدتاً در دو مکان متمرکز شده اند: پارک فناوری فناوری اطلاعات و مناطق اطراف آن، مرکز شهر و مناطق اطراف آن، مانند منطقه تجاری شمالی Huaqiang، موزه علوم، و مناطق دیگر. یکی دیگر از ویژگی های بارز این است که جریان سفر بین فرودگاه و این مناطق نیز به طور قابل توجهی افزایش یافته است ( شکل ۱۱ c). این مناطق عمدتاً به محل کار و نگرانی های تجاری مربوط می شوند. در مقابل، توزیع جریان سفر که در آخر هفتهها ظاهر میشود، پراکنده است و مربوط به مناطق سرگرمی مانند فروشگاه بزرگ Haiya، پیشتاز منابع چین، پارک جنگلی، و ایستگاه Futian است.شکل ۱۱ د). با این حال، ۲۷ درصد از جریان سفر بین واحدهای جغرافیایی در روزهای هفته بیشتر از تعطیلات آخر هفته در نیویورک است. این مناطق عمدتاً در مناطق منهتن متمرکز هستند و بین منهتن و سایر مناطق تعامل دارند. در تعطیلات آخر هفته، فعالیت های سفرهای بین منطقه ای تاکسی نسبت به روزهای هفته افزایش قابل توجهی داشته است.
۵٫۴٫ پایداری جریان OD بین روزها
بر اساس روش اندازهگیری پایداری جریان OD، ما به طور جداگانه تغییرات پایداری واحد جغرافیایی و بین مناطق را در طول روزهای هفته و پایداری آخر هفته تجزیه و تحلیل کردیم. ( شکل ۱۲ و شکل ۱۳ ). شکل ۱۲تغییر در ثبات سفر واحد جغرافیایی داخلی بر اساس جریان ترافیک در روزهای هفته و آخر هفته را نشان می دهد. به طور کلی مناطق پرترافیک و با ثبات بالا در منطقه فرودگاه Baoan، بندر Futian، Huaqiang جنوبی، پارک صنعتی فناوری و سایر مناطق در شنژن قرار دارند. ساختمانهای اداری و مدارس در TAZs (به عنوان مثال، Huaqiangbei، Dongmen، Old Street Commercial District، و منطقه دانشگاه Shenzhen) در روزهای هفته دارای حجم ترافیک نسبتاً پایدار و بزرگ و حجم کمتری در طول تعطیلات آخر هفته هستند. علاوه بر این، TAZ ها با عملکردهای داخلی متنوع تر (مانند باغ کریپ میرتل و منطقه نزدیک جونیجو) در تعطیلات آخر هفته پایداری نسبتاً بالاتری خواهند داشت ( شکل ۱۲).و) سفرهای کوتاه به جریان ترافیک پایدار کمک کرد. در نیویورک، بروکلین و منهتن در روزهای هفته ثبات بیشتری نسبت به جریان سفرهای داخلی در آخر هفته دارند. به همین ترتیب، مناطقی با سفرهای آخر هفته پایدارتر معمولاً دارای پارک هستند و عملکردهای زیرساختی منطقه نسبتاً کامل هستند.
ثبات و توزیع جریان سفر بین واحدهای جغرافیایی در شکل ۱۳ نشان داده شده است. در توزیع فضایی، فعل و انفعالات TAZ با پایداری بالا و جریان بالا عمدتاً در شش منطقه در شنژن، به ویژه در روزهای کاری رخ می دهد: منطقه صنعتی تراس طلایی منطقه بائوان (C1)، پارک فناوری فناوری اطلاعات (C2)، محله ایستگاه مترو لونگوا (C3) )، منطقه تجاری شمالی Huaqiang، بندر فوکودا، منطقه تجاری Dongmen Old Street و سایر مناطق تعاملی بیشتر (C4)، ایستگاه شرقی Shenzhen و مناطق اطراف آن (C5)، Longgang District Longcheng Park و Crape Myrtle Garden (C6). این مناطق بین روزهای هفته و آخر هفته ثبات بیشتری دارند. در OD های سفر کم تردد، توزیع فضایی OD های پایدار و سطح بالا به طور گسترده ای متفاوت است، که کاملاً منعکس کننده تفاوت در الگوهای سفر در روزهای هفته و آخر هفته است. در نیویورک، متوجه شدیم که ترافیک تعاملی بین سه فرودگاه و منهتن، بروکلین، و کوئینز بزرگ و پایدار است. در پاسخ به این پدیده می توان پیکربندی حمل و نقل عمومی را افزایش داد و ازدحام ترافیک زمینی را کاهش داد. در مقایسه با روزهای هفته، تاکسی های ثابت در تعطیلات آخر هفته بین مناطق دورتر حرکت می کنند.
از این یافته ها می توان برای هدایت برنامه ریزی حمل و نقل شهری در زندگی واقعی استفاده کرد. در مناطقی با حجم ترافیک بالا و ثبات بالا در سفرهای تاکسی، خدمات حمل و نقل عمومی (به عنوان مثال، اتوبوس های منطقه ای) می تواند برای کاهش استفاده از تاکسی و افزایش سهم حمل و نقل عمومی اضافه شود. این کار باعث بهبود کارایی حمل و نقل و کاهش آلاینده های مرتبط با هوا و انتشار کربن می شود. برای مناطقی با حجم ترافیک بالا اما ثبات کم در سفرهای تاکسی، درک الگوهای زمانی میتواند به بهینهسازی ارسال تاکسیها و خدمات آنلاین حمل خودرو کمک کند. برای مثال، میتوان برای برآورده کردن تقاضای سفر در ساعات اوج صبح در نزدیکی «خطهای تلفن»، ترغیب و راهنمایی بیشتر خودروهای آنلاین را تشویق کرد. علاوه بر این، اگر بین روزهای هفته و آخر هفته تفاوت معناداری وجود داشته باشد،
برای سفری که با جریان کم بین مناطق مشخص می شود، باید داده های دیگر را برای تجزیه و تحلیل دلایل جریان کم سفر ترکیب کنیم و سپس راه حل های ممکن را بررسی کنیم.
۵٫۵٫ تجزیه و تحلیل داده های نماینده
تحلیل قبلی شباهتهای مشخص و تفاوتهای آشکاری را در ساختار سفر تاکسی بینروز نشان میدهد، به این معنی که نتایج حاصل از تحلیل ساختار فضایی سفر تاکسی وابستگی خاصی به انتخاب دادهها دارد. بنابراین، ما بیشتر تفاوت بین OD سفر تاکسی بهدستآمده از دادههای پوشش برای روزهای مختلف و کل مجموعه داده را مقایسه کردیم تا تأثیر انتخاب دادهها بر نتایج را تحلیل کنیم. برای این منظور، دادههای روزهای مختلف را بهطور تصادفی انتخاب میکنیم و میانگین روزانه ماتریس OD بین TAZهای مختلف را محاسبه میکنیم.
شباهت ساختاری و شباهت جریان بین ماتریس OD مشتق شده از روزهای مختلف و ماتریس OD مشتق شده از کل مجموعه داده محاسبه و مقایسه می شود. سطح تشابه بالا نشان می دهد که داده های روز انتخاب شده می توانند داده های کلی را به خوبی نشان دهند. برای کاهش تأثیر انتخاب شانس با توجه به تعداد روزها، ما به طور تصادفی ۱۰ مجموعه روز را برای هر اندازه مجموعه از کل مجموعه داده انتخاب می کنیم. مقادیر حداکثر، حداقل و میانگین شباهت محاسبه می شود. ما آزمایشهایی را بر اساس دو مجموعه داده، شنژن و شهر نیویورک انجام دادیم. شکل ۱۳ و شکل ۱۴نشان می دهد که داده های یک روزه می تواند ۷۸ درصد از ساختار فضایی سفر و ۷۱ درصد از جریان سفر در شنژن را توصیف کند، در حالی که داده های یک هفته می تواند ۸۶ درصد از ساختار فضایی سفر و ۸۴ درصد از جریان سفر را توصیف کند. علاوه بر این، دادههای یک روزه میتوانند ۶۳ درصد از ساختار فضایی سفر و ۵۸ درصد از جریان سفر در نیویورک را توصیف کنند، در حالی که دادههای یک هفته میتوانند ۷۳ درصد از ساختار فضایی کلی سفر و ۷۶ درصد از جریان سفر را توصیف کنند. نیمی از دادههای دو مجموعه داده میتوانند ۸۷ درصد از ساختار فضایی سفر و ۸۷ درصد از جریان سفر در شنژن را توصیف کنند، و میتوانند ۸۰ درصد از ساختار فضایی کلی سفر و ۸۴ درصد از جریان سفر در نیویورک را توصیف کنند.
از یک طرف، این نتیجه می تواند برای ارزیابی قابلیت اطمینان نتایج تجزیه و تحلیل به دست آمده بر اساس داده های تاکسی استفاده شود. برای مثال، دادههای یک روزه، که بهطور تصادفی انتخاب شدهاند، میتوانند ۵۰ درصد از دادههای کلی را حداقل در شهرهای مختلف منعکس کنند. علاوه بر این، نتایج همچنین می تواند برای تعیین تعداد روزهای داده مورد نیاز برای دستیابی به پایایی معین در نتیجه گیری تحقیق مورد استفاده قرار گیرد. به عنوان مثال، در این مطالعه، اگر نرخ پوشش نیاز داشته باشد ۸۰ درصد از ساختار سفر را نشان دهد، نیمی از داده ها مورد نیاز خواهد بود.
ما بیشتر آزمایش کردیم که چگونه انتخاب روز بر الگوهای سفر با حجم بالا متفاوت از نمونه های کم حجم تأثیر می گذارد. همانطور که شکل ۱۵نشان می دهد، ۸۵٪ از ساختار فضایی سفر و ۷۹٪ از جریان سفر را می توان با داده های یک روزه برای OD با حجم جریان ترافیک بالا در شنژن بازیابی کرد، در حالی که نرخ نمایش برای OD های کم ۷۳٪ و ۵۲٪ می شود. حجم ترافیک به ترتیب علاوه بر این، ۷۳٪ از ساختار فضایی سفر و ۶۵٪ از جریان سفر را می توان با یک روز داده برای OD با حجم جریان ترافیک بالا در نیویورک بازیابی کرد، در حالی که نرخ نمایش برای OD ها با ترافیک کم ۵۵٪ و ۲۷٪ می شود. حجم، به ترتیب. این نشان می دهد که یک زیر مجموعه داده شده می تواند الگوهای اصلی سفر، به ویژه ساختار فضایی الگوهای سفر را بهتر ارزیابی کند.
۶٫ نتیجه گیری و بحث
این مقاله چگونگی تغییر الگوهای سفر تاکسی بین روزها را بر اساس دادههای تاکسی بررسی میکند. یک الگوریتم Levenshtein بهبود یافته برای اندازه گیری پایداری بین روز از هر دو دیدگاه ساختار فضایی و جریان استفاده می شود. چگونگی تأثیر انتخاب داده ها بر نتایج نیز آزمایش شده است. یافته های اصلی را می توان به شرح زیر خلاصه کرد. اول، تفاوتهای بین روز را میتوان در جریانها و ساختارهای سفر تاکسی مشاهده کرد و سفرهای OD با فرکانس بالا نسبتاً پایدار هستند. دوم، ODs بین منطقه مرکزی شهری و مناطق اطراف، حجم ترافیک بالا و پایداری بالایی را در بین روز نشان میدهد، و سفرهای ODs که در فرودگاه پایان یا شروع میشوند، ثبات ترافیکی بالایی را نشان میدهند. سوم، داده های یک روزه می توانند تا حدی برای توصیف ساختار کلی فضایی سفر و جریان سفر مورد استفاده قرار گیرند. در حالی که داده های یک هفته می تواند ۸۶٪ از ساختار فضایی سفر و ۸۴٪ از جریان سفر در شنژن را توصیف کند، و داده های یک هفته نیویورک می تواند ۷۳٪ از ساختار فضایی سفر و ۷۶٪ از جریان سفر را توصیف کند. برای OD با فرکانس بالا، ۸۵ درصد از ساختار فضایی کلی سفر و ۷۹ درصد از اطلاعات جریان سفر توسط داده های یک روزه شنژن و ۷۳ درصد از ساختار فضایی کلی سفر و ۶۵ درصد از اطلاعات جریان سفر پوشش داده شده است. با داده های یک روزه نیویورک. در الگوهای سفر تاکسی افراد در شهرهای مختلف تفاوت هایی وجود دارد و نمایندگی مجموعه داده ها در شهرهای مختلف متفاوت خواهد بود. برای OD با فرکانس بالا، ۸۵ درصد از ساختار فضایی کلی سفر و ۷۹ درصد از اطلاعات جریان سفر توسط داده های یک روزه شنژن و ۷۳ درصد از ساختار فضایی کلی سفر و ۶۵ درصد از اطلاعات جریان سفر پوشش داده شده است. با داده های یک روزه نیویورک. در الگوهای سفر تاکسی افراد در شهرهای مختلف تفاوت هایی وجود دارد و نمایندگی مجموعه داده ها در شهرهای مختلف متفاوت خواهد بود. برای OD با فرکانس بالا، ۸۵ درصد از ساختار فضایی کلی سفر و ۷۹ درصد از اطلاعات جریان سفر توسط داده های یک روزه شنژن و ۷۳ درصد از ساختار فضایی کلی سفر و ۶۵ درصد از اطلاعات جریان سفر پوشش داده شده است. با داده های یک روزه نیویورک. در الگوهای سفر تاکسی افراد در شهرهای مختلف تفاوت هایی وجود دارد و نمایندگی مجموعه داده ها در شهرهای مختلف متفاوت خواهد بود.
چندین بینش را می توان از یافته ها به دست آورد. اول، درک الگوهای تغییر بین روز می تواند به تصمیم گیری عملی کمک کند. به عنوان مثال، مکمل های خدمات حمل و نقل عمومی را می توان در میان مناطق با حجم ترافیک بالا و ثبات بالا در سفرهای تاکسی بهینه کرد تا سود اجتماعی و زیست محیطی ایجاد کند (به عنوان مثال، بهبود کارایی حمل و نقل شهری و کاهش آلاینده های هوا و کربن). دوم، نرخ بازنمایی می تواند به ارزیابی قابلیت اطمینان نتایج و تصمیم گیری در مورد انتخاب داده ها کمک کند. به عنوان مثال، اگر حالت بلندمدت را تحلیل نکنیم و فقط به یک اسکلت ساختار سفر شهری نیاز داشته باشیم، میتوانیم تنها از دادههای مسیر چند روزه استفاده کنیم. لازم به ذکر است که به دلیل تفاوت در الگوی سفر تاکسی ها در شهرهای مختلف دوره های مختلف، نمایش مجموعه داده های مختلف شهر متفاوت خواهد بود. به عنوان مثال، مجموعه داده شنژن مورد استفاده در این مقاله مربوط به سال ۲۰۱۱ است که هنوز در مرحله توسعه سریع است و شهر نیویورک در سال ۲۰۱۹ به یک کلان شهر بین المللی تبدیل شد.
هنوز در این مطالعه کاستی هایی وجود دارد که باید اصلاح شود. ابتدا، پایداری بین روزی الگوهای سفر تاکسی مشتق شده از سایر منابع داده (به عنوان مثال، داده های مکان تلفن همراه و داده های کارت هوشمند) باید بررسی و مقایسه شود. الگوهای سفر تاکسی ممکن است در منابع مختلف داده متفاوت باشد، همانطور که الگوهای ثبات بین روز نیز ممکن است متفاوت باشد. دوم، ما می توانیم داده های اضافی را برای تجزیه و تحلیل تاثیر تغییرات در ثبات با توجه به عوامل دیگر ترکیب کنیم. به عنوان مثال، اطلاعات کاربری زمین می تواند به تجزیه و تحلیل تغییرات در ثبات سفرهای بین منطقه ای با توجه به انواع مختلف زمین کمک کند.