کلید واژه ها:
زمان انتظار ؛ مانور ؛ ردیابی GPS ; دوچرخه سوار ; پسرفت
۱٫ مقدمه
۲٫ روش شناسی و مدل
۲٫۱٫ داده ها
۲٫۱٫۱٫ ردیابی GPS دوچرخه سواران
۲٫۱٫۲٫ مجموعه داده مانورها
۲٫۱٫۳٫ پاکسازی داده ها و انتخاب ویژگی
۲٫۲٫ انتخاب مدل
۲٫۲٫۱٫ رگرسیون تصادفی جنگل
رگرسیون تصادفی جنگل [ ۳۱ ] توسعه طبقه بندی جنگل تصادفی برای رسیدگی به یک پاسخ پیوسته است که از مجموعه ای از درختان رگرسیون استفاده می کند. یک درخت رگرسیون منفرد فضای ویژگی را از طریق یک سری تقسیمات دودویی ویژگی تقسیم می کند که مجموع باقیمانده مربع ها را به حداقل می رساند که به صورت زیر تعریف می شود:
جایی که و میانگین های پاسخ به چپ و راست یک تقسیم باینری هستند. تقسیمها تا زمانی انجام میشوند که یک معیار توقف برآورده شود، که برای این پیادهسازی، حداقل تعداد مشاهدات در یک گروه برای تعیین یک گره پایانی است. جنگل تصادفی بر روی یک درخت رگرسیون منفرد با آموزش درختان T بر روی تکرارهای بوت استرپ داده های اصلی و استفاده از یک زیرمجموعه تصادفی بهبود می یابد. ویژگی های آموزش هر درخت هر یک از درختان T یک پیش بینی برای مشاهدات من ایجاد می کند ، و پیش بینی نهایی مدل میانگین تمام پیش بینی ها یا . پارامترهای T و حداقل مشاهدات در یک گره پایانه برای بهینه بودن با بسته R randomForest [ ۳۲ ] تنظیم شدند. مدلهای ساخته شده برای مقادیر T بین ۱۰ و ۴۰۰ در افزایش ۱۰، ۶۰ درخت را نشان دادند که میانگین مربعات خطا (MSE) و پیچیدگی مدل را به حداقل میرسانند و با تغییر حداقل مقدار گره پایانه بین ۱ و ۱۰، ۱ را بهعنوان MSE-بهینه با مقدار ۱٫۹۶ شناسایی میکردند. با این حال، بررسی دستی ۶۰ میانگین زمان انتظار پیشبینیشده، انحرافات زیادی از زمانهای واقعی نشان داد، بنابراین مدل دقیقتری مورد نظر بود.
۲٫۲٫۲٫ SVM هسته گاوسی
SVM [ ۳۳ ] یک روش طبقه بندی باینری است که به دنبال یافتن بردار نرمال است و افست b از هایپرپلان که به بهترین وجه این دو کلاس را از هم جدا می کند. این امر با بهینهسازی از طریق برنامهریزی درجه دوم انجام میشود، که نقاط مرزی هر کلاس را که به عنوان بردارهای پشتیبانی شناخته میشوند، برای ایجاد صفحه مذکور مشخص میکند. SVM هسته گاوسی با استفاده از تابع هسته گاوسی SVM استاندارد را بهبود می بخشد. برای نمایش داده ها از فضای اصلی به فضای ویژگی های با ابعاد بالاتر برای تفکیک بهتر. سپس یافتن ابر صفحه بهینه به حل برنامه درجه دوم زیر کاهش می یابد:
موضوع به و ، که در آن C پارامتر تنظیم و ، که برای دو کلاس کد می کند. یک مشاهده جدید را می توان با قاعده تصمیم طبقه بندی کرد ، جایی که b را می توان با معادله تعیین کرد ، جایی که هر بردار پشتیبان است. برای پیاده سازی SVM هسته گاوسی برای طبقه بندی، ابتدا پاسخ پیوسته مطابق جدول ۴ به ۳ کلاس گسسته شد .
۲٫۳٫ رگرسیون ناپارامتری هسته
رگرسیون ناپارامتری هسته [ ۳۵ ] راهی برای حفظ ماهیت پیوسته میانگین زمان انتظار در حالی که انعطافپذیری لازم را در هنگام برخورد با مشاهدات محدود حفظ میکند، ارائه کرد. هدف از رگرسیون هسته تخمین رابطه تجربی بین و Y ، کجا ، با تعداد p متغیرها، بردار تصادفی ویژگی ها است و Y میانگین زمان انتظار [ ۳۶ ] است. این از طریق استفاده از برآوردگر Nadaraya-Watson، که در R در بسته np پیاده سازی شده است، انجام شد [ ۳۷ ]. برآوردگر چند متغیره زمان انتظار در مورد یک مکان با ارزش برداری ، ، به عنوان … تعریف شده است:
برآوردگر نادارایا-واتسون فقط با متغیرهای پیوسته قابل استفاده است. با این حال، ویژگی ها از نوع شناسی مختلط هستند. بنابراین، مسئله مستلزم تعمیم این برآوردگر است. برای انواع مختلف متغیرها می توان از انواع مختلفی از هسته ها استفاده کرد. هسته مورد استفاده برای ویژگی های پیوسته، هسته گاوسی با فرمول است برای داده های تک متغیره برآوردگر چگالی هسته چند متغیره پیوسته به صورت زیر است:
هسته Aitchison و Aitken [ ۳۸ ] برای این مورد استفاده شد متغیرهای اسمی با سطوح و به این صورت تعریف می شود:
جایی که پهنای باند است. این ویژگی های ترتیبی با لی و هسته راسین [ ۳۹ ] به صورت زیر تعریف می شوند:
جایی که پهنای باند است. با توابع توزین هسته که برای ویژگی های پیوسته، اسمی و ترتیبی تعریف شده اند، برآوردگر تعمیم یافته نادارایا-واتسون برای داده های ترکیبی را می توان به صورت زیر بیان کرد:
بر اساس هسته محصول مخلوط:
۲٫۴٫ انتخاب پهنای باند
انتخاب پهنای باند بر اساس روش اعتبار سنجی متقاطع حداقل مربعات یک خروجی [ ۴۰ ] انجام شد، که برای رسیدگی به مسائلی که با انتخاب پهنای باند از طریق به حداقل رساندن ساده مجموع باقیمانده مربع ها ایجاد می شود، ایجاد شد. حداقل مربعات خطای اعتبار متقاطع به صورت زیر تعریف می شود:
جایی که زیرنویس نشان دهنده مقدار i است که حذف شده است، و پهنای باند بهینه مقادیری هستند که خطا را به حداقل می رساند، یا . بسته np R این روش را با جستجوی شبکه brute-force همراه با پنج مقدار دهی اولیه متفاوت پیاده سازی می کند و نتیجه را با کمترین خطای اعتبارسنجی متقاطع برمی گرداند.
۲٫۵٫ بوت استرپینگ
۳٫ نتایج
۴٫ نتیجه گیری
منابع
- روپی، اف. Schweizer, J. ارزیابی الگوهای دوچرخه سوار با استفاده از داده های GPS از تلفن های هوشمند. ITE Intel. ترانسپ سیستم ۲۰۱۸ ، ۱۲ ، ۲۷۹-۲۸۵٫ [ Google Scholar ] [ CrossRef ]
- بروچ، جی. شوید، جی. Gliebe, J. دوچرخه سواران کجا سوار می شوند؟ یک مدل انتخاب مسیر با دادههای GPS ترجیحی آشکار ساخته شده است. ترانسپ Res. بخش A سیاست سیاست. ۲۰۱۲ ، ۴۶ ، ۱۷۳۰-۱۷۴۰٫ [ Google Scholar ] [ CrossRef ]
- ارگوت، ام. وانگ، جی. رایت، ا. ون هوت، سی. مدل انتخاب مسیر دوچرخه سوار دوهدفه. ترانسپ Res. بخش A سیاست سیاست. ۲۰۱۲ ، ۴۶ ، ۶۵۲-۶۶۳٫ [ Google Scholar ] [ CrossRef ]
- شوید، جی. دوچرخه سواری برای حمل و نقل و سلامت: نقش زیرساخت. J. سیاست بهداشت عمومی ۲۰۰۹ ، ۳۰ ، S95-S110. [ Google Scholar ] [ CrossRef ]
- روپی، اف. پولیزیانی، سی. Schweizer, J. تجزیه و تحلیل شبکه دوچرخه مبتنی بر داده بر اساس روشهای شمارش سنتی و ردیابی GPS از تلفن هوشمند. ISPRS Int. J. Geo-Inf. ۲۰۱۹ ، ۸ ، ۳۲۲٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
- شوایزر، جی. روپی، اف. پولیزیانی، سی. برآورد تابع پیوند-هزینه برای دوچرخه سواران بر اساس بهینه سازی تصادفی و ردیابی GPS. IET Intel. ترانسپ سیستم ۲۰۲۰ ، ۱۴ ، ۱۸۱۰-۱۸۱۴٫ [ Google Scholar ] [ CrossRef ]
- آلونسو، اف. فاوس، م. سندلز، بی. یوزچه، اس. ادراک شهروندان در رابطه با سیستم ها و زیرساخت های حمل و نقل: مطالعه سراسری در جمهوری دومینیکن. Infrastructures ۲۰۲۱ , ۶ , ۱۵۳٫ [ Google Scholar ] [ CrossRef ]
- ویلبرگ، ای. تنکانن، اچ. پوم، ا. سالونن، ام. Toivonen، T. مقایسه منابع داده های مکانی برای مطالعات دوچرخه سواری: مروری. در حمل و نقل در شهرهای مقیاس انسانی ; انتشارات ادوارد الگار: چلتنهام، انگلستان، ۲۰۲۱; صص ۱۶۹-۱۸۷٫ [ Google Scholar ]
- برجسون، ام. Eliasson, J. ارزش زمان و مزایای خارجی در ارزیابی دوچرخه. ترانسپ Res. بخش A سیاست سیاست. ۲۰۱۲ ، ۴۶ ، ۶۷۳-۶۸۳٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- فیورز، تی. گرون وولت، بی. کولوایج، ج. Geurs، K. درک در مقابل زمان انتظار واقعی: مطالعه موردی در بین دوچرخه سواران در Enschede، هلند. یافته های حمل و نقل ، ۱۰ ژوئیه ۲۰۱۹٫ [ Google Scholar ] [ CrossRef ]
- روپی، اف. پولیزیانی، سی. Schweizer, J. تجزیه و تحلیل عملکردهای پویا یک شبکه دوچرخه با تجزیه و تحلیل زمانی ردیابی GPS. مورد مطالعه. ترانسپ سیاست ۲۰۲۰ ، ۸ ، ۷۷۰–۷۷۷٫ [ Google Scholar ] [ CrossRef ]
- اشتراوس، جی. Miranda-Moreno، سرعت LF، زمان سفر و تاخیر برای تقاطع ها و بخش های جاده در شبکه مونترال با استفاده از داده های GPS تلفن هوشمند دوچرخه سوار. ترانسپ Res. قسمت D Transp. محیط زیست ۲۰۱۷ ، ۵۷ ، ۱۵۵-۱۷۱٫ [ Google Scholar ] [ CrossRef ]
- کلاری، ا. فقیه ایمانی، ع. میلر، ای جی کجا سریعتر سوار می شویم؟ بررسی سرعت دوچرخهسواری با استفاده از دادههای GPS گوشی هوشمند. حفظ کنید. جامعه شهرها ۲۰۱۹ ، ۴۹ ، ۱۰۱۵۹۴٫ [ Google Scholar ] [ CrossRef ]
- لارانجیرو، پی اف. مرچن، دی. گودوی، لس آنجلس؛ جیانوتی، ام. یوشیزاکی، HT; وینکنباخ، ام. Cunha، CB استفاده از داده های GPS برای کشف الگوهای سرعت و نوسانات زمانی در تدارکات شهری: مورد سائوپائولو، برزیل. J. Transp. Geogr. ۲۰۱۹ ، ۷۶ ، ۱۱۴-۱۲۹٫ [ Google Scholar ] [ CrossRef ]
- کورتس، CE; گیبسون، جی. گشوندر، ا. مونیزاگا، م. Zúñiga، M. تشخیص سرعت اتوبوس تجاری بر اساس داده های نظارت شده با GPS. ترانسپ Res. قسمت C Emerg. تکنولوژی ۲۰۱۱ ، ۱۹ ، ۶۹۵-۷۰۷٫ [ Google Scholar ] [ CrossRef ]
- پولیزیانی، سی. روپی، اف. Schweizer، J. بررسی ترافیک و ردیابی GPS برای بررسی الگوهای سرعت در حال حرکت دوچرخه سواران. ترانسپ Res. Procedia ۲۰۲۱ ، ۶۰ ، ۴۱۰-۴۱۷٫ [ Google Scholar ] [ CrossRef ]
- پولیزیانی، سی. روپی، اف. شوایزر، جی. ساراکو، م. تخمین زمان انتظار کاپوانو، D. دوچرخه سوار در تقاطع ها، مطالعه موردی با ردیابی GPS از بولونیا. ترانسپ Res. Procedia ، ۲۰۲۱; در مطبوعات . [ Google Scholar ]
- پولیزیانی، سی. روپی، اف. امبوگا، اف. شوایزر، جی. Tortora, C. دسته بندی سه گونه شناسی دوچرخه سوار فعال با کاوش در الگوهای بسیاری از ویژگی های داده جمع آوری شده GPS. Res. ترانسپ اتوبوس. مدیریت ۲۰۲۱ ، ۴۰ ، ۱۰۰۵۷۲٫ [ Google Scholar ] [ CrossRef ]
- تورتورا، سی. فرانکزاک، BC; براون، RP; McNicholas، PD مخلوطی از توزیع های هذلولی تعمیم یافته به هم پیوسته. J. Classif. ۲۰۱۹ ، ۳۶ ، ۲۶-۵۷٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- نقاط بهتر در دسترس آنلاین: https://www.betterpoints.ltd/ (در ۲۷ فوریه ۲۰۲۲ قابل دسترسی است).
- آلونسو، اف. یوزچه، اس. فاوس، م. استبان، سی. آیا امنیت شهری انتخاب های حمل و نقل و رفتار مسافرتی شهروندان را تعدیل می کند؟ یک مطالعه ملی در جمهوری دومینیکن. جلو. حفظ کنید. شهرها ۲۰۲۰ ، ۲ ، ۴۲٫ [ Google Scholar ] [ CrossRef ]
- SUMOPy. در دسترس آنلاین: https://sumo.dlr.de/docs/Contributed/SUMOPy.html (در ۲۷ فوریه ۲۰۲۲ قابل دسترسی است).
- OSM. در دسترس آنلاین: https://www.openstreetmap.org/#map=19/44.50163/11.34276 (در تاریخ ۲۷ فوریه ۲۰۲۲ قابل دسترسی است).
- شوایزر، جی. برناردی، س. روپی، اف. الگوریتم تطبیق نقشه برای ردیابی سیستم موقعیت یابی جهانی دوچرخه در بولونیا اعمال شد. ITE Intel. ترانسپ سیستم ۲۰۱۶ ، ۱۰ ، ۲۴۴-۲۵۰٫ [ Google Scholar ] [ CrossRef ]
- فرابونی، ف. مارین پوچادس، وی. دی آنجلیس، م. پیترانتونی، ال. پراتی، جی. رفتار دویدن در نور قرمز دوچرخه سواران در ایتالیا: یک مطالعه مشاهده ای. اسید. مقعدی قبلی ۲۰۱۸ ، ۱۲۰ ، ۲۱۹-۲۳۲٫ [ Google Scholar ] [ CrossRef ]
- تنگاتینی، اس. بیگازی، ا. روپی، اف. ظاهر و رفتار: آیا ویژگی های فیزیکی دوچرخه سواران منعکس کننده ترجیحات و عادات آنها هستند؟ رفتار سفر. Soc. ۲۰۱۸ ، ۱۳ ، ۳۶-۴۳٫ [ Google Scholar ] [ CrossRef ]
- روسی، آر. مانتوانو، آ. پاسکوچی، اف. روپی، اف. توزیع زمان پیشروی و سرعت مناسب برای دوچرخهها در خطوط جداگانه دوچرخه. ترانسپ Res. Procedia ۲۰۱۷ ، ۲۷ ، ۱۹-۲۶٫ [ Google Scholar ] [ CrossRef ]
- راهنمای ظرفیت بزرگراه ; هیئت تحقیقات حمل و نقل: واشنگتن، دی سی، ایالات متحده آمریکا، ۲۰۰۰٫
- شوایزر، جی. پولیزیانی، سی. روپی، اف. مورگانو، دی. Magi، M. ساخت یک سناریوی حمل و نقل میکرو شبیه سازی در مقیاس بزرگ با استفاده از داده های بزرگ. ISPRS Int. J. Geo-Inf. ۲۰۲۱ ، ۱۰ ، ۱۶۵٫ [ Google Scholar ] [ CrossRef ]
- تیم اصلی R. R: زبان و محیطی برای محاسبات آماری . بنیاد R برای محاسبات آماری: وین، اتریش، ۲۰۲۰٫ [ Google Scholar ]
- بریمن، L. جنگل های تصادفی. ماخ فرا گرفتن. ۲۰۰۱ ، ۴۵ ، ۵-۳۲٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- لیاو، ا. وینر، ام. طبقه بندی و رگرسیون توسط جنگل تصادفی. R News ۲۰۰۲ , ۲ , ۱۸-۲۲٫ [ Google Scholar ]
- Boser، BE; Guyon، IM; Vapnik، VN یک الگوریتم آموزشی برای طبقهبندیکننده حاشیه بهینه. در مجموعه مقالات پنجمین کارگاه سالانه ACM در نظریه یادگیری محاسباتی، پیتسبورگ، PA، ایالات متحده آمریکا، ۲۷-۲۹ ژوئیه ۱۹۹۲٫ صص ۱۴۴-۱۵۲٫ [ Google Scholar ]
- مایر، دی. دیمیتریادو، ای. هورنیک، ک. وینگسل، آ. لیش، اف. چانگ، سی سی; Lin، CC; Meyer, MD Package ‘e1071’. R Journal نسخه ۱٫۷-۳٫ ۲۰۱۹٫ در دسترس آنلاین: https://rdrr.io/rforge/e1071/ (در ۲۷ فوریه ۲۰۲۲ قابل دسترسی است).
- نادارایا، EA در مورد تخمین رگرسیون. نظریه احتمالی. Appl. ۱۹۶۴ ، ۹ ، ۱۴۱-۱۴۲٫ [ Google Scholar ] [ CrossRef ]
- García-Portugués, E. Notes for Nonparametric Statistics , نسخه ۶٫۴٫۴; Bookdown، ۲۰۲۱; شابک ۹۷۸-۸۴-۰۹-۲۹۵۳۷-۱٫ در دسترس آنلاین: https://bookdown.org/egarpor/NP-UC3M/ (دسترسی در ۲۷ فوریه ۲۰۲۲).
- هایفیلد، تی. Racine, JS Nonparametric Econometrics: The np Package. J. Stat. نرم افزار ۲۰۰۸ ، ۲۷ ، ۱-۳۲٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- آیچیسون، جی. Aitken، CG تفکیک باینری چند متغیره به روش کرنل. Biometrika ۱۹۷۶ ، ۶۳ ، ۴۱۳-۴۲۰٫ [ Google Scholar ] [ CrossRef ]
- لی، کیو. راسین، اقتصاد سنجی ناپارامتری JS: نظریه و عمل . انتشارات دانشگاه پرینستون: پرینستون، نیوجرسی، ایالات متحده آمریکا، ۲۰۰۷٫ [ Google Scholar ]
- لی، کیو. Racine, J. رگرسیون ناپارامتریک خطی محلی اعتبار متقاطع. آمار گناه ۲۰۰۴ ، ۱۴ ، ۴۸۵-۵۱۲٫ [ Google Scholar ]
- هاردل، دبلیو. نوارهای خطای همزمان Marron، JS Bootstrap برای رگرسیون ناپارامتریک. ان آمار ۱۹۹۱ ، ۱۹ ، ۷۷۸-۷۹۶٫ [ Google Scholar ] [ CrossRef ]
بدون دیدگاه