شبکه کانولوشن انتشار مکانی-زمانی: چارچوبی جدید برای پیش‌بینی تقاضای تاکسی

پیش بینی تقاضای تاکسی نقش مهمی در خدمات حمل و نقل سواری دارد. پیش‌بینی دقیق تقاضای تاکسی می‌تواند به شرکت‌های تاکسی در پیش‌تخصیص تاکسی‌ها، بهبود استفاده از خودرو، کاهش زمان انتظار و کاهش تراکم ترافیک کمک کند. این یک کار چالش برانگیز به دلیل الگوهای مکانی-زمانی بسیار غیرخطی و پیچیده داده‌های تاکسی است. بسیاری از روش‌های پیش‌بینی تقاضای تاکسی‌های موجود، فاقد توانایی درک وابستگی‌های مکانی-زمانی پویا در بین مناطق هستند. آن‌ها یا محدودیت‌های شبکه‌های عصبی گراف را در نظر نمی‌گیرند یا وابستگی‌های زمانی طولانی‌مدت را به‌طور مؤثر درک نمی‌کنند. در این مقاله، ما یک شبکه کانولوشن انتشار مکانی-زمانی (ST-DCN) برای پیش‌بینی تقاضای تاکسی پیشنهاد می‌کنیم. وابستگی های فضایی پویا به طور موثر از طریق یک شبکه کانولوشنی انتشار نمودار دو فازی که در آن مکانیسم توجه معرفی می شود، ضبط می شود. علاوه بر این، یک ماژول پیچیدگی زمانی جدید برای یادگیری طیف های مختلف وابستگی های زمانی، از جمله دوره های اخیر، روزانه و هفتگی طراحی شده است. در داخل ماژول، لایه‌های کانولوشن روی هم چیده شده‌اند تا توالی‌های بسیار طولانی را مدیریت کنند. نتایج تجربی روی دو مجموعه داده تاکسی در مقیاس بزرگ از شهر نیویورک (NYC) و چنگدو نشان می‌دهد که روش ما به طور قابل‌توجهی از هفت روش پایه پیشرفته برتری دارد. لایه های کانولوشن برای رسیدگی به دنباله های بسیار طولانی روی هم چیده شده اند. نتایج تجربی روی دو مجموعه داده تاکسی در مقیاس بزرگ از شهر نیویورک (NYC) و چنگدو نشان می‌دهد که روش ما به طور قابل‌توجهی از هفت روش پایه پیشرفته برتری دارد. لایه های کانولوشن برای رسیدگی به دنباله های بسیار طولانی روی هم چیده شده اند. نتایج تجربی روی دو مجموعه داده تاکسی در مقیاس بزرگ از شهر نیویورک (NYC) و چنگدو نشان می‌دهد که روش ما به طور قابل‌توجهی از هفت روش پایه پیشرفته برتری دارد.

کلید واژه ها:

پیش بینی تقاضا ; وابستگی های مکانی-زمانی ؛ گراف شبکه های عصبی ; مکانیسم توجه

۱٫ مقدمه

محبوبیت خدمات درخواست تاکسی امروزه تا حد زیادی رفتار سفر مردم در مناطق شهری را تغییر داده است. پیش‌بینی سفارش تاکسی نقش مهمی در خدمات درخواست تاکسی بازی می‌کند، زیرا می‌تواند بر تخصیص اولیه منابع برای برآورده کردن تقاضای سفر تأثیر بگذارد. طراحی دقیق‌تر مدل‌های پیش‌بینی سفارش تاکسی می‌تواند کارایی سرویس تاکسی را افزایش داده و ازدحام ترافیک را کاهش دهد.
با بهره‌گیری از استقرار گسترده سنسورهای GPS در وسایل نقلیه تاکسی، مقدار زیادی داده‌های سفر تاکسی جمع‌آوری شده است که فرصت‌هایی را برای طراحی مدل‌های مبتنی بر داده قدرتمندتر برای بهبود دقت پیش‌بینی تقاضای تاکسی به ارمغان می‌آورد. با این حال، داده های سفارش تاکسی در سناریوهای زندگی واقعی عموماً از الگوهای پیچیده مکانی-زمانی پیروی می کنند [ ۱ ، ۲ ]. شکل ۱ a نمونه ای از توزیع فضایی سفارشات یک ساعته تاکسی در شهر نیویورک (NYC) را نشان می دهد. می توان مشاهده کرد که سفارشات نیز تمایل دارند در اطراف مناطق داغ شهر جمع شوند. توزیع زمانی سفارشات تاکسی در شکل ۲ نشان داده شده استکه در آن تقاضای ساعتی از نظر زمانی همبستگی دارد و شامل دوره های کوتاه مدت و بلند مدت است. الگوی رایج دیگری که در اینجا نشان داده نشده است اما در کارهای قبلی مشاهده شده است، همبستگی تقاضا در مناطق دور به دلیل عملکردهای مشابه [ ۳ ] یا اتصالات توسط سیستم حمل و نقل عمومی [ ۱ ] است.
پیش‌بینی تقاضای تاکسی را می‌توان به عنوان یک مورد خاص از مشکل پیش‌بینی داده‌های مکانی-زمانی کلی‌تر در نظر گرفت. علاوه بر داده های سفارش تاکسی [ ۴ ، ۵ ، ۶ ، ۷ ]، انواع دیگری از مجموعه داده های مکانی-زمانی نیز برای پیش بینی مورد مطالعه قرار گرفته اند، از جمله حجم ترافیک [ ۸ ، ۹ ، ۱۰ ، ۱۱ ، ۱۲ ]، جریان ترافیک [ ۲ ، ۱۳ ، ۱۴ ، ۱۵ ، ۱۶ ] و تقاضای اشتراک دوچرخه [ ۱۷]. از آنجایی که سفارشات تاکسی به طور پیوسته در فضا توزیع می شود، پیش پردازش معمولاً برای جمع آوری داده ها در شبکه های [ ۱ ، ۴ ، ۶ ]، مناطق [ ۱۸ ]، یا پارتیشن های ایجاد شده از شبکه جاده ها [ ۲ ] انجام می شود. در نتیجه، مشکل به پیش‌بینی یک ماتریس یا نمودار تبدیل می‌شود که در آن چالش‌ها در مدل‌سازی وابستگی‌های مکانی-زمانی پیچیده و پویا در داده‌های تقاضا نهفته است.
روش‌های متعارف پیش‌بینی تقاضای سفر، همبستگی زمانی را با استفاده از تجزیه و تحلیل سری‌های زمانی مانند میانگین متحرک یکپارچه اتورگرسیو (ARIMA) مدل‌سازی کردند [ ۱۹ ، ۲۰ ، ۲۱ ]. آنها می توانند در مدیریت الگوهای پیچیده مکانی-زمانی در داده های تقاضای سفر ضعیف باشند. پیشرفت‌های اخیر در یادگیری عمیق تا حد زیادی استفاده از مدل‌های شبکه عصبی را در پیش‌بینی تقاضای سفر ارتقا داده است. ژانگ و همکاران [ ۱ ] ST-ResNet را توسعه داد که در آن وابستگی های منطقه ای محلی و جهانی با انباشتن چندین لایه کانولوشن گرفته شد. همین رویکرد در DMVST-Net [ ۳]، که در آن وابستگی معنایی بیشتر با ساختن یک نمودار برای نشان دادن شباهت بین الگوهای تقاضا در بین مناطق در نظر گرفته شد. شبکه کانولوشن گراف (GCN) نیز به طور گسترده برای مدل‌سازی وابستگی‌های فضایی در پیش‌بینی تقاضای سفر استفاده شد. لین و همکاران [ ۱۷ ] GCN را با فیلتر نموداری برای پیش‌بینی تقاضای اشتراک دوچرخه پیشنهاد کرد که در آن فیلتر نمودار چندین ویژگی از جمله فاصله مکانی، الگوی تقاضا، میانگین مدت سفر و غیره را کد می‌کند. Geng et al. [ ۴ ] یک شبکه کانولوشن گراف چند نموداری را برای در نظر گرفتن سه نوع گراف مجاورت کدگذاری مجاورت فضایی، شباهت عملکردی، و اتصال حمل و نقل ایجاد کرد. بای و همکاران [ ۵] یک GCN سلسله مراتبی را طراحی کرد که چندین لایه GCN را برای ثبت همبستگی های مکانی-زمانی بلندمدت روی هم قرار می داد. سان و همکاران [ ۲ ] خروجی پنج لایه GCN را با هم ادغام کرد که انواع مختلفی از نماهای زمانی را ثبت کرد. ژانگ و همکاران [ ۱۸ ] خوشه‌بندی تقاضای تاکسی را انجام داد، سپس یک شبکه عصبی بازگشتی چند سطحی (MLRNN) برای استفاده از ناهمگونی بین منطقه‌ای برای بهبود پیش‌بینی طراحی کرد. به منظور دریافت پویایی زمانی، Ye et al. [ ۲۲ ] یک مکانیسم پیچیدگی گراف بر پایه لایه جفت شده را توسعه داد که در آن هر لایه GCN دارای یک ماتریس مجاورت متفاوت است که به طور مکرر به روز می شود. برخی از مطالعات بیشتر پیش‌بینی تقاضا از یک منطقه مبدا تا مقصد (OD) را بررسی کردند. لیو و همکاران [ ۶] پیچیدگی را بر روی ماتریس OD برای مدل سازی وابستگی فضایی محلی انجام داد. وانگ و همکاران [ ۷ ] یک طرح یادگیری چند وظیفه ای با شبکه حافظه کوتاه مدت پرش دوره ای (LSTM) برای پیش بینی ماتریس OD و جریان ترافیک ورودی و خروجی یک شبکه ایجاد کرد.
اگرچه مطالعات زیادی برای مدل‌سازی وابستگی‌های مکانی-زمانی در داده‌های تقاضای تاکسی انجام شده است، آنها نمی‌توانند وابستگی‌های مکانی-زمانی را به‌طور موثر دریافت کنند. از یک طرف، مشکل محدودیت های شبکه های عصبی کانولوشن گراف با هیچ روش موجود در نظر گرفته نمی شود. از سوی دیگر، اگرچه پیچیدگی علّی متسع می‌تواند وابستگی‌های زمانی طولانی‌مدت را در مقایسه با روش‌های شبکه عصبی بازگشتی (RNN) یاد بگیرد، اما مشکل اثرات شبکه‌بندی را دارد. روش پیشنهادی ما، شبکه کانولوشنال انتشار مکانی-زمانی (ST-DCN)، به طور موثر به این دو چالش می‌پردازد. مشارکت های کار ما به شرح زیر خلاصه می شود:
  • ما یک شبکه کانولوشن انتشار گراف دو فازی طراحی می‌کنیم که می‌تواند به طور موثر محدودیت‌های شبکه‌های عصبی کانولوشن گراف را برطرف کند. در طول فرآیند انتشار پیچیدگی، ما از دو نوع ماتریس مجاورت استفاده می‌کنیم و مکانیسم توجه را برای گرفتن وابستگی‌های فضایی پویا به صورت تطبیقی ​​معرفی می‌کنیم.
  • پیچیدگی علتی گشاد شده ترکیبی برای گرفتن وابستگی‌های زمانی استفاده می‌شود، که می‌تواند مشکل اثر شبکه پیچیدگی متسع معمولی را برطرف کند. ما از مکانیزم دروازه‌ای برای کنترل کارآمد جریان اطلاعات گره‌ها و در نظر گرفتن دوره‌ای داده‌های تقاضای تاکسی استفاده می‌کنیم.
  • ما رویکرد خود را بر روی دو مجموعه داده دنیای واقعی در مقیاس بزرگ ارزیابی کردیم. نتایج تجربی نشان می‌دهد که ST-DCN از هفت روش پایه موجود برتری دارد.

۲٫ مقدماتی

ایستگاه مجازی: درخواست‌های سفارش تاکسی معمولاً در مناطق خاصی در حالت حمل‌ونقل مانند تاکسی جمع‌آوری می‌شوند. به عنوان مثال، در ورودی یک دانشگاه یا یک منطقه مسکونی، که ناخودآگاه یک ایستگاه مجازی را تشکیل می‌دهد، معمولاً ویژگی‌های متمایزتری تقاضای تاکسی وجود دارد [ ۲۳ ]. کشف این ایستگاه های مجازی می تواند به شناسایی ویژگی های تقاضای تاکسی کمک کند و پیش بینی را دقیق تر کند. شایان ذکر است که اکثر کارهای موجود در زمینه پیش بینی تقاضای حمل و نقل، شهر را به شبکه هایی تقسیم می کنند و سپس هر شبکه را به عنوان گره گراف در نظر می گیرند. مشابه CCRNN [ ۲۲ ]، ما از خوشه بندی پیک چگالی (DPC) [ ۲۴ ] استفاده می کنیم.] به تقسیم کردن مناطق به ایستگاه های مجازی نزدیک می شود و آنها را به عنوان گره های نمودارها در نظر می گیرد. در سناریوهای واقع بینانه با ساختار شبکه جاده ای بیشتر مطابقت دارد و به دستیابی به نتایج پیش بینی دقیق تر کمک می کند.

پیش بینی تقاضای تاکسی: با توجه به یک نمودار G=(V,E,A)، جایی که V مجموعه ای از گره های گراف را نشان می دهد ( |V|=N) که ایستگاه های مجازی هستند. E مجموعه ای از لبه ها است که نشان دهنده ارتباط بین گره ها است. ARN×Nیک ماتریس مجاورت وزنی از نمودار است که در آن هر عنصر وجود دارد Aijوزنی را ذخیره می کند که نشان دهنده قدرت اتصال بین گره i و j است. در مرحله زمانی t ، نمودار G یک سیگنال گراف دارد XtRN×C، C تعداد ابعاد ویژگی ورودی است. دو ویژگی در نظر گرفته شده است، از جمله تعداد برداشت و رها کردن هر گره در مرحله زمانی t . با توجه به نمودار G و تاریخچه سیگنال‌های نمودار مرحله زمانی H ، مسئله پیش‌بینی تقاضای تاکسی به عنوان یافتن تابع نقشه‌برداری f فرموله می‌شود که می‌تواند تاکسی را برای مراحل بعدی زمانی P پیش‌بینی کند . رابطه نگاشت را می توان به صورت زیر تعریف کرد:

f(X(tH+1):t,G)X(t+1):(t+P)

جایی که X(tH+1):tRH×N×Cو X(t+1):(t+P)RP×N×C.

۳٫ روش شناسی

در این بخش، مدل پیشنهادی ST-DCN را با جزئیات فنی توضیح می دهیم. همانطور که در شکل ۳ نشان داده شده است ، شبکه ST-DCN پیشنهادی شامل (الف) یک لایه ورودی، (ب) یک ماژول کانولوشن زمانی، (ج) یک ماژول پیچش مکانی، و (د) یک لایه خروجی است. ماژول های کانولوشن زمانی و مکانی از چند بلوک T و بلوک S تشکیل شده اند. هر بلوک به طور متناظر از لایه‌های پیچیدگی زمانی و فضایی روی هم تشکیل شده است. هر دو لایه کانولوشن زمانی و مکانی در نهایت با اتصالات باقیمانده گنجانده می شوند تا از مشکل ناپدید شدن گرادیان جلوگیری شود [ ۲۵ ].

۳٫۱٫ مدلسازی وابستگی فضایی

مدل‌سازی وابستگی‌های فضایی یک مطالعه پیش‌نیاز مهم برای دستیابی به پیش‌بینی تقاضای تاکسی است. ظهور شبکه‌های عصبی نموداری مختلف در سال‌های اخیر، کار پرداختن به انواع داده‌های گرافیکی را تسهیل کرده است. شبکه‌های عصبی نموداری می‌توانند برای مدل‌سازی شبکه‌های جاده‌ای پیچیده در هنگام برخورد با مشکل پیش‌بینی تقاضای تاکسی استفاده شوند. این به محدودیت های شبکه های عصبی کانولوشن (CNN) در مقابله با داده های غیر اقلیدسی می پردازد.

این مقاله پیچیدگی انتشار پیشنهاد شده توسط DCRNN [ ۸ ] را اعمال می‌کند و ماتریس مجاورت خود تطبیقی ​​طراحی شده در Graph WaveNet [ ۱۱ ] را برای مدل‌سازی وابستگی فضایی به کار می‌گیرد. به طور خاص، ما استفاده می کنیم A¯¯¯برای نشان دادن ماتریس مجاورت ساکن که در آن هر مقدار فاصله بین دو گره و را ذخیره می کند A˜برای نشان دادن ماتریس مجاورت خود تطبیقی ​​با تعریف زیر

A˜=softmax(ReLU(M1,MT2) )
h=k=0KPkXWk1+A˜kXWk2

جایی که M1,M2RN×cجاسازی گره منبع و هدف هستند، Pماتریس انتقال است، X نشان دهنده ورودی، و W نشان دهنده ماتریس پارامتر مدل است.

معادله ( ۳ ) اثرات مختلف وابستگی های فضایی نشان داده شده توسط ماتریس های مجاورت مختلف را در نظر نمی گیرد، که برای یادگیری موثر وابستگی های فضایی مهم است. به طور مشابه، در فرآیند انتشار کانولوشن، تأثیرات مختلف هر مرحله نیز باید در نظر گرفته شود. بنابراین، ما یک فرآیند انتشار کانولوشن را برای کنترل جریان اطلاعات روی گره‌ها اتخاذ می‌کنیم که از دو فاز اصلی تشکیل شده است: مرحله انتشار اطلاعات و مرحله کنترل اطلاعات. مرحله انتشار اطلاعات به صورت زیر تعریف می شود:

Xk=αXk۱+(۱α)A˜Xk۱

جایی که αیک هایپرپارامتر است که برای کنترل میزان نگهداری اطلاعات گره اصلی استفاده می شود. همین رابطه برای ماتریس مجاورت ساکن فقط با جایگزین کردن صدق می کند آ˜با آ¯¯¯در معادله بالا

مرحله انتشار اطلاعات به صورت بازگشتی اطلاعات گره ها را همراه با یک ساختار نمودار مشخص منتشر می کند. یکی از مشکلاتی که باید با شبکه های کانولوشن گراف برطرف شود این است که تعداد گره های همسایگی به صورت تصاعدی در هنگام استفاده از یک شبکه گراف چندلایه افزایش می یابد. مشکل له کردن بیش از حد رخ خواهد داد: مقدار زیادی از اطلاعات در مورد گره های همسایه باید در بردار ویژگی یک گره منفرد فشرده شود [ ۲۶ ]]. در نتیجه، اطلاعات را نمی توان به طور موثر منتشر کرد و مدل عملکرد ضعیفی دارد. برای حل این مشکل، درصد مشخصی از اطلاعات اصلی گره‌ها را در طول فرآیند انتشار اطلاعات حفظ می‌کنیم، که می‌تواند به طور همزمان اطلاعات گره‌های اصلی را حفظ کند و به طور مؤثری می‌تواند کاوش گره‌های همسایه را عمیق‌تر کند.

شبکه های کانولوشن گراف نیز با مشکل هموارسازی بیش از حد مواجه هستند [ ۲۷ ، ۲۸ ]. پس از چندین لایه کانولوشن گراف، ویژگی های گره به بردارهای یکسان یا مشابه همگرا می شوند و آنها را غیر قابل تشخیص می کند. مرحله کنترل اطلاعات برای رسیدگی موثر به این مشکل اتخاذ می شود و می تواند اطلاعات تولید شده توسط گره ها را کنترل کند. در اینجا، ما از مکانیسم توجه [ ۲۹ ] برای کنترل جریان اطلاعات گره ها به صورت تطبیقی ​​استفاده می کنیم. مکانیسم توجه می تواند توجه محدود را بر روی اطلاعات مهم متمرکز کند، بنابراین منابع محاسباتی را ذخیره می کند و به سرعت مفیدترین اطلاعات را به دست می آورد. پس از ترکیب دو مرحله از فرآیند انتشار کانولوشن، معادله ( ۳ ) به معادله زیر تبدیل می شود.۶ ):

دبلیومن=C(ایکسمن) )ک۱C(ایکسj) )
=۱کدبلیومنایکسمن

که در آن K عمق انتشار اطلاعات، X خروجی مرحله قبلی انتشار اطلاعات است که به عنوان ورودی برای انتشار اطلاعات بعدی استفاده می شود، و W ضریب وزن های خودآموز با استفاده از مکانیسم توجه است.

۳٫۲٫ مدل سازی وابستگی زمانی

در این بخش، ابتدا اهمیت حسابداری برای تناوب زمانی در هنگام گرفتن وابستگی های زمانی را مورد بحث قرار می دهیم. ثانیا، ما مفهوم پیچیدگی علّی متسع معمولی و مزیت آن را نسبت به RNN برای گرفتن وابستگی‌های زمانی طولانی‌مدت به طور مؤثر توصیف می‌کنیم. سپس، کانولوشن متسع هیبریدی (HDC) برای حل مشکل اثر شبکه‌بندی در پیچش متسع معمولی استفاده می‌شود. در نهایت، برای کنترل موثر جریان اطلاعات گره‌ها، از مکانیزم دروازه‌ای برای بهبود عملکرد مدل استفاده می‌شود. به طور خاص، جزئیات مدل وابستگی زمانی به شرح زیر ارائه شده است.
تناوب زمانی: داده های تقاضای تاکسی معمولاً الگوی تناوبی قوی روزانه یا هفتگی را نشان می دهند. شکل ۲ نمونه ای از داده های تقاضای یک هفته تاکسی در نیویورک را نشان می دهد. مشاهده می‌شود که منحنی‌های تقاضا از دوشنبه تا جمعه کاملاً متفاوت از روزهای آخر هفته است.
مشابه ASTGCN [ ۹ ] و ST-ResNet [ ۱ ]، این مقاله همچنین وابستگی های اخیر، روزانه و هفتگی داده های تقاضای تاکسی را در نظر می گیرد. با فرض اینکه زمان فعلی باشد τ۰، اندازه پنجره زمانی تاریخی است تیاچ، اندازه پنجره زمانی قابل پیش بینی است تیپ. قسمت های آبی، قرمز و سبز در شکل ۴ به ترتیب دوره های اخیر، روزانه و هفتگی را نشان می دهند.
لازم به ذکر است که در مدل ما: تیاچتیپ. از آنجایی که تناوب تقاضای تاکسی نوساناتی خواهد داشت، به شدت دوره ای نیست [ ۱۳ ]. به عنوان مثال، ساعات اوج مصرف در روزهای کاری معمولاً بعد از ظهر بین ساعت ۱۷:۳۰ تا ۱۹:۳۰ در نوسان است.

پیچیدگی علت گشاد شده: شبکه‌های پیچیدگی سببی متسع می‌توانند به صورت تصاعدی میدان گیرنده را با قرار دادن عمق لایه‌های شبکه افزایش دهند. در مقایسه با روش‌های مبتنی بر RNN، شبکه‌های پیچیدگی علّی متسع می‌توانند توالی‌های طولانی‌مدت را به شیوه‌ای غیر بازگشتی مقابله کنند، محاسبات موازی را ممکن می‌سازند و مسئله انفجار گرادیان را کاهش می‌دهند [ ۳۰ ]. شبکه‌های کانولوشنی علّی متسع، توالی علیت زمانی را با قرار دادن صفر در ورودی‌ها حفظ می‌کنند. به این ترتیب، تضمین می‌کند که فقط اطلاعات تاریخی برای پیش‌بینی بدون درز اطلاعات آینده استفاده می‌شود. به طور رسمی تر، برای یک توالی یک بعدی از ورودی ها ایکسآرتیو فیلتر f۰ … − ۱ }، عملیات پیچش اتساع F در دنباله ورودی با عنصر t را می توان به صورت زیر تعریف کرد:

اف) =۰– ۱fمن )ایکس– d⋅ من

که در آن d میزان اتساع، n اندازه فیلتر و – d⋅ منجهت گذشته را نشان می دهد.

پیچیدگی گشاد شده هیبریدی: وانگ و همکاران. [ ۳۱ ] اشاره می کند که چارچوب کانولوشن متسع معمولی مشکل شبکه بندی را دارد، به عنوان مثال، کانولوشن گشاد شده مقادیر صفر را بین دو پیکسل نمونه برداری شده از هسته کانولوشن وارد می کند. اگر نرخ اتساع بیش از حد بزرگ شود، پیچش بسیار کم و برای یادگیری مضر خواهد بود زیرا همه پیکسل ها در محاسبه دخالت ندارند. به این ترتیب، یکپارچگی اطلاعات از دست خواهد رفت که برای کارهای سطح پیکسل کشنده است ( شکل ۵).آ). بنابراین، این مقاله از HDC برای غلبه بر مشکلات ناشی از اثر شبکه‌بندی استفاده می‌کند. HDC از یک سری از نرخ های اتساع استفاده می کند، به جای یک واحد، تا میدان گیرنده نهایی را به طور کامل بدون سوراخ یا لبه های از دست رفته پوشش دهد. در عین حال، میدان دریافت شبکه نیز برای جمع آوری اطلاعات جهانی گسترش می یابد.
پیچش متسع هیبریدی راه حل ساده ای است که برای غلبه بر اثر شبکه بندی پیشنهاد شده است که دارای سه ویژگی اصلی زیر است:
  • نرخ اتساع یک پیچش گشاد شده روی هم نباید فاکتور مشترکی بیشتر از ۱ داشته باشد. برای مثال، [۲، ۴، ۶] پیچیدگی سه لایه مناسبی نخواهد بود، زیرا هنوز اثرات شبکه‌بندی دارد.
  • نرخ اتساع به عنوان یک ساختار ناهموار طراحی شده است، به عنوان مثال، یک ساختار چرخه ای مانند [۱، ۲، ۵، ۱، ۲، ۵].
  • نرخ اتساع باید معادله را برآورده کند:

    ممن(ممن ۱– ۲دمن،ممن ۱− ۲ (ممن ۱دمن) ،دمن)
جایی که دمننرخ اتساع لایه i است و ممنحداکثر نرخ اتساع در لایه i است. با فرض وجود n لایه و پیش فرض این است مn=دn. اگر روی یک هسته کانولوشن با اندازه اعمال شود × k، هدف اجازه دادن است M2≤ k.
همانطور که در شکل ۵ نشان داده شده است ، افزایش نرخ اتساع تمایل به تغییر تمرکز آن از ویژگی های محلی به ویژگی های جهانی دارد. تنها با استفاده از تعداد کمی از لایه های پیچش گشاد شده، میدان پذیرنده را می توان به میزان قابل توجهی افزایش داد.

TCN دردار: ما از TCN دردار طراحی شده توسط Graph WaveNet [ ۱۱ ] برای کنترل جریان اطلاعات معتبر و دور انداختن اطلاعات نامعتبر در TCN استفاده می کنیم. یک پیچیدگی زمانی توسط یک تابع فعال سازی هذلولی مماس که به عنوان یک فیلتر کار می کند دنبال می شود. پیچیدگی زمانی دیگر توسط یک تابع فعال سازی سیگموئید دنبال می شود که به عنوان دروازه ای برای کنترل مقدار اطلاعات در حال انتشار عمل می کند. به طور خاص، Gated TCN به شکل زیر است:

Z=tanh(Θ۱X+b1)σ(Θ۲X+b2)

جایی که Θ۱,Θ۲,b1و b2پارامترهای قابل یادگیری هستند، ⊙ عملگر ضرب المان را نشان می دهد، σ()یک تابع سیگموئید است، ∗ عملیات پیچش گشاد شده است. شکل ۶ ساختار TCN دردار را نشان می دهد.

۳٫۳٫ اجزای اضافی

اتصال پرش: با افزایش عمق شبکه، مشکلات اضافی ناپدید شدن گرادیان یا انفجار ایجاد می شود که آموزش مدل های یادگیری عمیق را دشوار می کند. در همین حال، اورهان و پیتکو [ ۳۲ ] نشان دادند که اتصال پرش تقارن شبکه را به زور می شکند و تخریب شبکه عصبی را کاهش می دهد. بنابراین، ما اتصال پرش را برای افزایش قابلیت یادگیری شبکه معرفی می‌کنیم، که می‌تواند از یک لایه شبکه فعال شود و سپس به سرعت به لایه دیگر یا حتی لایه‌های عمیق‌تر شبکه عصبی بازخورد بدهد.
ماژول خروجی: برای دستیابی به هدف پیش‌بینی تقاضای تاکسی چند مرحله‌ای، ماژول خروجی شبکه ST-DCN ما از یک پرسپترون چند لایه (MLP) و دو لایه کانولوشن استاندارد ۱×۱ تشکیل شده است که ابعاد ورودی را به مقدار دلخواه تبدیل می‌کند. ابعاد خروجی ST-DCN خروجی را درمان می کند X(t+1):(t+P)به عنوان یک کل، که می تواند به طور موثر مشکل ناسازگاری ابعادی بین آموزش و آزمایش را مدیریت کند. ما می‌توانیم از گام‌های زمانی متوالی H تاریخی برای پیش‌بینی P گام‌های متوالی آینده استفاده کنیم، فقط برای تنظیم اندازه زمانی خروجی مورد انتظار به عنوان P.

۴٫ آزمایشات

۴٫۱٫ تنظیمات آزمایشی

شرح مجموعه داده: آزمایش‌ها بر روی دو مجموعه داده دنیای واقعی جمع‌آوری‌شده از NYC OpenData و Didi Chuxing انجام می‌شوند.
  • تاکسی نیویورک ( https://www1.nyc.gov/site/tlc/about/tlc-trip-record-data.page (دسترسی در ۵ مه ۲۰۲۱)): این مجموعه داده شامل ۹۱ روز از ۳۵ میلیون سوابق سفر تاکسی نیویورک است. در تاکسی های زرد از ۱ آوریل ۲۰۱۶ تا ۳۰ ژوئن ۲۰۱۶٫
  • Didi Taxi ( https://outreach.didichuxing.com/research/opendata/en/ (دسترسی در ۷ ژوئیه ۲۰۲۱)): مجموعه داده شامل درخواست تاکسی از ۱ نوامبر ۲۰۱۶ تا ۳۰ نوامبر ۲۰۱۶ برای شهر چنگدو با بیش از ۷ درخواست است. میلیون رکورد سفر تاکسی
ما فقط از اطلاعات زیر استفاده می‌کنیم: تاریخ/زمان‌های تحویل و تحویل، مکان‌های تحویل و تحویل. در آزمایش‌ها، مجموعه داده آموزشی، مجموعه داده اعتبارسنجی و مجموعه داده آزمایشی را به نسبت ۷:۱٫۵:۱٫۵ تقسیم می‌کنیم.
پیش پردازش: ما داده ها را طبق رویکرد مورد استفاده در CCRNN [ ۲۲ ] پیش پردازش می کنیم. سوابق تاکسی خام در یک پنجره زمانی ۳۰ دقیقه ای جمع می شوند که در آن مقادیر از دست رفته با صفر جایگزین می شوند و نقاط پرت فیلتر می شوند. ما از یک پنجره کشویی برای آموزش، اعتبارسنجی و آزمایش داده ها برای تولید نمونه استفاده می کنیم. نرمال سازی امتیاز Z برای استانداردسازی ورودی های داده اتخاذ شده است. همانطور که در شکل ۱ ب نشان داده شده است، سفارشات تاکسی های نیویورک بدون ایستگاه در ۲۴۸ ایستگاه مجازی دسته بندی شده اند . سفارشات تاکسی چنگدو در ۳۴ ایستگاه مجازی جمع می شوند.
تنظیم پارامتر: همه آزمایش‌ها در محیط با یک پردازنده Intel(R) Xeon(R) Gold 6132 @ 2.60 GHz و یک کارت گرافیک NVIDIA Tesla P40 انجام می‌شوند. داده‌های ورودی دارای ابعاد C برابر با ۲ هستند. ما از ۱۲ مرحله پیوسته زمان H = برای پیش‌بینی تقاضای تاکسی در مراحل بعدی استفاده می‌کنیم.P{۳,۶,۱۲}فواصل زمانی (یعنی کوتاه، میان مدت، بلند مدت) هنگام آزمایش نتیجه پیش بینی.
برای پوشش طول توالی ورودی، از ۹ لایه TCN دردار با دنباله ای از نرخ های اتساع [۱، ۲، ۵، ۱، ۲، ۵، ۱، ۲، ۵] استفاده می کنیم. ما از معادله ( ۶ ) به عنوان لایه پیچش نمودار خود با مرحله انتشار K = ۳ استفاده می کنیم. مدل ما توسط بهینه ساز Adam [ ۳۳ ] با نرخ یادگیری اولیه ۰٫۰۰۱۵ آموزش داده شده و با نرخ ۰٫۲ برای هر ۵ دوره تحلیل می رود. Dropout به عنوان ۰٫۳ تنظیم شده است. نسبت حفظ از انتشار اطلاعات روی ۰٫۰۵ تنظیم شده است. ما همچنین از مجموعه داده اعتبارسنجی با صبر ۲۰ استفاده می کنیم تا الگوریتم آموزشی خود را برای هر مدل بر اساس بهترین امتیاز اعتبار سنجی متوقف کنیم.
ما از سه معیار ارزیابی، شامل میانگین خطای مطلق (MAE)، خطای میانگین مربعات ریشه (RMSE) و ضریب همبستگی پیرسون (PCC)، برای ارزیابی عملکرد همه روش‌ها استفاده می‌کنیم. RMSE بین برآوردگر و حقیقت زمین به عنوان تابع ضرر استفاده می شود.

۴٫۲٫ خطوط پایه

این مقاله فقط مدل ما را با مدل های جدیدتر یادگیری عمیق مقایسه می کند. ما عملکرد مدل پیشنهادی خود (ST-DCN) را با هفت خط پایه زیر مقایسه می کنیم:
  • LSTM [ ۳۴ ]: شبکه حافظه کوتاه مدت بلند مدت، یک مدل RNN ویژه برای پیش بینی سری های زمانی.
  • DCRNN [ ۸ ]: شبکه عصبی بازگشتی کانولوشن انتشار، که شبکه‌های کانولوشنی گراف انتشار را با GRU به روش رمزگذار-رمزگشا ترکیب می‌کند.
  • STGCN [ ۳۵ ]: یک شبکه کانولوشنال نمودار مکانی-زمانی از کانولوشن گراف ChebNet و شبکه‌های کانولوشنیک ۱ بعدی برای گرفتن وابستگی‌های مکانی و همبستگی‌های زمانی استفاده می‌کند.
  • GWNet [ ۱۱ ]: یک شبکه کانولوشنال نمودار مکانی-زمانی، ماتریس مجاورت تطبیقی ​​را در پیچیدگی‌های نمودار انتشار با پیچیدگی‌های معمولی گشادشده ۱ بعدی ادغام می‌کند.
  • ASTGCN [ ۹ ]: شبکه‌های کانولوشنال نمودار مکانی-زمانی مبتنی بر توجه، که مکانیسم‌های توجه مکانی و توجه زمانی را به ترتیب برای مدل‌سازی دینامیک مکانی و زمانی معرفی می‌کند. برای انصاف، ما فقط اجزای اخیر آن را در نظر می گیریم.
  • MTGNN [ ۳۶ ]: یک شبکه عصبی گراف که برای پیش‌بینی سری‌های زمانی چند متغیره با افزودن یک لایه یادگیری نمودار طراحی شده است تا روابط پنهان میان داده‌های سری زمانی را به تصویر بکشد.
  • CCRNN [ ۲۲ ]: یک پیچیدگی نمودار لایه‌ای جفت که برای پیش‌بینی تقاضای حمل‌ونقل طراحی شده است.

۴٫۳٫ مقایسه عملکرد

جدول ۱ نتایج ST-DCN و خطوط پایه در مجموعه داده تاکسی نیویورک را نشان می دهد. این نشان می‌دهد که ST-DCN ما در همه معیارها به‌طور مداوم و بسیار زیاد از سایر مدل‌های پایه بهتر عمل می‌کند، به جز PCC گزارش‌شده از آزمایش پیش‌بینی کوتاه‌مدت با p = ۳٫ به طور خاص، روش ST-DCN ما به ۴٫۳۱٪، ۴٫۰۴٪ و – می‌رسد. ۰٫۰۷٪ بهبود نسبی زمانی که p = ۳; ۷٫۲۲٪، ۸٫۳۷٪، و ۰٫۴۴٪ بهبود نسبی زمانی که p = ۶; ۹٫۸۹٪، ۹٫۱۶٪ و ۰٫۴۹٪ بهبود نسبی زمانی که p = ۱۲ بیش از بهترین عملکرد در میان روش های پایه، به ترتیب. جدول ۲نتایج ST-DCN و خطوط پایه را در مجموعه داده تاکسی چنگدو نشان می دهد. این نشان می‌دهد که ST-DCN ما در همه معیارها به طور مداوم و بسیار زیاد از سایر مدل‌های پایه بهتر عمل می‌کند. به طور خاص، روش ST-DCN ما به ۸٫۷۸٪، ۱۰٫۹۱٪ و ۰٫۰۷٪ بهبود نسبی زمانی که p = ۳ به دست می آورد. ۱۵٫۵۹٪، ۱۴٫۵۹٪، و ۰٫۰۹٪ بهبود نسبی زمانی که p = ۶; ۱۵٫۷۴٪، ۱۱٫۴۰٪ و ۰٫۰۸٪ بهبود نسبی زمانی که p = ۱۲ بیش از بهترین عملکرد در میان روش های پایه، به ترتیب.
عملکرد پایین LSTM نشان‌دهنده محدودیت در نظر گرفتن تنها همبستگی‌های زمانی و لزوم استفاده از وابستگی‌های مکانی شبکه مکانی-زمانی است. روش‌هایی مانند STGCN، DCRNN و ASTGCN به شدت به یک نمودار از پیش تعریف‌شده متکی هستند، که ممکن است وابستگی‌های مهم بین گره‌ها را ثبت نکند، بنابراین منجر به عملکرد بدتر می‌شود. با این حال، به لطف ترکیب معماری رمزگذار-رمزگشا برای پیش‌بینی سری‌های زمانی با پیچیدگی نمودار، DCRNN عملکرد بهتری دارد. با بهره مندی از ماتریس مجاورت خودآموز، MTGNN به دقت رقابتی در آزمایش های پیش بینی کوتاه مدت دست می یابد. اگرچه رقابتی کمتری نسبت به مدل ما دارد، اما GWNt و CCRNN هنوز دقت نسبتاً بالایی را گزارش می‌کنند، که ممکن است با اتخاذ نمودارهای تطبیقی ​​در مدل‌سازی روابط بین گره‌ها توضیح داده شود.
شکل ۷مقایسه نتایج پیش‌بینی روش‌های مختلف را با افزایش زمان پیش‌بینی نشان می‌دهد. ما نتایج LSTM را حذف می کنیم زیرا عملکرد ضعیفی دارد. به طور کلی، با طولانی‌تر شدن زمان پیش‌بینی، پیش‌بینی مشکل‌تر می‌شود و بنابراین خطای پیش‌بینی بزرگ‌تر می‌شود. همانطور که در شکل نشان داده شده است، MTGNN در مقایسه با STGCN برای پیش بینی کوتاه مدت عملکرد خوبی دارد. با این حال، زمانی که زمان پیش بینی افزایش می یابد، دقت پیش بینی آن به شدت کاهش می یابد. هنگامی که زمان پیش‌بینی طولانی‌تر می‌شود، خطاهای سایر رویکردها به آرامی افزایش می‌یابد و عملکرد کلی آنها نسبتاً خوب است. مدل ST-DCN ما بهترین عملکرد پیش‌بینی را در تمام زمان‌های پیش‌بینی به دست می‌آورد و خطاهای آن کوچک‌ترین هستند و کندترین را افزایش می‌دهند، که نشان می‌دهد مدل ما بسیار پایدار است.

۴٫۴٫ تجزیه و تحلیل مولفه

برای ارزیابی بیشتر اثر اجزای مختلف ST-DCN، ما شش نوع از مدل ST-DCN را طراحی می‌کنیم. ما این شش نوع را با مدل ST-DCN در مجموعه داده تاکسی NYC مقایسه می کنیم که p = ۱۲ باشد. تفاوت بین این هفت مدل به شرح زیر است:
  • پایه: این مدل به پیچیدگی اتساع هیبریدی، پیچیدگی انتشار نمودار دو فازی و تناوب زمانی مجهز نیست.
  • +HDC: این مدل از پیچش گشاد شده هیبریدی برای غلبه بر اثر شبکه‌بندی استفاده می‌کند.
  • دو فازی: این مدل از پیچش انتشار گراف دو فازی برای رسیدگی به دو محدودیت پیچیدگی گراف استفاده می‌کند، اما از پیچیدگی گشاد شده ترکیبی استفاده نمی‌کند.
  • یک T-block (1 روز): این مدل دوره روزانه را در یک T-block در نظر می گیرد (فقط دیروز شامل می شود).
  • مولتی تی بلوک (۱ روز): این مدل دوره روزانه را در چند بلوک T در نظر می گیرد (فقط دیروز شامل می شود).
  • یک T-block (7 روز): این مدل دوره روزانه و هفتگی را در یک T-block در نظر می گیرد.
  • ST-DCN (مولتی T-block (7 روز)): این مدل دوره روزانه و هفتگی را در چند بلوک T در نظر می گیرد. این نسخه کامل رویکرد پیشنهادی ما ST-DCN است.
همانطور که در جدول ۳ نشان داده شده است ، می توانیم مشاهده کنیم که نسخه کامل ST-DCN از سایر انواع بهتر عمل می کند. تأثیر HDC از نظر MAE قابل توجه است اما در RMSE کمتر آشکار است. اثر مشهود کانولوشن انتشار نمودار دو فازی، اثربخشی انتخاب اطلاعات مفید در هر فرآیند انتشار کانولوشنی را نشان می‌دهد. در مقایسه با مدلی که فقط تناوب روزانه را در نظر می گیرد، وارد کردن تناوب هفتگی به مدل نیز دقت آن را بهبود می بخشد. علاوه بر این، این مدل پس از استفاده از چند بلوک T به جای یک بلوک برای پردازش تمام وابستگی های زمانی، از رقبای خود بهتر عمل می کند. از این رو، هر زیر ماژول طراحی شده دارای اثرات مثبتی برای پیش بینی بهبود عملکرد است.

۵٫ بحث

برای بهبود دقت پیش‌بینی تقاضای تاکسی، لازم است اطلاعات مکانی-زمانی به طور موثر مدل‌سازی شود. در مقایسه با HA، ARIMA و LSTM که فقط اطلاعات زمانی را در نظر می گیرند. ST-ResNet، STDN [ ۱۳] و DMVST-Net که اطلاعات مکانی-زمانی را ترکیب می کنند، دقت پیش بینی را بهبود بخشیده اند، اگرچه این روش ها از CNN برای به دست آوردن اطلاعات مکانی استفاده می کنند. ایده اصلی چنین روش هایی در نظر گرفتن داده های ترافیکی مانند تصاویر و پردازش همبستگی فضایی آنها توسط CNN است. با این حال، در وظایف پیش‌بینی ترافیک، ویژگی‌های توزیع داده‌ها از نظر مکانی با تصاویر متفاوت است، بنابراین محدودیت‌هایی در کاربرد روش‌های مبتنی بر CNN برای مشکلات ترافیکی وجود دارد. به عنوان مثال، در مسئله پیش‌بینی تقاضای تاکسی، ممکن است همبستگی‌های با تأخیر زمانی در داده‌های مبدا و مقصد از نظر مکانی وجود داشته باشد. مناطق کانونی مبدا-مقصد ممکن است از تمام مناطق شبکه عبور کنند. داده‌های مناطق با ویژگی‌های یکسان نیز از نظر فضایی همبستگی دارند و توزیع آنها به مناطق هندسی ثابت محدود نمی‌شود.
با توجه به توانایی GCN در مدل سازی شبکه های جاده ای پیچیده، محققان در سال های اخیر از روش های مبتنی بر GCN برای پیش بینی ترافیک استفاده کرده اند. به عنوان مثال، STG2Seq [ ۵ ]، STSGCN [ ۱۴ ]، STFGNN [ ۱۶ ]، و روش پایه انتخاب شده در این مقاله با هدف بهبود ماتریس مجاورت GCN است. با این حال، همه آنها محدودیت های شبکه های عصبی کانولوشن گراف را از دست دادند، که یکی از مشکلاتی است که در این مقاله بر آن غلبه کرد.
از نظر وابستگی زمانی، اکثر مدل‌های مبتنی بر یادگیری عمیق از روش‌های RNN استفاده می‌کنند، مانند ST-ResNet، STDN، DMVST-Net، DCRNN، CCRNN، و غیره. با این حال، از نقطه‌نظر بهینه‌سازی مدل، RNN‌ها نمی‌توانند وابستگی‌های بلندمدت را به خوبی دریافت کنند. و از مشکلات ناپدید شدن گرادیان یا انفجار رنج می برند. همچنین رویکردهایی با استفاده از TCN، مانند Graph WaveNet، STFGNN، و MTGNN وجود دارد که به دلیل مشکل اثر شبکه پیچیدگی متسع معمولی نمی‌توانند دقت پیش‌بینی را به طور موثر بهبود بخشند. ST-DCN از TCN برای گرفتن وابستگی زمانی طولانی مدت استفاده می کند در حالی که از پیچش گشاد شده هیبریدی برای غلبه بر مشکل اثر شبکه استفاده می کند و ST-DCN را قادر می سازد به دقت پیش بینی بالایی دست یابد. ST-DCN چه از مجموعه داده های سه ماهه تاکسی نیویورک استفاده کند و چه از مجموعه داده های یک ماهه تاکسی چنگدو، به دقت پیش بینی پیشرفته دست می یابد.
لازم به ذکر است که اگرچه ST-DCN می تواند به دقت پیش بینی بالایی دست یابد، اما در مقایسه با سایر روش ها به حافظه بیشتر و زمان تمرین بیشتری نیاز دارد. اگرچه ST-DCN از دو نوع ماتریس مجاورت برای گرفتن وابستگی‌های فضایی به صورت تطبیقی ​​استفاده می‌کند، اما اساساً هنوز یک ساختار نمودار ثابت است و اگر بتوان از نمودارهای پویا برای مدل‌سازی وابستگی‌های فضایی استفاده کرد، اثربخشی مدل ممکن است بیشتر بهبود یابد. ST-DCN از ماژول های جداگانه برای گرفتن همبستگی های زمانی و مکانی استفاده می کند، نه به طور همزمان، که ناهمگونی در داده های مکانی-زمانی را نادیده می گیرد.

۶٫ نتیجه گیری و کار آینده

این مقاله یک مدل کانولوشنی انتشار فضایی-زمانی جدید به نام ST-DCN پیشنهاد می‌کند و با موفقیت آن را برای پیش‌بینی تقاضای تاکسی اعمال می‌کند. ST-DCN می تواند وابستگی های فضایی را به طور موثر در یک شبکه کانولوشنی انتشار نمودار دو فازی به تصویر بکشد. علاوه بر این، مدل ما با استفاده از مکانیسم توجه، ویژگی پویا را در همبستگی فضایی در نظر می‌گیرد. ST-DCN می‌تواند وابستگی‌های زمانی طولانی‌مدت را از طریق یک پیچیدگی گشاد شده ترکیبی، که لایه‌های کانولوشنال خود را به‌طور تصاعدی روی هم می‌چسباند تا میدان گیرنده را افزایش دهد، یاد بگیرد. علاوه بر این، ما همچنین تناوب زمانی را برای به دست آوردن نتایج پیش‌بینی دقیق‌تر در نظر می‌گیریم. آزمایش‌ها روی دو مجموعه داده تاکسی در مقیاس بزرگ نشان می‌دهند که روش ما می‌تواند به عملکرد پیش‌بینی پیشرفته دست یابد، که برتری مدل ما را نشان می‌دهد.
برای کارهای آینده، ساختار شبکه و تنظیمات پارامتر را بیشتر بهینه خواهیم کرد. علاوه بر این، ما قصد داریم مدل پیشنهادی را برای سایر وظایف پیش‌بینی مکانی-زمانی اعمال کنیم. علاوه بر این، تقاضای تاکسی نیز تحت تأثیر بسیاری از عوامل خارجی، مانند آب و هوا و رویدادهای فوری است. در آینده، برخی از تأثیرات خارجی را برای بهبود بیشتر دقت پیش‌بینی در نظر خواهیم گرفت.

منابع

  1. ژانگ، جی. ژنگ، ی. Qi، D. شبکه‌های باقیمانده مکانی-زمانی عمیق برای پیش‌بینی جریان‌های جمعیتی در سطح شهر. در مجموعه مقالات AAAI، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، ۴ تا ۹ فوریه ۲۰۱۷؛ صفحات ۱۶۵۵-۱۶۶۱٫ [ Google Scholar ]
  2. سان، ج. ژانگ، جی. لی، کیو. یی، ایکس. لیانگ، ی. ژنگ، ی. پیش‌بینی جریان‌های جمعیت در سطح شهر در مناطق نامنظم با استفاده از شبکه‌های کانولوشن گراف چند نمای. IEEE Trans. دانستن مهندسی داده ۲۰۲۰ ، ۱۴ . [ Google Scholar ] [ CrossRef ]
  3. یائو، اچ. وو، اف. که، جی. تانگ، ایکس. جیا، ی. لو، اس. گونگ، پی. لی، ز. بله، جی. Chuxing، D. شبکه چند نمای عمیق فضایی-زمانی برای پیش بینی تقاضای تاکسی. arXiv ۲۰۱۸ , arXiv:1802.08714. [ Google Scholar ]
  4. گنگ، ایکس. لی، ی. وانگ، ال. ژانگ، ال. یانگ، کیو. بله، جی. لیو، ی. شبکه پیچیدگی چند نموداری فضایی-زمانی برای پیش‌بینی تقاضای تگرگ سواری. در مجموعه مقالات AAAI، هونولولو، HI، ایالات متحده آمریکا، ۲۷ ژانویه تا ۱ فوریه ۲۰۱۹؛ جلد ۳۳، ص ۳۶۵۶–۳۶۶۳٫ [ Google Scholar ]
  5. بای، ال. یائو، ال. Kanhere, SS; وانگ، ایکس. شنگ، QZ STG2seq: نمودار مکانی-زمانی به مدل توالی برای پیش‌بینی تقاضای مسافر چند مرحله‌ای. IJCAI ۲۰۱۹ ، ۱۹۸۱-۱۹۸۷٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  6. لیو، ال. کیو، ز. لی، جی. وانگ، کیو. اویانگ، دبلیو. لین، ال. شبکه فضایی زمینه‌ای برای پیش‌بینی تقاضای مبدا و مقصد تاکسی. IEEE Trans. هوشمند ترانسپ سیستم ۲۰۱۹ ، ۲۰ ، ۳۸۷۵–۳۸۸۷٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  7. وانگ، ی. وو، تی. یین، اچ. خو، جی. چن، اچ. ژنگ، ک. پیش‌بینی ماتریس مبدا-مقصد از طریق پیچیدگی نمودار: دیدگاه جدیدی از مدل‌سازی تقاضای مسافر. در مجموعه مقالات بیست و پنجمین کنفرانس ACM SIGKDD در مورد کشف دانش و داده کاوی، Anchorage، AK، ایالات متحده آمریکا، ۴ تا ۸ اوت ۲۰۱۹؛ ص ۱۲۲۷–۱۲۳۵٫ [ Google Scholar ] [ CrossRef ]
  8. لی، ی. یو، آر. شهابی، ج. لیو، ی. شبکه عصبی تکراری کانولوشنال انتشار: پیش‌بینی ترافیک مبتنی بر داده. arXiv ۲۰۱۸ , arXiv:1707.01926. [ Google Scholar ]
  9. گوا، اس. لین، ی. فنگ، ن. آهنگ، سی. وان، اچ. شبکه‌های کانولوشنال نمودار مکانی-زمانی مبتنی بر توجه برای پیش‌بینی جریان ترافیک. در مجموعه مقالات AAAI، هونولولو، HI، ایالات متحده آمریکا، ۲۷ ژانویه تا ۱ فوریه ۲۰۱۹؛ جلد ۳۳، ص ۹۲۲–۹۲۹٫ [ Google Scholar ]
  10. ژائو، ال. آهنگ، ی. ژانگ، سی. لیو، ی. وانگ، پی. لین، تی. دنگ، م. Li، H. T-gcn: یک شبکه کانولوشن گراف زمانی برای پیش‌بینی ترافیک. IEEE Trans. هوشمند ترانسپ سیستم ۲۰۱۹ ، ۲۱ ، ۳۸۴۸–۳۸۵۸٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  11. وو، زی. پان، اس. لانگ، جی. جیانگ، جی. ژانگ، سی. موج موج گراف برای مدل‌سازی نمودار عمیق مکانی-زمانی. IJCAI ۲۰۱۹ ، ۱۹۰۷–۱۹۱۳٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  12. شی، ایکس. چی، اچ. شن، ی. وو، جی. یین، ب. رویکرد توجه مکانی-زمانی برای پیش‌بینی ترافیک. IEEE Trans. هوشمند ترانسپ سیستم ۲۰۲۰ ، ۲۲ ، ۴۹۰۹-۴۹۱۸٫ [ Google Scholar ] [ CrossRef ]
  13. یائو، اچ. تانگ، ایکس. وی، اچ. ژنگ، جی. لی، زی. بازبینی شباهت مکانی-زمانی: یک چارچوب یادگیری عمیق برای پیش‌بینی ترافیک. در مجموعه مقالات AAAI، هونولولو، HI، ایالات متحده آمریکا، ۲۷ ژانویه تا ۱ فوریه ۲۰۱۹؛ جلد ۳۳، ص ۵۶۶۸–۵۶۷۵٫ [ Google Scholar ]
  14. آهنگ، سی. لین، ی. گوا، اس. وان، اچ. شبکه های کانولوشن گراف همزمان مکانی-زمانی: چارچوبی جدید برای پیش بینی داده های شبکه مکانی-زمانی. در مجموعه مقالات AAAI، نیویورک، نیویورک، ایالات متحده آمریکا، ۷ تا ۱۲ فوریه ۲۰۲۰؛ ص ۹۱۴-۹۲۱٫ [ Google Scholar ] [ CrossRef ]
  15. ژانگ، ایکس. هوانگ، سی. خو، ی. شیا، ال. دای، پی. بو، ال. ژانگ، جی. ژنگ، ی. پیش‌بینی جریان ترافیک با شبکه انتشار نمودار مکانی-زمانی. در مجموعه مقالات AAAI، مجازی، ۲ تا ۹ فوریه ۲۰۲۱؛ جلد ۳۵، ص ۱۵۰۰۸–۱۵۰۱۵٫ [ Google Scholar ]
  16. لی، ام. Zhu, Z. شبکه های عصبی نمودار فیوژن مکانی-زمانی برای پیش بینی جریان ترافیک. در مجموعه مقالات AAAI، مجازی، ۲ تا ۹ فوریه ۲۰۲۱؛ جلد ۳۵، ص ۴۱۸۹–۴۱۹۶٫ [ Google Scholar ]
  17. لین، ال. او، ز. پیتا، اس. پیش‌بینی تقاضای ساعتی سطح ایستگاه در یک شبکه اشتراک‌گذاری دوچرخه در مقیاس بزرگ: یک رویکرد شبکه عصبی کانولوشنال گراف. ترانسپ Res. قسمت C Emerg. تکنولوژی ۲۰۱۸ ، ۹۷ ، ۲۵۸-۲۷۶٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  18. ژانگ، سی. زو، اف. Lv، Y.; بله، پی. وانگ، FY MLRNN: پیش‌بینی تقاضای تاکسی بر اساس یادگیری عمیق چند سطحی و تحلیل ناهمگونی منطقه‌ای. IEEE Trans. هوشمند ترانسپ سیستم ۲۰۲۱ ، ۱-۱۱٫ [ Google Scholar ] [ CrossRef ]
  19. کالتن برونر، آ. مزا، ر. گریولا، جی. کودینا، جی. Banchs، R. چرخه های شهری و الگوهای تحرک: کاوش و پیش بینی روندها در یک سیستم حمل و نقل عمومی مبتنی بر دوچرخه. اوباش فراگیر. محاسبه کنید. ۲۰۱۰ ، ۶ ، ۴۵۵-۴۶۶٫ [ Google Scholar ] [ CrossRef ]
  20. موریرا-ماتیاس، ال. گاما، ج. فریرا، م. مندس موریرا، جی. Damas, L. پیش بینی تقاضای تاکسی-مسافر با استفاده از داده های جریانی. IEEE Trans. هوشمند ترانسپ سیستم ۲۰۱۳ ، ۱۴ ، ۱۳۹۳–۱۴۰۲٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  21. ویلیامز، بی.ام. Hoel، LA مدلسازی و پیش بینی جریان ترافیک وسایل نقلیه به عنوان یک فرآیند ARIMA فصلی: مبنای نظری و نتایج تجربی. J. Transp. مهندس ۲۰۰۳ ، ۱۲۹ ، ۶۶۴-۶۷۲٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  22. بله، جی. سان، ال. دو، بی. فو، ی. Xiong، H. پیچیدگی نمودار لایه‌ای برای پیش‌بینی تقاضای حمل‌ونقل. در مجموعه مقالات AAAI، مجازی، ۲ تا ۹ فوریه ۲۰۲۱؛ جلد ۳۵، ص ۴۶۱۷–۴۶۲۵٫ [ Google Scholar ]
  23. دو، بی. هو، ایکس. سان، ال. لیو، جی. کیائو، ی. Lv، W. پیش‌بینی تقاضای ترافیک بر اساس شبکه عصبی کانولوشنال انتقال پویا. IEEE Trans. هوشمند ترانسپ سیستم ۲۰۲۰ ، ۲۲ ، ۱۲۳۷-۱۲۴۷٫ [ Google Scholar ] [ CrossRef ]
  24. رودریگز، آ. Laio، A. خوشه بندی با جستجوی سریع و یافتن قله های چگالی. Science ۲۰۱۴ ، ۳۴۴ ، ۱۴۹۲-۱۴۹۶٫ [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  25. او، ک. ژانگ، ایکس. رن، اس. Sun, J. یادگیری باقیمانده عمیق برای تشخیص تصویر. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، لاس وگاس، NE، ایالات متحده آمریکا، ۲۷ تا ۳۰ ژوئن ۲۰۱۶٫ صص ۷۷۰-۷۷۸٫ [ Google Scholar ]
  26. آلون، یو. Yahav, E. On the Bottleneck of Graph Neural Networks and Perfectives It. در مجموعه مقالات کنفرانس بین المللی در مورد بازنمایی های یادگیری، آدیس آبابا، اتیوپی، ۲۶ تا ۳۰ آوریل ۲۰۲۰٫ [ Google Scholar ]
  27. اونو، ک. سوزوکی، T. گراف شبکه های عصبی به طور نمایی قدرت بیانی را برای طبقه بندی گره از دست می دهند در مجموعه مقالات کنفرانس بین المللی در مورد بازنمایی یادگیری، نیواورلئان، لس آنجلس، ایالات متحده آمریکا، ۶ تا ۹ مه ۲۰۱۹٫ [ Google Scholar ]
  28. لی، کیو. هان، ز. بینش Wu، XM Deeper در مورد شبکه های کانولوشن گراف برای یادگیری نیمه نظارت شده. در مجموعه مقالات سی و دومین کنفرانس AAAI در مورد هوش مصنوعی، نیواورلئان، لس آنجلس، ایالات متحده آمریکا، ۲ تا ۷ فوریه ۲۰۱۸٫ [ Google Scholar ]
  29. واسوانی، ع. Shazeer، N. پارمار، ن. Uszkoreit، J. جونز، ال. گومز، AN; قیصر، Ł. Polosukhin، I. توجه شما تمام چیزی است که نیاز دارید. Adv. عصبی Inf. روند. سیستم ۲۰۱۷ ، ۳۰ ، ۵۹۹۹-۶۰۰۹٫ [ Google Scholar ]
  30. بای، اس. Kolter، JZ; کلتون، وی. ارزیابی تجربی شبکه‌های کانولوشنال و تکراری عمومی برای مدل‌سازی توالی. arXiv ۲۰۱۸ , arXiv:1803.01271. [ Google Scholar ]
  31. وانگ، پی. چن، پی. یوان، ی. لیو، دی. هوانگ، ز. هو، ایکس. کاترل، جی. درک پیچیدگی برای تقسیم بندی معنایی. در مجموعه مقالات کنفرانس زمستانی IEEE 2018 در مورد کاربردهای بینایی کامپیوتری (WACV)، دریاچه تاهو، NV، ایالات متحده، ۱۲ تا ۱۵ مارس ۲۰۱۸؛ ص ۱۴۵۱-۱۴۶۰٫ [ Google Scholar ]
  32. اورهان، ای. Pitkow, X. اتصالات را پرش کنید تکینگی ها را حذف کنید. در مجموعه مقالات کنفرانس بین المللی در مورد بازنمایی های یادگیری، ونکوور، بریتیش کلمبیا، کانادا، ۳۰ آوریل تا ۳ مه ۲۰۱۸٫ [ Google Scholar ]
  33. Kingma، DP; Ba, J. Adam: روشی برای بهینه سازی تصادفی. arXiv ۲۰۱۴ ، arXiv:1412.6980. [ Google Scholar ]
  34. هوکرایتر، اس. Schmidhuber, J. حافظه کوتاه مدت طولانی. محاسبات عصبی ۱۹۹۷ ، ۹ ، ۱۷۳۵-۱۷۸۰٫ [ Google Scholar ] [ CrossRef ] [ PubMed ]
  35. یو، بی. یین، اچ. Zhu, Z. شبکه‌های کانولوشنال نمودار فضایی-زمانی: یک چارچوب یادگیری عمیق برای پیش‌بینی ترافیک. arXiv ۲۰۱۷ , arXiv:1709.04875. [ Google Scholar ]
  36. وو، زی. پان، اس. لانگ، جی. جیانگ، جی. چانگ، ایکس. ژانگ، سی. اتصال نقاط: پیش‌بینی سری‌های زمانی چند متغیره با شبکه‌های عصبی نمودار. arXiv ۲۰۲۰ ، arXiv:2005.11650، ۷۵۳–۷۶۳٫ [ Google Scholar ]
شکل ۱٫ توزیع فضایی داده های سفارش تاکسی یک ساعته در شهر نیویورک ( a ) و ایستگاه های مجازی کشف شده توسط خوشه بندی ( b ). هر نقطه در ( a ) مبدأ سفارش تاکسی را نشان می دهد و نقشه حرارتی زیرین نقاط داغ شهر را برجسته می کند.
شکل ۲٫ توزیع زمانی سفارش تاکسی ساعتی در طول یک هفته ( a ) و در طول روز هفته ( b ).
شکل ۳٫ معماری تصویری شبکه کانولوشنی انتشار فضایی-زمانی پیشنهادی (ST-DCN). ST-DCN شامل ( الف ) یک لایه ورودی، ( ب ) یک ماژول کانولوشن زمانی، ( ج ) یک ماژول پیچش فضایی، و ( د ) یک لایه خروجی است.
شکل ۴٫ نمونه ای از ساخت ورودی قطعات سری زمانی (فرض کنید اندازه هر دو پنجره تاریخی و پیش بینی ۳۰ دقیقه باشد).
شکل ۵٫ تصویری از مسئله شبکه بندی. پیچیدگی معمولی گشاد شده با اندازه هسته ۲٫ ( الف ) همه لایه‌های کانولوشن دارای نرخ اتساع d = 2 هستند. ( ب ) لایه‌های کانولوشنال بعدی به ترتیب دارای نرخ اتساع d = 1، ۲، ۴ هستند.
شکل ۶٫ اجزای بلوک زمانی.
شکل ۷٫ مقایسه عملکرد روش های مختلف با افزایش زمان پیش بینی در مجموعه داده تاکسی نیویورک.

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

خانهدربارهتماسارتباط با ما