۱٫ مقدمه
پیشبینی جریان ترافیک نقش حیاتی در سیستمهای حمل و نقل هوشمند (ITS) دارد [ ۱ ]. با توجه به یک شبکه جادهای، هدف پیشبینی جریان ترافیک پیشبینی روند جریان ترافیک در آینده نزدیک بر اساس دادههای جریان تاریخی است. از آنجایی که تراکم ترافیک در حال تبدیل شدن به یک مشکل جدی در اکثر شهرها است، نحوه پیش بینی دقیق جریان ترافیک برای مدیریت حمل و نقل، حفاظت از محیط زیست و ایمنی عمومی اهمیت زیادی دارد.
پیشبینی جریان ترافیک یک مشکل مکانی-زمانی معمولی است که در آن هم ویژگیهای مکانی و هم ویژگیهای زمانی باید به طور کامل در نظر گرفته شوند. رویکردهای پیشبینی اولیه [ ۲ ، ۳ ] عمدتاً از مدلهای آماری سنتی برای استخراج قوانین ضمنی پنهان در دادهها استفاده میکردند. با این حال، این مدل ها برای به تصویر کشیدن غیر خطی بودن سری ترافیک بسیار ساده هستند. برخلاف روشهای آماری، رویکردهای کلاسیک مبتنی بر یادگیری ماشین [ ۴ ، ۵ ] قادر به یادگیری روابط پیچیدهتر بودند، اما به مهندسی ویژگیهای دقیق نیاز داشتند که میتواند برای انسانها پرزحمت و خستهکننده باشد. با الهام از پیشرفت های یادگیری عمیق، برخی تلاش ها [ ۶ ، ۷] سعی کرد بر اساس شبکه های عصبی کانولوشن (CNN) و شبکه های عصبی تکراری (RNN) پیش بینی کند. با این حال، CNN های کلاسیک نمی توانند از رابطه غیر اقلیدسی شبکه های جاده ای با ترافیک نامنظم به دلیل عملیات کانولوشنی منظم خود استفاده کنند. از این منظر، شبکههای کانولوشن گراف (GCN) برای پیشبینی جریان ترافیک با توجه به توانایی آنها برای مقابله با دادههای نمودار معرفی شدهاند. علاوه بر این، برخی از کارهای تحقیقاتی [ ۸ ، ۹ ، ۱۰ ، ۱۱ ] GCN ها را با RNN و CNN ترکیب کردند تا به ترتیب ویژگی های مکانی و زمانی را ثبت کنند.
اگرچه پیشرفتهای امیدوارکنندهای در پیشبینی جریان ترافیک انجام شده است، اما دستیابی به پیشبینیهای بسیار دقیق هنوز بسیار چالش برانگیز است، عمدتاً به دو دلیل زیر: (الف) ویژگیهای تغییرات زمانی دورهای در جریان ترافیک در نظر گرفته نمیشوند و (ب) ) همبستگی های مکانی-زمانی به طور موثر ثبت نشده اند.
برای اولی، اکثر رویکردهای موجود [ ۱۲ ، ۱۳ ، ۱۴ ، ۱۵ ، ۱۶ ، ۱۷] فقط به تناوب جریان ترافیک بدون توجه به جابجایی زمانی دوره ای توجه کرد که منجر به ثبت غیر جامع ویژگی های زمانی شد. بنابراین، استحکام و دقت به دست آمده توسط این مدل ها نمی تواند انتظارات را برآورده کند. برای نشان دادن، تناوب سری ترافیک به دلیل عوامل مختلفی مانند آب و هوای پیچیده یا شرایط ترافیک در زمان واقعی، به جای ثابت، پویا است، اگرچه تناوب روزانه و تناوب هفتگی معمولاً به عنوان عوامل قوی در پیشبینی جریان ترافیک شناخته میشوند. یک مثال معمولی از تغییر زمانی دوره ای در شکل ۱ نشان داده شده است (منبع داده: داده های جریان ترافیک دنیای واقعی دیدی از ۳۱ اکتبر ۲۰۱۹ تا ۳۰ نوامبر ۲۰۱۹ در پکن). ساعات اوج مصرف روزانه در شکل ۱a معمولا بین ساعت ۶:۰۰ بعد از ظهر تا ۷:۰۰ بعد از ظهر هستند، اما بسته به اینکه یک روز کاری است و عوامل دیگری مانند آب و هوای غیرعادی و ازدحام ترافیک، می تواند از ساعت ۵:۰۰ بعد از ظهر تا ۹:۰۰ بعد از ظهر متغیر باشد. به طور مشابه، در شکل ۱ ب، نوسان را می توان در اعداد هفتگی مشاهده کرد. بنابراین، برای روشهای فعلی مقابله با موقعیتهای پویا و پیچیده در شبکههای ترافیکی واقعی، تنها با مدلسازی مشخصه استاتیک تناوب، دشوار است.
برای دومی، دادههای ترافیکی همبستگیهای مکانی-زمانی را به شدت مرتبط کردهاند، اما مطالعات اخیر [ ۹ ، ۱۳ ، ۱۸ ] وابستگی متقابل بین ویژگیهای مکانی و ویژگیهای زمانی در جریان ترافیک را در نظر نگرفتهاند. آنها ماژول GCN را برای نمایش ویژگیهای فضایی کل شبکه ترافیک در همان مرحله و ماژول CNN را برای پردازش ویژگیهای زمانی هر جاده در مراحل زمانی مختلف اتخاذ کردند. این راه حل همبستگی های مکانی-زمانی را جدا می کند و منجر به از دست دادن برخی از عوامل ضمنی، مانند تأثیر هر جاده بر جاده های اطراف خود در مراحل زمانی مختلف می شود. بنابراین دقت پیشبینی مدل کمتر از حد انتظار است.
برای پرداختن به دو چالش فوق الذکر، ما یک چارچوب مبتنی بر یادگیری عمیق را پیشنهاد میکنیم : یک شبکه چندمولفهای تقویتشده و جریانساز شبکهی N تکاملی .(AM-RGCN) برای پیش بینی جریان ترافیک. ما ابتدا یک ماژول چند جزئی تقویت شده برای ثبت تغییر زمانی دوره ای که در سری جریان ترافیک پدیدار می شود، ارائه می کنیم. سپس، ما یک معماری رمزگذار-رمزگشا را ارائه میکنیم که در آن رمزگذار به دنبال گرفتن همبستگیهای مکانی-زمانی است و رمزگشا توانایی به دست آوردن نمایشهای ابعادی بالا را از پیشبینیهای چند مرحلهای بر اساس توالیهای مکانی-زمانی دارد. در نهایت یک ماژول فیوژن برای تولید نتایج پیشبینی با ترکیب نمایشهای با ابعاد بالا توسعه مییابد. به طور خلاصه، این مقاله مشارکت های زیر را ارائه می دهد:
-
ما یک ماژول چند جزئی تقویتشده را پیشنهاد میکنیم تا با افزودن نمایشهای تغییر زمانی به نمایشهای دورهای، ویژگیهای تغییر زمانی دورهای در سری ترافیک را به تصویر بکشد.
-
ما یادگیرنده همبستگی زمانی (TCL) را پیشنهاد میکنیم که پیچیدگی یکبعدی را در LSTM ترکیب میکند و آن را با پیچیدگی نمودار در معماری رمزگذار-رمزگشا ترکیب میکند تا همبستگیهای مکانی-زمانی در شبکه جاده را مدیریت کند.
-
آزمایشهای گسترده روی دو مجموعه داده ترافیک دنیای واقعی، PEMSD4 و PEMSD8، تأیید میکند که AM-RGCN ما در مقایسه با رویکردهای موجود، به نتایج پیشرفتهای دست مییابد.
ادامه این مقاله به شرح زیر سازماندهی شده است. کارهای مربوط به پیش بینی جریان ترافیک در بخش ۲ مورد بحث قرار گرفته است. بخش ۳ رویکردهای پیشنهادی ما را با جزئیات معرفی می کند. در بخش ۴ ، آزمایشهای قابل مقایسه با AM-RGCN را روی مجموعه دادههای ترافیک دنیای واقعی انجام میدهیم و نتایج را تجزیه و تحلیل میکنیم. در نهایت، نتایج این مطالعه در بخش ۵ ارائه شده است.
۲٫ کارهای مرتبط
۲٫۱٫ پیش بینی جریان ترافیک
پیش بینی جریان ترافیک به طور گسترده در ITSs مورد تحقیق قرار گرفته است. رویکردهای موجود پیشبینی جریان ترافیک را میتوان به طور عمده به رویکردهای سنتی و رویکردهای یادگیری عمیق تقسیم کرد. به طور خاص، رویکردهای سنتی را می توان بیشتر به دو دسته طبقه بندی کرد: مدل های پارامتری و ناپارامتریک [ ۱۹ ]. مدلهای پارامتریک، مانند رویکردهای مبتنی بر میانگین متحرک یکپارچه بازگشتی خودکار (ARIMA) [ ۲ ] و رویکردهای مبتنی بر فیلتر کالمن (KF) [ ۳ ]، از سری ترافیک تاریخی برای استخراج آماری قانون ضمنی در سریهای زمانی استفاده میکنند. با این حال، این رویکردها برای دریافت غیرخطی بودن داده های ترافیکی بسیار ساده هستند. مدلهای غیر پارامتریک، مانند رویکردهای مبتنی بر K-Nearest Neighbor (KNN) [ ۵]، رویکردهای مبتنی بر رگرسیون برداری پشتیبانی (SVR) [ ۴ ]، و رویکردهای مبتنی بر درخت رگرسیون تقویتشده با گرادیان (GBRT) [ ۲۰ ]، از اصل به حداقل رساندن ریسک تجربی استفاده میکنند، که ممکن است از مشکل بیش از حد برازش رنج ببرد.
یادگیری عمیق در سال های اخیر دستاوردهای بزرگی داشته است. در نتیجه، بسیاری از محققان از رویکردهای یادگیری عمیق برای پیشبینی جریان ترافیک استفاده میکنند. برخی از تلاشها [ ۶ ، ۲۱ ] از حافظه کوتاهمدت (LSTM) [ ۲۲ ] و واحدهای بازگشتی دردار (GRUs) [ ۲۳ ] برای پیشبینی جریان ترافیک استفاده کردند و به نتایج قابلتوجهی دست یافتند. با این حال، این رویکردها عمدتاً ویژگیهای سریهای زمانی را در نظر میگیرند و از ویژگیهای مکانی در شبکههای ترافیکی غفلت میکنند. به منظور رسیدگی به ویژگی های فضایی به طور همزمان، Ma و همکاران. [ ۲۴ ] یک مدل عمیق CNN را پیشنهاد کرد که از یک ماتریس مکانی-زمانی دو بعدی برای گرفتن اطلاعات مکانی-زمانی استفاده می کند. یو و همکاران [ ۲۵] از CNN برای به دست آوردن ویژگی های فضایی استفاده کرد و سپس LSTM را برای تجزیه و تحلیل سری های زمانی به کار برد. با این حال، رویکردهای مبتنی بر CNN عمدتاً ویژگیهای فضای اقلیدسی را به جای فضای غیراقلیدسی استخراج میکنند. برای مقابله با مشکل، GCN ها [ ۲۶ ] در پیش بینی جریان ترافیک معرفی می شوند. GCN های مکانی-زمانی (STGCNs) [ ۹ ] و GCN های زمانی (T-GCNs) [ ۲۷ ] هر دو از GCN ها برای به دست آوردن ویژگی های مکانی استفاده می کنند و سپس ویژگی های زمانی را از طریق CNN های تک بعدی یا GRU به طور جداگانه ضبط می کنند. این رویکردها عموماً بهتر از رویکردهای بدون GCN در پیشبینی عمل میکنند. سونگ و همکاران [ ۲۸] GCN همزمان مکانی-زمانی (STSGCN) را برای به تصویر کشیدن ناهمگونی در شبکه های مکانی-زمانی پیشنهاد کرد و به یک نتیجه متمایز دست یافت. بای و همکاران [ ۲۹ ] GCN ها را در GRU ها ادغام کرد تا روابط مکانی-زمانی را به طور همزمان ثبت کند. برخی از مطالعات [ ۳۰ ، ۳۱ ، ۳۲ ] تلاش کردند مکانیسم توجه را برای حل آن معرفی کنند.
رویکردهای مبتنی بر GCN در بالا عمدتاً از دادههای اخیر برای نمایش اطلاعات زمانی استفاده میکنند در حالی که تناوب در جریان ترافیک را نادیده میگیرند. روی و همکاران [ ۱۴ ] GNN ترافیک مکانی-زمانی ساده شده (SST-GNN) را برای ثبت الگوهای ترافیک دوره ای با اتخاذ یک طرح رمزگذاری موقعیت جدید پیشنهاد کرد. چن و همکاران GCN جهت دار موقتی (T-DGCN) [ ۱۵ ] را پیشنهاد کرد که از یک استراتژی رمزگذاری موقعیت جهانی جدید برای گرفتن وابستگی زمانی مانند تناوب روزانه استفاده می کند. او و همکاران [ ۱۶شبکههای شبکهای موازی فضایی-زمانی (STP-TrellisNets) را پیشنهاد کرد که از ماژول Periodicity TrellisNet (P-TrellisNet) برای ثبت تناوب در سریهای ترافیک استفاده میکند. این مدلها تناوب روزانه را در نظر گرفتند در حالی که تناوب هفتگی را نادیده گرفتند. اگرچه برخی از محققان STGCN چند جزء (MSTGCN) [ ۱۳ ]، STGCN مبتنی بر توجه (ASTGCN) [ ۱۸ ] و هندسه اطلاعات و GCN مبتنی بر توجه (IGAGCN) [ ۱۷ ] را برای نمایش تناوب روزانه و هفتگی پیشنهاد کردند، آنها اثرات تغییر زمانی دوره ای را کنار گذاشت. یائو و همکاران [ ۳۳] شبکه دینامیکی مکانی-زمانی (STDN) را برای جابجایی زمانی دورهای پیشنهاد کرد که از یک شبکه LSTM با مکانیزم توجه برای ثبت وابستگیهای بلندمدت و کوتاهمدت در سریهای ترافیک استفاده میکرد. با این حال، این مدل در فضای اقلیدسی مستقر شده است و بر پرداختن به تغییر در تناوب روزانه تمرکز دارد. علاوه بر این، بیشتر رویکردهای ذکر شده در بالا، مدلهای مختلفی را برای ثبت ویژگیهای مکانی و زمانی به طور جداگانه اتخاذ میکنند. بر این اساس، آنها در به دست آوردن همبستگی های مکانی – زمانی به طور موثر شکست می خورند.
۲٫۲٫ شبکه های پیچیدگی نمودار
رویکردهای سنتی [ ۲۴ ، ۲۵ ] عمدتاً شبکه ترافیک را به شبکهها تقسیم کردند و از CNN برای گرفتن ویژگیهای فضایی استفاده کردند که اتصال توپولوژیکی شبکههای ترافیکی را نادیده میگرفت. روشهای کانولوشن گراف میتوانند دادههای ساختار یافته نمودار را با جمعآوری اطلاعات همسایگان، که رویکردهای مؤثری برای استخراج روابط توپولوژیکی فضایی پیچیده در شبکههای ترافیکی هستند، مدیریت کنند.
شبکه های کانولوشن گراف به دو دسته تقسیم می شوند، مبتنی بر طیف و مبتنی بر فضایی. رویکردهای مبتنی بر فضایی مستقیماً عملیات کانولوشن را روی گرههای گراف انجام میدهند. GraphSAGE [ ۳۴ ] یک تابع تجمع را برای تعریف پیچیدگی نمودار معرفی کرد. شبکه توجه گراف (GAT) [ ۳۵ ] از لایه های توجه برای تنظیم اهمیت هر گره در هنگام اعمال توابع تجمع بهره برداری کرد. رویکردهای مبتنی بر طیف [ ۲۶ ، ۳۶ ، ۳۷ ] از یک ماتریس لاپلاسی برای انجام عملیات کانولوشن روی نمودارها در حوزه فوریه استفاده می کنند. با توجه به انتخاب هسته های کانولوشن، رویکردهای مبتنی بر طیف عمدتاً شامل ChebNet [ ۳۷ ] و GCN [ ۲۶ ] است.]. GCN ها از تقریب مرتبه اول ChebNet استفاده می کنند تا پارامترهای پیچیدگی نمودار را بسیار ساده کنند. با انباشتن چندین لایه GCN، محدوده همسایگی پذیرای GCN ها را می توان افزایش داد.
۳٫ مقدمات
با توجه به داده های جریان ترافیک تاریخی ثبت شده توسط حسگرها در شبکه ترافیک و نمودار توپولوژیکی حسگرهای مربوطه، هدف از پیش بینی جریان ترافیک پیش بینی جریان ترافیک آینده در شبکه های جاده ای است.
در این مطالعه، ما شبکه جاده ترافیک را به عنوان یک نمودار غیر جهت دار تعریف می کنیم [ خطای پردازش ریاضی ]، که در آن V مجموعه ای محدود از [ خطای پردازش ریاضی ]گره هایی که حسگرها را نشان می دهند. E مجموعه ای از لبه هایی است که سنسورهای مختلف را به هم متصل می کند. [ خطای پردازش ریاضی ]ماتریس مجاورت نمودار G است که نشان دهنده اتصال کل شبکه راه است. ماتریس مجاورت فقط شامل عناصر ۰ و ۱ است. اگر دو حسگر مستقیماً در یک جاده مجاور باشند، عنصر ۱ است، در غیر این صورت عنصر ۰ است. جریان ترافیک مشاهده شده در G در زمان t به عنوان یک سیگنال نمودار نشان داده می شود. [ خطای پردازش ریاضی ]، که در آن F بعد ویژگی هر گره است. داده های جریان ترافیک تاریخی در زمان t را می توان به صورت تعریف کرد [ خطای پردازش ریاضی ]، که در آن H طول داده های مشاهده تاریخی است. پیش بینی جریان ترافیک به صورت نشان داده می شود [ خطای پردازش ریاضی ]، P طول داده های پیش بینی است. هدف پیش بینی جریان ترافیک یادگیری یک مدل است [ خطای پردازش ریاضی ]که می تواند به دقت سیگنال های نمودار P آینده را با توجه به سیگنال های نمودار H تاریخی کل شبکه جاده پیش بینی کند: [ خطای پردازش ریاضی ].
۴٫ روش شناسی
ما یک چارچوب کلی به نام AM-RGCN برای رسیدگی به مشکل تغییر زمانی دوره ای و بهره برداری از همبستگی های مکانی-زمانی پیشنهاد می کنیم. همانطور که در شکل ۲ نشان داده شده است ، AM-RGCN پیشنهادی عمدتاً از سه ماژول تشکیل شده است: (۱) یک ماژول چند جزئی تقویت شده که قصد دارد ویژگی های تناوب و تغییر زمانی دوره ای را به طور همزمان ثبت کند. (۲) یک ماژول رمزگذار که هدف آن مشخص کردن همبستگی های مکانی-زمانی در داده های جریان ترافیک است. (۳) یک ماژول رمزگشا که پیش بینی های چند مرحله ای را از توالی های مکانی-زمانی انجام می دهد.
۴٫۱٫ ماژول چند جزئی تقویت شده برای تغییر زمانی دوره ای
ایده چند جزئی توسط Guo و همکاران معرفی شد. [ ۱۸ ]. ماژول چند جزیی پیشنهادی مولفه اخیر، جزء تناوب روزانه و جزء تناوب هفتگی دادههای جریان ترافیک را در بر میگیرد. همانطور که در شکل ۳ الف نشان داده شده است، [ خطای پردازش ریاضی ]و [ خطای پردازش ریاضی ]به ترتیب به پنجره پیش بینی (از ساعت ۱۷ تا ۶ بعد از ظهر روز پنجشنبه) و زمان فعلی مراجعه کنید. [ خطای پردازش ریاضی ]، [ خطای پردازش ریاضی ]، و [ خطای پردازش ریاضی ]تعداد مراحل زمانی سه جزء فوق به ترتیب داده های جریان ترافیک را در مقیاس های زمانی مختلف توصیف می کنند. به طور مشخص، [ خطای پردازش ریاضی ]، جایی که [ خطای پردازش ریاضی ]نشان دهنده استفاده از سری ترافیک از گذشته است [ خطای پردازش ریاضی ]ساعت ها). [ خطای پردازش ریاضی ]، جایی که [ خطای پردازش ریاضی ]به معنای استفاده از جریان ترافیک همان بازه زمانی (از ساعت ۱۷:۰۰ تا ۱۸:۰۰) در گذشته است. [ خطای پردازش ریاضی ]روزها). [ خطای پردازش ریاضی ]، جایی که [ خطای پردازش ریاضی ]نشان دهنده استفاده از سوابق ترافیکی همان بازه زمانی (از ساعت ۱۷:۰۰ تا ۱۸:۰۰) در گذشته است. [ خطای پردازش ریاضی ]پنجشنبه(های)
چند مولفه افزوده، جزء افزوده شده روزانه و جزء افزوده شده هفتگی را برای شیفت روزانه و شیفت هفتگی معرفی می کند. همانطور که در شکل ۳ ب نشان داده شده است، [ خطای پردازش ریاضی ]و [ خطای پردازش ریاضی ]طول مولفه افزوده شده روزانه و هفتگی به طور جداگانه است. S نشان دهنده افست دوره ای است که نشان می دهد یک جابجایی دوره وجود دارد [ خطای پردازش ریاضی ]مراحل زمانی قبل و بعد از تناوب روزانه و هفتگی. به طور خاص، رابطه بین چند جزئی و چند جزئی تقویت شده را می توان به صورت معادله ( ۱ ) بیان کرد:
فرکانس نمونه برداری از سری ترافیک به صورت f بار در روز تعریف می شود، سپس جزئیات چند جزئی تقویت شده به شرح زیر است:
همانطور که در شکل ۳ ب نشان داده شده است، مولفه اخیر قسمت طلایی است که نشان دهنده سری های زمانی است که نزدیک ترین آنها به دنباله پیش بینی است. با توجه به تداوم جریان ترافیک، ما استدلال می کنیم که همبستگی های قوی در لحظات اخیر وجود دارد. بیان مولفه اخیر به شرح زیر است:
که در آن N تعداد گره ها در شبکه راه ها را نشان می دهد، F بعد نمایش هر گره است و [ خطای پردازش ریاضی ]مخفف جریان ترافیک در زمان t است.
- (۲)
-
جزء افزوده شده روزانه
همانطور که در شکل ۳ ب نشان داده شده است، مولفه روزانه قسمت سبز رنگ است که داده ها را در همان دوره زمانی پنجره پیش بینی در چند روز گذشته نشان می دهد. تاثیر تغییر دوره ای ناشی از آب و هوای غیرعادی، تراکم ترافیک و سایر عوامل در جریان ترافیک است. در نتیجه، سری های افست را که به همان طول توالی های پیش بینی است، قبل و بعد از مولفه های روزانه اضافه می کنیم تا جزء افزوده شده روزانه را تشکیل دهیم. مولفه را می توان به صورت زیر بیان کرد و نتیجه را با معادله ( ۱ ) ساده می کنیم:
فرض کنید گام زمانی ۵ دقیقه است و می خواهیم جریان ترافیک ساعت بعدی را پیش بینی کنیم ( [ خطای پردازش ریاضی ]) از ساعت ۱۷:۰۰ تا ۱۸:۰۰ روز پنجشنبه. [ خطای پردازش ریاضی ]فرکانس نمونه برداری یک روز است. اجازه دهید [ خطای پردازش ریاضی ]و [ خطای پردازش ریاضی ]، سپس [ خطای پردازش ریاضی ]. معادله ( ۳ ) به این معنی است که ما از جریان ترافیک از ساعت ۴:۰۰ بعد از ظهر تا ۷:۰۰ بعد از ظهر در آخرین سه شنبه و چهارشنبه استفاده می کنیم. برای مثال، [ خطای پردازش ریاضی ]را می توان به عنوان جریان ترافیک از ساعت ۱۶:۰۰ تا ۱۹:۰۰ در سه شنبه اخیر در نظر گرفت. [ خطای پردازش ریاضی ]جریان ترافیک از ساعت ۱۶:۰۰ تا ۷:۰۰ بعد از ظهر در آخرین چهارشنبه است.
- (۳)
-
جزء افزوده شده هفتگی
همانطور که در شکل ۳ ب نشان داده شده است، مولفه هفتگی قسمت قرمز رنگ است که داده ها را در همان دوره زمانی پنجره پیش بینی در چند هفته گذشته نشان می دهد. ما یک سری افست را که به همان طول دنباله پیش بینی است، قبل و بعد از مؤلفه هفتگی اضافه می کنیم تا مؤلفه تقویت شده هفتگی را تشکیل دهیم. به طور مشابه، می توان آن را به صورت زیر بیان کرد:
فرض کنید که تنظیمات مشابهی را داریم که در مولفه روزانه افزوده شده است. اجازه دهید [ خطای پردازش ریاضی ]و [ خطای پردازش ریاضی ]، سپس [ خطای پردازش ریاضی ]. معادله ( ۴ ) نشان می دهد که ما سوابق ترافیکی ۴:۰۰ بعد از ظهر تا ۷:۰۰ بعد از ظهر از دو پنجشنبه گذشته را اتخاذ می کنیم. بر این اساس، [ خطای پردازش ریاضی ]را می توان به عنوان جریان ترافیک از ساعت ۴:۰۰ بعد از ظهر تا ۷:۰۰ بعد از ظهر پنجشنبه دو هفته پیش در نظر گرفت. [ خطای پردازش ریاضی ]جریان ترافیک از ساعت ۱۶:۰۰ تا ۷:۰۰ بعد از ظهر پنجشنبه گذشته است.
سه مولفه فوق به طور مشترک ماژول چند جزئی تقویت شده را تشکیل می دهند که تناوب و تغییر زمانی دوره ای در پیش بینی ترافیک را در نظر می گیرد. اجازه دهید [ خطای پردازش ریاضی ]طول ماژول چند جزئی تقویت شده و داده های ورودی باشد [ خطای پردازش ریاضی ]به معماری رمزگذار – رمزگشا منتقل می شوند.
۴٫۲٫ رمزگذار برای همبستگی های مکانی-زمانی
ماژول رمزگذار برای بهره برداری از همبستگی های مکانی-زمانی طراحی شده است. همانطور که در شکل ۲ نشان داده شده است، از یک GCN و TCL تشکیل شده است، که هر دو برای یادگیری نمایش های مکانی-زمانی از سری های چند جزئی تقویت شده استفاده می شوند.
۴٫۲٫۱٫ پیچیدگی نمودار در بعد فضایی
همانطور که در شکل ۴ الف نشان داده شده است، شبکه ترافیک یک ساختار نمودار معمولی است و جریان ترافیک همسایگان هر حسگر برای پیش بینی ضروری است. ما یک GCN را برای گرفتن روابط توپولوژیکی فضایی انتخاب می کنیم. همانطور که به طور خلاصه در شکل ۴ ب نشان داده شده است، مدل GCN می تواند رابطه توپولوژیکی بین سنسور مرکزی و حسگرهای مرتبه اول اطراف آن را بدست آورد و ویژگی های جریان ترافیک را در شبکه جاسازی کند. مدل GCN دو لایه را می توان به صورت زیر بیان کرد:
جایی که [ خطای پردازش ریاضی ]نشان دهنده ویژگی های شبکه راه در هر برش زمانی است [ خطای پردازش ریاضی ]; [ خطای پردازش ریاضی ]نشان دهنده ترفند عادی سازی مجدد است. [ خطای پردازش ریاضی ]به معنای افزودن یک حلقه خود به ماتریس مجاورت است. [ خطای پردازش ریاضی ]و [ خطای پردازش ریاضی ]ماتریس پارامتر از بعد ویژگی ورودی F تا بعد مشخصه خروجی H و C را به طور جداگانه نشان می دهد. [ خطای پردازش ریاضی ]تابع فعال سازی است.
برای استفاده کامل از اطلاعات توپولوژیکی، از یک GCN با وزن مشترک دو لایه برای ثبت ویژگیهای فضایی شبکه ترافیک در هر برش زمانی استفاده میکنیم.
۴٫۲٫۲٫ یادگیرنده همبستگی زمانی (TCL) در بعد زمانی
دادههای جریان ترافیک عمدتاً ورودی سهبعدی گرهها، توالیها و ویژگیها هستند. در بخش قبلی، ما از GCN ها برای نشان دادن همبستگی های فضایی متقابل بین همه حسگرها در امتداد بعد گره استفاده کردیم. در بلوکهای TCL، ابتدا پیچیدگی یک بعدی را اضافه میکنیم تا مشخصه داخلی هر حسگر را در بعد ویژگی یکپارچه کنیم، و سپس LSTM را در بعد توالی برای ویژگیهای زمانی اتخاذ میکنیم. TCL پیشنهادی ما تا حدی از Convolutional LSTM (ConvLSTM) [ ۳۸ ] الهام گرفته شده است. همانطور که در شکل ۵ نشان داده شده است ، ما نمایش های فضایی استخراج شده از GCN ها در هر لحظه را به صورت [ خطای پردازش ریاضی ]. TCL ابتدا از پیچیدگی یک بعدی برای ادغام ویژگی فضایی هر سنسور بر اساس حالت پنهان قبلی استفاده می کند. [ خطای پردازش ریاضی ]و [ خطای پردازش ریاضی ]، سپس آن را همراه با وضعیت حافظه سلول قبلی به LSTM می فرستد [ خطای پردازش ریاضی ]برای یادگیری ویژگی های زمانی، که در آن H اندازه پنهان است. به طور خاص، قبل از آمدن اولین ورودی، تمام حالتهای LSTM را صفر میکنیم. در طول فرآیند آموزش، قبل از اعمال عملیات کانولوشن، به حالتهای پنهان، لایه صفر اضافه میکنیم. اندازه هسته و اندازه بالشتک کانولوشن یک بعدی به صورت جداگانه ۳ و ۱ است.
برای اطمینان از اینکه ویژگی های مکانی و زمانی را می توان به طور همزمان یاد گرفت، ویژگی های مکانی را وارد می کنیم. [ خطای پردازش ریاضی ]به عنوان منبع TCL در هر لحظه از سری جریان ترافیک، که به مدل کمک می کند تا همبستگی های مکانی – زمانی را بیاموزد. بنابراین، در مرحله زمانی t ، فرآیند محاسبات TCL پیشنهادی را می توان به صورت زیر ساده کرد:
جایی که [ خطای پردازش ریاضی ]. عبور می کنیم [ خطای پردازش ریاضی ]وارد TCL شده و وضعیت حافظه سلولی را به روز کنید [ خطای پردازش ریاضی ]با استفاده از گیت ورودی [ خطای پردازش ریاضی ]، دروازه فراموشی [ خطای پردازش ریاضی ]و حالت پنهان قبلی [ خطای پردازش ریاضی ]. در نهایت از گیت خروجی استفاده می کنیم [ خطای پردازش ریاضی ]برای به روز رسانی وضعیت پنهان فعلی [ خطای پردازش ریاضی ]. میتوانیم فرآیند محاسبات فوق را به صورت زیر خلاصه کنیم:
جایی که [ خطای پردازش ریاضی ]پارامترهای قابل یادگیری در TCL را نشان می دهد. [ خطای پردازش ریاضی ]و [ خطای پردازش ریاضی ]عملکرد فعال سازی را نشان می دهد. * عملیات پیچیدگی یک بعدی را نشان می دهد. ⊙ نشان دهنده محصول هادامارد است.
سپس ماژول رمزگذار از حالت خروجی نهایی عبور می کند [ خطای پردازش ریاضی ]، [ خطای پردازش ریاضی ]TCL شامل ویژگیهای مکانی – زمانی جریان ترافیک به رمزگشا میشود.
۴٫۳٫ رمزگشا برای پیش بینی چند مرحله ای
ماژول رمزگشا عمدتا برای پیش بینی چند مرحله ای استفاده می شود. همانطور که در شکل ۲ نشان داده شده است، از TCL و CNN تشکیل شده است که از حالت های پنهان به دست آمده از رمزگذار برای تولید نمایش ویژگی های با ابعاد بالا از توالی های مکانی-زمانی استفاده می کند.
در رمزگشای ما، TCL برای باز کردن حالت پنهان پذیرفته شده است [ خطای پردازش ریاضی ]و وضعیت حافظه سلولی [ خطای پردازش ریاضی ]از رمزگذار علاوه بر این، از آنجایی که هیچ دنباله ورودی در TCL وجود ندارد، یک آرایه تمام صفر را با همان ابعاد حالت پنهان مقداردهی اولیه می کنیم. [ خطای پردازش ریاضی ]به عنوان ورودی برای ساده سازی. به طور خاص، در هر لحظه، ما از حالت پنهان و حالت حافظه سلولی از لحظه قبل و آرایه صفر برای پیش بینی لحظه بعدی استفاده می کنیم. هدف این است که اطمینان حاصل شود که نتیجه پیش بینی در هر لحظه با لحظه قبلی مرتبط است. با فرض اینکه اندازه پنجره پیش بینی P باشد ، بیان رمزگشا به صورت زیر است:
جایی که [ خطای پردازش ریاضی ]و [ خطای پردازش ریاضی ]آرایه های تمام صفر را نشان می دهد. سپس به هم می پیوندیم [ خطای پردازش ریاضی ]و یک عملیات کانولوشنی برای تبدیل پیش بینی های چند مرحله ای به نمایش های با ابعاد بالا اعمال کنید.
نمایشهای بهدستآمده از ماژول چند جزیی تقویتشده فوق و معماری رمزگذار-رمزگشا به ماژول فیوژن، که از یک اتصال باقیمانده و CNN تشکیل شده است، برای تولید نتایج پیشبینی منتقل میشوند. بطور مشخص، ماژول فیوژن از یک اتصال باقیمانده کانولوشنی برای یکپارچه سازی اطلاعات باقیمانده استفاده می کند. [ خطای پردازش ریاضی ]از ماژول چند جزئی تقویت شده با نمایش های با ابعاد بالا [ خطای پردازش ریاضی ]از رمزگشا، با هدف تسریع آموزش مدل و کاهش مشکل اضافه برازش. در نهایت، یک CNN برای تضمین پیشبینیها اتخاذ میشود [ خطای پردازش ریاضی ]همان ابعاد و شکل های مورد انتظار را دارند.
۵٫ آزمایش کنید
برای ارزیابی عملکرد مدل ما، آزمایشهای مقایسهای روی دو مجموعه داده ترافیک دنیای واقعی انجام میشود. علاوه بر این، ما مطالعات فرسایشی را برای نشان دادن اثربخشی ماژولهای مختلف انجام میدهیم.
۵٫۱٫ مجموعه داده ها
مجموعه داده های ترافیک عمومی PEMSD4 و PEMSD8 مجموعه داده های ترافیکی واقعی بزرگراه هستند که توسط سیستم اندازه گیری عملکرد آژانس حمل و نقل کالیفرنیا (PeMS) جمع آوری شده اند. این سیستم بر روی نقشه نمایش داده می شود و دارای بیش از ۳۹۰۰۰ حسگر مستقل است که در سیستم بزرگراه در تمام مناطق بزرگ شهری ایالت کالیفرنیا مستقر شده اند. مشاهدات حسگرها در پنجره های ۵ دقیقه ای جمع شده و اطلاعات جغرافیایی سنسورها نیز گنجانده شده است.
ما از معیارهای محبوب PEMSD4 و PEMSD8 که توسط Guo و همکاران منتشر شده است استفاده می کنیم. [ ۱۸ ] که حسگرهای اضافی را که فاصله آنها کمتر از ۳٫۵ مایل است حذف می کند و برای مقادیر از دست رفته درون یابی خطی را اتخاذ می کند. جزئیات مجموعه داده ها در جدول ۱ توضیح داده شده است: (۱) PeMSD4 آماری دو ماهه از جریان ترافیک در منطقه خلیج سانفرانسیسکو را ثبت می کند که از ۱ ژانویه ۲۰۱۸ تا ۲۸ فوریه ۲۰۱۸ شامل ۳۰۷ حسگر می باشد. ما داده های ۵۰ روز اول را به عنوان مجموعه آموزشی و مجموعه اعتبار سنجی و ۹ روز باقی مانده را به عنوان مجموعه آزمایشی انتخاب می کنیم. (۲) PeMSD8 شامل دو ماه آمار در مورد جریان ترافیک در منطقه سان برناردینو، از ۱ ژوئیه ۲۰۱۶ تا ۳۱ اوت ۲۰۱۶، شامل ۱۷۰ حسگر است. ما داده های ۵۰ روز اول را به عنوان مجموعه آموزشی و مجموعه اعتبار سنجی و ۱۲ روز باقی مانده را به عنوان مجموعه آزمایشی انتخاب می کنیم. علاوه بر این، ما مجموعه داده را با محاسبه حداکثر مقدار از قبل پردازش می کنیم [ خطای پردازش ریاضی ]در مجموعه داده و عادی سازی کل مجموعه داده توسط [ خطای پردازش ریاضی ].
۵٫۲٫ پارامتر مدل
همه آزمایشها بر روی یک کلاستر لینوکس (CPU: 6 Core Processor Intel (Broadwell)، GPU: NVIDIA Tesla P40) کامپایل و آزمایش میشوند. پارامترهای مدل را می توان به سه بخش تقسیم کرد: (۱) چند جزئی افزوده: در این مطالعه، ما بر پیش بینی جریان ترافیک ساعت بعدی تمرکز می کنیم، یعنی، [ خطای پردازش ریاضی ]. برای [ خطای پردازش ریاضی ]یا ۳، از پارامتر مدل استفاده می کنیم [ خطای پردازش ریاضی ]برای کارایی آموزش با توجه به یک مبادله بین دقت پیشبینی و کارایی محاسباتی در آزمایش، ما سه پارامتر جزء را به صورت [ خطای پردازش ریاضی ]، [ خطای پردازش ریاضی ]، و [ خطای پردازش ریاضی ]و افست دوره ای به صورت S = 1 برای هر دو مجموعه داده. علاوه بر این، فواصل افزوده شده، محدوده تغییرات زمانی دوره ای ساعات اوج مصرف نشان داده شده در شکل ۱ را پوشش می دهد. در نتیجه، طول دنباله چند جزئی تقویت شده است [ خطای پردازش ریاضی ]; (۲) ساختار شبکه: رمزگذار از دو لایه GCN استفاده می کند که فیلترهای کانولوشن آن ۱۲۸ و ۶۴ هستند، به طور جداگانه. فیلترهای پیچشی TCL با تعداد سنسورها مطابقت دارد و ۶۴ واحد مخفی وجود دارد. در رمزگشا، ۶۴ واحد مخفی TCL وجود دارد در حالی که توالی های خروجی عبارتند از [ خطای پردازش ریاضی ]و فیلترهای کانولوشن CNN به صورت تنظیم شده است [ خطای پردازش ریاضی ]. در ماژول فیوژن، فیلترهای کانولوشن هستند [ خطای پردازش ریاضی ]; (۳) فراپارامترهای آموزشی: ما مدل خود را با استفاده از بهینه ساز Adam [ ۳۹ ] با نرخ یادگیری ۰٫۰۰۱ و کاهش وزن ۵ × آموزش می دهیم.[ خطای پردازش ریاضی ]. خروجی [ ۴۰ ] را ۰٫۸ قرار دادیم. در این مقاله، ما یک میانگین مربع خطا (MSE) بین تخمینگر و حقیقت زمین را به عنوان تابع ضرر اعمال میکنیم.
۵٫۳٫ متریک ارزیابی
ما از ریشه میانگین مربعات خطا (RMSE) و میانگین خطای مطلق (MAE) به عنوان معیارهای ارزیابی استفاده می کنیم:
جایی که [ خطای پردازش ریاضی ]یعنی حقیقت زمینی، [ خطای پردازش ریاضی ]جریان ترافیک پیشبینیشده است و n تعداد تمام مقادیر پیشبینیشده است.
۵٫۴٫ خط مبنا
ما مدل خود را با خطوط پایه زیر مقایسه می کنیم:
-
میانگین تاریخی (HA). ما از میانگین ۱۲ برش زمانی گذشته در دوره مشابه یک هفته قبل برای پیش بینی برش زمانی فعلی استفاده می کنیم.
-
آریما [ ۲ ]. یک مدل پیشبینی سنتی معمولی برای سریهای زمانی ما ضریب رگرسیون خودکار را تنظیم می کنیم [ خطای پردازش ریاضی ]، ضریب اختلاف [ خطای پردازش ریاضی ]، ضریب میانگین متحرک [ خطای پردازش ریاضی ].
-
LSTM [ ۲۲ ]. یک مدل RNN ویژه برای پیشبینی سریهای زمانی. ما جریان ترافیک تاریخی را تنظیم کردیم [ خطای پردازش ریاضی ]و اندازه پنهان [ خطای پردازش ریاضی ].
-
شبکه واحد بازگشتی دردار (GRU) [ ۲۳ ]. یک مدل RNN بهبود یافته برای پیشبینی سریهای زمانی ما جریان ترافیک تاریخی را تنظیم کردیم [ خطای پردازش ریاضی ]و اندازه پنهان ۶۴ است.
-
STGCN [ ۹ ]. این مدل از پیچیدگی یک بعدی و پیچیدگی نمودار برای استخراج ویژگیهای مکانی-زمانی استفاده میکند که به طور گسترده در پیشبینی جریان ترافیک استفاده میشود. هر دو اندازه هسته پیچیدگی گراف [ خطای پردازش ریاضی ]و اندازه هسته پیچیدگی زمانی [ خطای پردازش ریاضی ]در آزمایش ها روی ۳ تنظیم شده اند.
-
MSTGCN [ ۱۳ ]. یک شبکه چند جزئی برای پیش بینی جریان ترافیک بهترین ترکیبات اتخاذ شده در این مقاله عبارتند از [ خطای پردازش ریاضی ]، [ خطای پردازش ریاضی ]، و [ خطای پردازش ریاضی ].
-
ASTGCN [ ۱۸ ]. یک مدل پیشبینی جریان ترافیک، که توجه مکانی – زمانی را به MSTGCN اضافه میکند. بهترین ترکیبات اتخاذ شده در این مقاله عبارتند از [ خطای پردازش ریاضی ]، [ خطای پردازش ریاضی ]، و [ خطای پردازش ریاضی ].
-
STSGCN [ ۲۸ ]. یک مدل پیشبینی ترافیک که تلاش میکند تا همبستگیهای محلی-زمانی پیچیده را در دادههای مکانی-زمانی به تصویر بکشد. بهترین تنظیم شامل ۴ STSGCL است، هر STSGCM شامل ۳ عملیات کانولوشن گراف با ۶۴، ۶۴، ۶۴ فیلتر، به طور جداگانه است.
۵٫۵٫ نتایج و تجزیه و تحلیل
به طور کلی، در مقایسه پایه، مدل ما به بهترین عملکرد در PEMSD4 و PEMSD8 در مقایسه با روشهای سنتی موجود و روشهای یادگیری عمیق دست مییابد. سپس، روش چند جزئی تقویتشده و ماژول TCL ارزیابی میشوند و ثابت میکنند که در جنبههای زیر مؤثر هستند: (۱) روش چند مؤلفهای تقویتشده بهتر از روش چند مؤلفهای عمل میکند و برای ثبت تغییر زمانی دورهای در جریان ترافیک مفید است. ; (۲) ماژول TCL ما بهتر از انواع خود عمل می کند و می تواند همبستگی های مکانی-زمانی را به طور موثر یاد بگیرد.
۵٫۵٫۱٫ مقایسه پایه
جدول ۲ عملکرد AM-RGCN و مدل های پایه را برای ۱۵ دقیقه (سه برش زمانی)، ۳۰ دقیقه (شش برش زمانی)، و ۱ ساعت (۱۲ برش زمانی) پیش بینی های پیش روی دو مجموعه داده ارائه می کند. همانطور که نشان داده شده است، AM-RGCN ما بهترین عملکرد را در هر دو مجموعه داده از نظر تمام معیارهای ارزیابی دارد.
عملکردهای پیشبینی خطوط پایه سنتی (HA و ARIMA) بدترین هستند، که به دلیل توانایی آنها برای گرفتن ویژگیهای مکانی-زمانی از دادههای سری زمانی پیچیده محدود میشود. در مقایسه، رویکردهای یادگیری عمیق (مدلهای مبتنی بر GCN و RNN) با تواناییشان در یادگیری از دادههای ترافیک غیرخطی، با حاشیههای زیادی از آنها بهتر عمل میکنند. در کار پیشبینی ترافیک یک ساعته روی مجموعه داده PEMSD8، حتی مدل یادگیری عمیق با بدترین عملکرد (LSTM) بهتر از بهترین روش سنتی انتخاب شده (HA) کار میکند. از نظر آماری، اولی خطاهای RMSE و MAE را تقریباً ۲۹٫۹٪ و ۲۲٫۵٪ در مقایسه با دومی کاهش می دهد. در رویکردهای یادگیری عمیق، مدلهای مبتنی بر GCN (STGCN، MSTGCN، ASTGCN، STSGCN، و AM-RGCN) عموماً بهتر از مدلهای مبتنی بر RNN (LSTM و GRU) عمل میکنند.
در میان مدلهای مبتنی بر GCN، STGCN بدترین مدل است زیرا فقط از مؤلفه اخیر برای ثبت ویژگیهای زمانی استفاده میکند و به دلیل نداشتن ویژگیهای تناوب محدود شده است. روشهای بهتری مانند MSTGCN و ASTGCN میتوانند تناوب روزانه و هفتگی را با روش چند جزیی ثبت کنند. بنابراین، آنها عملکرد RMSE و MAE را ۱۲٫۶٪، ۹٫۵٪ و ۱۳٫۵٪، ۱۰٫۲٪ در پیش بینی یک ساعته در PEMSD4 بهبود می بخشند. با این حال، این مدلهای مبتنی بر GCN در تشخیص همبستگی کارآمد نیستند، زیرا از ماژولهای GCN و ۱D-CNN برای مدلسازی ویژگیهای مکانی و زمانی جداگانه استفاده میکنند. در مقایسه، STSGCN همبستگی های مکانی-زمانی موضعی را در نظر می گیرد و نسبت به STGCN نیز برتر است. اما بی توجهی آن به تناوب باعث می شود عملکرد آن در تمام فواصل و معیارها به طور کامل از MSTGCN و ASTGCN پیشی نگیرد. نتایج فوق از چهار مدل مبتنی بر GCN اهمیت تناوب و همبستگیهای مکانی – زمانی را در پیشبینی جریان ترافیک ثابت میکند. با این حال، عملکرد آنها به دلیل ناتوانی در مدیریت همزمان ویژگیهای تناوب استاتیک و همبستگیهای مکانی-زمانی، و همچنین معرفی تغییر تناوب پویا محدود میشود.
در مقابل، AM-RGCN ما از چند جزء تقویتشده برای درک ویژگیهای آفست دورهای استفاده میکند، و TCL را با GCN در هر لحظه ترکیب میکند تا همبستگیهای مکانی-زمانی را بیاموزد. در پیشبینی ساعت آینده بر اساس پارامترهای مدل مشابه (حدود ۱٫۴M) با ASTGCN (مدل پیشرفته قبلی) مقایسه میشود. نتایج نشان میدهد که AM-RGCN RMSE و MAE را ۶٫۳% و ۸٫۰% در PEMSD8 و ۸٫۰% و ۹٫۲% در PEMSD4 کاهش میدهد، اگرچه زمان بیشتری (۴٫۵ ms) نسبت به ASTGCN (2.4 ms) برای یک تکرار رو به جلو در استنتاج به دلیل استفاده از یک ساختار مکرر. با توجه به مقایسه های فوق، مدل ما در بیان ویژگی های مکانی و زمانی سری های ترافیکی مزایای بیشتری دارد.
۵٫۵٫۲٫ جلوه های ماژول چند جزئی افزوده
در مرحله اول، برای بررسی اثربخشی ماژول چند جزئی افزوده پیشنهادی ما (AM-RGCN)، آزمایشهای مقایسهای را با مدلهای چند جزیی (MSTGCN، ASTGCN) انجام میدهیم که فقط تناوب در سریهای ترافیک را در نظر میگیرند. برای کنترل متغیرها، محدوده های چند جزئی و چند جزئی تقویت شده به صورت تنظیم شده است. [ خطای پردازش ریاضی ]، [ خطای پردازش ریاضی ]، [ خطای پردازش ریاضی ]و [ خطای پردازش ریاضی ]، [ خطای پردازش ریاضی ]، [ خطای پردازش ریاضی ]، به ترتیب، جایی که افست دوره ای [ خطای پردازش ریاضی ]. تنظیم نشان می دهد که افست زمانی دوره ای یک ساعت است. نتایج تجربی در شکل ۶ نشان داده شده است. ما میتوانیم مشاهده کنیم که هر رویکردی که از چند مؤلفه تقویتشده استفاده میکند، بهتر از روش چند مؤلفهای عمل میکند. به عنوان مثال، برای پیشبینی یک ساعته در PEMSD4 و PEMSD8، MSTGCN، ASTGCN، و AM-RGCN همگی هنگام جایگزینی چند جزئی با چند جزئی تقویتشده، عملکرد بهتری دارند. ما استدلال می کنیم که عواملی که در واقع منجر به پیش بینی های بدتر در چند جزء می شوند، مانند شرایط آب و هوایی و ترافیک، در محدوده بازه دوره گنجانده نشده اند. در مقایسه، چند جزئی تقویتشده میتواند عوامل فوق را پوشش دهد و ویژگیهای تناوب و جابجاییهای زمانی دورهای را به طور همزمان با افزایش دامنه دادههای هر ماژول دوره ثبت کند.
سپس، آزمایشهای فرسایشی انجام میدهیم تا سهم هر جزء در چند مولفه تقویتشده در PEMSD8 را بررسی کنیم ( جدول ۳ )، و نتایج تجربی زیر مشاهده میشود: (۱) مدل مجهز به [ خطای پردازش ریاضی ]به طور قابل توجهی بهتر از کسانی که با [ خطای پردازش ریاضی ]و [ خطای پردازش ریاضی ]افزایش اثر به ترتیب ۳۱٫۶% و ۳۲٫۲% و ۲۸٫۱% و ۲۳٫۹% برای RMSE و MAE. این نشان میدهد که پیشبینی سریهای زمانی در درجه اول به برشهای زمانی اخیر در هنگام در نظر گرفتن تنها یک جزء بستگی دارد. (۲) در مقایسه با مجرد [ خطای پردازش ریاضی ]، عملکرد را می توان با ترکیب کردن بهبود داد [ خطای پردازش ریاضی ]با [ خطای پردازش ریاضی ]یا [ خطای پردازش ریاضی ]. علاوه بر این، زمانی می توان بهترین عملکرد را به دست آورد که مدل به تمام اجزا مجهز باشد، زیرا افزایش روزانه چند جزئی افزوده شده و چند جزئی افزوده هفتگی می تواند به مدل سازی تناوب و جابجایی زمانی دوره ای کمک کند، در مقایسه با استفاده از مولفه اخیر برای وابستگی کوتاه مدت بنابراین، این دو آزمایش از برتری روش چند جزئی تقویتشده ما در رسیدگی به مشکل تغییر زمانی دورهای پشتیبانی میکنند.
۵٫۵٫۳٫ اثرات یادگیرنده همبستگی زمانی
برای بررسی بیشتر مزایای TCL، ما AM-RGCN را با انواع آن مقایسه می کنیم که جایگزین TCL با CNN یا LSTM می شوند، در حالی که همه آنها به یک ماژول چند جزئی تقویت شده مجهز هستند. با توجه به نتایج تجربی در جدول ۴ ، می توان چندین نتیجه گرفت:
اولا، AM-LSTM-GCN به خوبی AM-CNN-GCN عمل نمی کند. ما پیشنهاد میکنیم دلیل اصلی این است که وقتی این مدل پیشبینیهای چند مرحلهای را از طریق یک رویکرد گام به گام ایجاد میکند، خطاها انباشته میشوند. برای دقیق تر بودن، اگر طول پیش بینی P باشد، باید واحدهای LSTM را بار P حلقه کنیم ، که منجر به تجمع خطا در هر زمان می شود. در مقابل، AM-CNN-GCN مستقیماً از انتشار خطا با استفاده از یک CNN برای ترسیم طول پیشبینی زمانی نهایی به P جلوگیری میکند.
ثانیا، AM-RGCN به دلیل ترکیب GCN و TCL در شبکه رمزگذار برای گرفتن همبستگی های مکانی-زمانی، نسبت به AM-CNN-GCN برتری دارد. بطور مشخص، در هر لحظه پیشبینیشده، اطلاعات مکانی – زمانی آخرین مرحله زمانی را برای دستیابی به یک پیشبینی پیوسته در نظر میگیرد. در مقابل، AM-CNN-GCN همبستگیهای بین ویژگیهای مکانی و زمانی را جدا میکند و تأثیر هر حسگر را بر حسگرهای اطراف خود در مراحل زمانی مختلف در شبکههای ترافیکی کنار میگذارد.
در مورد مقایسه AM-RGCN و AM-LSTM-GCN، مدل ما همچنان اولویت قابل توجه خود را حفظ کرده است. این به این دلیل است که راه حل ترکیب کانولوشن یک بعدی و LSTM هنگام مدیریت ویژگی های توپولوژیکی فضایی از GCN به طور موثر عمل می کند، در حالی که AM-LSTM-GCN آن را به دلیل محدودیت توانایی صاف می کند. در جزئیات، عملیات مسطح کردن ویژگیهای فضایی و سایر ویژگیها را در یک بعد ادغام میکند، که منجر به از بین رفتن ویژگیهای فضایی از GCN میشود. بر این اساس، AM-RGCN نسبت به دو نوع دیگر در پردازش همبستگی های مکانی-زمانی بهتر است.
۶٫ نتیجه گیری و کار آینده
ما شبکه کانولوشن گراف چند جزئی تقویت شده (AM-RGCN) را برای انجام پیشبینی جریان ترافیک پیشنهاد میکنیم. به طور خاص، ماژول چند جزئی تقویتشده را برای ثبت تغییرات زمانی دورهای که در سریهای ترافیک ظاهر میشود، معرفی میکنیم. سپس، ما یک معماری رمزگذار-رمزگشا را پیادهسازی میکنیم که در آن رمزگذار با هدف گرفتن همبستگیهای مکانی-زمانی و رمزگشا طراحی شده است تا نمایشهایی با ابعاد بالا از پیشبینیهای چند مرحلهای را به دست آورد.
در واقع، ساختار گراف اتخاذ شده در این مقاله یک گراف بدون جهت است. در عمل، ساختار گراف شبکه راه هدایت می شود و شرایط در شبکه ترافیک به صورت پویا تغییر می کند. در آینده به بهبود عملکرد پیش بینی جریان ترافیک با استفاده از نمودار جهت دار و مکانیزم توجه خواهیم پرداخت. با این حال، AM-RGCN ما یک چارچوب کلی پیشبینی مکانی-زمانی برای دادههای ساختار نمودار است، بنابراین میتوان آن را برای سایر وظایف پیشبینی مکانی-زمانی مانند پیشبینی سرعت ترافیک نیز اعمال کرد.