۱٫ مقدمه
با توسعه سریع فناوری اینترنت موبایل و رشد دستگاههای هوشمند GPS داخلی، شبکههای اجتماعی مبتنی بر مکان (LBSN) مانند Foursquare و Gowalla به سرعت در حال رشد و محبوب شدن هستند. مردم عادت دارند نظرات خود را در مورد مکان هایی که در LBSN بازدید می کنند به اشتراک بگذارند. رفتار ورود کاربران محدود و تحت تأثیر اطلاعات زمینه ای متعدد (عامل زمان، طبقه بندی و عامل جغرافیایی و غیره) در LBSN است. توصیه نقطه مورد علاقه (POI) یکی از مهم ترین برنامه ها است که پیش بینی لیستی از POI های بازدید نشده مورد علاقه کاربران است. با ظهور صنعت گردشگری آنلاین، الگوریتم توصیه می تواند خدمات شخصی سازی شده را ارائه دهد و به مسافران کمک کند تا موارد جالب را پیدا کنند. مکانها—مانند توصیه رستورانهایی که در هنگام سفر کاربران با سلیقه آنها مطابقت دارند.۱ ].
فیلتر مشارکتی (CF) معمولاً برای توصیه POI با استفاده از بررسیهای کاربر به دلیل مدل ساده آن استفاده میشود. علاوه بر این، روشهای CF مبتنی بر مدل مانند فاکتورسازی ماتریس (MF) و عاملبندی ماتریس احتمال انواع آن (PMF) اغلب برای توصیه POI استفاده میشود زیرا میتواند دادههای بازخورد ضمنی یک ماتریس POI کاربر را بدست آورد [ ۲ ، ۳ ]. تأثیر عوامل پنهان بر ترجیحات و ویژگیهای POI کاربران را در نظر میگیرد و از حاصل ضرب درونی بردارهای پنهان کاربر و POI برای پیشبینی احتمال دسترسی کاربر به POI استفاده میکند. با این حال، تکنیک های مبتنی بر CF اغلب از مشکل پراکندگی داده ها رنج می برند.
برای بهبود عملکرد توصیه، بسیاری از اطلاعات زمینه ای (عامل زمان، طبقه بندی، عامل جغرافیایی) در روش CF و MF گنجانده شده است، که مشکل پراکندگی ماتریس را کاهش می دهد. به عنوان مثال، یوان یک مدل توصیه POI مبتنی بر CF را همراه با اطلاعات زمان ایجاد کرد، که نشان میدهد رفتار ورود کاربر دارای تناوب است و تحت تأثیر عامل زمان است [ ۴ ]. با این حال، آنها از در نظر گرفتن مسیر پیوسته کاربر برای به دست آوردن شباهت کاربر صرف نظر می کنند. خو و همکاران [ ۵] یک روش توصیه POI را بر اساس مسیرهای پیوسته کاربران پیشنهاد کرد و آنها توالی دسترسی مشترک مجازی را برای کاربران ایجاد کردند تا کاربرانی را با ترجیحات یکسان پیدا کنند. از آنجایی که دستههای POI اطلاعات مهمی را در مورد علایق و عادات کاربران میرسانند [ ۶ ]، او و همکاران. با پیشبینی اولویتهای کاربران برای دستهها و رتبهبندی نامزدهای POI بر اساس اولویتهای دسته، یک روش پیشنهادی POI جدید پیشنهاد کرد [ ۷ ]. به دلیل اینکه تعداد دستههای POI بسیار کوچکتر از POI هستند، تأثیر پیشبینی خوبی بر روی دادههای پراکنده ورود پیدا میکند. لیو از درخت سلسله مراتبی دسته برای مدلسازی ترجیحات کاربر استفاده کرد [ ۸]. تأثیر جغرافیایی مکان ها بر رفتار حرکتی کاربران مطالعه شده و به طور گسترده برای توصیه POI استفاده می شود. مشخص شد که مکانهای ورود کاربر یک پدیده خوشهبندی آشکار را نشان میدهند [ ۹ ]. برخی از مطالعات توزیع بررسیهای تاریخی همه کاربران را در یک مدل بیان میکنند، مانند توزیع قانون قدرت [ ۱۰ ] یا توزیع گاوسی چند مرکزی، و تأثیر جغرافیایی مکان را بررسی میکنند. با این حال، با توجه به علایق و سبک زندگی متفاوت کاربران، مدلسازی ویژگیهای توزیع فضایی کاربر ضروری است. پژوهش حاضر با در نظر گرفتن یک یا دو عامل نمیتواند عملکرد بهتری داشته باشد و باید ویژگیهای تأثیرگذارتری را برای بهبود اثربخشی توصیههای POI ادغام کرد.
با الهام از دیدگاههای بالا، برای در نظر گرفتن عوامل بیشتر برای بهبود عملکرد توصیههای POI، این مقاله یک روش توصیهشده POI شخصیشده جدید با کاوش در تأثیر متوالی، دستهبندی و جغرافیایی پیشنهاد میکند. در ابتدا، ما یک روش ساخت توالی دسترسی مشترک مجازی بهبود یافته را پیشنهاد میکنیم و کاربرانی را با عادات حرکتی مشابه با کاربران هدف پیدا میکنیم. در همین حال، یک روش محاسبه شباهت کاربر جدید با توجه به ترتیب بررسی و محاسبه تمایز دسته پیشنهاد شده است. به طور خاص، نمایش بردار ترجیحی کاربر برای POI بر اساس مدل کیسه کلمات پیوسته (CBOW) آموخته می شود. سپس، نمایش بردار ترجیح کاربر با یک روش CF ترکیب میشود تا احتمال ترجیح رفتاری کاربران هدف برای POI به دست آید. علاوه بر این، یک مدل تخمین تراکم هسته (KDE) برای بدست آوردن احتمال ترجیح جغرافیایی کاربر از POIها استفاده می شود. در نهایت، یک لیست توصیهای از POIهای k بالا با توجه به احتمال ترجیح رفتاری کاربر و احتمال ترجیح جغرافیایی که به عنوان یک جمع وزنی محاسبه شده و به ترتیب نزولی مرتب شدهاند، تولید میشود.
مشارکت های اصلی کار ما به شرح زیر خلاصه می شود:
- ۱٫
-
در این مقاله، ما یک چارچوب پیشنهادی POI جدید برای بهرهبرداری از تأثیر متوالی، دستهبندی و جغرافیایی (به نام SCGM) پیشنهاد میکنیم و احتمال ترجیح کاربر را از ترکیب خطی CF و KDE محاسبه میکنیم.
- ۲٫
-
یک روش محاسبه شباهت کاربر جدید بر اساس توالی دسترسی مشترک مجازی ساخته شده از کاربران و تمایز طبقه بندی POI پیشنهاد شده است.
- ۳٫
-
به طور خاص، ما CBOW را معرفی می کنیم تا تأثیر متنی POI در دنباله را به تصویر بکشیم و اولویت کاربران را برای POI بدست آوریم.
- ۴٫
-
تعداد زیادی آزمایش انجام شده بر روی دو مجموعه داده LBSN نشان می دهد که روش پیشنهادی ما به طور قابل توجهی بهتر از روش های دیگر از نظر دقت، یادآوری و امتیاز F1 عمل می کند.
بقیه مقاله به شرح زیر سازماندهی شده است: ما روش های توصیه POI را در بخش ۲ مرور می کنیم . در بخش ۳ ، برخی از کارهای مقدماتی شرح داده شده است. بخش ۴ روش پیشنهادی POI پیشنهادی را شرح می دهد. بخش ۵ نتایج تجربی و تجزیه و تحلیل پارامتر مربوطه را ارائه می دهد. در نهایت، بخش ۶ نتیجه گیری را ارائه می کند.
۲٫ کارهای مرتبط
توصیه های POI توجه بسیار بیشتری از سوی دانشگاه ها به خود جلب کرده و به یک جهت کاربردی مهم در خدمات شبکه های اجتماعی مبتنی بر مکان تبدیل شده اند. برای پیشبینی بهتر اولویتهای کاربر، افراد سعی میکنند عوامل زمینهای متعددی را که بر رفتار ورود کاربر تأثیر میگذارد، در مدل توصیه بگنجانند.
۲٫۱٫ اطلاعات زمانی و ترتیبی
رفتار و علایق کاربر در طول زمان در LBSN تغییر می کند. محققان سعی می کنند با ترکیب اطلاعات زمان، عملکرد سیستم توصیه POI را بهبود بخشند [ ۱۱ ، ۱۲ ]. برخی از محققان عمدتاً زمان ورود کاربران را به چند دوره تقسیم می کنند و ترجیحات کاربران را برای مکان در هر دوره یاد می گیرند. از آنجایی که افراد در روزهای هفته و غیر هفته رفتار ملاقات متفاوتی دارند، حسینی و همکاران. [ ۱۳ ] چارچوب پیشنهادی را بر اساس ترجیحات زمانی هفتگی کاربران پیشنهاد کرد. آنها ویژگی های ترجیحی سوابق ورود افراد را در روزهای هفته و آخر هفته بررسی می کنند. گائو و همکاران [ ۱۴] یک مدل رتبهبندی مشارکتی اجتماعی حسگر فضایی-زمانی با در نظر گرفتن پراکندگی دادهها برای توصیه پیشنهاد کرد. بر اساس چارچوب فاکتورسازی تانسور است و هر بعد با ویژگیهای بالقوه کاربر، زمان ورود، مکان ورود و اطلاعات اجتماعی مطابقت دارد. گان و همکاران [ ۱۵ ] اولویت مبتنی بر حافظه را در طرح توصیه POI بر اساس تئوری حافظه ابینگهاوس یکپارچه کرد. آنها یک مدل تضعیف مبتنی بر حافظه برای مدیریت اولویت POI کاربر ایجاد می کنند و شباهت اولویت POI بین کاربران را از طریق سوابق ورود آنها در LBSN محاسبه می کنند. ژانگ و همکاران [ ۱۶ ] مفهوم چسبندگی POI را معرفی کرد و یک چارچوب CF پیشنهاد کرد که اولویت حافظه و چسبندگی POI را ترکیب می کند.
۲٫۲٫ اطلاعات دسته
POI معمولاً دارای یک یا چند ویژگی دسته است که به طور قابل توجهی بر رفتار دسترسی کاربر تأثیر می گذارد. اطلاعات دسته بندی POI نقش مهمی در مدل سازی ترجیحات خاص کاربران دارد. در واقع، تصمیم POI کاربر تحت تأثیر اولویت دسته بندی آنها قرار می گیرد و کاربران با اولویت های دسته بندی یکسان تمایل به نشان دادن عادات ثبت نام یکسان دارند. به عنوان مثال، مسافران تمایل دارند در مکان هایی مانند هتل ها چک-این کنند، در حالی که دانشجویان در مکان هایی مانند کتابخانه چک-این می کنند. بیشتر مطالعات بر اساس رابطه بین کاربران و POI ها انجام می شود، اما مطالعات کمی بر رابطه بین کاربران و دسته ها تمرکز می کنند. بائو و همکاران [ ۱۷ ] شباهت کاربر را با محاسبه انحراف دسته کاربر در روش توصیه CF مبتنی بر کاربر محاسبه کرد. لیو و همکاران [ ۱۸] POI را بر اساس دسته بندی خوشه بندی کرد و ماتریس دسته کاربر را برای جایگزینی ماتریس POI کاربر با توجه به داده های ثبت نام تاریخی کاربران ایجاد کرد. سپس، فناوری تجزیه ماتریس برای بررسی دسته بندی top-k که کاربران می خواستند بعداً بازدید کنند، استفاده می شود. ژو و همکاران [ ۱۹ ] رفتار ورود کاربران به انواع مختلف POI در زمانهای مختلف را بهعنوان منحنیهای زمانی در مطالعه خود توصیف کردند. آنها یک الگوریتم پیشنهاد مکان مبتنی بر تاب خوردگی زمان پویا و بهترین الگوریتم توصیه مکان مبتنی بر جفت منحنی را پیشنهاد کردند. رحمانی و همکاران [ ۶ ] یک مدل توصیه POI بر اساس آگاهی از دسته پیشنهاد کرد که ویژگیهای اطلاعات دستهبندی POI را در بر میگرفت. لی و همکاران [ ۲۰] یک مسیر مجازی را به چارچوب توصیه CF اعمال کرد و شباهت مسیرها را با تجزیه ماتریس دسته کاربر و ساخت یک نمودار Voronoi محاسبه کرد. آنها فقط بردار ویژگی دسته را در اطلاعات دسته برجسته می کنند، اما تمایز دسته را نادیده می گیرند، که می تواند به طور شهودی شباهت بین کاربران را منعکس کند.
۲٫۳٫ اطلاعات جغرافیایی
از آنجایی که رفتار ورود کاربران اساساً یک تعامل فیزیکی بین کاربران و POI است، کاربر ترجیح می دهد به POI نزدیک آنها دسترسی داشته باشد. بنابراین، عوامل جغرافیایی بر رفتار ورود کاربران تأثیر می گذارد و تأثیر جغرافیایی استخراج می تواند عملکرد توصیه های POI را بهبود بخشد. وانگ و همکاران [ ۲۱ ] دریافتند که تأثیر بین POI نامتقارن و متفاوت است، و آنها حساسیت جغرافیایی و فاصله فیزیکی را برای شبیه سازی تأثیر جغرافیایی پواسون بین دو POI تجزیه و تحلیل کردند. آنها عملکرد توصیه را با ادغام اثرات جغرافیایی POI خاص در مدل توصیه بهبود می بخشند. رحمانی و همکاران [ ۲۲] مدلهای جغرافیایی را در روش تجزیه ماتریس منطقی گنجانید و یک مدل پیشنهادی POI LGLMF را پیشنهاد کرد. با در نظر گرفتن اطلاعات جغرافیایی از جنبه کاربر و POI به ترتیب اثر توصیه را بهبود می بخشد. لی و همکاران [ ۲۳ ] یک مدل تجزیه جغرافیایی سلسله مراتبی رتبه-GEOMF را پیشنهاد کرد، که جاسازی کاربران و POI ها را بر اساس فرکانس ورود کاربر می آموزد. لیو و همکاران [ ۲۴ ] الگوهای تحرک کاربر را با ثبت تأثیر جغرافیایی بر رفتار ورود کاربران مدلسازی کرد و یک چارچوب عاملبندی احتمال جغرافیایی را پیشنهاد کرد که شامل ترجیحات کاربر، تأثیر جغرافیایی و الگوهای رفتار کاربر است. یین و همکاران [ ۲۵] تأثیر مناطق جغرافیایی بر ترجیح کاربر را مورد مطالعه قرار داد. آنها مدل ترجیح کاربر را بر اساس ترجیحات جمعی مردم در منطقه هدف و ترجیحات شخصی کاربران در منطقه مجاور ایجاد می کنند. هنگام توصیه POI برای کاربران، ارزش دارد که تأثیر جغرافیایی شخصی مکان را به عنوان توزیع فاصله جداگانه برای هر کاربر مدل سازی کنیم.
۳٫ مقدمات
تعاریف کلیدی توصیه POI و معرفی مختصری از کلمه embedding در این بخش توضیح داده شده است.
۳٫۱٫ تعاریف
تعریف ۱
(ثبت ورود). اجازه دهید U = {u1,u2,…,un}مجموعه ای از کاربران در LBSN باشد، V = {v1,v2,…,vn}مجموعه ای از POI و C = باشد {c1,c2,…,cn}مجموعه ای از دسته های POI باشد. V توسط {lat,lon}، جایی که latعرض جغرافیایی یک POI است و lonطول جغرافیایی است. همه سوابق ورود مرتب شده بر اساس زمان ورود به صورت CH = تعریف می شوند {ch1,ch2,…,chn}، جایی که chiنشان دهنده تمام سوابق ورود به ui، و هر رکورد ورود به عنوان نشان داده شده است ch=(u,v,t)، که نشان می دهد POI v توسط کاربر u در زمان t بازدید شده است.
تعریف ۲
(توالی ورود). دنباله چک در uiرا می توان به عنوان تعریف کرد seqri= {v1,v2,…,vn}، جایی که r نشان دهنده دوره r در یک روز است و POI ها بر اساس زمان ورود مرتب می شوند. علاوه بر این، تمام چک در توالی از uiبه عنوان مشخص می شوند Sui= (seq1i,seq2i,…,seqni).
تعریف ۳
(POI متنی). در ترتیب ورود seqri، هدف viو زمینه ای آن {vi−w:vi+w}POI هایی با زمان های مختلف ورود هستند که w نشان دهنده اندازه پنجره متنی است.
تعریف ۴
(توصیه POI). توصیه POI این است که با استخراج سوابق ثبت نام کاربر، فهرستی از POI های بازدید نشده را به یک کاربر توصیه کنید. با توجه به تمام سوابق ثبت نام CH، یک لیست رتبه بندی شده از POIs top-k = {v1,v2,..,vk}برای یک کاربر برگردانده می شود.
۳٫۲٫ جاسازی کلمه
اخیراً، فناوری جاسازی کلمه به دادهکاوی مسیر و سیستمهای توصیه متوالی گسترش یافته است [ ۲۶ ]. این به CBOW یا Skip-Grams بستگی دارد که یادگیری عصبی و بردارهای کلمه آموخته شده را تنظیم کند که به طور مؤثر روابط مهمی را در اطلاعات متنی در مجموعه داده آموزشی ثبت کند. در سیستم توصیه POI، دنباله ورود کاربر هدف به عنوان یک جمله در نظر گرفته می شود و POI کلمه در جمله است که به عنوان یک بردار یک داغ نشان داده می شود. در این مقاله از مدل CBOW برای آموزش بردار POI استفاده شده است. این POI مرکزی را با توجه به POI های اطراف پیش بینی می کند، که دارای مزایای بهره وری بالا است.
در طول تخمین احتمال ایجاد یک POI مرکزی، هر POI دو نمایش متفاوت دارد. یکی بردار POI مرکزی و دیگری بردار POI متنی است. لازم است میانگین بردارهای POIهای متنی را گرفته و یک عملیات softmax روی حاصل ضرب داخلی بردارها انجام دهیم تا احتمال POI مرکزی ایجاد شود. همانطور که در شکل ۱ نشان داده شده است ، وقتی اندازه پنجره داده شده دو باشد، POIهای متنی هستند vi−۲,vi−۱,vi+1,vi+2. سپس، احتمال تولید vIبا عملیات softmax بر روی حاصل ضرب داخلی بردار مطابق با معادله ( ۱ ) است:
جایی که D = { ۰ , ۱ , … , | D − ۱ | }مجموعه شاخص است، | D |طول فرهنگ لغت است. علاوه بر این، پمنو qمنهنگامی که POI نمایه شده با i به ترتیب به عنوان مرکز POI و POI متنی استفاده می شود، بردارهای POI را نشان می دهد. با انجام بهینه سازی تابع هدف، بردار تک داغ POI در نمایش برداری کم بعدی تعبیه شده و فرمول آن به صورت زیر است:
۴٫ روش پیشنهادی
۴٫۱٫ چارچوب SCGM
در این مقاله، ما یک روش توصیه POI را پیشنهاد میکنیم که از تأثیر متوالی، دستهبندی و جغرافیایی (به نام SCGM) بهرهبرداری میکند. SCGM یک مدل پیشنهادی ترکیبی POI از CF و تخمین چگالی هسته است. در الگوریتم ۱ توضیح داده شده است.
ما ابتدا یک توالی دسترسی مشترک مجازی بر اساس الگوریتم ۲ می سازیم و شباهت بین مسیرهای کاربر را مطابق الگوریتم ۳ محاسبه می کنیم. سپس، SCGM احتمال ترجیح رفتاری کاربر را طبق الگوریتم ۴ دریافت می کند و بر اساس CF با محاسبه شباهت مسیر است. علاوه بر این، با توجه به اینکه نزدیکی جغرافیایی به طور قابلتوجهی بر رفتار ورود کاربران تأثیر میگذارد، SCGM بر اساس KDE احتمال اولویت جغرافیایی را دریافت میکند. در نهایت، احتمال ترجیح رفتاری کاربر و احتمال ترجیح جغرافیایی در یک مدل خطی ترکیب میشوند و لیست توصیهای از POIهای k بالا تولید میشود. به طور رسمی، αیک ضریب وزنی جغرافیایی، احتمال آن کاربر است تومناز POI بازدید می کند vjرا می توان به صورت زیر بیان کرد:
الگوریتم ۱: روش SCGM. |
ورودی: کاربر مورد نظر ui، تمام سوابق ورود CHو پارامتر α |
خروجی: لیست Top-k از POI |
۱: chi←CH |
۲: برای هر کدام uj∈U انجام دادن |
۳: chj←CH |
۴: یک توالی دسترسی مشترک مجازی بسازید seqijطبق الگوریتم ۲ |
۵: بدست آوردن sim(ui,uj)طبق الگوریتم ۳ |
۶: پایان برای |
۷: برای هر کدام vj∈V انجام دادن |
۸: احتمال ترجیح رفتاری کاربر را بدست آورید pscore(ui,vj)طبق الگوریتم ۴ |
۹: احتمال ترجیح جغرافیایی کاربر را بدست آورید pgeo(vj|chi)بر اساس KDE |
۱۰: محاسبه احتمال ترجیح کاربر score(ui,vj)مطابق با معادله ( ۳ ) |
۱۱: پایان برای |
۱۲: POIهای k بالا را انتخاب کنید که به صورت نزولی بر اساس احتمال ترجیح کاربر مرتب شوند. لیست Top-k را برگردانید . |
۱۳: لیست Top-k را برگردانید . |
الگوریتم ۲: روش ساخت یک توالی دسترسی مشترک مجازی. |
ورودی: سوابق ورود chi,chj |
خروجی: استومن، استوj، s eqمن ج |
۱: یک روز را به چهار دوره زمانی تقسیم کنید تی= {تی۱،تی۲،تی۳،تی۴} |
۲: استومن← { ϕ } ،استوj← { ϕ } |
۳: برای هر کدام Trدر T انجام دهید |
۴: توالی های ورود را ایجاد کنید seqriو seqrj |
۵: Sui←Sui∩{seqri} |
۶: Suj←Suj∩{seqrj} |
۷: برای هر کدام vk∈seqri انجام دادن |
۸: tv1←seq |
۹: tvk←tvk– tv1 |
۱۰: tv1←۰ |
۱۱: پایان برای |
۱۲: برای هر کدام vk∈seqrj انجام دادن |
۱۳: tv1←seq |
۱۴: tvk←tvk– tv1 |
۱۵: tv1←۰ |
۱۶: پایان برای |
۱۷: برای هر کدام vn∈seqri انجام دادن |
۱۸: setn←{ϕ} |
۱۹: پایان برای |
۲۰: برای هر کدام vm∈seqrj انجام دادن |
۲۱: برای هر کدام vn∈seqri انجام دادن |
۲۲: tmn←|tm−tn| |
۲۳: پایان برای |
۲۴: حداقل مقدار را پیدا کنید tmn |
۲۵: setn←setn∩{vm} |
۲۶: پایان برای |
۲۷: پایان برای |
الگوریتم ۳: محاسبه شباهت دو کاربر. |
ورودی: Sui، Suj، seqij |
خروجی: sim(ui,uj) |
۱: برای هر کدام seqri∈Sui انجام دادن |
۲: برای هر کدام vn∈seqri انجام دادن |
۳: sim(vn,setn)=∑vm∈setncos(vn,vm)|setn| |
۴: پایان برای |
۵: تفاوت دسته را محاسبه کنید F(seqrij)مطابق با معادله ( ۵ ) |
۶: محاسبه کنید sim(seqri,seqrj)مطابق با معادله ( ۶ ) |
۷: پایان برای |
۸: سیم کارت را محاسبه کنید (ui,uj)مطابق با معادله ( ۷ ) |
الگوریتم ۴: محاسبه اولویت رفتاری کاربر بر اساس الگوریتم CF. |
ورودی: کاربر مورد نظر ui، POI هدف vj، تمام سوابق ورود CH |
خروجی: احتمال ترجیح رفتاری کاربر pscore( ui، vj) |
۱: برای uj∈Uانجام دادن |
۲: chj←CH |
۳: برای هر کدام vk∈chj انجام دادن |
۴: بردار پنهان را راه اندازی کنید vkبا تعبیه مدل |
۵: پایان برای |
۶: محاسبه کنید ujبا تجمیع vk∈chj |
۷: uj=∑vk∈chjvk∣∣chj∣∣ |
۸: pcontextuj,vj←cosine(uj,vj) |
۹: پایان برای |
۱۰: محاسبه کنید pscore(ui,vj)مطابق با معادله ( ۸ ) |
۴٫۲٫ توالی دسترسی مشترک مجازی را بسازید
شباهت مسیر کاربر برای نشان دادن شباهت ترجیحات دسترسی در بین کاربران در این مقاله استفاده شده است. برای یافتن کاربرانی که شباهت زیادی به کاربر هدف دارند، رفتار مشابه کاربران را در ترتیب ثبت ورود تاریخی بررسی میکنیم. الگوریتم ۲ روش ساخت یک توالی دسترسی مشترک مجازی را نشان می دهد seqij={seq1ij,…,seqrij,…,seqnij}بر اساس تاریخچه ورود دو کاربر uiو uj، و seqrijنشان دهنده توالی مشترک مجازی در هر دوره زمانی است.
اولاً، توالیهای ورود کاربران در دورههای مختلف ایجاد میشوند. تحت تأثیر عوامل زمان، کاربران در زمان های مختلف روز رفتار متفاوتی را برای ورود نشان می دهند. بنابراین، تقسیم یک روز به دوره های مختلف می تواند رفتار ورود کاربر را بهتر بیان کند. به طور خاص، یک روز به چهار دوره زمانی تقسیم می شود T={T1,T2,T3,T4}، جایی که T1={0:00−۶:۰۰}، T2={6:00−۱۲:۰۰}، T3={12:00−۱۸:۰۰}، و T4={18:00−۲۴:۰۰}. شباهت بین کاربران با تحلیل رفتار تاریخی کاربران هدف مشابه سایر کاربران در هر دوره محاسبه می شود. همانطور که در شکل ۲ نشان داده شده است ، کاربر هدف uiبازدید می کند v1، v2,…, vnدر یک دوره Tr، سپس ترتیب ورود می تواند به صورت بیان شود seqri=(v1,v2,…,vn). در مقداردهی اولیه، مربوطه setkاز POI vkبازدید شده توسط کاربر هدف خالی تنظیم شده است. در نتیجه، یک دنباله ورود دارای n مجموعه است، که در آن n تعداد POI های موجود در دنباله ورود را نشان می دهد.
ثانیا، ما زمان بررسی POI را برای بررسی الگوی رفتار بین کاربران در هر دوره تنظیم میکنیم (خطوط ۷-۱۱ در الگوریتم ۲). برای یک دوره معین Tr، شباهت بین کاربران عمدتاً با رفتار تاریخی مشابه بین کاربران آشکار می شود. با این حال، توالی اعلام حضوری ساخته شده نمیتواند الگوهای رفتار ورود مشابه دو کاربر را به دقت توصیف کند. برای مثال، uiاز ساعت ۶ صبح تا ۹ صبح از پارک، کتابخانه و شرکت بازدید کرد ujهر چند از ساعت ۹ صبح تا ۱۲ بعد از ظهر از پارک، کتابخانه و شرکت بازدید کرد uiو ujالگوهای رفتار ورود مشابهی دارند، به دلیل تفاوت در زمان ورود به عنوان کاربرانی با اولویت های متفاوت در نظر گرفته می شوند. بنابراین، برای تشریح دقیق شباهت بین کاربران، سعی میکنیم با پردازش زمان ورود هر POI، یک توالی دسترسی مشترک مجازی بسازیم. به طور خاص، برای هر ترتیب ورود، تنظیم کنید tv1تا زمان ورود اولین رکورد در دنباله باشد، و زمان ورود به سایر رکوردها را به گونه ای تغییر دهید که فاصله زمانی نسبت به مهر زمانی اولین رکورد حفظ شود. پس از تنظیم زمان، POI های توالی کاربر مانند قبل باقی می مانند.
در نهایت، در یک دوره معین، توالی دسترسی مشترک مجازی دو کاربر را می سازیم seqriو seqrj. مقدار دهی اولیه یک مجموعه setnبرای هر POI vn∈ seqri، و، برای هر POI vm∈ seqrj، فاصله زمانی ورود را محاسبه می کنیم vnو vm-سپس، برای یافتن حداقل فاصله زمانی ورود و تقسیم vmبه درون setnمربوط به vn. همانطور که در شکل ۲ نشان داده شده است ، توالی دسترسی مشترک مجازی کاربر uiو کاربر ujدر دوره تقسیم بندی شده ساخته شده است Tr، و POI بازدید شده کاربر ujبه مجموعه مربوطه اختصاص داده می شود. مجموعه خالی را می توان با روش ساخت به دست آورد. به عنوان مثال، اگر vj3و vj2دارای حداقل فاصله زمانی ورود به vi2، سپس آنها به تقسیم می شوند set2.
۴٫۳٫ محاسبه شباهت کاربر جدید
پس از ساخت توالی دسترسی مشترک مجازی، یک روش جدید برای محاسبه شباهت بین کاربران پیشنهاد میکنیم. در الگوریتم ۳ نشان داده شده است و شباهت را می توان با اطلاعات زمینه ای و تمایز طبقه بندی محاسبه کرد.
رفتار ورود کاربران اغلب تحت تأثیر اطلاعات زمینهای قرار میگیرد که از طریق آن میتوان عادات رفتاری و الگوهای حرکتی کاربران را به طور کامل بررسی کرد. ما در این مقاله مدل جاسازی کلمه را معرفی میکنیم، یک POI واحد به عنوان یک کلمه در نظر گرفته میشود و هر POI به یک بردار پنهان تبدیل میشود. با ساخت توالی مشترک مجازی، میتوانیم محاسبه شباهت مسیرهای دو کاربر را به محاسبه شباهت بین هر یک تبدیل کنیم. vn∈seqriو مجموعه مربوط به آن setn. محاسبه به شرح زیر است:
با توجه به پراکندگی سوابق ورود، تعداد کمی از POI های رایج برای دسترسی کاربران وجود دارد. بنابراین، یافتن کاربرانی با اولویت دسترسی یکسان دشوار است. ما مفهوم تمایز دسته را برای یافتن کاربرانی با اولویتهای دسترسی قابلشکل معرفی میکنیم. شباهت بین کاربران را می توان به طور موثر از طریق اطلاعات دسترسی کاربران به دسته محاسبه کرد. تمایز دسته، میزان شباهت را در بین کاربران بر اساس ترجیح آنها برای دسترسی به دسته ها ارزیابی می کند. با الهام از فرکانس معکوس سند (IDF)، دستهای که اکثر کاربران به آن دسترسی دارند، اولویت دسترسی شخصی کاربر را نشان نمیدهد، در حالی که دستهای که تنها چند کاربر به آن دسترسی دارند میتواند اولویت کاربر را منعکس کند، و کاربرانی که به این دسته دسترسی دارند اغلب شباهت بالایی دارند. تمایز دسته F(seqrij)به صورت زیر نشان داده شده است:
شباهت ترتیب ورود در هر دوره را می توان با محاسبه به دست آورد sim(vn,setn)و F(seqrij)و شباهت بین کاربران را می توان با اندازه گیری نتایج هر دوره زمانی بدست آورد. فرمول محاسباتی خاص در ( ۶ ) و ( ۷ ) آورده شده است:
به طور مشخص، seqrijمجموعه ای از دسته بندی های مشترک را نشان می دهد که توسط دو کاربر در طول دوره معین به آنها دسترسی پیدا کرده اند Tr، و nqنشان دهنده تعداد کل کاربرانی است که از رده q ام بازدید می کنندseqrij، و len(⋅)برای محاسبه طول دنباله کاربر استفاده می شود.
۴٫۳٫۱٫ توصیه POI بر اساس CF
الگوریتم CF مبتنی بر کاربر قصد دارد POI بازدید شده توسط کاربران با اولویت های مشابه را توصیه کند. فقط باید شباهت بین کاربر هدف و سایر کاربران را با توجه به سوابق ثبت ورود تاریخی تجزیه و تحلیل کند و سپس احتمال ورود کاربر مورد نظر را در یک POI خاص بر اساس POI های دسترسی کاربران مشابه پیش بینی می کند و یک عدد ایجاد می کند. لیست توصیه در الگوریتم ۴ نشان داده شده است، شباهت کاربر بر اساس الگوریتم ۳ که قبلا معرفی شد به دست می آید، و فرمول بدست آوردن احتمال ترجیح رفتاری کاربر از POI را می توان به صورت زیر بیان کرد:
جایی که |Fui|مجموعه شباهت کاربر است، cuj,vjنشان می دهد که آیا یک کاربر ujاز یک POI بازدید می کند vjو مقدار آن ۰ یا ۱ است، pcontextuj,vjاحتمال ترجیح بازدید کاربر برای POI است که طبق معادله ( ۱۰ ) به دست آمده است.
از آنجایی که توالی بررسی POI کاربر ترجیحات کاربر را منعکس می کند، جاسازی های POI vjدر ترتیب ورود به آنها می توان برای مدل سازی ترجیحات کاربر استفاده کرد. به طور خاص، ما محاسبه می کنیم ujبا تجمع متوسط، و می تواند یکپارچگی و نرمی جاسازی ورودی را با تبدیل خطی حفظ کند:
احتمال ترجیح دسترسی کاربر به POI را می توان به صورت زیر بیان کرد:
۴٫۳٫۲٫ توصیه POI بر اساس KDE
همانطور که اولین قانون جغرافیایی توبلر اشاره می کند، اشیاء جغرافیایی در توزیع مکانی، با خوشه بندی، تصادفی و منظم بودن به هم مرتبط هستند. هر چه فاصله نزدیکتر باشد، رابطه نزدیکتر خواهد بود. در عمل، تاثیر جغرافیایی باید برای هر کاربر متفاوت باشد. به عنوان مثال، برخی از افراد ترجیح می دهند معمولاً از POI های نزدیک بازدید کنند و برخی از افرادی که ترجیح می دهند با وسیله نقلیه سفر کنند، معمولاً POI های دور را کاوش می کنند. رفتار تلفن همراه کاربران تحت تأثیر فاصله جغرافیایی قرار می گیرد و سوابق ورود آنها دارای ویژگی های توزیع فضایی خاصی برای توصیه های POI است. ما به طور تصادفی سه کاربر را از مجموعه داده انتخاب کردیم. شکل ۳توزیع check-in را در فاصله بین هر جفت POI در سوابق ورود آنها توضیح می دهد. مشاهده می شود که تأثیر جغرافیایی برای هر کاربر متفاوت است. کاربر ۱ دوست دارد به POI با برد کوتاه دسترسی داشته باشد، کاربر ۲ دوست دارد به POI فراتر از یک فاصله مشخص دسترسی داشته باشد و کاربر ۳ فرکانس دسترسی یکسانی را در محدوده خاصی دارد. بنابراین، تاثیر اطلاعات جغرافیایی بر کاربران نباید به عنوان یک توزیع کلی مدل شود، بلکه باید به صورت شخصی مدل سازی شود. بنابراین، مطالعه تأثیر جغرافیایی شخصی برای رفتارهای ورود کاربر ضروری است.
مشخص شده است که KDE میتواند ویژگیهای توزیع شخصی شده POI را بر اساس سوابق ثبت نام تاریخی کاربران به دست آورد، که راحتی زیادی برای توصیه POI به ارمغان میآورد. بنابراین، ما KDE را برای مدلسازی ترجیحات شخصی کاربر برای POI از جنبه جغرافیایی اتخاذ میکنیم. دقت تخمین چگالی هسته تا حد زیادی به انتخاب بستگی دارد K(⋅)و h ، کجا K(⋅)تابع هسته است و σانحراف معیار است با توجه به ویژگی های داده های ورود، تابع هسته گاوسی به عنوان تابع هسته در این مقاله استفاده شده است. h پهنای باندی است که با محاسبه انحراف استاندارد POI با توجه به سوابق ثبتنام تاریخی کاربران به دست میآید:
بر اساس تأثیر عوامل جغرافیایی، احتمال کاربر تومنبازدید از یک POI به شرح زیر است:
۵٫ نتایج
۵٫۱٫ مجموعه داده ها
در آزمایش، ما از دو مجموعه داده ارائه شده توسط Foursquare [ ۲۷ ] استفاده میکنیم که شامل بررسیهای شهر نیویورک و توکیو از ۱۲ آوریل ۲۰۱۲ تا ۱۶ فوریه ۲۰۱۳ است. مجموعه داده شامل پنج ویژگی با شناسه کاربر (ID) است. محل ورود، طول جغرافیایی مکان، عرض جغرافیایی مکان و زمان ورود. در مرجع. [ ۲۰ ]، لی و همکاران. ۱۰ را به عنوان آستانه حذف کاربران غیرفعال و POI های غیرفعال در نظر بگیرید. با الهام از این، ما برخی از پیش پردازش ها را روی مجموعه داده انجام می دهیم تا کاربرانی را که کمتر از ۱۰ POI مختلف بازدید کرده اند و آن دسته از POI هایی که کمتر از ۱۰ بار توسط کاربران بازدید شده اند را حذف کنیم. آمار اولیه دو مجموعه داده در جدول ۱ نشان داده شده است. علاوه بر این، ۸۰ درصد از بررسی ها به صورت تصادفی به عنوان داده های آموزشی و ۲۰ درصد از بررسی ها برای آزمایش انتخاب می شوند.
۵٫۲٫ معیارهای ارزیابی
عملکرد مدل پیشنهادی در این مقاله با استفاده از Precision@k ، Recall@k و امتیاز F1 ارزیابی شده است.
نرخ دقت نسبت POI به درستی پیش بینی شده به تعداد کل POI توصیه شده است:
نرخ فراخوان نسبت POI به درستی پیش بینی شده به تعداد کل POI بازدید شده واقعی است:
امتیاز F ۱ بر اساس دقت و میزان یادآوری شاخص ارزیابی جامع است:
جایی که Lkلیست توصیه شده Top-k POI های آن کاربر است uiمی خواهم بازدید کنم، و Lvisitedفهرستی از POI های آن کاربر را نشان می دهد uiدر تست بازدید کرده است.
۵٫۳٫ روش مقایسه ای
پنج روش توصیه POI به عنوان روش های پایه برای مقایسه انتخاب شده اند.
PMF [ ۳ ]: این یک مدل پیشنهادی POI بر اساس فاکتورسازی ماتریس است که می تواند احتمال دسترسی کاربران به POI را با تجزیه اطلاعات به دست آمده توسط ماتریس دسترسی به POI کاربران پیش بینی کند.
LRT [ ۱۲ ]: این یک مدل پیشنهادی POI است که اطلاعات زمان را بر اساس تجزیه ماتریس یکپارچه می کند، که همبستگی بین مکان ورود و زمان ورود را در نظر می گیرد.
PFMMGM [ ۲ ]: این یک سیستم توصیه مبتنی بر فاکتورسازی ماتریس است، و نفوذ جغرافیایی را از طریق یک مدل گاوسی چند مرکزی می گیرد و اطلاعات اجتماعی و نفوذ جغرافیایی را در چارچوب فاکتورسازی ماتریس ادغام می کند.
CPAM [ ۲۶ ]: این یک مدل ادراک زمینه و ترجیح است، از طریق یک مدل جاسازی POI مبتنی بر skip-Gram برای محاسبه ترجیحات کاربران برای POIهای هدف، و ترکیب با الگوریتم تجزیه ماتریس منطقی برای استخراج ترجیحات کاربران برای POI.
Li [ ۲۰ ]: این یک مدل توصیه POI آگاه از زمینه بر اساس چارچوب CF است. لیست توصیه ها با مطالعه تأثیر ویژگی های زمان و مکان بر کاربران ایجاد می شود.
۵٫۴٫ تجزیه و تحلیل نتایج
روش پیشنهادی با روشهای دیگر مقایسه میشود و تأثیر پارامترها بر توصیه مورد بحث قرار میگیرد.
۵٫۴٫۱٫ مقایسه عملکرد
مدل پیشنهادی SCGM با پنج روش پایه در مجموعه داده نیویورک و مجموعه داده توکیو مقایسه شده است. مدل SCGM بدیهی است که عملکرد بهتری نسبت به سایر الگوریتمها در دقت، یادآوری و امتیاز F1 دارد.
شکل ۴دقت هر الگوریتم را در دو مجموعه داده نشان می دهد. می توان دید که دقت شش الگوریتم در مجموعه داده توکیو به وضوح بالاتر از مجموعه داده نیویورک است. از سوی دیگر، به وضوح می توان دریافت که دقت الگوریتم با افزایش طول لیست توصیه شده POI کاهش می یابد. زمانی که لیست طول پیشنهادی به ترتیب ۵، ۱۰ و ۲۰ باشد، الگوریتم ما عملکرد بهتری نسبت به سایرین دارد. علاوه بر این، با در نظر گرفتن طول لیست ۵ به عنوان مثال، دقت LRT و PMF زیاد نیست، و هیچ یک از دو الگوریتم تأثیر اطلاعات جغرافیایی را در نظر نمیگیرند و در نتیجه عملکرد توصیهای ضعیف را به دنبال دارد. دقت روش PFMMGM، CPAM و لی نزدیک است. با این حال، دقت الگوریتم ما از همه الگوریتمهای پایه بالاتر است.precision@5 روش لی به ترتیب به ۰٫۰۵۴ و ۰٫۰۲۴ می رسد. SCGM مقدار precision@5 ۰٫۰۶۹ و ۰٫۰۳۲ را دریافت می کند که بهبودی نزدیک به ۲۸% و ۳۳% نسبت به روش Li را نشان می دهد.
شکل ۵ یادآوری شش الگوریتم روی مجموعه داده ها را نشان می دهد. فراخوانی الگوریتم با افزایش طول لیست توصیه های POI از ۵ تا ۲۰ افزایش می یابد. عملکرد فراخوانی هر الگوریتم زمانی بهترین است که k = 20 باشد. الگوریتم های LRT و PMF کمترین مقدار recall@20 را دارند. در مجموعه داده نیویورک، مقدار recall@20 PFMMGM و CPAM هر دو زیر ۰٫۰۴ است که به طور قابل توجهی کمتر از روش Li و SCGM است. مقدار recall@20 روش لی و SCGM در مجموعه داده نیویورک ۰٫۰۵ و ۰٫۰۶ است. علاوه بر این فراخوان @۲۰روش PFMMGM، CPAM و لی در مجموعه داده توکیو حدود ۰٫۰۴۵ است. آنها هنوز هم کمتر از الگوریتم SCGM هستند. بنابراین، SCGM از سایر الگوریتم ها بهتر عمل می کند و عملکرد خوبی در مجموعه داده های پراکنده دارد.
امتیاز F1 عملکرد کلی الگوریتم را منعکس می کند. همانطور که از شکل ۶ نشان داده شده است، الگوریتم های PMF و LRT عملکرد ضعیفی دارند و امتیازات F1 بسیار پایین تر از الگوریتم های دیگر است. عملکرد الگوریتم های PMFMGM و CPAM بهتر از الگوریتم های PMF و LRT است. در میان آنها، PMFMGM تأثیر جغرافیایی را بر اساس سوابق ورود کاربر مدلسازی میکند و به عملکرد بهتری دست مییابد، و CPAM بازخورد ضمنی و تأثیر متنی پیچیده را روی سوابق ورود در نظر میگیرد. علاوه بر این، روش لی بهتر از PMFMGM، CPAM و PMF عمل می کند. این به طور جامع تأثیر عوامل زمان و مکان را بر ورود کاربر در نظر می گیرد. علاوه بر این، الگوریتم SCGM پیشنهادی بهترین عملکرد را به دست میآورد. در مجموعه داده نیویورک (k = 20)، امتیاز F1 PMFMGM، CPAM، روش لی و SCGM به ترتیب به ۰٫۰۱۴، ۰٫۰۱۷، ۰٫۰۲۴ و ۰٫۰۲۹ می رسد. در مجموعه داده توکیو (k = 10)، در مقایسه با روش PMFMGM، CPAM و Li، امتیاز F1 روش SCGM ما به طور جداگانه ۶۶%، ۵۶% و ۳۱% بهبود یافت. نتایج نشان میدهد که SCGM، با بهرهگیری از توالی، اطلاعات زمانی، اطلاعات دستهبندی و اطلاعات جغرافیایی، میتواند به طور قابلتوجهی عملکرد کلی توصیههای POI را بهبود بخشد.
۵٫۴٫۲٫ اثر پارامتر
مطالعه پارامتر ضروری است α، و اهمیت نفوذ جغرافیایی در تصمیم گیری کاربر را نشان می دهد. شکل ۷ نشان می دهد که دقت@۵ ، recall@5 و امتیاز F1 با وزن های مختلف αاز دو مجموعه داده پارامتر αاز ۰٫۱ تا ۰٫۹ متغیر است. شکل نشان می دهد که نتایج زمانی به اوج می رسد α= ۰٫۲ و α= ۰٫۴ در دو مجموعه داده توکیو و نیویورک به طور جداگانه. می توان استنباط کرد که مردم مناطق مختلف عادات زندگی متفاوتی دارند و تأثیر جغرافیایی آنها نیز متفاوت است. بنابراین، تنظیم پارامتر ضروری است αدر مجموعه داده های مختلف بنابراین، ما انتخاب می کنیم α= ۰٫۲ به عنوان پارامتر مجموعه داده توکیو و α= ۰٫۴ به عنوان پارامتر مجموعه داده نیویورک در ارزیابی تجربی.
۶٫ نتیجه گیری
این مقاله یک مدل پیشنهادی POI (SCGM) را پیشنهاد میکند که فاکتورهای ترتیبی، دستهبندی و جغرافیایی را برای تولید فهرست توصیههای POI ادغام میکند. بر اساس مدل CBOW، بردارهای پنهان ترجیح کاربر برای POI از ترتیب ورود کاربر محاسبه میشوند. سپس، یک توالی دسترسی مشترک مجازی برای کاربران میسازیم و یک روش محاسبه شباهت کاربر جدید از طریق ترکیب تمایز دستهبندی و بردار نهفته POI طراحی میکنیم و آن را در چارچوب توصیهای CF اعمال میکنیم. علاوه بر این، روش تخمین چگالی هسته برای مدلسازی رفتار ورود شخصی کاربر به کار میرود. در پایان، لیستی از POI های توصیه شده بر اساس احتمال ترجیحی کاربر برای POI محاسبه شده با ترکیب CF و KDE به دست می آید. آزمایشها روی دو مجموعه داده LBSN نشان میدهد که SCGM از نظر دقت، یادآوری و امتیاز F1 نسبت به سایر الگوریتمهای پیشنهادی POI برتری دارد. علاوه بر این، الگوریتم پیشنهادی POI پیشنهادی را می توان در منطقه خدمات گردشگری آنلاین اعمال کرد. می تواند بر اساس عادت مصرف شخصی و ترجیحات سفر، هتل یا مکان دیدنی مناسب را در اختیار کاربر قرار دهد تا پیچیدگی برنامه ریزی گردشگری را برای کاربران کاهش دهد. در آینده، روش محاسبه شباهت مسیر را برای بهبود عملکرد توصیههای POI و کشف راههای کارآمد برای محافظت از اطلاعات خصوصی کاربران بیشتر بهینهسازی خواهیم کرد. علاوه بر این، ما می خواهیم الگوریتم را گسترش دهیم و یک سیستم توصیه برای برخی سناریوهای کاربردی مانند بازاریابی و حمل و نقل هوایی ایجاد کنیم. علاوه بر این، الگوریتم پیشنهادی POI پیشنهادی را می توان در منطقه خدمات گردشگری آنلاین اعمال کرد. می تواند بر اساس عادت مصرف شخصی و ترجیحات سفر، هتل یا مکان دیدنی مناسب را در اختیار کاربر قرار دهد تا پیچیدگی برنامه ریزی گردشگری را برای کاربران کاهش دهد. در آینده، روش محاسبه شباهت مسیر را برای بهبود عملکرد توصیههای POI و کشف راههای کارآمد برای محافظت از اطلاعات خصوصی کاربران بیشتر بهینهسازی خواهیم کرد. علاوه بر این، ما می خواهیم الگوریتم را گسترش دهیم و یک سیستم توصیه برای برخی سناریوهای کاربردی مانند بازاریابی و حمل و نقل هوایی ایجاد کنیم. علاوه بر این، الگوریتم پیشنهادی POI پیشنهادی را می توان در منطقه خدمات گردشگری آنلاین اعمال کرد. می تواند بر اساس عادت مصرف شخصی و ترجیحات سفر، هتل یا مکان دیدنی مناسب را در اختیار کاربر قرار دهد تا پیچیدگی برنامه ریزی گردشگری را برای کاربران کاهش دهد. در آینده، روش محاسبه شباهت مسیر را برای بهبود عملکرد توصیههای POI و کشف راههای کارآمد برای محافظت از اطلاعات خصوصی کاربران بیشتر بهینهسازی خواهیم کرد. علاوه بر این، ما می خواهیم الگوریتم را گسترش دهیم و یک سیستم توصیه برای برخی سناریوهای کاربردی مانند بازاریابی و حمل و نقل هوایی ایجاد کنیم. می تواند بر اساس عادت مصرف شخصی و ترجیحات سفر، هتل یا مکان دیدنی مناسب را در اختیار کاربر قرار دهد تا پیچیدگی برنامه ریزی گردشگری را برای کاربران کاهش دهد. در آینده، روش محاسبه شباهت مسیر را برای بهبود عملکرد توصیههای POI و کشف راههای کارآمد برای محافظت از اطلاعات خصوصی کاربران بیشتر بهینهسازی خواهیم کرد. علاوه بر این، ما می خواهیم الگوریتم را گسترش دهیم و یک سیستم توصیه برای برخی سناریوهای کاربردی مانند بازاریابی و حمل و نقل هوایی ایجاد کنیم. می تواند بر اساس عادت مصرف شخصی و ترجیحات سفر، هتل یا مکان دیدنی مناسب را در اختیار کاربر قرار دهد تا پیچیدگی برنامه ریزی گردشگری را برای کاربران کاهش دهد. در آینده، روش محاسبه شباهت مسیر را برای بهبود عملکرد توصیههای POI و کشف راههای کارآمد برای محافظت از اطلاعات خصوصی کاربران بیشتر بهینهسازی خواهیم کرد. علاوه بر این، ما می خواهیم الگوریتم را گسترش دهیم و یک سیستم توصیه برای برخی سناریوهای کاربردی مانند بازاریابی و حمل و نقل هوایی ایجاد کنیم.