روش توصیه نقطه‌ای با بهره‌برداری از تأثیر متوالی، مقوله‌ای و جغرافیایی

توصیه نقطه مورد علاقه (POI) به عنوان یک سرویس مهم در شبکه های اجتماعی مبتنی بر مکان به سرعت توسعه یافته است، که می تواند به کاربران کمک کند مکان های ناشناخته جالب تری پیدا کنند و ارائه دهندگان خدمات را تسهیل کند تا اعلان ها یا تبلیغات دقیق تری را به کاربران ارائه دهند. برخی از کارهای موجود، مشکل پراکندگی داده‌ها در فیلتر مشترک را با ترکیب اطلاعات زمینه‌ای در مدل مورد بررسی قرار داده‌اند. با این حال، آنها رابطه توالی موجود در سوابق ورود به تاریخ کاربر را نادیده می‌گیرند، که مدل‌سازی دقیق ترجیحات کاربر را دشوار می‌کند و بر نتایج توصیه‌های نهایی تأثیر می‌گذارد. برای به دست آوردن اولویت کاربران برای مکان با دقت بیشتر، این مقاله یک چارچوب توصیه POI جدید را پیشنهاد می‌کند که از تأثیر ترتیبی، دسته‌بندی و جغرافیایی بهره می‌برد. اولا، ما بردار پنهان POI و بردار پنهان ترجیح کاربر برای POI را از ترتیب ورود کاربر بر اساس مدل جاسازی کلمه بدست می آوریم. در مرحله بعد، یک توالی دسترسی مشترک مجازی برای کاربران با توجه به بررسی های کاربر ساخته می شود، یک روش محاسبه شباهت جدید با ترکیب تمایز دسته و بردار نهفته POI وجود دارد. سپس، آن را به چارچوب فیلتر مشترک اعمال می کنیم تا احتمال اولویت رفتاری کاربر از POI را بدست آوریم. علاوه بر این، روش تخمین چگالی هسته برای بدست آوردن احتمال ترجیح جغرافیایی کاربر از POI با در نظر گرفتن تأثیر جغرافیایی استفاده می شود. در نهایت، لیست توصیه های POI با ترکیب وزنی احتمال ترجیحی دو کاربر برای بهبود عملکرد توصیه POI به دست می آید.

کلید واژه ها:

توصیه POI ؛ محاسبه تشابه توالی ; جاسازی کلمه ; شبکه اجتماعی مبتنی بر مکان

۱٫ مقدمه

با توسعه سریع فناوری اینترنت موبایل و رشد دستگاه‌های هوشمند GPS داخلی، شبکه‌های اجتماعی مبتنی بر مکان (LBSN) مانند Foursquare و Gowalla به سرعت در حال رشد و محبوب شدن هستند. مردم عادت دارند نظرات خود را در مورد مکان هایی که در LBSN بازدید می کنند به اشتراک بگذارند. رفتار ورود کاربران محدود و تحت تأثیر اطلاعات زمینه ای متعدد (عامل زمان، طبقه بندی و عامل جغرافیایی و غیره) در LBSN است. توصیه نقطه مورد علاقه (POI) یکی از مهم ترین برنامه ها است که پیش بینی لیستی از POI های بازدید نشده مورد علاقه کاربران است. با ظهور صنعت گردشگری آنلاین، الگوریتم توصیه می تواند خدمات شخصی سازی شده را ارائه دهد و به مسافران کمک کند تا موارد جالب را پیدا کنند. مکان‌ها—مانند توصیه رستوران‌هایی که در هنگام سفر کاربران با سلیقه آن‌ها مطابقت دارند.۱ ].
فیلتر مشارکتی (CF) معمولاً برای توصیه POI با استفاده از بررسی‌های کاربر به دلیل مدل ساده آن استفاده می‌شود. علاوه بر این، روش‌های CF مبتنی بر مدل مانند فاکتورسازی ماتریس (MF) و عامل‌بندی ماتریس احتمال انواع آن (PMF) اغلب برای توصیه POI استفاده می‌شود زیرا می‌تواند داده‌های بازخورد ضمنی یک ماتریس POI کاربر را بدست آورد [ ۲ ، ۳ ]. تأثیر عوامل پنهان بر ترجیحات و ویژگی‌های POI کاربران را در نظر می‌گیرد و از حاصل ضرب درونی بردارهای پنهان کاربر و POI برای پیش‌بینی احتمال دسترسی کاربر به POI استفاده می‌کند. با این حال، تکنیک های مبتنی بر CF اغلب از مشکل پراکندگی داده ها رنج می برند.
برای بهبود عملکرد توصیه، بسیاری از اطلاعات زمینه ای (عامل زمان، طبقه بندی، عامل جغرافیایی) در روش CF و MF گنجانده شده است، که مشکل پراکندگی ماتریس را کاهش می دهد. به عنوان مثال، یوان یک مدل توصیه POI مبتنی بر CF را همراه با اطلاعات زمان ایجاد کرد، که نشان می‌دهد رفتار ورود کاربر دارای تناوب است و تحت تأثیر عامل زمان است [ ۴ ]. با این حال، آنها از در نظر گرفتن مسیر پیوسته کاربر برای به دست آوردن شباهت کاربر صرف نظر می کنند. خو و همکاران [ ۵] یک روش توصیه POI را بر اساس مسیرهای پیوسته کاربران پیشنهاد کرد و آنها توالی دسترسی مشترک مجازی را برای کاربران ایجاد کردند تا کاربرانی را با ترجیحات یکسان پیدا کنند. از آنجایی که دسته‌های POI اطلاعات مهمی را در مورد علایق و عادات کاربران می‌رسانند [ ۶ ]، او و همکاران. با پیش‌بینی اولویت‌های کاربران برای دسته‌ها و رتبه‌بندی نامزدهای POI بر اساس اولویت‌های دسته، یک روش پیشنهادی POI جدید پیشنهاد کرد [ ۷ ]. به دلیل اینکه تعداد دسته‌های POI بسیار کوچکتر از POI هستند، تأثیر پیش‌بینی خوبی بر روی داده‌های پراکنده ورود پیدا می‌کند. لیو از درخت سلسله مراتبی دسته برای مدلسازی ترجیحات کاربر استفاده کرد [ ۸]. تأثیر جغرافیایی مکان ها بر رفتار حرکتی کاربران مطالعه شده و به طور گسترده برای توصیه POI استفاده می شود. مشخص شد که مکان‌های ورود کاربر یک پدیده خوشه‌بندی آشکار را نشان می‌دهند [ ۹ ]. برخی از مطالعات توزیع بررسی‌های تاریخی همه کاربران را در یک مدل بیان می‌کنند، مانند توزیع قانون قدرت [ ۱۰ ] یا توزیع گاوسی چند مرکزی، و تأثیر جغرافیایی مکان را بررسی می‌کنند. با این حال، با توجه به علایق و سبک زندگی متفاوت کاربران، مدل‌سازی ویژگی‌های توزیع فضایی کاربر ضروری است. پژوهش حاضر با در نظر گرفتن یک یا دو عامل نمی‌تواند عملکرد بهتری داشته باشد و باید ویژگی‌های تأثیرگذارتری را برای بهبود اثربخشی توصیه‌های POI ادغام کرد.
با الهام از دیدگاه‌های بالا، برای در نظر گرفتن عوامل بیشتر برای بهبود عملکرد توصیه‌های POI، این مقاله یک روش توصیه‌شده POI شخصی‌شده جدید با کاوش در تأثیر متوالی، دسته‌بندی و جغرافیایی پیشنهاد می‌کند. در ابتدا، ما یک روش ساخت توالی دسترسی مشترک مجازی بهبود یافته را پیشنهاد می‌کنیم و کاربرانی را با عادات حرکتی مشابه با کاربران هدف پیدا می‌کنیم. در همین حال، یک روش محاسبه شباهت کاربر جدید با توجه به ترتیب بررسی و محاسبه تمایز دسته پیشنهاد شده است. به طور خاص، نمایش بردار ترجیحی کاربر برای POI بر اساس مدل کیسه کلمات پیوسته (CBOW) آموخته می شود. سپس، نمایش بردار ترجیح کاربر با یک روش CF ترکیب می‌شود تا احتمال ترجیح رفتاری کاربران هدف برای POI به دست آید. علاوه بر این، یک مدل تخمین تراکم هسته (KDE) برای بدست آوردن احتمال ترجیح جغرافیایی کاربر از POIها استفاده می شود. در نهایت، یک لیست توصیه‌ای از POIهای k بالا با توجه به احتمال ترجیح رفتاری کاربر و احتمال ترجیح جغرافیایی که به عنوان یک جمع وزنی محاسبه شده و به ترتیب نزولی مرتب شده‌اند، تولید می‌شود.
مشارکت های اصلی کار ما به شرح زیر خلاصه می شود:
۱٫
در این مقاله، ما یک چارچوب پیشنهادی POI جدید برای بهره‌برداری از تأثیر متوالی، دسته‌بندی و جغرافیایی (به نام SCGM) پیشنهاد می‌کنیم و احتمال ترجیح کاربر را از ترکیب خطی CF و KDE محاسبه می‌کنیم.
۲٫
یک روش محاسبه شباهت کاربر جدید بر اساس توالی دسترسی مشترک مجازی ساخته شده از کاربران و تمایز طبقه بندی POI پیشنهاد شده است.
۳٫
به طور خاص، ما CBOW را معرفی می کنیم تا تأثیر متنی POI در دنباله را به تصویر بکشیم و اولویت کاربران را برای POI بدست آوریم.
۴٫
تعداد زیادی آزمایش انجام شده بر روی دو مجموعه داده LBSN نشان می دهد که روش پیشنهادی ما به طور قابل توجهی بهتر از روش های دیگر از نظر دقت، یادآوری و امتیاز F1 عمل می کند.
بقیه مقاله به شرح زیر سازماندهی شده است: ما روش های توصیه POI را در بخش ۲ مرور می کنیم . در بخش ۳ ، برخی از کارهای مقدماتی شرح داده شده است. بخش ۴ روش پیشنهادی POI پیشنهادی را شرح می دهد. بخش ۵ نتایج تجربی و تجزیه و تحلیل پارامتر مربوطه را ارائه می دهد. در نهایت، بخش ۶ نتیجه گیری را ارائه می کند.

۲٫ کارهای مرتبط

توصیه های POI توجه بسیار بیشتری از سوی دانشگاه ها به خود جلب کرده و به یک جهت کاربردی مهم در خدمات شبکه های اجتماعی مبتنی بر مکان تبدیل شده اند. برای پیش‌بینی بهتر اولویت‌های کاربر، افراد سعی می‌کنند عوامل زمینه‌ای متعددی را که بر رفتار ورود کاربر تأثیر می‌گذارد، در مدل توصیه بگنجانند.

۲٫۱٫ اطلاعات زمانی و ترتیبی

رفتار و علایق کاربر در طول زمان در LBSN تغییر می کند. محققان سعی می کنند با ترکیب اطلاعات زمان، عملکرد سیستم توصیه POI را بهبود بخشند [ ۱۱ ، ۱۲ ]. برخی از محققان عمدتاً زمان ورود کاربران را به چند دوره تقسیم می کنند و ترجیحات کاربران را برای مکان در هر دوره یاد می گیرند. از آنجایی که افراد در روزهای هفته و غیر هفته رفتار ملاقات متفاوتی دارند، حسینی و همکاران. [ ۱۳ ] چارچوب پیشنهادی را بر اساس ترجیحات زمانی هفتگی کاربران پیشنهاد کرد. آنها ویژگی های ترجیحی سوابق ورود افراد را در روزهای هفته و آخر هفته بررسی می کنند. گائو و همکاران [ ۱۴] یک مدل رتبه‌بندی مشارکتی اجتماعی حسگر فضایی-زمانی با در نظر گرفتن پراکندگی داده‌ها برای توصیه پیشنهاد کرد. بر اساس چارچوب فاکتورسازی تانسور است و هر بعد با ویژگی‌های بالقوه کاربر، زمان ورود، مکان ورود و اطلاعات اجتماعی مطابقت دارد. گان و همکاران [ ۱۵ ] اولویت مبتنی بر حافظه را در طرح توصیه POI بر اساس تئوری حافظه ابینگهاوس یکپارچه کرد. آنها یک مدل تضعیف مبتنی بر حافظه برای مدیریت اولویت POI کاربر ایجاد می کنند و شباهت اولویت POI بین کاربران را از طریق سوابق ورود آنها در LBSN محاسبه می کنند. ژانگ و همکاران [ ۱۶ ] مفهوم چسبندگی POI را معرفی کرد و یک چارچوب CF پیشنهاد کرد که اولویت حافظه و چسبندگی POI را ترکیب می کند.

۲٫۲٫ اطلاعات دسته

POI معمولاً دارای یک یا چند ویژگی دسته است که به طور قابل توجهی بر رفتار دسترسی کاربر تأثیر می گذارد. اطلاعات دسته بندی POI نقش مهمی در مدل سازی ترجیحات خاص کاربران دارد. در واقع، تصمیم POI کاربر تحت تأثیر اولویت دسته بندی آنها قرار می گیرد و کاربران با اولویت های دسته بندی یکسان تمایل به نشان دادن عادات ثبت نام یکسان دارند. به عنوان مثال، مسافران تمایل دارند در مکان هایی مانند هتل ها چک-این کنند، در حالی که دانشجویان در مکان هایی مانند کتابخانه چک-این می کنند. بیشتر مطالعات بر اساس رابطه بین کاربران و POI ها انجام می شود، اما مطالعات کمی بر رابطه بین کاربران و دسته ها تمرکز می کنند. بائو و همکاران [ ۱۷ ] شباهت کاربر را با محاسبه انحراف دسته کاربر در روش توصیه CF مبتنی بر کاربر محاسبه کرد. لیو و همکاران [ ۱۸] POI را بر اساس دسته بندی خوشه بندی کرد و ماتریس دسته کاربر را برای جایگزینی ماتریس POI کاربر با توجه به داده های ثبت نام تاریخی کاربران ایجاد کرد. سپس، فناوری تجزیه ماتریس برای بررسی دسته بندی top-k که کاربران می خواستند بعداً بازدید کنند، استفاده می شود. ژو و همکاران [ ۱۹ ] رفتار ورود کاربران به انواع مختلف POI در زمان‌های مختلف را به‌عنوان منحنی‌های زمانی در مطالعه خود توصیف کردند. آنها یک الگوریتم پیشنهاد مکان مبتنی بر تاب خوردگی زمان پویا و بهترین الگوریتم توصیه مکان مبتنی بر جفت منحنی را پیشنهاد کردند. رحمانی و همکاران [ ۶ ] یک مدل توصیه POI بر اساس آگاهی از دسته پیشنهاد کرد که ویژگی‌های اطلاعات دسته‌بندی POI را در بر می‌گرفت. لی و همکاران [ ۲۰] یک مسیر مجازی را به چارچوب توصیه CF اعمال کرد و شباهت مسیرها را با تجزیه ماتریس دسته کاربر و ساخت یک نمودار Voronoi محاسبه کرد. آنها فقط بردار ویژگی دسته را در اطلاعات دسته برجسته می کنند، اما تمایز دسته را نادیده می گیرند، که می تواند به طور شهودی شباهت بین کاربران را منعکس کند.

۲٫۳٫ اطلاعات جغرافیایی

از آنجایی که رفتار ورود کاربران اساساً یک تعامل فیزیکی بین کاربران و POI است، کاربر ترجیح می دهد به POI نزدیک آنها دسترسی داشته باشد. بنابراین، عوامل جغرافیایی بر رفتار ورود کاربران تأثیر می گذارد و تأثیر جغرافیایی استخراج می تواند عملکرد توصیه های POI را بهبود بخشد. وانگ و همکاران [ ۲۱ ] دریافتند که تأثیر بین POI نامتقارن و متفاوت است، و آنها حساسیت جغرافیایی و فاصله فیزیکی را برای شبیه سازی تأثیر جغرافیایی پواسون بین دو POI تجزیه و تحلیل کردند. آنها عملکرد توصیه را با ادغام اثرات جغرافیایی POI خاص در مدل توصیه بهبود می بخشند. رحمانی و همکاران [ ۲۲] مدل‌های جغرافیایی را در روش تجزیه ماتریس منطقی گنجانید و یک مدل پیشنهادی POI LGLMF را پیشنهاد کرد. با در نظر گرفتن اطلاعات جغرافیایی از جنبه کاربر و POI به ترتیب اثر توصیه را بهبود می بخشد. لی و همکاران [ ۲۳ ] یک مدل تجزیه جغرافیایی سلسله مراتبی رتبه-GEOMF را پیشنهاد کرد، که جاسازی کاربران و POI ها را بر اساس فرکانس ورود کاربر می آموزد. لیو و همکاران [ ۲۴ ] الگوهای تحرک کاربر را با ثبت تأثیر جغرافیایی بر رفتار ورود کاربران مدل‌سازی کرد و یک چارچوب عامل‌بندی احتمال جغرافیایی را پیشنهاد کرد که شامل ترجیحات کاربر، تأثیر جغرافیایی و الگوهای رفتار کاربر است. یین و همکاران [ ۲۵] تأثیر مناطق جغرافیایی بر ترجیح کاربر را مورد مطالعه قرار داد. آنها مدل ترجیح کاربر را بر اساس ترجیحات جمعی مردم در منطقه هدف و ترجیحات شخصی کاربران در منطقه مجاور ایجاد می کنند. هنگام توصیه POI برای کاربران، ارزش دارد که تأثیر جغرافیایی شخصی مکان را به عنوان توزیع فاصله جداگانه برای هر کاربر مدل سازی کنیم.

۳٫ مقدمات

تعاریف کلیدی توصیه POI و معرفی مختصری از کلمه embedding در این بخش توضیح داده شده است.

۳٫۱٫ تعاریف

تعریف  ۱

(ثبت ورود). اجازه دهید U = {u1,u2,,un}مجموعه ای از کاربران در LBSN باشد، V =  {v1,v2,,vn}مجموعه ای از POI و C = باشد {c1,c2,,cn}مجموعه ای از دسته های POI باشد. V توسط {lat,lon}، جایی که latعرض جغرافیایی یک POI است و lonطول جغرافیایی است. همه سوابق ورود مرتب شده بر اساس زمان ورود به صورت CH = تعریف می شوند {ch1,ch2,,chn}، جایی که chiنشان دهنده تمام سوابق ورود به ui، و هر رکورد ورود به عنوان نشان داده شده است ch=(u,v,t)، که نشان می دهد POI v توسط کاربر u در زمان t بازدید شده است.

تعریف  ۲

(توالی ورود). دنباله چک در uiرا می توان به عنوان تعریف کرد seqri{v1,v2,,vn}، جایی که r نشان دهنده دوره r در یک روز است و POI ها بر اساس زمان ورود مرتب می شوند. علاوه بر این، تمام چک در توالی از uiبه عنوان مشخص می شوند Sui(seq1i,seq2i,,seqni).

تعریف  ۳

(POI متنی). در ترتیب ورود seqri، هدف viو زمینه ای آن {viw:vi+w}POI هایی با زمان های مختلف ورود هستند که w نشان دهنده اندازه پنجره متنی است.

تعریف  ۴

(توصیه POI). توصیه POI این است که با استخراج سوابق ثبت نام کاربر، فهرستی از POI های بازدید نشده را به یک کاربر توصیه کنید. با توجه به تمام سوابق ثبت نام CH، یک لیست رتبه بندی شده از POIs top-k = {v1,v2,..,vk}برای یک کاربر برگردانده می شود.

۳٫۲٫ جاسازی کلمه

اخیراً، فناوری جاسازی کلمه به داده‌کاوی مسیر و سیستم‌های توصیه متوالی گسترش یافته است [ ۲۶ ]. این به CBOW یا Skip-Grams بستگی دارد که یادگیری عصبی و بردارهای کلمه آموخته شده را تنظیم کند که به طور مؤثر روابط مهمی را در اطلاعات متنی در مجموعه داده آموزشی ثبت کند. در سیستم توصیه POI، دنباله ورود کاربر هدف به عنوان یک جمله در نظر گرفته می شود و POI کلمه در جمله است که به عنوان یک بردار یک داغ نشان داده می شود. در این مقاله از مدل CBOW برای آموزش بردار POI استفاده شده است. این POI مرکزی را با توجه به POI های اطراف پیش بینی می کند، که دارای مزایای بهره وری بالا است.

در طول تخمین احتمال ایجاد یک POI مرکزی، هر POI دو نمایش متفاوت دارد. یکی بردار POI مرکزی و دیگری بردار POI متنی است. لازم است میانگین بردارهای POIهای متنی را گرفته و یک عملیات softmax روی حاصل ضرب داخلی بردارها انجام دهیم تا احتمال POI مرکزی ایجاد شود. همانطور که در شکل ۱ نشان داده شده است ، وقتی اندازه پنجره داده شده دو باشد، POIهای متنی هستند vi۲,vi۱,vi+1,vi+2. سپس، احتمال تولید vIبا عملیات softmax بر روی حاصل ضرب داخلی بردار مطابق با معادله ( ۱ ) است:

پ(vمن|vمن – ۲،vمن – ۱،vمن ۱،vمن ۲) =[پتیمن(qمن – ۲+qمن – ۱+qمن ۱+qمن ۲]D۱[پتیj(qمن – ۲+qمن – ۱+qمن ۱+qمن ۲]

جایی که D = ۰ ۱ … − ۱ }مجموعه شاخص است، |طول فرهنگ لغت است. علاوه بر این، پمنو qمنهنگامی که POI نمایه شده با i به ترتیب به عنوان مرکز POI و POI متنی استفاده می شود، بردارهای POI را نشان می دهد. با انجام بهینه سازی تابع هدف، بردار تک داغ POI در نمایش برداری کم بعدی تعبیه شده و فرمول آن به صورت زیر است:

– g۱Dپ(vمن|vمن – ۲،vمن – ۱،vمن ۱،vمن ۲)

۴٫ روش پیشنهادی

۴٫۱٫ چارچوب SCGM

در این مقاله، ما یک روش توصیه POI را پیشنهاد می‌کنیم که از تأثیر متوالی، دسته‌بندی و جغرافیایی (به نام SCGM) بهره‌برداری می‌کند. SCGM یک مدل پیشنهادی ترکیبی POI از CF و تخمین چگالی هسته است. در الگوریتم ۱ توضیح داده شده است.

ما ابتدا یک توالی دسترسی مشترک مجازی بر اساس الگوریتم ۲ می سازیم و شباهت بین مسیرهای کاربر را مطابق الگوریتم ۳ محاسبه می کنیم. سپس، SCGM احتمال ترجیح رفتاری کاربر را طبق الگوریتم ۴ دریافت می کند و بر اساس CF با محاسبه شباهت مسیر است. علاوه بر این، با توجه به اینکه نزدیکی جغرافیایی به طور قابل‌توجهی بر رفتار ورود کاربران تأثیر می‌گذارد، SCGM بر اساس KDE احتمال اولویت جغرافیایی را دریافت می‌کند. در نهایت، احتمال ترجیح رفتاری کاربر و احتمال ترجیح جغرافیایی در یک مدل خطی ترکیب می‌شوند و لیست توصیه‌ای از POIهای k بالا تولید می‌شود. به طور رسمی، αیک ضریب وزنی جغرافیایی، احتمال آن کاربر است تومناز POI بازدید می کند vjرا می توان به صورت زیر بیان کرد:

(تومن،vj) =pscore (تومن،vj) +αپgo(vj|chi)
الگوریتم ۱: روش SCGM.
ورودی: کاربر مورد نظر ui، تمام سوابق ورود CHو پارامتر α
خروجی: لیست Top-k از POI
  ۱:   chiCH
  ۲:   برای هر کدام ujU انجام دادن
  ۳:    chjCH
  ۴: یک توالی دسترسی مشترک مجازی بسازید seqijطبق الگوریتم ۲
  ۵: بدست آوردن sim(ui,uj)طبق الگوریتم ۳
  ۶:   پایان برای
  ۷:   برای هر کدام vjV انجام دادن
  ۸: احتمال ترجیح رفتاری کاربر را بدست آورید pscore(ui,vj)طبق الگوریتم ۴
  ۹: احتمال ترجیح جغرافیایی کاربر را بدست آورید pgeo(vj|chi)بر اساس KDE
۱۰: محاسبه احتمال ترجیح کاربر score(ui,vj)مطابق با معادله ( ۳ )
۱۱:   پایان برای
۱۲: POIهای k بالا را انتخاب کنید که به صورت نزولی بر اساس احتمال ترجیح کاربر مرتب شوند. لیست Top-k را برگردانید .
۱۳:   لیست Top-k را برگردانید .
الگوریتم ۲: روش ساخت یک توالی دسترسی مشترک مجازی.
ورودی: سوابق ورود chi,chj
خروجی: استومن، استوj، eqمن ج
  ۱: یک روز را به چهار دوره زمانی تقسیم کنید تی{تی۱،تی۲،تی۳،تی۴}
  ۲:   استومن← { ϕ } ،استوj← { ϕ }
  ۳:   برای هر کدام Trدر  انجام دهید
  ۴: توالی های ورود را ایجاد کنید seqriو seqrj
  ۵:    SuiSui{seqri}
  ۶:    SujSuj{seqrj}
  ۷:    برای هر کدام vkseqri انجام دادن
  ۸:     tv1seq
  ۹:     tvktvk– tv1
۱۰:     tv1۰
۱۱:    پایان برای
۱۲:    برای هر کدام vkseqrj انجام دادن
۱۳:     tv1seq
۱۴:     tvktvk– tv1
۱۵:     tv1۰
۱۶:    پایان برای
۱۷:    برای هر کدام vnseqri انجام دادن
۱۸:     setn{ϕ}
۱۹:    پایان برای
۲۰:    برای هر کدام vmseqrj انجام دادن
۲۱:     برای هر کدام vnseqri انجام دادن
۲۲:      tmn|tmtn|
۲۳:     پایان برای
۲۴: حداقل مقدار را پیدا کنید tmn
۲۵:     setnsetn{vm}
۲۶:    پایان برای
۲۷:   پایان برای
الگوریتم ۳: محاسبه شباهت دو کاربر.
ورودی: Sui، Suj، seqij
خروجی: sim(ui,uj)
  ۱:   برای هر کدام seqriSui انجام دادن
  ۲:    برای هر کدام vnseqri انجام دادن
  ۳:     sim(vn,setn)=vmsetncos(vn,vm)|setn|
  ۴:    پایان برای
  ۵: تفاوت دسته را محاسبه کنید F(seqrij)مطابق با معادله ( ۵ )
  ۶: محاسبه کنید sim(seqri,seqrj)مطابق با معادله ( ۶ )
  ۷:   پایان برای
  ۸: سیم کارت را محاسبه کنید (ui,uj)مطابق با معادله ( ۷ )
الگوریتم ۴: محاسبه اولویت رفتاری کاربر بر اساس الگوریتم CF.
ورودی: کاربر مورد نظر ui، POI هدف vj، تمام سوابق ورود CH
خروجی: احتمال ترجیح رفتاری کاربر pscore( ui، vj)
  ۱:   برای ujUانجام دادن
  ۲:    chjCH
  ۳:    برای هر کدام vkchj انجام دادن
  ۴: بردار پنهان را راه اندازی کنید vkبا تعبیه مدل
  ۵:    پایان برای
  ۶: محاسبه کنید ujبا تجمیع vkchj
  ۷:    uj=vkchjvk∣∣chj∣∣
  ۸:    pcontextuj,vjcosine(uj,vj)
  ۹:   پایان برای
۱۰: محاسبه کنید pscore(ui,vj)مطابق با معادله ( ۸ )

۴٫۲٫ توالی دسترسی مشترک مجازی را بسازید

شباهت مسیر کاربر برای نشان دادن شباهت ترجیحات دسترسی در بین کاربران در این مقاله استفاده شده است. برای یافتن کاربرانی که شباهت زیادی به کاربر هدف دارند، رفتار مشابه کاربران را در ترتیب ثبت ورود تاریخی بررسی می‌کنیم. الگوریتم ۲ روش ساخت یک توالی دسترسی مشترک مجازی را نشان می دهد seqij={seq1ij,,seqrij,,seqnij}بر اساس تاریخچه ورود دو کاربر uiو uj، و seqrijنشان دهنده توالی مشترک مجازی در هر دوره زمانی است.
اولاً، توالی‌های ورود کاربران در دوره‌های مختلف ایجاد می‌شوند. تحت تأثیر عوامل زمان، کاربران در زمان های مختلف روز رفتار متفاوتی را برای ورود نشان می دهند. بنابراین، تقسیم یک روز به دوره های مختلف می تواند رفتار ورود کاربر را بهتر بیان کند. به طور خاص، یک روز به چهار دوره زمانی تقسیم می شود T={T1,T2,T3,T4}، جایی که T1={0:00۶:۰۰}، T2={6:00۱۲:۰۰}، T3={12:00۱۸:۰۰}، و T4={18:00۲۴:۰۰}. شباهت بین کاربران با تحلیل رفتار تاریخی کاربران هدف مشابه سایر کاربران در هر دوره محاسبه می شود. همانطور که در شکل ۲ نشان داده شده است ، کاربر هدف uiبازدید می کند v1، v2,…, vnدر یک دوره Tr، سپس ترتیب ورود می تواند به صورت بیان شود seqri=(v1,v2,,vn). در مقداردهی اولیه، مربوطه setkاز POI vkبازدید شده توسط کاربر هدف خالی تنظیم شده است. در نتیجه، یک دنباله ورود دارای n مجموعه است، که در آن n تعداد POI های موجود در دنباله ورود را نشان می دهد.
ثانیا، ما زمان بررسی POI را برای بررسی الگوی رفتار بین کاربران در هر دوره تنظیم می‌کنیم (خطوط ۷-۱۱ در الگوریتم ۲). برای یک دوره معین Tr، شباهت بین کاربران عمدتاً با رفتار تاریخی مشابه بین کاربران آشکار می شود. با این حال، توالی اعلام حضوری ساخته شده نمی‌تواند الگوهای رفتار ورود مشابه دو کاربر را به دقت توصیف کند. برای مثال، uiاز ساعت ۶ صبح تا ۹ صبح از پارک، کتابخانه و شرکت بازدید کرد ujهر چند از ساعت ۹ صبح تا ۱۲ بعد از ظهر از پارک، کتابخانه و شرکت بازدید کرد uiو ujالگوهای رفتار ورود مشابهی دارند، به دلیل تفاوت در زمان ورود به عنوان کاربرانی با اولویت های متفاوت در نظر گرفته می شوند. بنابراین، برای تشریح دقیق شباهت بین کاربران، سعی می‌کنیم با پردازش زمان ورود هر POI، یک توالی دسترسی مشترک مجازی بسازیم. به طور خاص، برای هر ترتیب ورود، تنظیم کنید tv1تا زمان ورود اولین رکورد در دنباله باشد، و زمان ورود به سایر رکوردها را به گونه ای تغییر دهید که فاصله زمانی نسبت به مهر زمانی اولین رکورد حفظ شود. پس از تنظیم زمان، POI های توالی کاربر مانند قبل باقی می مانند.
در نهایت، در یک دوره معین، توالی دسترسی مشترک مجازی دو کاربر را می سازیم seqriو seqrj. مقدار دهی اولیه یک مجموعه setnبرای هر POI vn∈ seqri، و، برای هر POI vm∈ seqrj، فاصله زمانی ورود را محاسبه می کنیم vnو vm-سپس، برای یافتن حداقل فاصله زمانی ورود و تقسیم vmبه درون setnمربوط به vn. همانطور که در شکل ۲ نشان داده شده است ، توالی دسترسی مشترک مجازی کاربر uiو کاربر ujدر دوره تقسیم بندی شده ساخته شده است Tr، و POI بازدید شده کاربر ujبه مجموعه مربوطه اختصاص داده می شود. مجموعه خالی را می توان با روش ساخت به دست آورد. به عنوان مثال، اگر vj3و vj2دارای حداقل فاصله زمانی ورود به vi2، سپس آنها به تقسیم می شوند set2.

۴٫۳٫ محاسبه شباهت کاربر جدید

پس از ساخت توالی دسترسی مشترک مجازی، یک روش جدید برای محاسبه شباهت بین کاربران پیشنهاد می‌کنیم. در الگوریتم ۳ نشان داده شده است و شباهت را می توان با اطلاعات زمینه ای و تمایز طبقه بندی محاسبه کرد.

رفتار ورود کاربران اغلب تحت تأثیر اطلاعات زمینه‌ای قرار می‌گیرد که از طریق آن می‌توان عادات رفتاری و الگوهای حرکتی کاربران را به طور کامل بررسی کرد. ما در این مقاله مدل جاسازی کلمه را معرفی می‌کنیم، یک POI واحد به عنوان یک کلمه در نظر گرفته می‌شود و هر POI به یک بردار پنهان تبدیل می‌شود. با ساخت توالی مشترک مجازی، می‌توانیم محاسبه شباهت مسیرهای دو کاربر را به محاسبه شباهت بین هر یک تبدیل کنیم. vnseqriو مجموعه مربوط به آن setn. محاسبه به شرح زیر است:

sim(vn,setn)=vmsetncos(vn,vm)len(setn)

با توجه به پراکندگی سوابق ورود، تعداد کمی از POI های رایج برای دسترسی کاربران وجود دارد. بنابراین، یافتن کاربرانی با اولویت دسترسی یکسان دشوار است. ما مفهوم تمایز دسته را برای یافتن کاربرانی با اولویت‌های دسترسی قابل‌شکل معرفی می‌کنیم. شباهت بین کاربران را می توان به طور موثر از طریق اطلاعات دسترسی کاربران به دسته محاسبه کرد. تمایز دسته، میزان شباهت را در بین کاربران بر اساس ترجیح آنها برای دسترسی به دسته ها ارزیابی می کند. با الهام از فرکانس معکوس سند (IDF)، دسته‌ای که اکثر کاربران به آن دسترسی دارند، اولویت دسترسی شخصی کاربر را نشان نمی‌دهد، در حالی که دسته‌ای که تنها چند کاربر به آن دسترسی دارند می‌تواند اولویت کاربر را منعکس کند، و کاربرانی که به این دسته دسترسی دارند اغلب شباهت بالایی دارند. تمایز دسته F(seqrij)به صورت زیر نشان داده شده است:

F(seqrij)=⎧⎩⎨۱∣∣scij∣∣∣∣scij∣∣q=1log|U|nq0ifscijϕifscij=ϕ

شباهت ترتیب ورود در هر دوره را می توان با محاسبه به دست آورد sim(vn,setn)و F(seqrij)و شباهت بین کاربران را می توان با اندازه گیری نتایج هر دوره زمانی بدست آورد. فرمول محاسباتی خاص در ( ۶ ) و ( ۷ ) آورده شده است:

sim(seqri,seqrj)=len(seqri)n=1sim(vn,setn)len(seqri)F(seqrij)
sim(ui,uj)=۴r=1sim(seqri,seqrj)4
به طور مشخص، seqrijمجموعه ای از دسته بندی های مشترک را نشان می دهد که توسط دو کاربر در طول دوره معین به آنها دسترسی پیدا کرده اند Tr، و nqنشان دهنده تعداد کل کاربرانی است که از رده q ام بازدید می کنندseqrij، و len()برای محاسبه طول دنباله کاربر استفاده می شود.
۴٫۳٫۱٫ توصیه POI بر اساس CF

الگوریتم CF مبتنی بر کاربر قصد دارد POI بازدید شده توسط کاربران با اولویت های مشابه را توصیه کند. فقط باید شباهت بین کاربر هدف و سایر کاربران را با توجه به سوابق ثبت ورود تاریخی تجزیه و تحلیل کند و سپس احتمال ورود کاربر مورد نظر را در یک POI خاص بر اساس POI های دسترسی کاربران مشابه پیش بینی می کند و یک عدد ایجاد می کند. لیست توصیه در الگوریتم ۴ نشان داده شده است، شباهت کاربر بر اساس الگوریتم ۳ که قبلا معرفی شد به دست می آید، و فرمول بدست آوردن احتمال ترجیح رفتاری کاربر از POI را می توان به صورت زیر بیان کرد:

pscore(ui,vj)=1uj∣∣Fui∣∣sim(ui,uj)uj∣∣Fui∣∣sim(ui,uj)cuj,vjpcontextuj,vj

جایی که |Fui|مجموعه شباهت کاربر است، cuj,vjنشان می دهد که آیا یک کاربر ujاز یک POI بازدید می کند vjو مقدار آن ۰ یا ۱ است، pcontextuj,vjاحتمال ترجیح بازدید کاربر برای POI است که طبق معادله ( ۱۰ ) به دست آمده است.

از آنجایی که توالی بررسی POI کاربر ترجیحات کاربر را منعکس می کند، جاسازی های POI vjدر ترتیب ورود به آنها می توان برای مدل سازی ترجیحات کاربر استفاده کرد. به طور خاص، ما محاسبه می کنیم ujبا تجمع متوسط، و می تواند یکپارچگی و نرمی جاسازی ورودی را با تبدیل خطی حفظ کند:

uj=vkchjvk|chj|

احتمال ترجیح دسترسی کاربر به POI را می توان به صورت زیر بیان کرد:

pcontextuj,vj=cos(uj,vj)=ujvj|uj|2|vj|2−−−−−−−−−√
۴٫۳٫۲٫ توصیه POI بر اساس KDE
همانطور که اولین قانون جغرافیایی توبلر اشاره می کند، اشیاء جغرافیایی در توزیع مکانی، با خوشه بندی، تصادفی و منظم بودن به هم مرتبط هستند. هر چه فاصله نزدیکتر باشد، رابطه نزدیکتر خواهد بود. در عمل، تاثیر جغرافیایی باید برای هر کاربر متفاوت باشد. به عنوان مثال، برخی از افراد ترجیح می دهند معمولاً از POI های نزدیک بازدید کنند و برخی از افرادی که ترجیح می دهند با وسیله نقلیه سفر کنند، معمولاً POI های دور را کاوش می کنند. رفتار تلفن همراه کاربران تحت تأثیر فاصله جغرافیایی قرار می گیرد و سوابق ورود آنها دارای ویژگی های توزیع فضایی خاصی برای توصیه های POI است. ما به طور تصادفی سه کاربر را از مجموعه داده انتخاب کردیم. شکل ۳توزیع check-in را در فاصله بین هر جفت POI در سوابق ورود آنها توضیح می دهد. مشاهده می شود که تأثیر جغرافیایی برای هر کاربر متفاوت است. کاربر ۱ دوست دارد به POI با برد کوتاه دسترسی داشته باشد، کاربر ۲ دوست دارد به POI فراتر از یک فاصله مشخص دسترسی داشته باشد و کاربر ۳ فرکانس دسترسی یکسانی را در محدوده خاصی دارد. بنابراین، تاثیر اطلاعات جغرافیایی بر کاربران نباید به عنوان یک توزیع کلی مدل شود، بلکه باید به صورت شخصی مدل سازی شود. بنابراین، مطالعه تأثیر جغرافیایی شخصی برای رفتارهای ورود کاربر ضروری است.

مشخص شده است که KDE می‌تواند ویژگی‌های توزیع شخصی شده POI را بر اساس سوابق ثبت نام تاریخی کاربران به دست آورد، که راحتی زیادی برای توصیه POI به ارمغان می‌آورد. بنابراین، ما KDE را برای مدل‌سازی ترجیحات شخصی کاربر برای POI از جنبه جغرافیایی اتخاذ می‌کنیم. دقت تخمین چگالی هسته تا حد زیادی به انتخاب بستگی دارد K()و h ، کجا K()تابع هسته است و σانحراف معیار است با توجه به ویژگی های داده های ورود، تابع هسته گاوسی به عنوان تابع هسته در این مقاله استفاده شده است. h پهنای باندی است که با محاسبه انحراف استاندارد POI با توجه به سوابق ثبت‌نام تاریخی کاربران به دست می‌آید:

ک( ⋅ ) =۱۲ π–√هایکس۲۲
=(۴σ۵۳ n)15

بر اساس تأثیر عوامل جغرافیایی، احتمال کاربر تومنبازدید از یک POI به شرح زیر است:

پgo(vjجساعتمن) =۱nساعت۲۱nک( l aتیv۱– aتیvل) – ( l onv۱– onvل)ساعت

۵٫ نتایج

۵٫۱٫ مجموعه داده ها

در آزمایش، ما از دو مجموعه داده ارائه شده توسط Foursquare [ ۲۷ ] استفاده می‌کنیم که شامل بررسی‌های شهر نیویورک و توکیو از ۱۲ آوریل ۲۰۱۲ تا ۱۶ فوریه ۲۰۱۳ است. مجموعه داده شامل پنج ویژگی با شناسه کاربر (ID) است. محل ورود، طول جغرافیایی مکان، عرض جغرافیایی مکان و زمان ورود. در مرجع. [ ۲۰ ]، لی و همکاران. ۱۰ را به عنوان آستانه حذف کاربران غیرفعال و POI های غیرفعال در نظر بگیرید. با الهام از این، ما برخی از پیش پردازش ها را روی مجموعه داده انجام می دهیم تا کاربرانی را که کمتر از ۱۰ POI مختلف بازدید کرده اند و آن دسته از POI هایی که کمتر از ۱۰ بار توسط کاربران بازدید شده اند را حذف کنیم. آمار اولیه دو مجموعه داده در جدول ۱ نشان داده شده است. علاوه بر این، ۸۰ درصد از بررسی ها به صورت تصادفی به عنوان داده های آموزشی و ۲۰ درصد از بررسی ها برای آزمایش انتخاب می شوند.

۵٫۲٫ معیارهای ارزیابی

عملکرد مدل پیشنهادی در این مقاله با استفاده از Precision@k ، Recall@k و امتیاز F1 ارزیابی شده است.

نرخ دقت نسبت POI به درستی پیش بینی شده به تعداد کل POI توصیه شده است:

پ=۱U|∈ U|LکLvisited||Lk|

نرخ فراخوان نسبت POI به درستی پیش بینی شده به تعداد کل POI بازدید شده واقعی است:

Recall@k=1|U|uU|LkLvisited||Lvisited|

امتیاز F ۱ بر اساس دقت و میزان یادآوری شاخص ارزیابی جامع است:

F1=2PrecisionRecallPrecision+Recall

جایی که Lkلیست توصیه شده Top-k POI های آن کاربر است uiمی خواهم بازدید کنم، و Lvisitedفهرستی از POI های آن کاربر را نشان می دهد uiدر تست بازدید کرده است.

۵٫۳٫ روش مقایسه ای

پنج روش توصیه POI به عنوان روش های پایه برای مقایسه انتخاب شده اند.
PMF [ ۳ ]: این یک مدل پیشنهادی POI بر اساس فاکتورسازی ماتریس است که می تواند احتمال دسترسی کاربران به POI را با تجزیه اطلاعات به دست آمده توسط ماتریس دسترسی به POI کاربران پیش بینی کند.
LRT [ ۱۲ ]: این یک مدل پیشنهادی POI است که اطلاعات زمان را بر اساس تجزیه ماتریس یکپارچه می کند، که همبستگی بین مکان ورود و زمان ورود را در نظر می گیرد.
PFMMGM [ ۲ ]: این یک سیستم توصیه مبتنی بر فاکتورسازی ماتریس است، و نفوذ جغرافیایی را از طریق یک مدل گاوسی چند مرکزی می گیرد و اطلاعات اجتماعی و نفوذ جغرافیایی را در چارچوب فاکتورسازی ماتریس ادغام می کند.
CPAM [ ۲۶ ]: این یک مدل ادراک زمینه و ترجیح است، از طریق یک مدل جاسازی POI مبتنی بر skip-Gram برای محاسبه ترجیحات کاربران برای POIهای هدف، و ترکیب با الگوریتم تجزیه ماتریس منطقی برای استخراج ترجیحات کاربران برای POI.
Li [ ۲۰ ]: این یک مدل توصیه POI آگاه از زمینه بر اساس چارچوب CF است. لیست توصیه ها با مطالعه تأثیر ویژگی های زمان و مکان بر کاربران ایجاد می شود.

۵٫۴٫ تجزیه و تحلیل نتایج

روش پیشنهادی با روش‌های دیگر مقایسه می‌شود و تأثیر پارامترها بر توصیه مورد بحث قرار می‌گیرد.

۵٫۴٫۱٫ مقایسه عملکرد

مدل پیشنهادی SCGM با پنج روش پایه در مجموعه داده نیویورک و مجموعه داده توکیو مقایسه شده است. مدل SCGM بدیهی است که عملکرد بهتری نسبت به سایر الگوریتم‌ها در دقت، یادآوری و امتیاز F1 دارد.
شکل ۴دقت هر الگوریتم را در دو مجموعه داده نشان می دهد. می توان دید که دقت شش الگوریتم در مجموعه داده توکیو به وضوح بالاتر از مجموعه داده نیویورک است. از سوی دیگر، به وضوح می توان دریافت که دقت الگوریتم با افزایش طول لیست توصیه شده POI کاهش می یابد. زمانی که لیست طول پیشنهادی به ترتیب ۵، ۱۰ و ۲۰ باشد، الگوریتم ما عملکرد بهتری نسبت به سایرین دارد. علاوه بر این، با در نظر گرفتن طول لیست ۵ به عنوان مثال، دقت LRT و PMF زیاد نیست، و هیچ یک از دو الگوریتم تأثیر اطلاعات جغرافیایی را در نظر نمی‌گیرند و در نتیجه عملکرد توصیه‌ای ضعیف را به دنبال دارد. دقت روش PFMMGM، CPAM و لی نزدیک است. با این حال، دقت الگوریتم ما از همه الگوریتم‌های پایه بالاتر است.precision@5 روش لی به ترتیب به ۰٫۰۵۴ و ۰٫۰۲۴ می رسد. SCGM مقدار precision@5 ۰٫۰۶۹ و ۰٫۰۳۲ را دریافت می کند که بهبودی نزدیک به ۲۸% و ۳۳% نسبت به روش Li را نشان می دهد.
شکل ۵ یادآوری شش الگوریتم روی مجموعه داده ها را نشان می دهد. فراخوانی الگوریتم با افزایش طول لیست توصیه های POI از ۵ تا ۲۰ افزایش می یابد. عملکرد فراخوانی هر الگوریتم زمانی بهترین است که k = 20 باشد. الگوریتم های LRT و PMF کمترین مقدار recall@20 را دارند. در مجموعه داده نیویورک، مقدار recall@20 PFMMGM و CPAM هر دو زیر ۰٫۰۴ است که به طور قابل توجهی کمتر از روش Li و SCGM است. مقدار recall@20 روش لی و SCGM در مجموعه داده نیویورک ۰٫۰۵ و ۰٫۰۶ است. علاوه بر این فراخوان @۲۰روش PFMMGM، CPAM و لی در مجموعه داده توکیو حدود ۰٫۰۴۵ است. آنها هنوز هم کمتر از الگوریتم SCGM هستند. بنابراین، SCGM از سایر الگوریتم ها بهتر عمل می کند و عملکرد خوبی در مجموعه داده های پراکنده دارد.
امتیاز F1 عملکرد کلی الگوریتم را منعکس می کند. همانطور که از شکل ۶ نشان داده شده است، الگوریتم های PMF و LRT عملکرد ضعیفی دارند و امتیازات F1 بسیار پایین تر از الگوریتم های دیگر است. عملکرد الگوریتم های PMFMGM و CPAM بهتر از الگوریتم های PMF و LRT است. در میان آن‌ها، PMFMGM تأثیر جغرافیایی را بر اساس سوابق ورود کاربر مدل‌سازی می‌کند و به عملکرد بهتری دست می‌یابد، و CPAM بازخورد ضمنی و تأثیر متنی پیچیده را روی سوابق ورود در نظر می‌گیرد. علاوه بر این، روش لی بهتر از PMFMGM، CPAM و PMF عمل می کند. این به طور جامع تأثیر عوامل زمان و مکان را بر ورود کاربر در نظر می گیرد. علاوه بر این، الگوریتم SCGM پیشنهادی بهترین عملکرد را به دست می‌آورد. در مجموعه داده نیویورک (k = 20)، امتیاز F1 PMFMGM، CPAM، روش لی و SCGM به ترتیب به ۰٫۰۱۴، ۰٫۰۱۷، ۰٫۰۲۴ و ۰٫۰۲۹ می رسد. در مجموعه داده توکیو (k = 10)، در مقایسه با روش PMFMGM، CPAM و Li، امتیاز F1 روش SCGM ما به طور جداگانه ۶۶%، ۵۶% و ۳۱% بهبود یافت. نتایج نشان می‌دهد که SCGM، با بهره‌گیری از توالی، اطلاعات زمانی، اطلاعات دسته‌بندی و اطلاعات جغرافیایی، می‌تواند به طور قابل‌توجهی عملکرد کلی توصیه‌های POI را بهبود بخشد.
۵٫۴٫۲٫ اثر پارامتر
مطالعه پارامتر ضروری است α، و اهمیت نفوذ جغرافیایی در تصمیم گیری کاربر را نشان می دهد. شکل ۷ نشان می دهد که دقت@۵ ، recall@5 و امتیاز F1 با وزن های مختلف αاز دو مجموعه داده پارامتر αاز ۰٫۱ تا ۰٫۹ متغیر است. شکل نشان می دهد که نتایج زمانی به اوج می رسد α= ۰٫۲ و α= ۰٫۴ در دو مجموعه داده توکیو و نیویورک به طور جداگانه. می توان استنباط کرد که مردم مناطق مختلف عادات زندگی متفاوتی دارند و تأثیر جغرافیایی آنها نیز متفاوت است. بنابراین، تنظیم پارامتر ضروری است αدر مجموعه داده های مختلف بنابراین، ما انتخاب می کنیم α= ۰٫۲ به عنوان پارامتر مجموعه داده توکیو و α= ۰٫۴ به عنوان پارامتر مجموعه داده نیویورک در ارزیابی تجربی.

۶٫ نتیجه گیری

این مقاله یک مدل پیشنهادی POI (SCGM) را پیشنهاد می‌کند که فاکتورهای ترتیبی، دسته‌بندی و جغرافیایی را برای تولید فهرست توصیه‌های POI ادغام می‌کند. بر اساس مدل CBOW، بردارهای پنهان ترجیح کاربر برای POI از ترتیب ورود کاربر محاسبه می‌شوند. سپس، یک توالی دسترسی مشترک مجازی برای کاربران می‌سازیم و یک روش محاسبه شباهت کاربر جدید از طریق ترکیب تمایز دسته‌بندی و بردار نهفته POI طراحی می‌کنیم و آن را در چارچوب توصیه‌ای CF اعمال می‌کنیم. علاوه بر این، روش تخمین چگالی هسته برای مدل‌سازی رفتار ورود شخصی کاربر به کار می‌رود. در پایان، لیستی از POI های توصیه شده بر اساس احتمال ترجیحی کاربر برای POI محاسبه شده با ترکیب CF و KDE به دست می آید. آزمایش‌ها روی دو مجموعه داده LBSN نشان می‌دهد که SCGM از نظر دقت، یادآوری و امتیاز F1 نسبت به سایر الگوریتم‌های پیشنهادی POI برتری دارد. علاوه بر این، الگوریتم پیشنهادی POI پیشنهادی را می توان در منطقه خدمات گردشگری آنلاین اعمال کرد. می تواند بر اساس عادت مصرف شخصی و ترجیحات سفر، هتل یا مکان دیدنی مناسب را در اختیار کاربر قرار دهد تا پیچیدگی برنامه ریزی گردشگری را برای کاربران کاهش دهد. در آینده، روش محاسبه شباهت مسیر را برای بهبود عملکرد توصیه‌های POI و کشف راه‌های کارآمد برای محافظت از اطلاعات خصوصی کاربران بیشتر بهینه‌سازی خواهیم کرد. علاوه بر این، ما می خواهیم الگوریتم را گسترش دهیم و یک سیستم توصیه برای برخی سناریوهای کاربردی مانند بازاریابی و حمل و نقل هوایی ایجاد کنیم. علاوه بر این، الگوریتم پیشنهادی POI پیشنهادی را می توان در منطقه خدمات گردشگری آنلاین اعمال کرد. می تواند بر اساس عادت مصرف شخصی و ترجیحات سفر، هتل یا مکان دیدنی مناسب را در اختیار کاربر قرار دهد تا پیچیدگی برنامه ریزی گردشگری را برای کاربران کاهش دهد. در آینده، روش محاسبه شباهت مسیر را برای بهبود عملکرد توصیه‌های POI و کشف راه‌های کارآمد برای محافظت از اطلاعات خصوصی کاربران بیشتر بهینه‌سازی خواهیم کرد. علاوه بر این، ما می خواهیم الگوریتم را گسترش دهیم و یک سیستم توصیه برای برخی سناریوهای کاربردی مانند بازاریابی و حمل و نقل هوایی ایجاد کنیم. علاوه بر این، الگوریتم پیشنهادی POI پیشنهادی را می توان در منطقه خدمات گردشگری آنلاین اعمال کرد. می تواند بر اساس عادت مصرف شخصی و ترجیحات سفر، هتل یا مکان دیدنی مناسب را در اختیار کاربر قرار دهد تا پیچیدگی برنامه ریزی گردشگری را برای کاربران کاهش دهد. در آینده، روش محاسبه شباهت مسیر را برای بهبود عملکرد توصیه‌های POI و کشف راه‌های کارآمد برای محافظت از اطلاعات خصوصی کاربران بیشتر بهینه‌سازی خواهیم کرد. علاوه بر این، ما می خواهیم الگوریتم را گسترش دهیم و یک سیستم توصیه برای برخی سناریوهای کاربردی مانند بازاریابی و حمل و نقل هوایی ایجاد کنیم. می تواند بر اساس عادت مصرف شخصی و ترجیحات سفر، هتل یا مکان دیدنی مناسب را در اختیار کاربر قرار دهد تا پیچیدگی برنامه ریزی گردشگری را برای کاربران کاهش دهد. در آینده، روش محاسبه شباهت مسیر را برای بهبود عملکرد توصیه‌های POI و کشف راه‌های کارآمد برای محافظت از اطلاعات خصوصی کاربران بیشتر بهینه‌سازی خواهیم کرد. علاوه بر این، ما می خواهیم الگوریتم را گسترش دهیم و یک سیستم توصیه برای برخی سناریوهای کاربردی مانند بازاریابی و حمل و نقل هوایی ایجاد کنیم. می تواند بر اساس عادت مصرف شخصی و ترجیحات سفر، هتل یا مکان دیدنی مناسب را در اختیار کاربر قرار دهد تا پیچیدگی برنامه ریزی گردشگری را برای کاربران کاهش دهد. در آینده، روش محاسبه شباهت مسیر را برای بهبود عملکرد توصیه‌های POI و کشف راه‌های کارآمد برای محافظت از اطلاعات خصوصی کاربران بیشتر بهینه‌سازی خواهیم کرد. علاوه بر این، ما می خواهیم الگوریتم را گسترش دهیم و یک سیستم توصیه برای برخی سناریوهای کاربردی مانند بازاریابی و حمل و نقل هوایی ایجاد کنیم.

منابع

  1. لیو، ایکس. یانگ، ی. خو، ی. یانگ، اف. هوانگ، Q. Wang, H. توصیه POI در زمان واقعی از طریق مدل‌سازی اولویت‌های کاربر بلندمدت و کوتاه‌مدت. محاسبات عصبی ۲۰۲۲ ، ۴۶۷ ، ۴۵۴-۴۶۴ . [ Google Scholar ] [ CrossRef ]
  2. چنگ، سی. یانگ، اچ. کینگ، آی. لیو، MR فاکتورسازی ماتریس ذوب شده با نفوذ جغرافیایی و اجتماعی در شبکه های اجتماعی مبتنی بر مکان. در مجموعه مقالات بیست و ششمین کنفرانس AAAI در مورد هوش مصنوعی، تورنتو، ON، کانادا، ۲۲ تا ۲۶ ژوئیه ۲۰۱۲٫ انجمن برای پیشرفت هوش مصنوعی: منلو پارک، کالیفرنیا، ایالات متحده آمریکا، ۲۰۱۲; جلد ۲۶، ص. ۱٫ [ Google Scholar ]
  3. سالاخوتدینوف، ر. منیح، الف. فاکتورسازی ماتریس احتمالی. در پیشرفت‌ها در سیستم‌های پردازش اطلاعات عصبی ۲۰، مجموعه مقالات بیست و یکمین کنفرانس سالانه سیستم‌های پردازش اطلاعات عصبی، ونکوور، BC، کانادا، ۳-۶ دسامبر ۲۰۰۷ . بنیاد سیستم های پردازش اطلاعات عصبی: La Jolla، CA، USA، ۲۰۰۷; صص ۱۲۵۷-۱۲۶۴٫ [ Google Scholar ]
  4. یوان، Q. کنگ، جی. Sun، A. توصیه نقطه مورد علاقه مبتنی بر نمودار با تأثیرات جغرافیایی و زمانی. در مجموعه مقالات بیست و سومین کنفرانس بین المللی ACM در کنفرانس مدیریت اطلاعات و دانش، CIKM 2014، شانگهای، چین، ۳ تا ۷ نوامبر ۲۰۱۴٫ ACM, Inc.: Tipp City, OH, USA, 2014; صص ۶۵۹-۶۶۸٫ [ Google Scholar ]
  5. جیائو، ایکس. شیائو، ی. ژنگ، دبلیو. وانگ، اچ. Hsu, C. یک سیستم جدید توصیه نقطه مورد علاقه جدید بر اساس فرآیند تصمیم گیری سفر کاربر شبیه سازی شده. ژنرال آینده. محاسبه کنید. سیستم ۲۰۱۹ ، ۱۰۰ ، ۹۸۲-۹۹۳٫ [ Google Scholar ] [ CrossRef ]
  6. رحمانی، ح. علیان نژادی، م. زاده، RM; براتچی، م. افشارچی، م. Crestani, F. جاسازی مکان آگاه از دسته برای توصیه نقطه مورد علاقه. در مجموعه مقالات کنفرانس بین المللی ACM SIGIR 2019 در نظریه بازیابی اطلاعات، ICTIR 2019، سانتا کلارا، کالیفرنیا، ایالات متحده آمریکا، ۲ تا ۵ اکتبر ۲۰۱۹؛ ACM, Inc.: Tipp City, OH, USA, 2019; صص ۱۷۳-۱۷۶٫ [ Google Scholar ]
  7. او، جی. لی، ایکس. Liao, L. توصیه‌های بعدی با آگاهی از طبقه‌بندی از طریق رتبه‌بندی شخصی‌شده بیزی. در مجموعه مقالات بیست و ششمین کنفرانس مشترک بین المللی هوش مصنوعی، IJCAI 2017، ملبورن، استرالیا، ۱۹ تا ۲۵ اوت ۲۰۱۷؛ کتابخانه دیجیتال ACM: نیویورک، نیویورک، ایالات متحده آمریکا، ۲۰۱۷; جلد ۱۷، ص ۱۸۳۷–۱۸۴۳٫ [ Google Scholar ]
  8. لیو، ی. چاو، سی. وانگ، آر. Lee, VCS iMCrecc: یک چارچوب چند معیاره برای توصیه‌های شخصی‌شده نقطه‌نظر. Inf. علمی ۲۰۱۹ ، ۴۸۳ ، ۲۹۴-۳۱۲٫ [ Google Scholar ] [ CrossRef ]
  9. ژائو، اس. ژائو، تی. کینگ، آی. Lyu, MR Geo-teaser: رتبه جاسازی متوالی جغرافیایی-زمانی برای توصیه نقطه مورد علاقه. در مجموعه مقالات بیست و ششمین کنفرانس بین المللی در مورد همنشین وب جهانی، پرت، استرالیا، ۳ تا ۷ آوریل ۲۰۱۷؛ ACM, Inc.: Tipp City, OH, USA, 2017; صص ۱۵۳-۱۶۲٫ [ Google Scholar ]
  10. بله، م. یین، پی. لی، دبلیو. لی، دی‌ال. بهره‌برداری از نفوذ جغرافیایی برای توصیه‌های نقطه‌نظر مشترک. در مجموعه مقالات سی و چهارمین کنفرانس بین المللی ACM SIGIR در مورد تحقیق و توسعه در بازیابی اطلاعات، SIGIR 2011، پکن، چین، ۲۵-۲۹ ژوئیه ۲۰۱۱٫ ACM, Inc.: Tipp City, OH, USA, 2011; صص ۳۲۵-۳۳۴٫ [ Google Scholar ]
  11. چن، جی. ژانگ، دبلیو. ژانگ، پی. یینگ، پی. نیو، ک. Zou, M. بهره برداری از توصیه های مکانی و زمانی برای نقطه مورد علاقه. پیچیدگی ۲۰۱۸ ، ۲۰۱۸ ، ۶۹۲۸۶۰۵:۱–۶۹۲۸۶۰۵:۱۶٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  12. گائو، اچ. تانگ، جی. هو، ایکس. لیو، اچ. بررسی اثرات زمانی برای توصیه مکان در شبکه های اجتماعی مبتنی بر مکان. در مجموعه مقالات هفتمین کنفرانس ACM در مورد سیستم های توصیه کننده، هنگ کنگ، چین، ۱۲ تا ۱۶ اکتبر ۲۰۱۳٫ ACM, Inc.: Tipp City, OH, USA, 2013; صص ۹۳-۱۰۰٫ [ Google Scholar ]
  13. حسینی، س. Li, LT توصیه نقطه مورد علاقه با استفاده از جهت گیری های زمانی کاربران و مکان ها. در مجموعه مقالات سیستم های پایگاه داده برای کاربردهای پیشرفته- بیست و یکمین کنفرانس بین المللی، DASFAA 2016، دالاس، تگزاس، ایالات متحده آمریکا، ۱۶-۱۹ آوریل ۲۰۱۶؛ مجموعه مقالات، قسمت اول. اسپرینگر: برلین، آلمان، ۲۰۱۶; جلد ۹۶۴۲، ص ۳۳۰–۳۴۷٫ [ Google Scholar ]
  14. گائو، آر. لی، جی. لی، ایکس. آهنگ، سی. چانگ، جی. لیو، دی. وانگ، سی. STSCR: بررسی تأثیر متوالی مکانی-زمانی و اطلاعات اجتماعی برای توصیه مکان. محاسبات عصبی ۲۰۱۸ ، ۳۱۹ ، ۱۱۸-۱۳۳٫ [ Google Scholar ] [ CrossRef ]
  15. گان، م. Gao, L. کشف ترجیحات مبتنی بر حافظه برای توصیه POI در شبکه های اجتماعی مبتنی بر مکان. ISPRS Int. J. Geo-Inf. ۲۰۱۹ ، ۸ ، ۲۷۹٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  16. ژانگ، اچ. گان، م. Sun، X. ترکیب اولویت‌های مبتنی بر حافظه و چسبندگی نقطه‌ی علاقه در توصیه‌ها در شبکه‌های اجتماعی مبتنی بر مکان. ISPRS Int. J. Geo-Inf. ۲۰۲۱ ، ۱۰ ، ۳۶٫ [ Google Scholar ] [ CrossRef ]
  17. بائو، جی. ژنگ، ی. Mokbel، MF توصیه مبتنی بر موقعیت و اولویت آگاه با استفاده از داده های شبکه های جغرافیایی-اجتماعی پراکنده. در مجموعه مقالات کنفرانس بین‌المللی SIGSPATIAL 2012 در مورد پیشرفت‌ها در سیستم‌های اطلاعات جغرافیایی (که قبلاً GIS نامیده می‌شد)، ردوندو بیچ، کالیفرنیا، ایالات متحده آمریکا، ۷ تا ۹ نوامبر ۲۰۱۲٫ ACM, Inc.: Tipp City, OH, USA, 2012; صص ۱۹۹-۲۰۸٫ [ Google Scholar ]
  18. لیو، ایکس. لیو، ی. ابرر، ک. Miao, C. توصیه شخصی شده نقطه مورد علاقه با انتقال اولویت کاربران استخراج. در مجموعه مقالات بیست و دومین کنفرانس بین المللی ACM در مدیریت اطلاعات و دانش، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، ۲۷ اکتبر تا ۱ نوامبر ۲۰۱۳٫ ACM, Inc.: Tipp City, OH, USA, 2013; صص ۷۳۳-۷۳۸٫ [ Google Scholar ]
  19. ژو، دی. رحیمی، س.م. Wang, X. توصیه مکان مبتنی بر طبقه بندی احتمالی مبتنی بر شباهت با استفاده از تأثیر زمانی و جغرافیایی. بین المللی J. Data Sci. مقعدی ۲۰۱۶ ، ۱ ، ۱۱۱-۱۲۱٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  20. لی، ام. ژنگ، دبلیو. شیائو، ی. زو، ک. Huang, W. بررسی ویژگی‌های زمانی و مکانی برای توصیه‌های POI بعدی در LBSN. دسترسی IEEE ۲۰۲۱ ، ۹ ، ۳۵۹۹۷–۳۶۰۰۷٫ [ Google Scholar ] [ CrossRef ]
  21. وانگ، اچ. شن، اچ. اویانگ، دبلیو. چنگ، ایکس. بهره‌برداری از نفوذ جغرافیایی خاص POI برای توصیه‌های نقطه‌نظر. در مجموعه مقالات بیست و هفتمین کنفرانس بین المللی مشترک هوش مصنوعی، IJCAI 2018، استکهلم، سوئد، ۱۳ تا ۱۹ ژوئیه ۲۰۱۸؛ ACM, Inc.: Tipp City, OH, USA, 2018; صص ۳۸۷۷-۳۸۸۳٫ [ Google Scholar ]
  22. رحمانی، ح. علیان نژادی، م. احمدیان، س. براتچی، م. افشارچی، م. Crestani، F. LGLMF: مدل فاکتورسازی ماتریس لجستیک مبتنی بر جغرافیای محلی برای توصیه POI. در مجموعه مقالات فناوری بازیابی اطلاعات: پانزدهمین کنفرانس جوامع بازیابی اطلاعات آسیا، AIRS 2019، هنگ کنگ، چین، ۷ تا ۹ نوامبر ۲۰۱۹؛ اقدامات. Springer: برلین، آلمان، ۲۰۲۰؛ جلد ۱۲۰۰۴، ص ۶۶–۷۸٫ [ Google Scholar ]
  23. لی، ایکس. کنگ، جی. لی، ایکس. فام، TN; کریشناسوامی، S. Rank-geofm: یک روش فاکتورگیری جغرافیایی مبتنی بر رتبه بندی برای توصیه نقطه مورد علاقه. در مجموعه مقالات سی و هشتمین کنفرانس بین المللی ACM SIGIR در مورد تحقیق و توسعه در بازیابی اطلاعات، سانتیاگو، شیلی، ۹ تا ۱۳ اوت ۲۰۱۵٫ ACM, Inc.: Tipp City, OH, USA, 2015; صص ۴۳۳-۴۴۲٫ [ Google Scholar ]
  24. لیو، بی. فو، ی. یائو، ز. Xiong, H. یادگیری ترجیحات جغرافیایی برای توصیه نقطه مورد علاقه. در مجموعه مقالات نوزدهمین کنفرانس بین المللی ACM SIGKDD در مورد کشف دانش و داده کاوی، KDD 2013، شیکاگو، IL، ایالات متحده آمریکا، ۱۱-۱۴ اوت ۲۰۱۳٫ ACM, Inc.: Tipp City, OH, USA, 2013; ص ۱۰۴۳-۱۰۵۱٫ [ Google Scholar ]
  25. یین، اچ. وانگ، دبلیو. وانگ، اچ. چن، ال. ژو، X. یادگیری عمیق مشارکتی سلسله مراتبی آگاه به فضایی برای توصیه POI. IEEE Trans. بدانید. مهندسی داده ۲۰۱۷ ، ۲۹ ، ۲۵۳۷–۲۵۵۱٫ [ Google Scholar ] [ CrossRef ]
  26. یو، دی. وانیان، دبلیو. وانگ، دی. استفاده از نفوذ متنی و ترجیحات کاربر برای توصیه نقطه مورد علاقه. چندتایی. ابزارهای کاربردی ۲۰۲۱ ، ۸۰ ، ۱۴۸۷-۱۵۰۱٫ [ Google Scholar ] [ CrossRef ]
  27. یانگ، دی. ژانگ، دی. ژنگ، فولکس واگن؛ Yu, Z. مدل‌سازی اولویت فعالیت کاربر با اعمال نفوذ ویژگی‌های زمانی مکانی کاربر در LBSN. IEEE Trans. سیستم مرد سایبرن. سیستم ۲۰۱۵ ، ۴۵ ، ۱۲۹-۱۴۲٫ [ Google Scholar ] [ CrossRef ]
شکل ۱٫ مدل CBOW.
شکل ۲٫ نمونه ای از ساخت توالی دسترسی مشترک مجازی در Tr.
شکل ۳٫ احتمال ورود شخصی در فواصل جغرافیایی. ( الف – ج ) کاربر ۱-کاربر ۳٫
شکل ۴٫ نتایج دقیق شش روش در دو مجموعه داده. ( الف ) precison@5 ، ( ب ) precision@10 ، ( ج ) precision@20.
شکل ۵٫ نتایج شش روش را در دو مجموعه داده به یاد بیاورید. ( الف ) recall@5 ، ( ب ) recall@10 ، ( ج ) recall@20.
شکل ۶٫ نتایج امتیاز F1 از شش روش در دو مجموعه داده. ( الف ) امتیاز F1 @۵ ، ( ب ) امتیاز F1 @۱۰ ، ( ج ) امتیاز F1 @۲۰٫
شکل ۷٫ اثر پارامتر αروی دو مجموعه داده ( الف ) دقت، ( ب ) یادآوری، ( ج ) امتیاز F1.

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

خانهدربارهتماسارتباط با ما