STS: توصیه مکان شخصی سازی شده مکانی – زمانی – معنایی

خلاصه

شبکه اجتماعی مبتنی بر مکان (LBSN) که به سرعت در حال رشد است به یک پلت فرم امیدوارکننده برای مطالعه الگوهای تحرک کاربران تبدیل شده است. بسیاری از برنامه های کاربردی آنلاین را می توان بر اساس چنین مطالعاتی ساخت، که در میان آنها، توصیه مکان ها از اهمیت ویژه ای برخوردار است. مطالعات قبلی اهمیت تأثیرات مکانی و زمانی بر توصیه مکان را نشان داده است. با این حال، اکثر رویکردهای موجود یک مدل مکانی-زمانی جهانی برای همه کاربران ایجاد می‌کنند، علی‌رغم این واقعیت که کاربران همیشه الگوهای رفتاری ناهمگونی را نشان می‌دهند. به منظور تحقق توصیه‌های مکانی واقعاً شخصی‌شده، ما یک مدل مبتنی بر فرآیند گاوسی برای هر یک پیشنهاد می‌کنیمکاربر به طور سیستماتیک و غیرخطی اطلاعات زمانی و مکانی را برای پیش بینی جابجایی کاربر از مکان ثبت نام فعلی خود به مکان بعدی ترکیب می کند. مکان هایی که فاصله آنها تا مکان ورود کاربر فعلی نزدیک ترین به جابجایی پیش بینی شده باشد توصیه می شود. ما همچنین بهبودی را برای در نظر گرفتن اطلاعات دسته‌بندی مکان‌ها برای توصیه معنایی پیشنهاد می‌کنیم. یک چارچوب توصیه یکپارچه به نام spatial- t emporal- s emantic (STS) برای ترکیب پیش‌بینی جابجایی و ارتقای آگاهی معنایی برای ارائه N نهایی معرفی شده است .توصیه آزمایش‌های گسترده بر روی مجموعه داده‌های واقعی نشان می‌دهد که چارچوب STS پیشنهادی به طور قابل‌توجهی از مدل‌های پیشنهادی مکان از نظر دقت و میانگین رتبه متقابل (MRR) بهتر عمل می‌کند.

کلید واژه ها:

توصیه مکان ؛ فرآیند گاوسی ؛ مکانی – زمانی – معنایی ; شبکه های اجتماعی مبتنی بر مکان ؛ توصیه top -N

۱٫ معرفی

سال‌های اخیر شاهد توسعه سریع شبکه‌های اجتماعی آنلاین، دستگاه‌های تلفن همراه و دسترسی فراگیر به اینترنت بوده‌ایم که در مجموع باعث ایجاد یک برنامه آنلاین جدید، یعنی شبکه اجتماعی مبتنی بر مکان (LBSN) شده است. LBSNهای نماینده عبارتند از Foursquare، Yelp، Google+ Location Sharing و Dianping، و همچنین خدمات مبتنی بر مکان ارائه شده توسط شبکه های اجتماعی آنلاین محبوب (به عنوان مثال، مکان های Facebook، مکان های توییتر و لحظات Wechat). در یک LBSN، کاربران با به اشتراک گذاشتن تجربیات خود در مکان‌های خاص، به عنوان مثال، رستوران، باشگاه از طریق فعالیت‌های اعلام حضور، با یکدیگر تعامل دارند. یکی از خدمات ضروری LBSN ارائه توصیه مکان [ ۱ , ۲ , ۳ , ۴ , ۵ , ۶ ،۷، ۸ ، ۹ ]، که نه تنها به کاربران کمک می کند تا مکان های جدید را کشف کنند، بنابراین تجربه کاربر را به طور قابل توجهی افزایش می دهد، بلکه به عنوان پایه سایر خدمات (شخص ثالث) مانند تبلیغات مبتنی بر مکان نیز عمل می کند. به عنوان مثال، با درک الگوهای تحرک مشتریان، یک بانک می تواند اطلاعات تبلیغاتی آگاه از موقعیت مکانی را برای جذب مشتریان خود برای استفاده فعال تر از کارت های اعتباری خود منتشر کند.
با استفاده از تکنیک‌های پیشنهادی مرسوم، به عنوان مثال، فیلتر مشارکتی، رویکردهای زیادی برای توصیه مکان‌ها در LBSN با بررسی تأثیر اطلاعات جغرافیایی، زمانی، متنی و اجتماعی بر فعالیت‌های ورود کاربران پیشنهاد شده است [ ۱ ، ۲ ، ۳ ، ۴ , ۱۰ , ۱۱ , ۱۲ , ۱۳ , ۱۴ , ۱۵ , ۱۶ , ۱۷ , ۱۸ , ۱۹ , ۲۰ ]. به عنوان مثال، آثار [ ۴ ، ۱۲ ، ۱۴ ،۲۱ ] از نفوذ جغرافیایی استفاده کرد و مدل‌های مبتنی بر فیلتر مشترک را برای ترکیب اولویت کاربر، اطلاعات جغرافیایی و تأثیر اجتماعی برای توصیه مکان پیشنهاد کرد. از سوی دیگر، برخی از مطالعات بر روی تأثیر زمانی برای بهبود کیفیت توصیه تمرکز کردند [ ۱ ، ۱۵ ، ۲۲ ، ۲۳ ]. اکثر رویکردهای مبتنی بر فیلتر مشارکتی با یادگیری اطلاعات ورود به همه کاربران، یک مدل توصیه ایجاد می‌کنند. اگرچه این امر به طور موثر مشکل پراکندگی داده ها را کاهش می دهد، اما ناگزیر اطلاعات پر سر و صدایی را نیز معرفی می کند که بر شخصی سازی برای کاربران فردی تأثیر می گذارد. به عنوان مثال، با تجزیه و تحلیل داده های ورود کاربران، تعداد کمی از کارها نشان می دهد که احتمال ورود کاربران (به عنوان تابعی از مسافت طی شده) از توزیع قانون قدرت پیروی می کند [ ۱۰ ، ۱۲ ]. با این حال، این یافته بر اساس تمام اطلاعات کاربران به دست آمده است، و بنابراین ممکن است الگوهای تحرک تک تک کاربران را منعکس نکند. به این معنی که برخی از فعالیت‌های ورود کاربران ممکن است ویژگی power-law را نشان دهند اما با مقادیر پارامترهای مختلف، در حالی که برخی دیگر ممکن است توزیع متفاوتی را دنبال کنند [ ۵ ]]. بنابراین، مدل‌سازی رفتار ورود کاربران به روشی جهانی ممکن است توصیه‌های مکانی شخصی‌شده ارائه نکند.
به منظور پرداختن به این موضوع، ما یک مدل توصیه مکانی-زمانی شخصی برای هر کاربر بدون در نظر گرفتن تأثیر اطلاعات سایر کاربران پیشنهاد می‌کنیم. ما ابتدا چهار نوع اطلاعات زمانی را شناسایی می‌کنیم که ممکن است بر فعالیت‌های ورود کاربران تأثیر بگذارد: (۱) زمان روز. (۲) روز هفته؛ (۳) تفاوت زمانی بین دو ورود متوالی. (۴) دنباله ای از مهرهای زمانی اعلام حضورهای گذشته کاربر. سپس یک فرآیند گاوسی را اعمال می کنیم [ ۲۴] برای ترکیب سیستماتیک چنین اطلاعات زمانی برای پیش بینی جابجایی های کاربر در مهرهای زمانی زیر. مزایای استفاده از فرآیند گاوسی دو مورد است: (۱) اطلاعات زمانی را به صورت غیر خطی مدل می کند و می تواند الگوهای پیچیده تری را در مقایسه با اکثر کارهای موجود که اطلاعات زمانی را به صورت خطی پردازش می کنند، ثبت کند. (ii) می‌تواند پیش‌بینی‌های متوالی جابه‌جایی کاربر را ارائه دهد (به عنوان مثال، فعالیت‌های متوالی ورود کاربر در ۲۴ ساعت آینده) و بنابراین در برنامه‌های کاربردی دنیای واقعی کاربردی‌تر است.
برای بهبود بیشتر کیفیت توصیه‌ها، همراه با اطلاعات زمانی، دسته‌هایی از مکان‌های اعلام حضور کاربر را نیز در نظر می‌گیریم. به طور خاص، با توجه به شرایط زمانی (مثلاً ساعتی از روز)، احتمال دسته خاصی از مکان ورود بعدی کاربر را با شمارش وقوع چنین ترکیب زمانی-رده‌ای در فعالیت‌های اعلام حضور در گذشته کاربر استخراج می‌کنیم. ارتقای آگاهی معنایی پیشنهادی ترجیحات کاربران را در بازه‌های زمانی مختلف منعکس می‌کند (به‌عنوان مثال، حضور در ساختمان اداری در طول ساعات کاری یا حضور در سینما در آخر هفته)، بنابراین برای ارائه توصیه‌های شخصی‌شده مکان مفید است. یک چارچوب توصیه یکپارچه به نام spatial– t emporal – sسپس Emantic (STS) برای ترکیب مدل‌سازی تأثیر جغرافیایی مبتنی بر فرآیند گاوسی و مدل‌سازی تأثیر معنایی برای ایجاد توصیه نهایی N بالا پیشنهاد می‌شود.
مشارکت‌های این مقاله به شرح زیر خلاصه می‌شود: (۱) ما تجزیه و تحلیل داده‌های ورود را انجام دادیم تا الگوهای رفتاری ناهمگون ورود کاربران و همچنین تأثیر انواع مختلف اطلاعات زمانی را آشکار کنیم. (۲) ما یک مدل مبتنی بر رگرسیون فرآیند گاوسی را برای هر کاربر پیشنهاد می‌کنیم تا جابجایی‌های متوالی را بر اساس فعالیت‌های ثبت‌نام قبلی او برای توصیه مکان پیش‌بینی کند. یک نسخه اصلاح شده از تابع کوواریانس نمایی مربعی به طور سیستماتیک و غیر خطی مدل اطلاعات مکانی- زمانی معرفی شده است. (۳) یک ارتقای آگاهی معنایی برای استنباط توزیع دسته‌بندی مکان‌های ورود بعدی کاربر پیشنهاد شده است. یک چارچوب توصیه یکپارچه STS برای ترکیب چنین پیش‌بینی دسته‌بندی با پیش‌بینی جابجایی برای ارائه توصیه‌های مکان نهایی ایجاد شد. (۴) ما چارچوب STS را بر روی مجموعه داده های واقعی ارزیابی کردیم. نتایج تجربی نشان می‌دهد که رویکرد ما به طور قابل‌توجهی از مدل‌های پیشرفته از نظر دقت و میانگین رتبه متقابل (MRR) بهتر عمل می‌کند.
ساختار بقیه مقاله به شرح زیر است: در بخش ۲ ، ما کار مرتبط در مورد توصیه مکان در LBSN را بررسی می کنیم. بخش ۳ تجزیه و تحلیل داده های ورود به سیستم را برای نشان دادن الگوهای حرکتی کاربر ناهمگن و تأثیر زمانی ارائه می دهد. ما چارچوب پیشنهادی مکان پیشنهادی STS را در بخش ۴ توضیح می‌دهیم ، جایی که پیش‌بینی جابجایی مبتنی بر فرآیند گاوسی، ارتقای آگاهی معنایی و چارچوب توصیه یکپارچه به ترتیب در بخش ۴٫۱ بخش ۴٫۲ و بخش ۴٫۳ ارائه شده‌اند. ما نتایج تجربی را در بخش ۵ گزارش می‌کنیم و پس از آن نتیجه‌گیری و طرح کلی تحقیقات آینده در بخش ۶ ارائه می‌شود.

۲٫ کارهای مرتبط

مدل‌سازی رفتار ورود کاربران LBSN از دیدگاه‌های مختلف، از جمله تأثیر جغرافیایی، تأثیر زمانی، تأثیر معنایی، و غیره در نظر گرفته شده است. ما در مرحله بعد کار مرتبط را از این جنبه‌ها بررسی می‌کنیم و بر الگوهای رفتاری ناهمگون ورود کاربران تأکید می‌کنیم.

۲٫۱٫ نفوذ جغرافیایی

در [ ۱۲ ]، نفوذ جغرافیایی با فرض توزیع قانون قدرت [ ۲۵ ] حرکات جغرافیایی کاربران گرفته شد. یک چارچوب توصیه ترکیبی برای ترکیب ترجیحات، نفوذ جغرافیایی و اجتماعی کاربران در یک فرآیند توصیه پیشنهاد شد. چنگ و همکاران [ ۱۴ ] رفتار ورود چند مرکزی کاربران را بررسی کرد و یک مدل گاوسی چند مرکزی (MGM) را برای مطالعه تأثیر جغرافیایی پیشنهاد کرد. نویسندگان یک مدل فاکتورسازی ماتریسی را برای ترکیب ترجیحات کاربران، تأثیر اجتماعی و تأثیر جغرافیایی برای توصیه مکان پیشنهاد کردند. در [ ۱۸]، یک چارچوب تحلیل عاملی احتمالی جغرافیایی برای مدل‌سازی تأثیرات جغرافیایی بر رفتار ورود کاربر پیشنهاد شد. تنظیمات برگزیده کاربران با در نظر گرفتن داده های تعداد ورود به عنوان بازخورد ضمنی کاربر مدل سازی شد. لی و همکاران [ ۲۶ ] یک مدل MF مبتنی بر رتبه بندی را پیشنهاد کرد و از نفوذ جغرافیایی با در نظر گرفتن جذابیت POIهای همسایه بهره برداری کرد. در [ ۲۱ ]، تأثیر جغرافیایی بین دو POI با استفاده از سه عامل مدل‌سازی شد: تأثیر جغرافیایی POI، که ظرفیت POI در اعمال نفوذ جغرافیایی بر سایر POIها را نشان می‌دهد، حساسیت جغرافیایی POI که تمایل POI را منعکس می‌کند. از نظر جغرافیایی تحت تأثیر سایر POI ها و فاصله فیزیکی آنها قرار می گیرند. ما و همکاران [ ۲۷] یک مدل مبتنی بر رمزگذار خودکار برای توصیه POI، متشکل از یک رمزگذار خود توجه و یک رمزگشای آگاه از همسایه پیشنهاد کرد. در مرحله اول، رمزگذار خود توجه برای تمایز تطبیقی ​​درجه ترجیح کاربر در هر POI ثبت‌شده، با اختصاص یک بردار امتیاز اهمیت استفاده شد. در مرحله دوم، رمزگشای همسایه آگاه برای مدل‌سازی تأثیر جغرافیایی در بین POIها استفاده شد. در [ ۲۸ ]، یک چهارچوب رتبه‌بندی جغرافیایی شخصی‌سازی‌شده ترکیبی ایجاد شد تا اولویت نهفته کاربر و ترجیح جغرافیایی را با استفاده از روش‌های فاکتورسازی ماتریسی و خوشه‌ای به تصویر بکشد. لیو و همکاران [ ۲۹] یک شبکه کانولوشن مولد متسع فضایی-زمانی (ST-DCGN) برای توصیه POI پیشنهاد کرد. این چارچوب اهمیت اطلاعات زمینه‌ای مکانی-زمانی را در نظر می‌گیرد، که ترجیحات مکانی شخصی کاربر را با مدل‌سازی فواصل جغرافیایی پیوسته به دست می‌آورد و ترجیحات زمانی شخصی کاربر را با مدل‌سازی شناسه‌های زمانی پیوسته مشخص می‌گیرد. در مجموع، هنگام مدل‌سازی، تأثیر جغرافیایی در این مطالعات در نظر گرفته می‌شود.

۲٫۲٫ نفوذ زمانی

تحقیقات اخیر بر روی تأثیر زمانی بر توصیه مکان تمرکز کرده است. یوان و همکاران [ ۱۵ ] مشکل توصیه مکان آگاه از زمان را فرموله کرد، که مکان ها را برای کاربر هدف در یک زمان مشخص در روز توصیه می کند. فیلتر مشارکتی مبتنی بر کاربر برای ترکیب اطلاعات زمانی برای ارائه توصیه از دو جنبه استفاده شد: (۱) عامل زمان برای محاسبه شباهت بین دو کاربر در نظر گرفته شد و (۲) توصیه بر اساس اطلاعات ورود کاربران در آن زمان انجام شد. نقطه مورد علاقه، به جای کل تاریخچه ورود. یک تکنیک هموارسازی برای رسیدگی به مسئله پراکندگی داده ها، که با در نظر گرفتن تأثیر زمانی بدتر می شود، استفاده شد. گائو و همکاران [ ۱] یک مدل پیشنهاد مکان جدید بر اساس تأثیر زمانی بر حرکات جغرافیایی کاربر پیشنهاد کرد. دو ویژگی زمانی در این کار در نظر گرفته شد: (۱) عدم یکنواختی، به عنوان مثال، یک کاربر اولویت‌های متفاوتی را برای ورود در ساعات مختلف روز نشان می‌دهد و (۲) متوالی بودن، یعنی کاربر تمایل دارد ترجیحات مشابه بیشتری داشته باشد. ساعت ها. سپس این ویژگی ها در یک مدل فاکتورسازی ماتریسی برای توصیه مکان ادغام شدند. یینگ و همکاران [ ۳۰] یک سیستم توصیه POI آگاه از زمان را ابداع کرد که از دو جزء تشکیل شده است: تجزیه تانسور آگاه از متن برای مدل‌سازی ترجیحات کاربر و رتبه‌بندی POI مبتنی بر جستجوی ابرمتن وزنی (HITS). یک تانسور کاربر-رده-زمان و سه ماتریس (ماتریس کاربر-ویژگی، ماتریس مقوله زمانی و ماتریس دسته-رده) برای مدل‌سازی اولویت‌های کاربر آگاه از زمان ساخته شد. در [ ۳۱ ]، یک مدل رتبه بندی مشترک دو مرحله ای مشترک برای توصیه POI پیشنهاد شد. اطلاعات زمانی در روش‌های مبتنی بر رتبه‌بندی مشترک با استفاده از تنظیم‌کننده حساس به زمان برای ثبت رفتار کاربر درازمدت و الگوهای محبوبیت POI گنجانده شد. در [ ۳۲]، یک مدل فاکتورسازی پواسون تطبیق زمانی برای نمایه کردن محبوبیت POI، مدل سازی منظم بودن کاربران و ترکیب تطابق زمانی بین کاربران و POI پیشنهاد شد. به طور کلی، این مطالعات عمدتاً تأثیر زمانی را هنگام مدل‌سازی در نظر می‌گیرند.

۲٫۳٫ تأثیر معنایی

اطلاعات معنایی مانند دسته‌ها، برچسب‌ها، نکات و بررسی‌ها به طور فراگیر در LBSN در دسترس است. استفاده از چنین اطلاعاتی برای استنباط ترجیح کاربران می تواند به بهبود کیفیت توصیه مکان کمک کند [ ۶ ، ۷ ، ۱۷ ، ۱۸ ، ۳۳ ، ۳۴ ، ۳۵ ]. لیو و همکاران [ ۳۶] یک مدل جدید توصیه مکان آگاه از دسته را پیشنهاد کرد، که از الگوهای انتقال ترجیحات کاربران در دسته‌های مکان برای توصیه مکان شخصی‌سازی شده استفاده می‌کند. در مرحله اول، فاکتورسازی ماتریس برای پیش‌بینی دسته‌بندی‌های احتمالی مکان ورود بعدی کاربر، با توجه به اطلاعات دسته‌بندی مکان فعلی او (یعنی انتقال دسته‌ها) استفاده شد. در مرحله دوم، فاکتورسازی ماتریسی دیگری برای پیش‌بینی اولویت کاربر در مکان‌های دسته‌های مربوطه استنباط‌شده در مرحله اول اعمال شد. هائو و همکاران [ ۳۷] یک الگوریتم توصیه جامع POI را پیشنهاد کرد که یادگیری عمیق را با فیلتر کردن مشارکتی ترکیب می‌کرد. یک شبکه عصبی کانولوشن (CNN) برای استخراج اطلاعات متنی POI و یادگیری نمایش ذاتی آنها و یک مدل تعبیه چندوجهی مکان، زمان و متن برای حفظ پست‌های نظارت بر POI و استخراج مجموعه‌ای از ویژگی‌ها برای نمایش رویدادها یا انفجار استفاده شد. اطلاعاتی که ممکن است کاربران را جذب کند. لیان و همکاران [ ۳۸ ] یک چارچوب فیلترینگ مشارکتی مبتنی بر بازخورد ضمنی مقیاس‌پذیر (ICCF) برای ترکیب محتوای معنایی پیشنهاد کرد. یک الگوریتم بهینه‌سازی نزول مختصات برای مقیاس خطی با اندازه داده و اندازه ویژگی توسعه داده شد. ژانگ و همکاران [ ۳۹] یک چارچوب پیشنهادی POI مبتنی بر نظر ابداع کرد، که ابتدا از رویکرد وابسته به جنبه نظارت شده برای یادگیری یک مدل طبقه‌بندی در فضای خوشه‌ای جنبه‌ها برای پیش‌بینی قطبی‌های نکات استفاده می‌کند و سپس قطب‌های نوک را با پیوندهای اجتماعی و اطلاعات جغرافیایی ترکیب می‌کند. در [ ۸ ]، یک توصیه مکان آگاه از زمینه برای گروه‌های با پیاده‌روی تصادفی (CLGRW) پیشنهاد شد. این رویکرد، زمینه هایی مانند زمینه شخصی، بافت اجتماعی، بافت فضایی شخصی و بافت محیطی را در نظر می گیرد. در تمام مطالعات بررسی شده در بالا، از اطلاعات معنایی متمایز برای بهبود کیفیت توصیه مکان استفاده می شود.

۲٫۴٫ رفتارهای ورود ناهمگون

ژانگ و همکاران [ ۵ ] یک چارچوب توصیه مکان به نام iGSLR برای بررسی تأثیر اجتماعی و جغرافیایی شخصی شده پیشنهاد کرد. برای کاربران فردی، نویسندگان یک رویکرد تخمین چگالی هسته را برای مدل‌سازی تأثیر جغرافیایی بر رفتارهای ورود کاربران به‌عنوان توزیع‌های فردی به جای توزیع جهانی برای همه کاربران اعمال کردند. یک چارچوب توصیه یکپارچه برای ادغام اولویت کاربران، تأثیر اجتماعی، تأثیر جغرافیایی کاربران و تأثیر جغرافیایی شخصی مکان‌ها ایجاد شد. iGSLR نزدیکترین به چارچوب STS شخصی ما است و ما این دو رویکرد را در بخش ارزیابی مقایسه می کنیم. لو و همکاران [ ۹] یک چارچوب پیشنهاد مکان طراحی کرد تا نتایج حاصل از چندین توصیه کننده را که عوامل مختلف را در نظر می گیرند ترکیب کند. برای هر کاربر، تأثیر اساسی هر عامل تخمین زده شد، که بر اساس آن، نتایج از توصیه‌کنندگان مختلف برای استخراج توصیه شخصی جمع‌آوری شد. ژو و همکاران [ ۴۰ ] یک مدل ترکیبی یکپارچه ابداع کرد که مدل موضوعی و شبکه حافظه خارجی را با مکانیزم توجه عصبی ترکیب می‌کند تا اولویت‌های کلی و دقیق کاربران را به تصویر بکشد. به منظور ارتقای توصیه‌های شخصی‌شده، ترجیحات فضایی خاص کاربر و تأثیر فضایی خاص POI توسط یک ماژول جغرافیایی مورد بهره‌برداری قرار گرفت. یین و همکاران [ ۴۱] یک مدل توصیه POI برای اجرای مشترک یادگیری بازنمایی عمیق برای POI از ویژگی‌های ناهمگن و یادگیری نمایش سلسله مراتبی افزایشی برای ترجیحات شخصی آگاه از فضایی پیشنهاد کرد. فناوری‌های منظم‌سازی اجتماعی و هموارسازی فضایی برای غلبه بر پراکندگی داده‌ها در مدل‌سازی اولویت کاربر پویا آگاه از فضایی مورد بهره‌برداری قرار گرفتند. در مجموع، همه این مطالعات ناهمگونی رفتارهای ورود کاربران را هنگام مدل‌سازی در نظر می‌گیرند.

۳٫ بررسی تجزیه و تحلیل داده ها

در این بخش، ما یک تجزیه و تحلیل داده‌های بررسی واقعی ارائه می‌کنیم تا الگوهای حرکتی ناهمگن و تأثیر زمانی کاربران را نشان دهیم. داده ها از Gowalla، یک شبکه اجتماعی محبوب مبتنی بر مکان، که توسط فیس بوک در سال ۲۰۱۱ خریداری شد، جمع آوری شد [ ۳۶ ]. داده های ورود به پنج شهر ایالات متحده، یعنی آستین، شیکاگو، سانفرانسیسکو، لس آنجلس و هیوستون جمع آوری شد و ما از زیر مجموعه ای از داده ها (داده های ورود به شیکاگو) برای گزارش نتایج استفاده کردیم: ۱۳۸۴۵ کاربر وجود دارد که ۴۸۶۵۵۸ اعلام حضور در ۳۷۰۵۰ مکان ایجاد کرد. جزئیات بیشتر از داده های ورود در بخش ۵٫۱٫۱ ارائه شده است.

۳٫۱٫ الگوهای حرکتی ناهمگن

ما به‌طور تصادفی سه کاربر را انتخاب می‌کنیم که بیش از ۱۰۰۰ اعلام حضور دارند تا الگوهای حرکتی ناهمگن آنها را نشان دهیم. شکل ۱a تابع توزیع تجمعی (CDF) جابجایی های کاربران بین دو ورود متوالی را نشان می دهد (در مجموعه داده ما، هر مکان با طول و عرض جغرافیایی مرتبط است، که می تواند برای محاسبه فاصله بین دو مکان استفاده شود). مشاهده می کنیم که کاربر ۱ عمدتاً مسافت های کوتاهی را طی می کند، یعنی بیش از ۹۰ درصد از سفرهای او کمتر از ۲ کیلومتر است. تنها ۲ درصد از جابجایی های کاربر بیش از ۱۰ کیلومتر است. از طرف دیگر، کاربر ۳ اغلب دورتر سفر می کند: حدود ۱۰٪ از جابجایی های او بیش از ۱۵ کیلومتر و طولانی ترین جابجایی ۱۴۶٫۴ کیلومتر است. کاربر ۲ به روش “متوسط” رفتار می کند که کاربر ۱ و کاربر ۳ انجام می دهند. این نتیجه منحصر به فرد بودن توزیع جابجایی کاربران را نشان می دهد.
در شکل ۱ ب، احتمال ورود را به عنوان تابعی از جابجایی ها رسم می کنیم. واضح است که رفتار ورود کاربر ۱ مانند توزیع قانون قدرت را نشان می دهد (مکان های بازدید شده کاربر در فواصل کوتاه هستند، در حالی که سفرهای طولانی با احتمالات بسیار کمتر اتفاق می افتد)، اما توزیع برای کاربر ۳، اگرچه قدرت را نیز نشان می دهد. ویژگی قانون، بسیار “پراکنده” به نظر می رسد (یعنی به طور قابل توجهی از رفتار ورود کاربر ۱ منحرف می شود). این دوباره ثابت می‌کند که توزیع‌های جابجایی کاربران ناهمگن است، بنابراین برای مدل‌سازی به روشی جهانی مانند [ ۱۲ ] نامطلوب است.

۳٫۲٫ نفوذ زمانی

ما تأثیر زمانی را بررسی کردیم (توجه داشته باشید که برای نشان دادن تأثیر زمانی، از همه داده‌های ورود کاربران (شیکاگو) استفاده می‌کنیم) از سه جنبه، یعنی ساعت روز، روز هفته و اختلاف زمانی بین دو بررسی متوالی. ins شکل ۲ a CDF جابجایی ها را در چهار ساعت انتخاب شده در طول روز نشان می دهد. شکاف های آشکاری را می توان در بین ساعات مختلف مشاهده کرد: کاربران تمایل دارند در طول ۱۲ ساعت مسافت زیادی را طی کنند، احتمالاً به دلیل سفر به رستوران. از سوی دیگر، اکثر مردم ساعت ۷ یا بعد از آن شام می خورند، بنابراین جابجایی ها در ساعت ۶ (یعنی تازه کار تمام شده) نسبتا کوتاه است.
سپس CDF جابجایی ها را برای سه روز انتخاب شده در هفته ترسیم کردیم ( شکل ۲ ب را ببینید). تفاوت بین توزیع جابجایی در روزهای مختلف، اگرچه قابل مشاهده است، اما قابل توجه نیست. با این وجود، ما همچنان این نوع اطلاعات زمانی را در رویکرد خود در نظر گرفتیم زیرا: (۱) تفاوت‌های جزئی فقط رفتار همه کاربران را نشان می‌دهد، اما تأثیر روز هفته را بر کاربران منعکس نمی‌کند. (۲) می توان آن را با سایر اطلاعات زمانی ترکیب کرد تا الگوهای رفتار ورود کاربران را به طور دقیق مدل کند.
در نهایت، CDF جابجایی ها در فواصل اختلاف زمانی مختلف (در دقیقه) در شکل ۲ ج نشان داده شده است. تفاوت های زمانی به شش بازه طبقه بندی می شوند: [۰،۳۰]، [۳۱،۶۰]، [۶۱،۱۸۰]، [۱۸۱،۷۲۰]، [۷۲۱،۱۴۴۰] و [۱۴۴۱، +∞]. بدیهی است که هر چه اختلاف زمانی بیشتر باشد، جابجایی ها طولانی تر می شوند. بنابراین، تفاوت زمانی بین دو ورود متوالی می‌تواند نوع امیدوارکننده‌ای از اطلاعات زمانی برای مدل‌سازی رفتار ورود باشد.

۴٫ STS: توصیه مکان مکانی – زمانی – معنایی

در این بخش چارچوب STS خود را شرح می دهیم. در یک LBSN، مجموعه ای از کاربران را با علامت گذاری می کنیم U={تو۱،تو۲،…}و مجموعه ای از مکان ها توسط L={ل۱،ل۲،…}. برای هر کاربر u ، سوابق ثبت نام تاریخی او (به ترتیب زمانی) با نشان داده می شود سیتو={ج۱،ج۲،…}، جایی که جمن=<لمن،تیمن>آیا شما اولین ورود شما شامل مکان است ؟لمنو اطلاعات زمانی مربوطه تیمن. توجه داشته باشید که لمنشامل اطلاعات توصیفی مانند طول جغرافیایی، عرض جغرافیایی و دسته بندی مکان می باشد.
ما چهار نوع اطلاعات زمانی را شناسایی می کنیم: (۱) ساعت از روز (با مشخص شده است تی۱) (۲) روز هفته (مشخص شده با تی۲) (۳) اختلاف زمانی بین دو ورود متوالی (با مشخص شده است تی۳) (۴) دنباله ای از مهرهای زمانی اعلام حضورهای گذشته کاربر به ترتیب زمانی (مشخص شده با تی۴). تأثیر سه نوع اول اطلاعات زمانی در بخش ۳٫۲ نشان داده شده است . نوع چهارم اطلاعات زمانی برای رمزگذاری اثر “توالی” استفاده می شود. به این معنا که مدل‌های پیشنهادی مکان مرسوم، الگوهای رفتار ورود کاربران را از مجموعه‌ای از ورودهای تاریخی بدون در نظر گرفتن توالی چنین ورود‌هایی مورد مطالعه قرار دادند. این ممکن است برخی از ویژگی‌های مهم مانند انتقال ترجیحات کاربران [ ۳۶ ] را نادیده بگیرد (به عنوان مثال، کاربر دوست دارد پس از خرید در مرکز شهر در رستوران مورد علاقه‌اش ثبت نام کند و سپس از یک فنجان قهوه در نزدیکی آپارتمان خود لذت می‌برد)، که برای توصیه موقعیت مکانی شخصی
با مدل‌سازی جامع تأثیر زمانی از چهار جنبه ذکر شده در بالا، جابجایی کاربر را از مکان حضوری فعلی‌اش به مکان اعلام‌شده بعدی که در بخش فرعی بعدی ارائه می‌شود، پیش‌بینی می‌کنیم.

۴٫۱٫ پیش بینی جابجایی

برای کاربر u ، بردار جابجایی های او را بین دو ورود متوالی (به ترتیب زمانی) با نشان می دهیم Dتو، که می تواند با اطلاعات موقعیت جغرافیایی مربوطه (یعنی اطلاعات طول و عرض جغرافیایی) محاسبه شود. اطلاعات زمانی مربوط به جابجایی ها با نشان داده می شود تیتو=[تی۱⊤،تی۲⊤،تی۳⊤،تی۴⊤](یعنی اطلاعات زمانی ۴ بعدی مربوط به هر جابجایی است). شکل ۳ روابط بین را نشان می دهد سیتو، Dتوو تیتو.
درمان می کنیم تیتوبه عنوان متغیر مستقل، Dتوبه عنوان متغیر وابسته و اعمال فرآیند گاوسی برای پیش بینی جابجایی های آینده کاربران با توجه به چهار نوع اطلاعات زمانی. یک فرآیند گاوسی [ ۲۴ ] تعمیم توزیع احتمال گاوسی است، در حالی که توزیع احتمال متغیرهای تصادفی را توصیف می کند که اسکالر یا بردار هستند (برای توزیع های چند متغیره)، یک فرآیند تصادفی بر خواص توابع حاکم است. توزیع یک فرآیند گاوسی به طور کامل با تابع میانگین و تابع کوواریانس آن مشخص می شود. یک فرآیند گاوسی پ(f)توزیع بر روی توابع را تعریف می کند، جایی که f تابعی است که فضای ورودی را ترسیم می کند ایکسبه آر، یعنی f:ایکس→آر. اجازه دهید f=(f(ایکس۱)،f(ایکس۲)،…،f(ایکسn))نشان دهنده یک بردار n بعدی از مقادیر تابع در n نقطه مربوطه استایکسمن∈ایکس. به طور رسمی، پ(f)یک فرآیند گاوسی برای هر زیر مجموعه محدودی است {ایکس۱،ایکس۲،…،ایکسn}، توزیع حاشیه ای بر روی آن زیر مجموعه محدود پ(f)از یک توزیع گاوسی چند متغیره پیروی می کند [ ۲۴ ].

هدف از مدل مبتنی بر فرآیند گاوسی ما یادگیری یک تابع نهفته است fتوکه اطلاعات زمانی کاربر را ترسیم می کندتیتوبه بردار جابجایی او Dتو:

fتو:تیتو→Dتو.

به منظور در نظر گرفتن نویز، که در عمل رایج است (مثلاً مختصات GPS کاملاً دقیق نیستند)، یک نویز گاوسی مستقل و مستقل را فرض می‌کنیم. ϵ، با واریانس σ۲:

Dتو=fتو(تیتو)+ϵ.

توزیع مشترک جابجایی های مشاهده شده fتوو مقادیر تابعی که باید پیش بینی شود fتو”با توجه به این تئوری که مقادیر تابعی که باید آموخته شود از توزیع گاوسی چند متغیره تبعیت می کند، به دست می آید:

fتوfتو”∼ن(μ(تیتو)μ(تیتو”)،ک(تیتو،تیتو)+σ۲منک(تیتو،تیتو”)ک(تیتو”،تیتو)ک(تیتو”،تیتو”))،

جایی که من ماتریس هویت هستم، μ()تابع میانگین است و ک()ماتریس کوواریانس است. این (r،ج)عنصر ام از ک(تیتو،تیتو)نشان دهنده کوواریانس محاسبه شده در اطلاعات زمانی ۴ بعدی r و c درتیتو. بر این اساس، عناصر ک(تیتو”،تیتو)، ک(تیتو،تیتو”)و ک(تیتو”،تیتو”)نشان دهنده کوواریانس های محاسبه شده در تمام جفت های اطلاعات زمانی ۴ بعدی در ( تیتو”، تیتو)، ( تیتو، تیتو”) و تیتو”، به ترتیب. شکل ۴ نمونه ای از ماتریس کوواریانس را نشان می دهد ک(تیتو،تیتو”).

با شرطی کردن توزیع قبلی گاوسی مشترک بر روی اطلاعات زمانی مشاهده شده، احتمال fتو”:

fتو”|fتو،تیتو،تیتو”∼ن(μ(تیتو”)+ک(تیتو”،تیتو)(ک(تیتو،تیتو)+σ۲من)-۱(fتو-μ(تیتو))،ک(تیتو”،تیتو”)-ک(تیتو”،تیتو)(ک(تیتو،تیتو)+σ۲من)-۱ک(تیتو،تیتو”)).

ما می توانیم تابع نهفته تخمین زده شده را بدست آوریم fتو”یعنی جابجایی های آینده پیش بینی شده بر اساس توزیع آن:

fتو”¯=μ(تیتو”)+ک(تیتو”،تیتو)(ک(تیتو،تیتو)+σ۲من)-۱(fتو-μ(تیتو))،

فرآیند گاوسی همچنین واریانس توزیع را تولید می کند که می تواند برای اندازه گیری اطمینان پیش بینی استفاده شود:

vآr(fتو”)=ک(تیتو”،تیتو”)-ک(تیتو”،تیتو)(ک(تیتو،تیتو)+σ۲من)-۱ک(تیتو،تیتو”)).
از تعریف آن، یک مدل رگرسیون فرآیند گاوسی به طور کامل توسط یک تابع میانگین و یک تابع کوواریانس مشخص می‌شود. در بخش بعدی، نحوه طراحی این دو تابع برای مدل پیش‌بینی جابجایی را مورد بحث قرار می‌دهیم.

۴٫۱٫۱٫ تابع میانگین و تابع کوواریانس

برای تابع میانگین، از یک فرم ساده استفاده می کنیم که میانگین جابجایی های گذشته کاربر u است:

μ=∑من=۱|Dتو|دمن|Dتو|.

توابع کوواریانس متعددی وجود دارد که فرآیند گاوسی را در سناریوهای مختلف کاربردی انعطاف پذیر می کند. ما با یک تابع معروف به نام تابع کوواریانس نمایی مربعی برای مدل خود شروع می کنیم:

ک(تیمتر،تیn)=ساعت۲انقضا(-∑من=۱۴wمن(تیمن،متر-تیمن،n)22λ۲)،

جایی که تیمترو تیnاطلاعات زمانی ۴ بعدی مرتبط با دو جابجایی (نمایه شده توسط m و n ) کاربر u هستند. h و λفراپارامترهایی هستند که به ترتیب مقیاس (یا واریانس) خروجی تابع و مقیاس طول ورودی را کنترل می کنند. از آنجایی که چهار نوع اطلاعات زمانی ممکن است تأثیرات متفاوتی بر فعالیت‌های ورود کاربران داشته باشند، ما آنها را با تعیین وزن برای هر نوع ترکیب می‌کنیم (به عنوان مثال، wمن، جایی که من=۱،۲،۳،۴). ما این وزن ها را با یادگیری از داده های مشاهده شده تعیین می کنیم. توجه داشته باشید که اگرچه چهار نوع اطلاعات زمانی ترکیب شده اند تا تأثیر زمانی را به صورت خطی نشان دهند، اما تأثیر متقابل بین اطلاعات زمانی هر جفت جابجایی کاربر u به صورت غیرخطی (یعنی به شکل یک ماتریس کوواریانس) مدل‌سازی می‌شود. ، به شکل ۴ مراجعه کنید )، که قادر است با دقت بیشتری تأثیر زمانی بر رفتار ورود کاربران را به تصویر بکشد.

توجه داشته باشید که ما ادعا نمی کنیم که تابع کوواریانس نمایی مربعی مناسب ترین تابع برای پیش بینی جابجایی است. ما به عنوان یک کار آینده، بحث مفصل تری را در مورد مبادله بین توابع کوواریانس پیچیده تر (به عنوان مثال، تابع کوواریانس شبکه عصبی) و هزینه های محاسباتی اضافی مرتبط باقی می گذاریم.
۴٫۱٫۲٫ اتصالات مدل
در این بخش، نحوه برازش مدل، از جمله یادگیری فراپارامترهای تابع کوواریانس و وزن هر نوع اطلاعات زمانی را مورد بحث قرار می دهیم.

طبق تعریف فرآیند گاوسی، توزیع داده های مشاهده شده از توزیع گاوسی چند متغیره تبعیت می کند:

پ(Dتو|تیتو،Θتو)=(۲π)-|تیتو|۲|ک(تیتو،تیتو)|-۱۲ه-۱۲(Dتو-μ)⊤ک(تیتو،تیتو)-۱(Dتو-μ)،

جایی که Θتوپارامترهای مدل متشکل از فراپارامترهای تابع کوواریانس و وزن اطلاعات زمانی هستند. احتمال حاشیه ای ورود به سیستم منفی مربوطه به دست می آید:

L=-ورود به سیستمپ(Dتو|تیتو،Θتو)=|تیتو|۲ورود به سیستم۲π+۱۲ورود به سیستم|ک(تیتو،تیتو)|+۱۲(Dتو-μ)⊤ک(تیتو،تیتو)-۱(Dتو-μ).

برازش مدل به یک مسئله بهینه سازی غیرمحدب برای به حداقل رساندن احتمال حاشیه ای ورود به سیستم منفی تبدیل می شود . ما نزول گرادیان تصادفی (SGD) را برای یادگیری پارامترهای مدل اعمال می کنیم Θتو، که به طور مکرر به روز می شوند:

Θتو←Θتو-α∂LΘتو،

جایی که αمیزان یادگیری است. اگر به حداکثر تعداد تکرارهای از پیش تعریف شده رسیده باشد یا احتمال حاشیه ای ورود به سیستم منفی در یک تکرار خاص همگرا شود، روند بهینه سازی تکمیل می شود.

ما مشتقات L را با توجه به پارامترهای مدل پیدا می کنیمΘتو(هیپرپارامترهای تابع کوواریانس h , λ، σو وزن هر نوع اطلاعات زمانی wمن):

∂L∂Θتو=۱۲تیr(ک(تیتو،تیتو)-۱∂ک(تیتو،تیتو)∂Θتو)-۱۲(Dتو-μ)⊤ک(تیتو،تیتو)-۱∂ک(تیتو،تیتو)∂Θتوک(تیتو،تیتو)-۱(Dتو-μ)،

که در آن مشتق ماتریس کوواریانس است ک(تیتو،تیتو)با توجه به هر فراپارامتر کوواریانس به دست می آید (عنصر ماتریس با ردیف m و ستون n نمایه می شود ):

∂ک(تیتو،تیتو)∂ساعت=۲ساعت·انقضا(-∑من=۱۴wمن(تیمن،متر-تیمن،n)22λ۲)،
∂ک(تیتو،تیتو)∂λ=ساعت۲·انقضا(-∑من=۱۴wمن(تیمن،متر-تیمن،n)22λ۲)·∑من=۱۴wمن(تیمن،متر-تیمن،n)2λ۳،

و

∂ک(تیتو،تیتو)∂σ=۲σمن.

مشتق ماتریس کوواریانس ک(تیتو،تیتو)با توجه به وزن هر نوع اطلاعات زمانی wمنبه دست می آید (عنصر ماتریس با ردیف m و ستون n نمایه می شود ):

∂ک(تیتو،تیتو)∂wمن=ساعت۲·انقضا(-∑من=۱۴wمن(تیمن،متر-تیمن،n)22λ۲)·(-(تیمن،متر-تیمن،n)22λ۲).

۴٫۲٫ تقویت معنایی آگاهانه

پیش بینی جابجایی تخمین حرکت جغرافیایی کاربران را برای توصیه مکان ارائه می دهد. در این بخش، با مطالعه اطلاعات دسته‌بندی مکان‌های ورود کاربران (توجه داشته باشید که هر مکان با اطلاعات دسته‌بندی مرتبط است. به عنوان مثال، یک رستوران غذاهای دریایی به دسته «غذا» تعلق دارد، یک ارتقای آگاهی معنایی را پیشنهاد می‌کنیم.) برای استنتاج توزیع اولویت آگاه از زمان آنها برای توصیه.
دسته بندی شده در سیستم را با نشان می دهیم Ψ={ψ۱،ψ۲، ψ۳،…}. هدف از ارتقای آگاهی معنایی استنتاج توزیع احتمال کاربر از اطلاعات دسته است، به عنوان مثال، احتمال اینکه کاربر در مکانی تحت یک دسته خاص با توجه به محدودیت‌های اطلاعات زمانی بررسی شود: پ(Ψ|تی). توجه داشته باشید که ما فقط دو نوع اطلاعات زمانی را در نظر می گیریم، یعنی ساعت روز و روز هفته هنگام استخراج توزیع دسته.

برای کاربر u ، توزیع دسته با شمارش وقوع یک دسته خاص تخمین زده می شود ψمندر زمینه زمانی داده شده تی”از بررسی های تاریخی او:

پ^(ψمن|تی”)=nψمن،تی”|سیتو|،

جایی که nψمن،تی”تعداد وقوع دسته است ψمنبا توجه به اطلاعات زمانی تی”، و |سیتو|تعداد بازدیدهای کاربر توسط شما است. توجه داشته باشید که توزیع احتمال دسته مشتق شده مشروط به این شرط است که ∑من=۱|Ψ|پ(ψمن|تی”)= ۱٫ بر اساس چنین توزیع دسته بندی، ما می توانیم ترجیحات کاربر را در یک بازه زمانی مشخص استنباط کنیم و از این رو دقت توصیه مکان را بهبود ببخشیم.

۴٫۳٫ یک چارچوب توصیه یکپارچه

در این بخش، ما یک چارچوب توصیه یکپارچه به نام STS ایجاد می‌کنیم تا پیش‌بینی جابجایی و ارتقای آگاهی معنایی را ادغام کند تا توصیه‌های مکانی بالای N شخصی برای کاربر u ارائه دهد.

با توجه به اطلاعات زمانی تیتو، جابجایی بعدی پیش بینی شده کاربر u را با نشان می دهیمدتو(به بخش ۴٫۱ مراجعه کنید ). برای مکان نامزد ل”، ما فاصله بین مکان فعلی کاربر u را محاسبه می کنیمل”، نشان داده شده با د”. سپس تفاوت بین را بدست می آوریم دتوو د”:

Δتو=|دتو-د”|.

از نظر تئوری، تفاوت کمتر است Δتو، احتمال اینکه مکان بررسی شود بیشتر می شود. بر اساس چنین تفاوت فاصله جغرافیایی، احتمال اینکه محل نامزد باشد را استخراج می کنیم ل”توسط کاربر u بررسی خواهد شد .

پتو،ل”د=۱اگرΔتو≤۱۱ΔتوnاگرΔتو>1،

که در آن n یک پارامتر طراحی است که خطای پیش‌بینی جابجایی را محدود می‌کند. یک n مناسب یک n معقول ایجاد می کند (یک n بسیار کوچک نمی تواند خطای پیش بینی جابجایی را محدود کند (به عنوان مثال، زمانی که n = ۱، خطاهای پیش بینی ۱۰ متر و ۱۰۰ متر به ترتیب احتمال بررسی ۰٫۱ و ۰٫۰۱ را ایجاد می کنند، که به طور منطقی قابل مقایسه نیستند. در دنیای واقعی)؛ و یک n بسیار بزرگ می سازد پتو،ل”درویکرد به ۱، که در واقع تأثیر جغرافیایی را از بین می برد.) احتمال ورود که با احتمال ورود به معنای معنایی برای توصیه ترکیب می شود. انتخاب n به مجموعه داده مورد استفاده بستگی دارد، ما در بخش ۵ مثالی برای یک LBSN واقعی خواهیم داد .

در ادامه تأثیر معنایی بر احتمال ورود را ارائه دهید. دسته بندی مکان نامزد را نشان می دهیم ل”توسط ψ”. بر اساس توزیع دسته کاربر uپتو(Ψ|تیتو)(به بخش ۴٫۲ مراجعه کنید )، ما این احتمال را به دست می آوریم که کاربر در مکانی تحت دسته بندی ثبت نام کند. ψ”:

پتو،ل”س=پ^تو(ψ”|تیتو).

در نهایت، ما تأثیر مکانی-زمانی و تأثیر معنایی-زمانی را با هم ترکیب می‌کنیم تا احتمال نهایی را بدست آوریم که کاربر u در مکان نامزد بررسی می‌شود.ل”:

پتو،ل”=پتو،ل”دپتو،ل”س.
توجه داشته باشید که ما سایر روش‌های همجوشی مانند جمع وزنی را نیز امتحان کردیم پتو،ل”دو پتو،ل”س; با این حال، نتایج تجربی نشان می‌دهد که قانون محصول همیشه از قانون مجموع بهتر عمل می‌کند. این نیز با مشاهدات در [ ۵ ] سازگار است. بنابراین در این کار فقط از قانون محصول به عنوان روش فیوژن استفاده می کنیم.
به این ترتیب، احتمال ورود کاربر u را برای همه مکان‌های نامزد دریافت می‌کنیم. مکان های برتر که دارای بالاترین احتمال ورود هستند توصیه می شود.

۵٫ ارزیابی و بحث

۵٫۱٫ تنظیمات آزمایشی

۵٫۱٫۱٫ مجموعه داده ها

به منظور ارزیابی چارچوب STS شخصی‌شده پیشنهادی، از مجموعه داده‌های ورود واقعی جمع‌آوری‌شده از Gowalla استفاده کردیم. ما از APIهای Gowalla برای جمع‌آوری داده‌های ورود کاربران (طول جغرافیایی، عرض جغرافیایی، مهرهای زمانی، و غیره) استفاده کردیم که قبل از ۱ ژوئن ۲۰۱۱ در شهرهای زیر تولید شده‌اند: آستین، شیکاگو، هیوستون، لس‌آنجلس و سانفرانسیسکو [ ۳۶ ]. آمار داده های ورود در شهرهای مختلف در جدول ۱ خلاصه شده است که در آن نتوتعداد کاربران را نشان می دهد، نلتعداد مکان ها را نشان می دهد، نجتعداد ورودها را نشان می دهد، ن˜تونشان دهنده میانگین تعداد کاربران بازدید شده برای یک مکان و ن˜لبرای نشان دادن میانگین تعداد مکان های بازدید شده برای یک کاربر استفاده شد.
ما همچنین اطلاعات دسته بندی هر مکان مشاهده شده را جمع آوری کردیم. مکان‌ها در Gowalla به ۷ دسته اصلی، یعنی اجتماع، سرگرمی، غذا، زندگی شبانه، فضای باز، خرید و سفر دسته‌بندی شدند. در هر دسته اصلی، مکان ها به زیرمجموعه های مختلف طبقه بندی شدند (در سطح دوم در مجموع ۱۳۴ دسته وجود دارد). توجه داشته باشید که ممکن است زیرمجموعه‌های خاصی به دسته‌های خاص‌تری تقسیم شوند، اما به دلیل ناقص بودن داده‌ها، ما فقط سطوح دسته اول و دوم را در آزمایش‌های خود در نظر گرفتیم.
برای هر کاربر، اعلام حضورهای تاریخی او را به ترتیب زمانی مرتب کردیم. اولین ۷۰%بررسی‌ها به‌عنوان داده‌های آموزشی برای یادگیری مدل توصیه مکان انتخاب شدند و بقیه برای آزمایش استفاده شدند.
۵٫۱٫۲٫ خطوط پایه
ما چارچوب STS خود را با روش های پیشرفته توصیه مکان مقایسه کردیم. BaseMF [ ۴۲ ]: این مدل تنها ترجیحات کاربران را در مورد مکان‌ها برای توصیه بدون در نظر گرفتن اطلاعات جانبی دیگر (مثلاً تأثیر مکانی – زمانی) در نظر می‌گیرد. SGD برای برازش مدل با یادگیری ماتریس مکان کاربر استفاده شد. توصیه Top -N با مرتب‌سازی مکان‌های نامزد به ترتیب نزولی ترجیحات پیش‌بینی‌شده تولید شد. GeoCF [ ۱۲]: نفوذ جغرافیایی با استفاده از توزیع قانون قدرت، که با یک الگوریتم فیلتر مشترک مبتنی بر کاربر ادغام شده است، گرفته شد. یک چارچوب توصیه یکپارچه POI برای ترکیب خطی اولویت کاربر و نفوذ جغرافیایی پیشنهاد شده است. PTMF [ ۳۶ ]: این رویکرد شامل دو مرحله است که در مرحله اول، انتقال ترجیحی کاربران (که توسط دسته‌های مکان‌های ثبت‌شده ارائه می‌شود) توسط یک مدل BaseMF پیش‌بینی شد و در مرحله دوم، ترجیحات کاربران در مکان‌ها پیش‌بینی شد. در دسته بندی های مربوطه (پیش بینی شده توسط مرحله اول) توسط مدل BaseMF دیگری استنباط شد. توصیه Top -N بر اساس پیش‌بینی اولویت‌های آگاه از دسته ارائه شد. iGSLR [ ۵]: مشابه چارچوب STS ما، این رویکرد با استفاده از روش تخمین چگالی هسته برای مدل‌سازی نفوذ جغرافیایی، یک مدل توصیه شخصی برای کاربران تکی ایجاد می‌کند. یک چارچوب توصیه یکپارچه برای ترکیب ترجیحات کاربران (به دست آمده از فیلتر مشارکتی مبتنی بر کاربر) و نفوذ جغرافیایی برای توصیه نهایی استفاده شد. TempMF [ ۱ ]: این مدل تأثیر زمانی را از جنبه‌های غیریکنواختی و متوالی مطالعه می‌کند ( برای جزئیات بیشتر به بخش ۲ مراجعه کنید). فاکتورسازی ماتریس برای ادغام تأثیر زمانی به روش خطی (یعنی تجمیع خطی ترجیحات کاربران در ساعات مختلف) استفاده می‌شود. Distance2Pre [ ۴۳]: این مدل بر مدلسازی همبستگی بین کاربر و فاصله تمرکز دارد. اولویت‌های متوالی کاربران ابتدا با مدل‌سازی توالی‌های ورود به سیستم آموخته می‌شوند. سپس، ترجیحات فضایی کاربران با مدل‌سازی فواصل بین POI‌های بازدید شده متوالی آموخته می‌شود. یک روش همجوشی غیر خطی برای ادغام دو نوع اولویت برای توصیه پیشنهاد شده است. POI2Vec [ ۴۴ ]: این روش بازدیدکنندگان بالقوه را برای یک POI معین در آینده نزدیک پیش بینی می کند. یک درخت دودویی برای خوشه‌بندی POIهای مجاور در همان منطقه استفاده می‌شود و یک POI به چندین منطقه اختصاص داده می‌شود تا نفوذ فضایی آن را تقویت کند. سپس، روشی که به طور مشترک انتقال متوالی POI و ترجیح کاربر را مدل‌سازی می‌کند، توسعه یافت.
برای مدل‌های مبتنی بر فاکتورسازی ماتریسی که عوامل پنهان را بر اساس توزیع معین (مثلاً توزیع یکنواخت در محدوده [۰،۱]) مقداردهی اولیه می‌کنند، اعتبارسنجی متقابل ۵ پوشه‌ای انجام شد و نتایج میانگین گزارش شد.
۵٫۱٫۳٫ معیارهای

هدف یک مدل پیشنهاد مکان این است که با توجه به اطلاعات اعلام حضور کاربر در حال حاضر، مکان‌هایی را که دارای بالاترین رتبه‌بندی‌شده‌ترین مکان‌ها هستند، به‌طوری‌که اعلام حضور بعدی وی پس از یکی از مکان‌های توصیه‌شده انجام شود، توصیه شود برای اندازه‌گیری دقت روش پیشنهاد مکان، از Precision@N استفاده کردیم که نسبت مکان‌های پیش‌بینی‌شده موفقیت‌آمیز به توصیه‌های برتر N است :

پrهجمنسمنon@ن=∑تو∈U|Lتوr⋂Lتو|ن|U|،

جایی که Uنشان‌دهنده مجموعه کاربران از مجموعه داده آزمایشی است، N نشان‌دهنده اندازه لیست توصیه‌ها است، Lتوrنشان دهنده لیست توصیه های برتر N است که توسط مدل توصیه برای کاربر u ارائه شده استLتونشان دهنده لیست موقعیت مکانی واقعی است که توسط کاربر u بررسی شده است. از این متریک می توان برای نشان دادن نسبت ضربه توصیه top -N استفاده کرد.

در همین حال، ما همچنین از میانگین رتبه متقابل (MRR)، یک معیار رتبه‌بندی محبوب برای اندازه‌گیری کیفیت توصیه‌ها استفاده می‌کنیم، با این که بفهمیم اولین مکان با موفقیت پیش‌بینی شده چقدر از بالای فهرست فاصله دارد (میانگین در تمام موارد آزمایشی):

مآرآر=۱|U|∑من=۱|U|1آرمن،

جایی که آرمنموقعیت اولین مکان پیش‌بینی‌شده با موفقیت در لیست توصیه‌هایی است که برای کاربر من بازگردانده شده است.

۵٫۲٫ نتایج تجربی

در این بخش، ابتدا طراحی چارچوب STS پیشنهادی را از سه جنبه، یعنی تأثیر پراکندگی داده، تأثیر انواع مختلف اطلاعات زمانی و تأثیر اطلاعات دسته‌بندی تأیید می‌کنیم. پارامترهای تابع کوواریانس h , λو σبه ترتیب روی ۱، ۱ و ۵۰ تنظیم می شوند. نرخ یادگیری SGD روی ۰٫۰۰۰۰۱ تنظیم شده است. وزن چهار نوع اطلاعات زمانی به صورت ۱ مقداردهی می شود. n که خطای پیش‌بینی جابجایی را محدود می‌کند (به معادله ( ۱۹ ) مراجعه کنید) برای داده‌های شیکاگو و هیوستون ۶، برای داده‌های آستین و سانفرانسیسکو ۸ و برای داده‌های لس آنجلس ۱۰ تنظیم می‌شود. سپس ما عملکرد STS را با مدل های پیشرفته توصیه مکان مقایسه می کنیم.

۵٫۲٫۱٫ اثر پراکندگی داده ها

جدول ۲ عملکرد چارچوب STS را با حجم های مختلف داده های آموزشی خلاصه می کند (یعنی x % اول ورود هر کاربر). واضح است که برای همه مجموعه‌های داده، هم دقت و هم MRR با افزایش حجم داده‌های آموزشی افزایش می‌یابد. با این حال، در LBSN ها، اطلاعات ورود کاربران معمولاً پراکنده است، که بر عملکرد مدل های توصیه تأثیر می گذارد. برای تأیید اعتبار STS در یک تنظیم پراکندگی، x را روی ۲۵ تنظیم می‌کنیم و مشاهده می‌کنیم که STS همچنان کیفیت توصیه‌ای نسبتاً بالایی را در مقایسه با مدل‌های دیگر توصیه‌های مکان ارائه می‌کند که تحت شرایطی کار می‌کنند که ۷۰ درصد از اعلام حضورهای کاربران برای آموزش مدل (به مطالعات مقایسه ارائه شده در بخش ۵٫۲٫۴ مراجعه کنید).
در آزمایش‌های زیر، x را به‌طور پیش‌فرض روی ۷۰ تنظیم کردیم تا داده‌های آموزشی و داده‌های آزمایشی را برای همه مدل‌های توصیه مکان تقسیم کنیم.
۵٫۲٫۲٫ اثر اطلاعات زمانی
شکل ۵ ، در پنج شهر، مقایسه عملکرد بین چهار نوع STS را نشان می دهد، که تنها یکی از چهار نوع اطلاعات زمانی را به صورت جداگانه در نظر می گیرند (یعنی ساعت روز، روز هفته، تفاوت زمانی بین دو ورود متوالی و تمبرهای زمانی) و چارچوب کامل STS که بر تمام اطلاعات زمانی متکی است. یعنی برای یک نوع STS، تیتودر شکل ۳ یک بردار یک بعدی است.
مشاهده می‌کنیم که هر گونه اطلاعات زمانی فردی برای مدل‌سازی رفتار ورود کاربران کافی نیست، اما وقتی این نوع اطلاعات زمانی با هم ترکیب شوند، دقت پیش‌بینی جابجایی کاربران به وضوح بهبود می‌یابد. شکل ۵ a,b نیز اهمیت انواع مختلف اطلاعات زمانی را نشان می دهد. هیچ مشاهداتی وجود ندارد که نشان دهد کدام نوع اطلاعات زمانی به طور مداوم در پیش‌بینی جابجایی مهم‌تر از سایرین است و پیچیدگی و ناهمگونی مجموعه‌های داده را نشان می‌دهد. با این وجود، با توجه به داده‌های شیکاگو، مشاهده می‌کنیم که روز هفته اهمیت کمتری نسبت به ساعت روز و تفاوت ساعت دارد. این با نتایج تجزیه و تحلیل داده های ارائه شده در بخش ۳ مطابقت دارد ( شکل ۲ را ببینید). همچنین متوجه شدیم که مهرهای زمانی در برخی سناریوها (مانند داده‌های سانفرانسیسکو و داده‌های لس آنجلس) عملکرد بهتری از سایر اطلاعات زمانی دارند که نشان‌دهنده اهمیت در نظر گرفتن توالی رفتار ورود کاربران برای مدل‌سازی تحرک است.
۵٫۲٫۳٫ اثر اطلاعات دسته
ما در نهایت تاثیر اطلاعات دسته را مطالعه می کنیم. شکل ۶ مقایسه بین چهار نوع STS را نشان می دهد: (۱) یکی که سطح ۱ را برای تأثیر معنایی مدل اعمال می کند، به نام STS-C1. (۲) موردی که سطح ۲ را اعمال می کند، به نام STS-C2. (۳) چیزی که هیچ تأثیر معنایی را در نظر نمی گیرد، به نام STS-NC (به عنوان مثال، فقط پیش بینی جابجایی برای ارائه توصیه استفاده می شود، به معادله ( ۱۹ ) مراجعه کنید؛ (۴) چیزی که تنها بر تأثیر معنایی بدون در نظر گرفتن تکیه می کند. هر گونه نفوذ جغرافیایی، به نام STS-C (به معادله ( ۲۰ ) مراجعه کنید).
مشاهده می‌کنیم که وقتی سطح ۲ اعمال می‌شود، STS-C2 به طور قابل‌توجهی از STS-C1 که به سطح رده ۱ متکی است، بهتر عمل می‌کند. این نتیجه اهمیت انتخاب سطح دسته را نشان می‌دهد. در مطالعات مقایسه ای ارائه شده در زیربخش بعدی، چارچوب STS به طور پیش فرض از سطح ۲ استفاده می کند. وقتی هیچ اطلاعات دسته ای در نظر گرفته نمی شود (یعنی فقط پیش بینی جابجایی برای توصیه استفاده می شود)، عملکرد STS-NC امیدوارکننده نیست. این به دلیل پدیده خوشه‌بندی رایج مکان‌ها است، به عنوان مثال، مجموعه‌ای از مکان‌ها در جایی که فواصل مکان‌ها کوتاه است (مثلاً بسیاری از رستوران‌ها و مغازه‌ها در یک مرکز خرید قرار دارند) خوشه‌بندی می‌شوند. بنابراین حتی اگر خطای پیش‌بینی جابجایی به اندازه ۱۰۰ متر باشد، پیش‌بینی موفقیت‌آمیز مکان‌های هدف در حضور پدیده خوشه‌بندی مکان همچنان چالش برانگیز است. از سوی دیگر، اگر فقط از اطلاعات دسته‌بندی استفاده شود، عملکرد STS-C نیز امیدوارکننده نیست، که نشان‌دهنده اثربخشی مدل‌سازی مشترک تأثیر جغرافیایی و تأثیر معنایی (با در نظر گرفتن تأثیر زمانی) است.
ممکن است متوجه شوید که عملکرد STS-NC (یعنی فقط پیش‌بینی جابجایی مبتنی بر GP برای توصیه استفاده می‌شود) کمتر از روش‌های پیشرفته است ( جدول ۳ را ببینید).)، بنابراین اثربخشی رویکرد مبتنی بر پزشک عمومی ما در توصیه مکان زیر سوال می رود. با این حال، ما استدلال می‌کنیم که روش‌های پیشرفته عمدتاً مدل‌های ترکیبی هستند که تأثیر جغرافیایی را با بسیاری از عوامل دیگر مانند فیلتر کردن مشارکتی برای ارائه توصیه ترکیب می‌کنند، بنابراین مقایسه پیش‌بینی جابجایی مبتنی بر GP ما مستقیماً با این مدل‌ها ناعادلانه است. در واقع، زمانی که تنها تأثیر جغرافیایی در نظر گرفته می‌شود، روش مبتنی بر GP ما عملکرد انواع GeoCF و iGSLR را بهبود می‌بخشد (GeoCF و iGSLR دو مدل توصیه مکان هستند که تأثیر جغرافیایی را بررسی می‌کنند.) (یعنی فقط مؤلفه‌هایی استفاده می‌شوند که تأثیر جغرافیایی را ثبت می‌کنند. ) به ترتیب ۱۵٫۲۴% و ۱۲٫۴۱% از نظر دقت. در ادامه به بررسی مقایسه‌ای بین رویکرد خود و مدل‌های پیشرفته می‌پردازیم.
۵٫۲٫۴٫ مطالعات مقایسه ای
ما عملکرد چارچوب STS را با روش های پیشرفته توصیه مکان مقایسه می کنیم (به بخش ۵٫۱٫۲ مراجعه کنید.). با اعتبارسنجی متقاطع BaseMF، ابعاد بردار عامل پنهان، نرخ یادگیری و پارامتر تنظیم را به ترتیب به ۱۰، ۰٫۰۰۰۱ و ۰٫۰۱ تنظیم کردیم. برای PTMF، سطح ۲ در نظر گرفته شده است، که در آن پارامترهای ابعاد بردار عامل پنهان، نرخ یادگیری و تنظیم به ترتیب به ۵، ۰٫۰۰۰۱ و ۰٫۰۱ تنظیم می شوند. برای TempMF، ابعاد بردار عامل پنهان، نرخ یادگیری، پارامتر ترجیح کاربر، پارامتر مکان مشخصه و پارامتر تنظیم زمان را به ترتیب به ۱۰، ۰٫۰۰۰۱، ۲، ۲ و ۱ تنظیم کردیم. برای POI2Vec، تعداد ابعاد، آستانه اندازه منطقه و نرخ یادگیری به ترتیب ۲۰۰، ۰٫۱، ۰٫۰۰۵ تنظیم شده است. برای Distance2Pre، نرخ یادگیری، پارامتر تنظیم و تعداد ابعاد به ترتیب ۰٫۰۱، ۰٫۰۰۱ و ۲۰ تنظیم شده است.
جدول ۳نتایج مقایسه را با استفاده از پنج مجموعه داده در صورت ارائه ۱۰ توصیه برتر خلاصه می کند. همانطور که انتظار می رود، BaseMF بدترین عملکرد را دارد زیرا عوامل مختلفی مانند تأثیر زمانی و جغرافیایی را در نظر نمی گیرد، که به طور قابل توجهی بر پیش بینی مکان تأثیر می گذارد. GeoCF، با مدل‌سازی نفوذ جغرافیایی با استفاده از توزیع قانون قدرت، آشکارا BaseMF را از نظر دقت و MRR بهبود می‌بخشد. برای GeoCF، پارامتر وزن تأثیر اجتماعی، پارامتر وزن تأثیر جغرافیایی و پارامتر تنظیم به ترتیب روی ۰٫۱، ۰٫۱ و ۰٫۰۵ تنظیم شده است. برعکس، iGSLR با استفاده از یک رویکرد تخمین چگالی هسته، تأثیر جغرافیایی را برای کاربران فردی مدل می‌کند. برای iGSLR، مانند تنظیمات مقاله اصلی، عملکرد هسته به عنوان یک هسته معمولی و پهنای باند به صورت تنظیم شده است. ۱٫۰۶σ^ن-۱/۵( σ^نشان دهنده انحراف استاندارد نمونه های فاصله است، نتعداد نمونه های فاصله را نشان می دهد و می توان آنها را از داده های نمونه مربوطه به دست آورد). چنین روش شخصی سازی شده ای بهتر از GeoCF است که تأثیر جغرافیایی را به روشی جهانی مدل می کند. از سوی دیگر، TempMF بر تأثیر زمانی بر رفتار ورود کاربران تمرکز دارد. نتایج آزمایش‌ها نشان می‌دهد که TempMF عموماً از نظر دقت (به جز داده‌های لس آنجلس) بهتر از iGSLR عمل می‌کند، اما از نظر MRR (به جز داده‌های سانفرانسیسکو) کمی بهتر از iGSLR است. POI2Vec با مدل‌سازی تأثیر متقابل بین مناطق و POI، و همچنین ثبت انتقال متوالی POI، TempMF را بیشتر بهبود می‌بخشد. PTMF از دیگر مدل‌های مبتنی بر فاکتورسازی ماتریس و POI2Vec بهتر عمل می‌کند و اهمیت تأثیر معنایی را اثبات می‌کند و همچنین نشان می‌دهد که یادگیری انتقال ترجیحات کاربران به وضوح عملکرد توصیه را افزایش می‌دهد. Distance2Pre، اگرچه فقط نفوذ جغرافیایی را در نظر می گیرد، عملکرد بهتری از PTMF دارد. این به این دلیل است که Distance2Pre از واحد برگشتی دروازه‌ای (GRU) پیشرفته‌تری برای مدل‌سازی رفتار ورود متوالی کاربران استفاده می‌کند و مزیت روش‌های مدل‌سازی غیرخطی را نشان می‌دهد. در همه موارد، STS از دیگر مدل‌های توصیه‌شده با: (۱) ترکیب غیر خطی انواع مختلف اطلاعات زمانی برای پیش‌بینی تحرک آگاهانه، بهتر عمل می‌کند. (۲) مدلسازی تأثیر معنایی آگاهانه زمانی برای استنباط ترجیحات کاربران. (۳) ساخت مدل های توصیه برای کاربران فردی برای شخصی سازی. نشان دادن مزیت روش های مدل سازی غیر خطی در همه موارد، STS از دیگر مدل‌های توصیه‌شده با: (۱) ترکیب غیر خطی انواع مختلف اطلاعات زمانی برای پیش‌بینی تحرک آگاهانه، بهتر عمل می‌کند. (۲) مدلسازی تأثیر معنایی آگاهانه زمانی برای استنباط ترجیحات کاربران. (۳) ساخت مدل های توصیه برای کاربران فردی برای شخصی سازی. نشان دادن مزیت روش های مدل سازی غیر خطی در همه موارد، STS از دیگر مدل‌های توصیه‌شده با: (۱) ترکیب غیر خطی انواع مختلف اطلاعات زمانی برای پیش‌بینی تحرک آگاهانه، بهتر عمل می‌کند. (۲) مدلسازی تأثیر معنایی آگاهانه زمانی برای استنباط ترجیحات کاربران. (۳) ساخت مدل های توصیه برای کاربران فردی برای شخصی سازی.
در نهایت، شکل ۷دقت و MRR (میانگین بیش از سه مجموعه داده) مدل‌های پیشنهادی مختلف با اندازه‌های لیست توصیه‌های مختلف را نشان می‌دهد. مشابه نتایج تجربی قبلی، همه مدل‌ها عملکرد بهتری از BaseMF پایه دارند. TempMF دقت بالاتری تولید می کند اما MRR کمی کمتر از iGSLR تولید می کند، که نشان می دهد اگرچه نسبت ضربه بالاتر است، مکان های پیش بینی موفقیت آمیز TempMF در موقعیت های نسبتا پایین لیست های توصیه های برگشتی قرار دارند. PTMF بهتر از TempMF، iGSLR، GeoCF و POI2Vec است، اما توسط مدل یادگیری عمیق Distance2Pre شکست خورده است. در نهایت، با مدل‌سازی پیچیده و ترکیب عوامل تأثیرگذار مختلف، STS از تمام خطوط پایه دیگر در همه تنظیمات بهتر عمل می‌کند. به طور خلاصه، با میانگین‌گیری نتایج زمانی که مجموعه داده‌ها و اندازه‌های لیست توصیه‌های مختلف اعمال می‌شوند، STS GeoCF، iGSLR TempMF، POI2Vec را بهبود می‌بخشد.

۵٫۳٫ بحث

پیچیدگی زمانی STS عمدتاً با وارونگی یک ماتریس تعیین می‌شود (یعنی پیش‌بینی جابجایی مبتنی بر فرآیند گاوسی. به معادله ( ۵ ) مراجعه کنید). روش های استاندارد نیاز به زمان دارند O(n3)برای یک n×nماتریس چنین روش محاسباتی را می توان با استفاده از روش ضرب سریعتر ماتریس مانند الگوریتم Coppersmith-Winograd [ ۴۵ ] بهبود بخشید. روش دیگر، تکنیک های تقریب مانند استنتاج بیزی متغیر [ ۴۶ ] را می توان برای تسریع فرآیند یادگیری به کار برد. از آنجایی که چارچوب STS برای شخصی سازی برای کاربران منفرد ساخته شده است، می توان آن را به طور کامل و کارآمد موازی کرد (در مقایسه با رویکردهای مبتنی بر فیلتر مشارکتی که از تمام داده های کاربران یاد می گیرند) تا مجموعه داده های در مقیاس بزرگ را تامین کند.
اگرچه شبکه‌های اجتماعی یکی از ویژگی‌های مهم شبکه‌های اجتماعی مبتنی بر مکان است، مطالعات قبلی نشان داده‌اند که تأثیر اطلاعات اجتماعی وجود دارد، اما تأثیر آن بر رفتار ورود کاربران کاملاً محدود است [ ۱۰ ، ۱۴ ، ۳۶ ]. بنابراین در این کار، ما تأثیر اجتماعی را برای کاهش پیچیدگی چارچوب STS در نظر نمی گیریم.
مشابه سایر مدل‌های پیشنهاد مکان، میزان پراکندگی داده‌ها بر عملکرد STS تأثیر می‌گذارد. از نظر تئوری، STS حتی اگر کاربر مورد نظر فقط چند بار بررسی داشته باشد، کار می کند. علاوه بر این، فرآیند گاوسی واریانس پیش‌بینی جابجایی را فراهم می‌کند که می‌توان از آن برای نشان دادن اطمینان پیش‌بینی استفاده کرد. ما در بخش ارزیابی بالا نشان دادیم که چگونه عملکرد STS با اندازه های مختلف داده های آموزشی متفاوت است.
با ارتقای بیشتر و بیشتر پلتفرم‌های خدمات توصیه پایانه‌های تلفن همراه، الگوریتم پیشنهاد مکان ما از بسیاری از خدمات توصیه‌ای که شامل اطلاعات مکان هستند (مانند توصیه هتل، توصیه مکان دیدنی، توصیه مکان خرید، توصیه مکان تفریحی و غیره) پشتیبانی قوی ارائه می‌کند. ، به طوری که به طور موثر رضایت تجربه کاربر را بهبود بخشد.

۶٫ نتیجه گیری

در این کار، ما یک چارچوب پیشنهاد مکان شخصی به نام STS ارائه کردیم. یک فرآیند گاوسی برای ادغام سیستماتیک و غیرخطی انواع مختلف اطلاعات زمانی و مکانی برای پیش‌بینی جابجایی آگاهانه زمانی هر کاربر اعمال می‌شود. یک روش بهینه‌سازی مبتنی بر شیب نزولی تصادفی برای تناسب با مدل توسعه داده شده است. علاوه بر این، ما اطلاعات دسته‌بندی مکان‌های اعلام حضور هر کاربر را در نظر می‌گیریم تا احتمال اینکه کاربر در دسته‌های خاص با توجه به بافت زمانی اعلام حضور کند، استنباط می‌کنیم. یک چارچوب توصیه یکپارچه برای ترکیب پیش‌بینی جابجایی و استنتاج توزیع احتمال دسته‌بندی برای ارائه نهایی N بالا پیشنهاد شده است.توصیه مکان آزمایش‌های گسترده نشان می‌دهد که الگوریتم ما به طور قابل‌توجهی از مدل‌های پیشرفته از نظر دقت و MRR بهتر عمل می‌کند.
چندین جهت تحقیقاتی در کار آینده دنبال خواهد شد: (۱) بررسی توابع کوواریانس پیچیده‌تر برای مدل‌سازی بهتر تأثیر زمانی و تأثیر جغرافیایی. (۲) اتخاذ تکنیک های رتبه بندی، به عنوان مثال، یادگیری رتبه بندی برای بهبود عملکرد رتبه بندی توصیه ها. (۳) بررسی اطلاعات متنی بیشتر (به عنوان مثال، نکات، بررسی‌ها از سوابق ورود کاربران) با استفاده از مدل‌های پیشرفته NLP مانند ترانسفورماتورها برای تقویت مدل‌سازی تأثیر معنایی و استخراج اطلاعات فعالیت‌های مختلف کاربر. (۴) معرفی برخی روش‌های جدید محاسبه جابجایی برای جبران دقت موقعیت‌یابی پایین.

منابع

  1. گائو، اچ. تانگ، جی. هو، ایکس. لیو، اچ. بررسی اثرات زمانی برای توصیه مکان در شبکه های اجتماعی مبتنی بر مکان. در مجموعه مقالات هفتمین کنفرانس ACM در مورد سیستم های توصیه کننده، هنگ کنگ، چین، ۱۲ تا ۱۶ اکتبر ۲۰۱۳٫ صص ۹۳-۱۰۰٫ [ Google Scholar ]
  2. لیو، ایکس. لیو، ی. لی، ایکس. کاوش در زمینه مکان‌ها برای توصیه‌های مکان شخصی‌شده. در مجموعه مقالات بیست و پنجمین کنفرانس مشترک بین المللی هوش مصنوعی، نیویورک، نیویورک، ایالات متحده آمریکا، ۹ تا ۱۵ ژوئیه ۲۰۱۶؛ صص ۱۱۸۸-۱۱۹۴٫ [ Google Scholar ]
  3. گائو، آر. لی، جی. لی، ایکس. آهنگ، سی. چانگ، جی. لیو، دی. وانگ، سی. STSCR: بررسی تأثیر متوالی مکانی-زمانی و اطلاعات اجتماعی برای توصیه مکان. محاسبات عصبی ۲۰۱۸ ، ۳۱۹ ، ۱۱۸-۱۳۳٫ [ Google Scholar ] [ CrossRef ]
  4. لیو، جی. ژانگ، ز. لیو، سی. کیو، ا. ژانگ، اف. بهره‌برداری از تأثیرات اجتماعی دو بعدی جغرافیایی و ترکیبی برای توصیه مکان. ISPRS Int. J. Geo-Inf. ۲۰۲۰ ، ۹ ، ۲۸۵٫ [ Google Scholar ] [ CrossRef ]
  5. ژانگ، جی دی. Chow، CY iGSLR: توصیه موقعیت جغرافیایی-اجتماعی شخصی: یک رویکرد تخمین چگالی هسته. در مجموعه مقالات بیست و یکمین کنفرانس بین المللی ACM SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی، اورلاندو، فلوریدا، ایالات متحده آمریکا، ۵ تا ۸ نوامبر ۲۰۱۳٫ صص ۳۳۴-۳۴۳٫ [ Google Scholar ]
  6. یانگ، دی. ژانگ، دی. یو، ز. Wang, Z. یک سیستم توصیه موقعیت مکانی شخصی سازی شده با احساسات. در مجموعه مقالات بیست و چهارمین کنفرانس ACM در مورد فرامتن و رسانه های اجتماعی، پاریس، فرانسه، ۱-۳ مه ۲۰۱۳٫ صص ۱۱۹-۱۲۸٫ [ Google Scholar ]
  7. کوراشیما، تی. ایواتا، تی. هوشیده، ت. تکایا، ن. مدل موضوعی فوجیمورا، K. Geo: مدلسازی مشترک حوزه فعالیت و علایق کاربر برای توصیه مکان. در مجموعه مقالات ششمین کنفرانس بین المللی ACM در جستجوی وب و داده کاوی، رم، ایتالیا، ۴ تا ۸ فوریه ۲۰۱۳٫ صص ۳۷۵-۳۸۴٫ [ Google Scholar ]
  8. خزاعی، ا. علیمحمدی، ع. توصیه موقعیت مکانی گروه محور آگاه به زمینه در شبکه های اجتماعی مبتنی بر مکان. ISPRS Int. J. Geo-Inf. ۲۰۱۹ ، ۸ ، ۴۰۶٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  9. لو، ز. وانگ، اچ. مامولیس، ن. تو، دبلیو. Cheung، DW با جمع‌آوری چندین توصیه‌کننده در تنوع، توصیه مکان شخصی‌سازی کرد. GeoInformatica ۲۰۱۷ ، ۲۱ ، ۴۵۹-۴۸۴٫ [ Google Scholar ] [ CrossRef ]
  10. چو، ای. مایرز، SA; Leskovec, J. دوستی و تحرک: حرکت کاربر در شبکه های اجتماعی مبتنی بر مکان. در مجموعه مقالات هفدهمین کنفرانس بین المللی ACM SIGKDD در مورد کشف دانش و داده کاوی، سن دیگو، کالیفرنیا، ایالات متحده آمریکا، ۲۱ تا ۲۴ اوت ۲۰۱۱٫ ص ۱۰۸۲-۱۰۹۰٫ [ Google Scholar ]
  11. لیان، دی. ژائو، سی. Xie، X. سان، جی. چن، ای. Rui, Y. GeoMF: مدل‌سازی جغرافیایی مشترک و فاکتورسازی ماتریسی برای توصیه نقطه‌نظر. در مجموعه مقالات بیستمین کنفرانس بین المللی ACM SIGKDD در مورد کشف دانش و داده کاوی، نیویورک، نیویورک، ایالات متحده آمریکا، ۲۴ تا ۲۷ اوت ۲۰۱۴٫ صص ۸۳۱-۸۴۰٫ [ Google Scholar ]
  12. بله، م. یین، پی. لی، WC; لی، DL بهره‌برداری از تأثیر جغرافیایی برای توصیه‌های نقطه‌نظر مشارکتی. در مجموعه مقالات سی و چهارمین کنفرانس بین المللی ACM SIGIR در مورد تحقیق و توسعه در بازیابی اطلاعات، پکن، چین، ۲۵ تا ۲۹ ژوئیه ۲۰۱۱٫ صص ۳۲۵-۳۳۴٫ [ Google Scholar ]
  13. نولاس، ا. اسکلاتو، اس. لاتیا، ن. Mascolo، C. ویژگی‌های تحرک کاربر استخراج برای پیش‌بینی مکان بعدی در خدمات مبتنی بر مکان. در مجموعه مقالات دوازدهمین کنفرانس بین المللی IEEE در مورد داده کاوی، بروکسل، بلژیک، ۱۰-۱۳ دسامبر ۲۰۱۲٫ ص ۱۰۳۸-۱۰۴۳٫ [ Google Scholar ]
  14. چنگ، سی. یانگ، اچ. کینگ، آی. لیو، MR فاکتورسازی ماتریس ذوب شده با نفوذ جغرافیایی و اجتماعی در شبکه های اجتماعی مبتنی بر مکان. در مجموعه مقالات بیست و ششمین کنفرانس AAAI در مورد هوش مصنوعی، تورنتو، ON، کانادا، ۲۲ تا ۲۶ ژوئیه ۲۰۱۲٫ صص ۱۷-۲۳٫ [ Google Scholar ]
  15. یوان، Q. کنگ، جی. ما، ز. سان، ا. Thalmann، NM توصیه نقطه مورد علاقه آگاه از زمان. در مجموعه مقالات سی و ششمین کنفرانس بین المللی ACM SIGIR در مورد تحقیق و توسعه در بازیابی اطلاعات، دوبلین، ایرلند، ۲۸ ژوئیه تا ۱ اوت ۲۰۱۳٫ صص ۳۶۳-۳۷۲٫ [ Google Scholar ]
  16. یان، سی. تو، ی. وانگ، ایکس. ژانگ، ی. هائو، ایکس. ژانگ، ی. Dai، Q. STAT: مکانیسم توجه مکانی-زمانی برای شرح ویدیو. IEEE Trans. چندتایی. ۲۰۱۹ ، ۲۲ ، ۲۲۹-۲۴۱٫ [ Google Scholar ] [ CrossRef ]
  17. هو، بی. Ester, M. مدل‌سازی موضوع فضایی در رسانه‌های اجتماعی آنلاین برای توصیه مکان. در مجموعه مقالات هفتمین کنفرانس ACM در مورد سیستم های توصیه کننده، هنگ کنگ، چین، ۱۲ تا ۱۶ اکتبر ۲۰۱۳٫ صص ۲۵-۳۲٫ [ Google Scholar ]
  18. لیو، بی. فو، ی. یائو، ز. Xiong, H. یادگیری ترجیحات جغرافیایی برای توصیه نقطه مورد علاقه. در مجموعه مقالات نوزدهمین کنفرانس بین المللی ACM SIGKDD در مورد کشف دانش و داده کاوی، شیکاگو، IL، ایالات متحده، ۱۱-۱۴ اوت ۲۰۱۳٫ صص ۱۰۴۳-۱۰۵۱٫ [ Google Scholar ]
  19. ژائو، اس. ژائو، تی. کینگ، آی. Lyu, MR Geo-teaser: رتبه جاسازی متوالی جغرافیایی-زمانی برای توصیه نقطه مورد علاقه. در مجموعه مقالات بیست و ششمین کنفرانس بین المللی در مورد همنشین وب جهانی، پرت، استرالیا، ۳ تا ۷ آوریل ۲۰۱۷؛ صص ۱۵۳-۱۶۲٫ [ Google Scholar ]
  20. لیو، تی. لیائو، جی. وو، زی. وانگ، ی. وانگ، جی. بهره‌برداری از توجه آگاهی جغرافیایی-زمانی برای توصیه‌های مورد علاقه بعدی. محاسبات عصبی ۲۰۲۰ ، ۴۰۰ ، ۲۲۷-۲۳۷ . [ Google Scholar ] [ CrossRef ]
  21. وانگ، اچ. شن، اچ. اویانگ، دبلیو. چنگ، ایکس. بهره‌برداری از تأثیر جغرافیایی خاص POI برای توصیه‌های نقطه‌نظر. در مجموعه مقالات بیست و هفتمین کنفرانس بین المللی مشترک هوش مصنوعی، استکهلم، سوئد، ۱۳ تا ۱۹ ژوئیه ۲۰۱۸؛ صص ۳۸۷۷-۳۸۸۳٫ [ Google Scholar ]
  22. کای، ال. خو، جی. لیو، جی. Pei, T. ادغام زمینه های مکانی و زمانی در یک مدل فاکتورسازی برای توصیه POI. بین المللی جی. جئوگر. Inf. علمی ۲۰۱۸ ، ۳۲ ، ۵۲۴-۵۴۶٫ [ Google Scholar ]
  23. لی، اچ. هونگ، آر. وو، زی. جنرال الکتریک، Y. یک مدل فاکتورسازی ماتریس احتمالی مکانی-زمانی برای توصیه نقطه مورد علاقه. در مجموعه مقالات کنفرانس بین المللی SIAM 2016 در مورد داده کاوی، میامی، FL، ایالات متحده آمریکا، ۵-۷ مه ۲۰۱۶؛ صص ۱۱۷-۱۲۵٫ [ Google Scholar ]
  24. راسموسن، CE; ویلیامز، فرآیندهای گاوسی CKI برای یادگیری ماشینی ؛ انتشارات MIT: کمبریج، MA، ایالات متحده آمریکا، ۲۰۰۵٫ [ Google Scholar ]
  25. کلاوزت، ا. شالیزی، CR; نیومن، ME توزیع قانون قدرت در داده های تجربی. SIAM Rev. ۲۰۰۹ , ۵۱ , ۶۶۱-۷۰۳٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  26. لی، ایکس. کنگ، جی. لی، XL; فام، TAN; کریشناسوامی، S. Rank-geofm: یک روش فاکتورگیری جغرافیایی مبتنی بر رتبه بندی برای توصیه نقطه مورد علاقه. در مجموعه مقالات سی و هشتمین کنفرانس بین المللی ACM SIGIR در مورد تحقیق و توسعه در بازیابی اطلاعات، سانتیاگو، شیلی، ۹ تا ۱۳ اوت ۲۰۱۵٫ صص ۴۳۳-۴۴۲٫ [ Google Scholar ]
  27. مک.؛ ژانگ، ی. وانگ، کیو. لیو، ایکس. توصیه نقطه مورد علاقه: بهره‌برداری از رمزگذارهای خودکار آگاه با نفوذ همسایه. در مجموعه مقالات بیست و هفتمین کنفرانس بین المللی ACM در مدیریت اطلاعات و دانش، تورینو، ایتالیا، ۲۲ تا ۲۶ اکتبر ۲۰۱۸؛ صص ۶۹۷-۷۰۶٫ [ Google Scholar ]
  28. یانگ، اچ. چن، ال. Xiong، Y. Wu, J. PGRank: رتبه‌بندی جغرافیایی شخصی برای توصیه‌های نقطه‌نظر. در مجموعه مقالات بیست و پنجمین کنفرانس بین المللی همکار در وب جهانی، مونترال، QC، کانادا، ۱۱-۱۵ آوریل ۲۰۱۶؛ صص ۱۳۷-۱۳۸٫ [ Google Scholar ]
  29. لیو، سی. لیو، جی. خو، اس. وانگ، جی. لیو، سی. چن، تی. جیانگ، تی. یک شبکه کانولوشنال متسع فضایی-زمانی برای توصیه نقطه مورد علاقه. ISPRS Int. J. Geo-Inf. ۲۰۲۰ ، ۹ ، ۱۱۳٫ [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  30. یینگ، ی. چن، ال. Chen, G. یک سیستم توصیه POI آگاه از زمان با استفاده از تجزیه تانسور آگاه از متن و HITS وزنی. محاسبات عصبی ۲۰۱۷ ، ۲۴۲ ، ۱۹۵-۲۰۵ . [ Google Scholar ] [ CrossRef ]
  31. علیان نژادی، م. رافائلیدیس، دی. Crestani، F. یک مدل رتبه‌بندی مشترک منظم و منظم حساس به زمان دو مرحله‌ای مشترک برای توصیه نقطه مورد علاقه. IEEE Trans. دانستن مهندسی داده ۲۰۱۹ ، ۳۲ ، ۱۰۵۰-۱۰۶۳٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  32. یائو، زی. بهره‌برداری از الگوهای تحرک انسانی برای توصیه‌های مورد علاقه. در مجموعه مقالات یازدهمین کنفرانس بین المللی ACM در جستجوی وب و داده کاوی، مارینا دل ری، کالیفرنیا، ایالات متحده آمریکا، ۵ تا ۹ فوریه ۲۰۱۸؛ صص ۷۵۷-۷۵۸٫ [ Google Scholar ]
  33. چانگ، بی. پارک، ی. پارک، دی. کیم، اس. Kang, J. مدل تعبیه سلسله مراتبی نقطه مورد علاقه محتوا آگاه برای توصیه های پی در پی POI. در مجموعه مقالات بیست و هفتمین کنفرانس بین المللی مشترک هوش مصنوعی، استکهلم، سوئد، ۱۳ تا ۱۹ ژوئیه ۲۰۱۸؛ صص ۳۳۰۱–۳۳۰۷٫ [ Google Scholar ]
  34. لیو، بی. Xiong، H. توصیه نقطه مورد علاقه در شبکه های اجتماعی مبتنی بر مکان با آگاهی از موضوع و مکان. در مجموعه مقالات سیزدهمین کنفرانس بین المللی SIAM در مورد داده کاوی، آستین، تگزاس، ایالات متحده آمریکا، ۲ تا ۴ مه ۲۰۱۳٫ صص ۳۹۶-۴۰۴٫ [ Google Scholar ]
  35. یین، ز. کائو، ال. هان، جی. ژای، سی. Huang, T. کشف و مقایسه موضوع جغرافیایی. در مجموعه مقالات بیستمین کنفرانس بین المللی وب جهانی، حیدرآباد، هند، ۲۸ مارس تا ۱ آوریل ۲۰۱۱; صص ۲۴۷-۲۵۶٫ [ Google Scholar ]
  36. لیو، ایکس. لیو، ی. ابرر، ک. Miao, C. توصیه شخصی شده نقطه مورد علاقه توسط انتقال ترجیحی کاربران معدن. در مجموعه مقالات بیست و دومین کنفرانس بین المللی ACM در مدیریت اطلاعات و دانش، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، ۲۷ اکتبر تا ۱۰ نوامبر ۲۰۱۳٫ صص ۷۳۳-۷۳۸٫ [ Google Scholar ]
  37. هائو، پی. چانگ، WH; Chiang, JH جاسازی رویداد بلادرنگ برای توصیه POI. محاسبات عصبی ۲۰۱۹ ، ۳۴۹ ، ۱-۱۱٫ [ Google Scholar ] [ CrossRef ]
  38. لیان، دی. Ge، Y. ژانگ، اف. یوان، نیوجرسی؛ Xie، X. ژو، تی. Rui, Y. فیلتر مشارکتی مبتنی بر محتوا برای توصیه مکان. IEEE Trans. دانستن مهندسی داده ۲۰۱۸ ، ۳۰ ، ۱۱۲۲-۱۱۳۵٫ [ Google Scholar ] [ CrossRef ]
  39. ژانگ، جی دی. Chow، CY; Zheng, Y. ORec: یک چارچوب توصیه مبتنی بر نقطه نظر. در مجموعه مقالات بیست و چهارمین کنفرانس بین المللی ACM در مورد مدیریت اطلاعات و دانش، ملبورن، استرالیا، ۱۹ تا ۲۳ اکتبر ۲۰۱۵٫ صفحات ۱۶۴۱-۱۶۵۰٫ [ Google Scholar ]
  40. ژو، ایکس. ماسکولو، سی. Zhao, Z. شبکه‌های حافظه ارتقا یافته با موضوع برای توصیه‌های شخصی‌شده نقطه‌نظر. در مجموعه مقالات بیست و پنجمین کنفرانس بین المللی ACM SIGKDD در مورد کشف دانش و داده کاوی، انکوریج، AK، ایالات متحده آمریکا، ۴ تا ۸ اوت ۲۰۱۹؛ صفحات ۳۰۱۸–۳۰۲۸٫ [ Google Scholar ]
  41. یین، اچ. وانگ، دبلیو. وانگ، اچ. چن، ال. ژو، X. یادگیری عمیق مشارکتی سلسله مراتبی آگاه به فضایی برای توصیه POI. IEEE Trans. دانستن مهندسی داده ۲۰۱۷ ، ۲۹ ، ۲۵۳۷–۲۵۵۱٫ [ Google Scholar ] [ CrossRef ]
  42. منیح، ع. سالخوتدینوف، فاکتورسازی ماتریس احتمالی RR. در مجموعه مقالات بیست و یکمین کنفرانس بین المللی سیستم های پردازش اطلاعات عصبی، ونکوور، BC، کانادا، ۸-۱۱ دسامبر ۲۰۰۸٫ ص ۱۲۵۷–۱۲۶۴٫ [ Google Scholar ]
  43. کوی، کیو. تانگ، ی. وو، اس. وانگ، L. Distance2Pre: ترجیح فضایی شخصی برای پیش‌بینی نقطه مورد علاقه بعدی. در مجموعه مقالات بیست و سومین کنفرانس اقیانوس آرام-آسیا در مورد کشف دانش و داده کاوی، ماکائو، چین، ۱۴ تا ۱۷ آوریل ۲۰۱۹؛ صص ۲۸۹-۳۰۱٫ [ Google Scholar ]
  44. فنگ، اس. کنگ، جی. آن، ب. Chee, YM Poi2vec: نمایش نهفته جغرافیایی برای پیش‌بینی بازدیدکنندگان آینده. در مجموعه مقالات سی و یکمین کنفرانس AAAI در مورد هوش مصنوعی، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، ۴ تا ۱۰ فوریه ۲۰۱۷؛ ص ۱۰۲-۱۰۸٫ [ Google Scholar ]
  45. مسمیت، دی. وینوگراد، S. ضرب ماتریس از طریق پیشرفت های حسابی. در مجموعه مقالات نوزدهمین سمپوزیوم سالانه ACM در تئوری محاسبات، نیویورک، نیویورک، ایالات متحده آمریکا، ۲۵-۲۷ مه ۱۹۸۷٫ صص ۱-۶٫ [ Google Scholar ]
  46. فاکس، سی دبلیو؛ رابرتز، اس جی آموزش استنتاج بیزی متغیر. آرتیف. هوشمند Rev. ۲۰۱۲ , ۳۸ , ۸۵-۹۵٫ [ Google Scholar ] [ CrossRef ]
شکل ۱٫ رفتارهای حرکتی ناهمگون.
شکل ۲٫ نفوذ زمانی.
شکل ۳٫ نمونه ای از سوابق ورود کاربر uسیتو، بردار جابجایی ها Dتوو اطلاعات زمانی ۴ بعدی مربوطه تیتو.
شکل ۴٫ نمونه ای از ماتریس کوواریانس کاربر uک(تیتو،تیتو”)، جایی که ک(.)تابع کوواریانس است که کوواریانس جفت بردار اطلاعات زمانی معین را محاسبه می کند. ∣.∣نشان دهنده اصلی بودن یک مجموعه است.
شکل ۵٫ نفوذ زمانی.
شکل ۶٫ تأثیر تأثیر معنایی.
شکل ۷٫ مقایسه عملکرد با اندازه لیست توصیه های مختلف.

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

خانهدربارهتماسارتباط با ما