روش شبکه‌های کانولوشنال نمودار دانش برای الگوهای بوم‌شناختی روستاها با استفاده از ویژگی‌های جغرافیایی استخراج

خلاصه:

سیستم توصیه یکی از نقاط داغ در زمینه هوش مصنوعی است که می توان با استفاده از آن الگوهای اکولوژیکی مناسب برای روستاها را توصیه کرد. الگوهای بوم‌شناختی روستایی به معنای الگوهای پیشرفته‌ای است که می‌توان آن‌ها را به مناطق در حال توسعه که ویژگی‌های جغرافیایی مشابهی دارند توصیه کرد، که مزایای زیادی برای توسعه روستاها فراهم می‌کند. با این حال، روش‌های پیشنهادی فعلی به دلیل برخی محدودیت‌ها، مانند کم بودن داده‌ها و «شروع سرد»، دقت توصیه‌ای پایین دارند، زیرا ویژگی‌های پیچیده جغرافیایی را در نظر نمی‌گیرند. برای پرداختن به مسائل فوق، ما یک روش شبکه‌های کانولوشنال نمودار دانش جغرافیایی برای توصیه الگوهای بوم‌شناختی روستایی (KGCN4CEPR) پیشنهاد می‌کنیم. به طور مشخص، ابتدا یک نمودار دانش جغرافیایی از الگوهای بوم‌شناختی حومه شهر ایجاد می‌شود، که پراکندگی داده‌های الگوی اکولوژیکی روستا را جبران می‌کند. سپس، یک شبکه کانولوشنی برای استخراج شباهت جغرافیایی الگوهای اکولوژیکی در میان حومه‌های مجاور طراحی می‌شود که به طور موثر مشکل «شروع سرد» را در روش‌های پیشنهادی موجود حل می‌کند. نتایج تجربی نشان می دهد که روش KGCN4CEPR ما برای توصیه الگوهای اکولوژیکی حومه شهر مناسب است. علاوه بر این، روش پیشنهادی KGCN4CEPR به بهترین دقت توصیه (۶۰٪) دست می یابد که ۹٪ بیشتر از روش MKR و ۶٪ بیشتر از روش RippleNet است. یک شبکه کانولوشن برای استخراج شباهت جغرافیایی الگوهای اکولوژیکی در میان حومه های مجاور طراحی شده است که به طور موثر مشکل “شروع سرد” را در روش های پیشنهادی موجود حل می کند. نتایج تجربی نشان می دهد که روش KGCN4CEPR ما برای توصیه الگوهای اکولوژیکی حومه شهر مناسب است. علاوه بر این، روش پیشنهادی KGCN4CEPR به بهترین دقت توصیه (۶۰٪) دست می یابد که ۹٪ بیشتر از روش MKR و ۶٪ بیشتر از روش RippleNet است. یک شبکه کانولوشن برای استخراج شباهت جغرافیایی الگوهای اکولوژیکی در میان حومه های مجاور طراحی شده است که به طور موثر مشکل “شروع سرد” را در روش های پیشنهادی موجود حل می کند. نتایج تجربی نشان می دهد که روش KGCN4CEPR ما برای توصیه الگوهای اکولوژیکی حومه شهر مناسب است. علاوه بر این، روش پیشنهادی KGCN4CEPR به بهترین دقت توصیه (۶۰٪) دست می یابد که ۹٪ بیشتر از روش MKR و ۶٪ بیشتر از روش RippleNet است.

کلید واژه ها:

سیستم توصیه ; هوش مصنوعی جغرافیایی ; نمودار دانش جغرافیایی ; گراف دانش شبکه های کانولوشنال ; الگوهای اکولوژیکی حومه شهر

۱٫ معرفی

الگوهای بوم‌شناختی روستاها الگوهای اکولوژیکی نمونه‌ای هستند که می‌توانند مردم را به توسعه معقول تولید و همچنین در نظر گرفتن ویژگی‌های جغرافیایی محلی و حفاظت از محیط جغرافیایی راهنمایی کنند. به طور کلی، CEP را می توان در ده الگوی اصلی خلاصه کرد که در میان آنها الگوی توسعه صنعتی و الگوی گردشگری اوقات فراغت دو الگوی معمولی هستند. CEP را می توان به روشی سلسله مراتبی توصیف کرد، مانند سطح بالای متشکل از اطلاعات پایه، اطلاعات اقتصادی و اطلاعات زیست محیطی، سه نوع اطلاعات فوق را می توان بیشتر به اطلاعات ریز در سطح دوم تقسیم کرد. پیشنهاد الگوهای اکولوژیکی روستایی مناسب برای یک روستای خاص، به معنای ارائه الگوی با ویژگی‌های مشابه جغرافیایی، اجتماعی، اقتصادی و فرهنگی، یک راهنمای واقع بینانه برای توسعه سریع و پایدار روستا است. با این حال، الگوی اکولوژیکی حومه روستا شامل بسیاری از ویژگی‌های پیچیده، از جمله ویژگی‌های جغرافیایی انسانی و طبیعی مرتبط با اکولوژی و جغرافیا می‌شود. ویژگی های اولی شامل خشکسالی، آب و هوا، تراکم آب و سایر اطلاعات اولیه است، در حالی که ویژگی های دوم شامل توپوگرافی مربوطه، شکل زمین، ساختار صنعتی و اطلاعات آداب و رسوم فرهنگی است. نحوه استفاده از این ویژگی های جغرافیایی انسانی و طبیعی در یک سیستم توصیه کاری چالش برانگیز و معنادار است. ویژگی های اولی شامل خشکسالی، آب و هوا، تراکم آب و سایر اطلاعات اولیه است، در حالی که ویژگی های دوم شامل توپوگرافی مربوطه، شکل زمین، ساختار صنعتی و اطلاعات آداب و رسوم فرهنگی است. نحوه استفاده از این ویژگی های جغرافیایی انسانی و طبیعی در یک سیستم توصیه کاری چالش برانگیز و معنادار است. ویژگی های اولی شامل خشکسالی، آب و هوا، تراکم آب و سایر اطلاعات اولیه است، در حالی که ویژگی های دوم شامل توپوگرافی مربوطه، شکل زمین، ساختار صنعتی و اطلاعات آداب و رسوم فرهنگی است. نحوه استفاده از این ویژگی های جغرافیایی انسانی و طبیعی در یک سیستم توصیه کاری چالش برانگیز و معنادار است.

با اشاره به روش‌های پیشنهادی رایج فعلی، سه نوع روش برای توصیه الگوهای بوم‌شناختی حومه شهر وجود دارد: توصیه مبتنی بر محتوا، توصیه فیلتر مشارکتی، و توصیه ترکیبی [ ۱ ، ۲ ، ۳ ]. توصیه مبتنی بر محتوا یک روش کلاسیک است که شباهت بین دو مجموعه از آیتم ها را محاسبه می کند و آنها را با توجه به شباهت آنها در لیست توصیه ها مرتب می کند. روش فیلتر مشارکتی [ ۴ ] از داده‌های ترجیحی رفتاری تاریخی کاربر برای ایجاد مدلی برای ارائه توصیه‌هایی با کاوش در ارتباط بین کاربر و مورد استفاده می‌کند. برای بهبود بیشتر دقت توصیه، توصیه ترکیبی [ ۵] سعی می کند برخی از الگوریتم های هوش مصنوعی را با اطلاعات کمکی دیگر (مثلاً ترکیب شبکه های کانولوشن با نمودار دانش) ترکیب کند. از بین سه روش ذکر شده، روش بهینه، روش توصیه ترکیبی است که می تواند بهترین عملکرد را در توصیه های فیلم، موسیقی و کتاب داشته باشد. با این حال، محدودیت‌هایی همچنان وجود دارد زیرا ویژگی‌های مکانی جغرافیایی را در نظر نمی‌گیرند. به طور خاص، در سناریوی توصیه الگوهای اکولوژیکی حومه شهر، هنوز دو مشکل اصلی وجود دارد، یکی مشکل پراکنده و دیگری مشکل “شروع سرد”. اولی محاسبه دقیق شباهت این ویژگی های پراکنده را به دلیل نداشتن ویژگی های کافی دشوار می کند.

برای پرداختن به محدودیت‌های بالا، ما شبکه کانولوشنال نمودار دانش (KGCN) را معرفی می‌کنیم و نمودار دانش جغرافیایی الگوهای بوم‌شناختی روستایی (به طور خلاصه نمودار دانش روستایی) را از طریق هستی‌شناسی و ساختار الگوهای بوم‌شناختی حومه شهر ایجاد می‌کنیم. ما یک روش شبکه‌های کانولوشنال نمودار دانش برای توصیه الگوهای بوم‌شناختی روستایی (KGCN4CEPR) پیشنهاد می‌کنیم. به طور خاص، مقاله ما دارای چهار نکته اصلی است:

(۱): ما یک نمودار دانش جغرافیایی از الگوهای اکولوژیکی حومه شهر را با استخراج ویژگی‌های جغرافیایی ایجاد می‌کنیم، که پراکندگی داده‌های الگوی بوم‌شناختی روستا را از طریق اطلاعات معنایی غنی نمودار دانش جبران می‌کند. روابط خاص و تعبیه الگوی بوم‌شناختی روستا وزن و محاسبه می‌شوند، به طوری که ویژگی‌های شخصی‌شده جغرافیایی الگوی بوم‌شناختی روستا به طور موثر نشان داده می‌شوند.
(۲): ما یک شبکه کانولوشنال را برای استخراج شباهت جغرافیایی الگوهای اکولوژیکی طراحی می‌کنیم، که به طور موثر مشکل «شروع سرد» را حل می‌کند. ویژگی‌های فضایی اطلاعات محله از طریق عملیات تجمع همسایگی شبکه‌های کانولوشن مورد بهره‌برداری قرار می‌گیرد.
(۳): ما ویژگی‌های رابطه جغرافیایی بین الگوی بوم‌شناختی روستا و روستا را با در نظر گرفتن مقیاس فضایی محله بررسی می‌کنیم تا روش ما برای کار توصیه‌شده تحت سناریوهای الگوی اکولوژیکی روستا مناسب‌تر باشد.
(۴): برای راحتی سایر محققان، کد و مجموعه داده این پروژه را در اینترنت منتشر کرده‌ایم ( https://github.com/973866103/KGCN4CEPR ، دسترسی به تاریخ ۲۱ ژوئن ۲۰۲۲).

به طور کلی، روش KGCN4CEPR بر اساس ویژگی‌های موجود در نمودار دانش مربوط به محیط جغرافیایی، به این احتمال دست می‌یابد که حومه شهر با الگوی اکولوژیکی حومه شهر مطابقت دارد. الگوی اکولوژیکی حومه شهر با احتمال محاسباتی نزدیکتر به ۱ به احتمال زیاد توصیه می شود.

بقیه این مقاله به شرح زیر سازماندهی شده است. بخش ۲ کارهای مرتبط را بررسی می کند. روش KGCN4CEPR در بخش ۳ ارائه شده است . بخش ۴ ارزیابی های تجربی را شرح می دهد. در نهایت، نتایج ما در بخش ۵ آمده است.

۲٫ کارهای مرتبط

در این قسمت به معرفی مختصر الگوی اکولوژیکی می پردازیم سپس به روش های ذکر شده مربوط به سیستم های توصیه می پردازیم.

۲٫۱٫ سه دسته اصلی الگوی اکولوژیکی

با توجه به عناصر مختلف دخیل در ساخت الگوهای بوم شناختی، الگوهای بوم شناختی را می توان در سه دسته خلاصه کرد: الگوهای دولت محور، الگوهای بازار محور و الگوهای آگاهی فردی [ ۶ ].

الگوی دولت محور، ساخت، اجرا و گسترش الگوی اکولوژیکی را از طریق قدرت اداری دولت که متکی بر سیستم اداری است، ترویج می کند. این الگو الگوی اصلی برای ساخت تمدن اکولوژیکی در چین در حال حاضر است که مزیت آن این است که می تواند قدرت سیستم مدیریت سلسله مراتبی مرکزی و محلی چین را کامل کند. با این حال، از طریق نیروی اداری «از بالا به پایین»، هنوز تضاد بین منافع محلی و ملی وجود دارد و باید بیشتر بهینه شود [ ۷ ].

الگوی بازار محور یک الگوی ساخت و ساز است که به طور گسترده در کشورهای توسعه یافته استفاده می شود. از مکانیسم های بازار برای تنظیم تعادل پویای محیط و منابع استفاده می کند تا به توسعه همزمان اقتصاد و اکولوژی دست یابد. در مقایسه با الگوی دولت‌محور، این الگو به دلیل درون‌زایی بودن، راهی مؤثر برای ساخت الگوهای اکولوژیکی در نظر گرفته می‌شود. با این حال، مکانیسم بازار و سیاست‌های اقتصادی محیطی چین هنوز ناکافی است. بنابراین، چگونگی بهره‌برداری کامل از درون‌زایی الگوی بازار محور هنوز یک مشکل است [ ۸ ].

الگوی آگاهی فردی مستلزم مشارکت کامل هر فرد در جامعه است که متکی بر کنش آگاهانه جامعه است. زمانی که مفهوم تمدن بوم شناختی یک فرد به طور کامل ساخته شود، الگوی خودآگاه فردی شتابی پایدار خواهد داشت. فرض این الگو این است که هر فرد در جامعه نیاز به مشارکت فعال دارد. با این وجود، آموزش و تبلیغات بوم شناختی ما کافی نیست تا نتواند این فرض را به خوبی برآورده کند [ ۹ ].

به طور خلاصه، الگوی دولت محور در بین سه الگو در چین غالب است. بنابراین، ما بر الگوهای دولت محور تمرکز می کنیم و توصیه هایی برای الگوهای اکولوژیکی حومه شهر برای تصمیمات و حمایت دولت ارائه می کنیم.

۲٫۲٫ سیستم های توصیه

توصیه یک موضوع مهم، پیچیده و چالش برانگیز در تحقیقات هوش مصنوعی است. روش‌های پیشنهادی موجود را می‌توان به روش‌های مبتنی بر محتوا، روش‌های فیلتر مشارکتی و روش‌های ترکیبی تقسیم کرد [ ۱۰ ].

۲٫۲٫۱٫ توصیه مبتنی بر محتوا

پیشنهاد روش توصیه مبتنی بر محتوا [ ۱۱ ، ۱۲ ، ۱۳ ] از تحقیقات بازیابی اطلاعات سرچشمه گرفته و نوعی سیستم توصیه سنتی پرکاربرد است. روش توصیه مبتنی بر محتوا عمدتاً شامل دو نوع داده است: ویژگی‌های محتوای آیتم‌ها و نمایه‌های کاربر (علایق). ایده اصلی آن محاسبه شباهت بین آیتم های یک زیر مجموعه و آیتم های کل مجموعه است. اولی با توجه به بازخورد صریح (رتبه‌بندی، لایک و غیره) و بازخورد ضمنی (جستجو، کلیک، خرید و غیره) از کل مجموعه انتخاب می‌شود. سپس، این روش آنها را با توجه به شباهت آنها در یک لیست توصیه مرتب می کند.

نقطه ضعف آن این است که به شدت به متخصصان دامنه و مهندسی ویژگی های پیچیده در هنگام ساخت ویژگی های محتوا و نمایه های کاربر متکی است. علاوه بر این، روش توصیه مبتنی بر محتوا از مشکل “شروع سرد” برای کاربران جدید رنج می برد. به عنوان مثال، در استفاده از توصیه‌های الگوهای اکولوژیکی حومه شهر، برای یک حومه جدید مشخص شده، محاسبه دقیق شباهت دشوار است زیرا جمع‌آوری داده‌های عظیم و غنی از حومه در چین تقریباً غیرممکن است. بنابراین، استفاده مستقیم از روش توصیه مبتنی بر محتوا برای حل مشکل توصیه الگوهای اکولوژیکی روستا غیرممکن است.

۲٫۲٫۲٫ توصیه فیلتر مشارکتی

توصیه فیلتر مشارکتی [ ۱۴ ] یکی دیگر از سیستم های توصیه سنتی پرکاربرد است که می تواند محتوای علاقه مند را برای یک کاربر خاص ارائه دهد. ابتدا کاربرانی را که مشابه این کاربر هستند پیدا می کند و سپس با توجه به علایق آن کاربران محتوا را به این کاربر توصیه می کند. روش توصیه فیلتر مشارکتی را می توان بیشتر به توصیه فیلتر مشارکتی مبتنی بر حافظه و توصیه فیلتر مشارکتی مبتنی بر مدل طبقه بندی کرد. اولی را می توان به فیلتر مشارکتی مبتنی بر آیتم و فیلتر مشارکتی مبتنی بر کاربر تقسیم کرد. دومی عمدتاً شامل SVD [ ۴ ] و نوع آن است که می‌تواند داده‌ها را به ابعاد پایین ترسیم کند و شباهت‌های بین موارد را محاسبه کند.

با این حال، روش توصیه فیلتر مشترک هنوز از یک مشکل پراکندگی داده رنج می برد. به عبارت دیگر، زمانی که ماتریس تعامل آیتم ها و کاربران یک ماتریس پراکندگی باشد، یافتن اطلاعات همسایگی کاربران در ماتریس پراکندگی دشوار است که منجر به دقت توصیه کمتر می شود. به طور کلی، هر چه اندازه داده بزرگتر باشد، همپوشانی آیتم کوچکتر و ماتریس کم تر می شود. علاوه بر این، مشکل “شروع سرد” نیز دارد. نمی‌تواند با جمع‌آوری رفتار کاربر، مانند مرور، کلیک یا خرید، محصول جدیدی را بدون داده‌های تاریخی توصیه کند. به عنوان مثال، تحت سناریوی توصیه الگوهای اکولوژیکی حومه شهر، ماتریس تعامل روستا و الگوها خالی است، زیرا یافتن ویژگی‌های جغرافیایی طبیعی و ویژگی‌های انسانی روستا دشوار است.

۲٫۲٫۳٫ توصیه ترکیبی

برای بهبود بیشتر عملکرد توصیه ها، به ویژه در مورد داده های پراکنده و “شروع سرد”، محققان روش توصیه ترکیبی را پیشنهاد کردند که ایده اصلی آن ترکیب روش های توصیه با اطلاعات کمکی است. منابع این اطلاعات کمکی متنوع است، که برجسته‌تر از آن نمودار دانش [ ۱۵ ، ۱۶ ] است. گراف دانش یک گراف ناهمگن جهت دار است که در آن گره نشان دهنده موجودیت و یال نشان دهنده رابطه [ ۱۷ ]]، به طوری که می تواند روابط معنایی غنی بین موجودیت ها ایجاد کند. در مقایسه با روش‌های بدون KG، گنجاندن KG در توصیه‌ها به نفع نتایج است. ارتباط معنایی غنی بین آیتم‌ها در KG می‌تواند به کشف ارتباطات پنهان آنها و بهبود دقت نتایج کمک کند. بنابراین، روش‌های توصیه ترکیبی مبتنی بر KG عملکرد بهتری نسبت به روش‌های بدون KG دارند.

RippleNet [ ۹ ] یک روش توصیه ترکیبی مبتنی بر KG است که ابتدا روش مبتنی بر مسیر و KG را ادغام کرد. MKR [ ۱۸ ] یکی دیگر از روش های توصیه ترکیبی مبتنی بر KG است که یادگیری ویژگی چند وظیفه ای را با KG ترکیب می کند. KGCN [ ۱۹ ] اطلاعات محله را در KG با استفاده از شبکه‌های کانولوشنی جمع‌آوری کرد. KGCN به دلیل مزایای آن در رسیدگی به مشکل پراکندگی و فضایی به عنوان یک مدل پایه انتخاب شده است. در بین سه روش فوق بهترین عملکرد را در فیلم، موسیقی و توصیه کتاب به دست آورد [ ۹ ، ۱۸ ، ۱۹ ]]. با این حال، این روش ها در سناریوی با ویژگی های جغرافیایی انسانی و طبیعی قابل صلاحیت نیستند. به عبارت دیگر، تحت سناریوی الگوهای اکولوژیکی حومه شهر، KGCN از دقت پایینی برخوردار است زیرا مجاورت فضایی جغرافیایی را در نظر نمی‌گیرد.

در واقع مجاورت فضایی جغرافیایی به قوانین جغرافیا اشاره دارد، «اشیاء نزدیک بیشتر به یکدیگر مرتبط هستند» و «هر چه پیکربندی‌های جغرافیایی دو ناحیه شبیه‌تر باشد، مقادیر (فرآیند) متغیر هدف در این دو منطقه مشابه‌تر است. مناطق» [ ۲۰ ، ۲۱]. به طور خاص، نزدیک‌تر بودن حومه شهر در موقعیت مکانی، ویژگی‌های جغرافیایی مشابه بیشتری خواهد داشت و در نتیجه الگوهای اکولوژیکی روستایی مشابهی خواهد داشت. بنابراین مجاورت فضایی جغرافیایی یک عامل کلیدی کاربرد جغرافیایی است که باید در سیستم های توصیه مورد توجه قرار گیرد. اگر بتوان از مجاورت فضایی جغرافیایی در سیستم های توصیه استفاده کرد، می تواند عملکرد روش پیشنهادی فعلی را در مسائل توصیه های جغرافیایی بسیار بهبود بخشد.

۳٫ روش KGCN4CEPR

در این قسمت روش پیشنهادی KGCN4CEPR را در دو قسمت شرح می دهیم. برای بخش اول، ما روش توصیه KGCN را با ایجاد نمودار دانش جغرافیایی مرتبط با محیط جغرافیایی از طریق هستی‌شناسی و ساختار الگوهای اکولوژیکی حومه شهر گسترش می‌دهیم. برای جبران پراکندگی و بهبود عملکرد سیستم توصیه، از نمودار دانش روستایی استفاده می‌کنیم تا ویژگی‌های الگوهای اکولوژیکی روستاها و موجودیت‌های روستایی غنی‌تر از قبل شوند. این به این دلیل است که نمودار دانش اطلاعات را با یکدیگر پیوند می دهد و همبستگی داده ها را بهبود می بخشد. برای بخش دوم، ما از شبکه های کانولوشن برای استخراج مجاورت فضایی جغرافیایی بین مناطق حومه محله در فضای جغرافیایی بهره برداری می کنیم [ ۲۰ ]،۲۱ ]. در همین حال، ما همسایه‌ها را برای هر موجودیت در نمودار دانش جمع‌آوری کردیم و هنگام محاسبه نمایش یک موجودیت معین، اطلاعات همسایگی را با سوگیری ترکیب کردیم. شبکه کانولوشنال با انتخاب مهم ترین اطلاعات نمودار دانش، پیش بینی را به اندازه کافی افزایش می دهد. به منظور مناسب تر کردن آن برای کار توصیه الگوی اکولوژیکی حومه شهر در حوزه جغرافیایی، ویژگی های رابطه جغرافیایی بین روستا و الگوی اکولوژیکی روستا را بیشتر بررسی می کنیم.

۳٫۱٫ ساخت نمودار دانش روستایی

ساخت نمودار دانش را می توان به دو دسته تقسیم کرد: از بالا به پایین و از پایین به بالا [ ۲۲ ]. ابتدا هستی شناسی دامنه گراف دانش را از بالا به پایین ایجاد می کند و اطلاعات هستی شناسی و طرحواره را از منابع داده با کیفیت بالا، مانند دامنه های صنعتی و وب سایت های دایره المعارفی استخراج می کند. پایین به بالا از موجودیت لایه پایین شروع می شود و الگوهای جدید را با استفاده از جستجوی دستی و خزنده های وب استخراج می کند.

در مورد ساخت نمودار دانش روستایی، از ترکیب متناوب بالا به پایین و پایین به بالا استفاده می کنیم. ابتدا پایه هستی شناسی را با استفاده از روش بالا به پایین می سازیم و سپس موجودیت های نمودار دانش را با استخراج دانش بر اساس روش پایین به بالا گسترش می دهیم. در این بخش به ترتیب ساخت هستی شناسی و موجودیت گراف دانش روستا را معرفی می کنیم.

۳٫۱٫۱٫ گراف دانش روستایی ساخت هستی شناسی

ما حجم زیادی از ادبیات علمی، دانش دایره‌المعارفی و وب‌سایت‌های دولتی را در مورد الگوهای اکولوژیکی حومه شهر از طریق جستجوی دستی و خزنده وب جمع‌آوری و سازماندهی می‌کنیم. ما اطلاعات هستی‌شناختی الگوهای بوم‌شناختی روستاها را مرتب می‌کنیم و چارچوب هستی‌شناسی الگوهای بوم‌شناختی روستا را با استفاده از ابزار Protégé، همانطور که در شکل ۱ نشان داده شده است، می‌سازیم . در شکل ۱ ، جعبه های با رنگ روشن به معنای کلاس ها هستند، در حالی که جعبه هایی با رنگ عمیق به معنای نمونه ها هستند.

به منظور ارائه راهنمایی برای ساخت موثر موجودیت، ما یک سیستم دانش الگوهای بوم‌شناختی روستایی را بر اساس سه بخش ایجاد می‌کنیم، یعنی مفهوم الگوی اکولوژیکی، اطلاعات سلسله مراتبی برای توصیف مفهوم الگو، و اطلاعات دقیق، همانطور که در شکل ۲ نشان داده شده است. . به عنوان مثال، منطقه روستایی Hancunhe برای توسعه الگوی توسعه صنعتی مناسب است ، طول و عرض جغرافیایی آن (۱۱۵٫۹۶۱، ۳۹٫۶۰۳)، جمعیت ۲۷۰۰ نفر، اندازه منطقه ۲٫۴ کیلومتر مربع ^، و طول جاده ۱۳۲۸٫۷۴ کیلومتر است.

می توان دریافت که ده الگوی اصلی بوم شناختی روستاها به شرح زیر وجود دارد: الگوی توسعه صنعتی، الگوی حفاظت از محیط زیست، الگوی متراکم حومه شهر، الگوی حکمرانی جامع اجتماعی، الگوی میراث فرهنگی، الگوی توسعه شیلات، الگوی مرتع مرتع، الگوی بهبود محیط زیست، کشاورزی کارآمد. الگو و الگوی گردشگری اوقات فراغت هر الگو دارای برخی روابط سلسله مراتبی است که می تواند به اطلاعات پایه، اقتصادی و اکولوژیکی تقسیم شود. یکی از الگوهای اکولوژیکی روستایی ذکر شده در بالا را برای روستای مشخص شده به عنوان مناسب توصیه می کنیم.

۳٫۱٫۲٫ گراف دانش ساخت روستا

ما تعداد زیادی از داده‌های ساختاریافته، نیمه ساختاریافته و بدون ساختار را جمع‌آوری و سازماندهی می‌کنیم تا موجودیت‌های نمودار دانش روستایی مرتبط با محیط جغرافیایی را گسترش دهیم، مطابق شکل ۲ . داده های ما از دو منبع اصلی، یعنی داده های اینترنتی و آمار رسمی به دست می آید.

بخشی از داده ها از اینترنت می آید. اطلاعات پراکنده زیادی در اینترنت وجود دارد و ما داده ها را از ادبیات علمی، دانش دایره المعارفی، گزارش های خبری، رسانه های اجتماعی و سایر اطلاعات با استفاده از جستجوهای دستی و خزنده های وب جمع آوری می کنیم. به عنوان مثال، یک نمونه از جعبه اطلاعات دایره المعارف بایدو ، در مورد اطلاعات حومه شهر Hancunhe است، همانطور که در شکل ۳ نشان داده شده است. دایره المعارف بایدو یکی از منابع نمودار دانش روستایی ما است. ما به صورت دستی نام روستا را بازیابی می کنیم و اطلاعات مربوط به جعبه اطلاعات را از دایره المعارف بایدو دریافت می کنیم. دسته بندی را انتخاب کرده و مطابق شکل ۲ محتویات را فیلتر کردیممانند دسته «اطلاعات پایه» و مطالب «جمعیت و مکان» از دایره المعارف بایدو می باشد. اطلاعات جمع‌آوری‌شده بیشتر به سه گانه نهاد-رابطه- موجودیت، مانند ( Hancunhe Countryside, countryside.locate.district, Fangshan District) و ( Hancunhe Countryside, countryside.population, 2700) نگاشت می‌شود.

بخش دیگری از داده ها از آمار شهرستان های سالنامه آماری چین ( https://data.cnki.net/yearbook/Single/N2021110004 ، دسترسی به ۱۵ مارس ۲۰۲۱) پایگاه داده، شامل داده های جمعیت شهرستان، اقتصاد، منطقه و غیره ما این داده ها را به سه گانه متناظر به دو صورت نگاشت می کنیم. از یک طرف، ما ویژگی های مهم مربوط به توسعه الگوهای اکولوژیکی روستا را انتخاب می کنیم. از سوی دیگر، ما از داده‌هایی با مقیاس فضایی بزرگ‌تر برای تکمیل داده‌های گمشده با مقیاس فضایی کوچک‌تر برای ویژگی‌های تقریبی استفاده می‌کنیم.

در نهایت، ما نمودار دانش حومه شهر را با نگاشت سه گانه از داده های بالا بر روی یک پلت فرم KG محبوب (Neo4j)، که دارای ۴۴۱ موجودیت و ۲۲ رابطه است، ایجاد می کنیم، همانطور که در شکل ۴ نشان داده شده است.

۳٫۲٫ روش توصیه KGCN4CEPR

در این بخش، ابتدا مسئله توصیه الگوهای بوم‌شناختی روستا را فرموله می‌کنیم، سپس اجرای KGCN4CEPR را بر اساس نمودار دانش روستایی ایجاد شده در بخش ۳٫۱ ارائه می‌کنیم. به طور خاص، ما از شبکه‌های کانولوشنی برای استخراج مجاورت فضایی بین موجودیت‌ها در نمودار دانش روستا و استخراج ویژگی‌های رابطه بین روستا و الگوی اکولوژیکی روستا استفاده می‌کنیم تا بتوانیم الگوی بوم‌شناختی روستا را برای حومه مشخص شده به‌طور علمی توصیه کنیم.

۳٫۲٫۱٫ فرمول مسأله

ما مشکل توصیه الگوهای اکولوژیکی روستا را به صورت زیر فرموله می کنیم. در سناریوی توصیه الگوهای بوم‌شناختی روستا، مجموعه‌ای از مالگوها پ=پ۱،پ۲،…،پمو مجموعه ای از نحومه شهر V=v1،v2،…،vن. ماتریس تعامل الگو-حومه Y=yپ۱،v1،yپ۱،v2،…،yپم،vن∈ℝم×نبسته به موقعیت واقعی، جایی که تعریف می شود yپ،v=1آن روستا را نشان می دهد vبرای الگو مناسب است پ; در غیر این صورت، yپ،v=0. علاوه بر این، ما همچنین یک نمودار دانش روستایی داریم جی، که از سه گانه نهاد-رابطه- موجودیت تشکیل شده است ساعت،r،تی. اینجا ساعت∈ξ، r∈آرو تی∈ξسر، رابطه و دم را نشان می دهد جی، به ترتیب. با توجه به یک مثال، سه گانه ( Xiaonan Countryside, countryside.locate.district, Lvshunkou District) به این معنی است که روستای Xiaonan در ناحیه Lvshunkou واقع شده است.

با توجه به ماتریس تعامل الگو-حومه Yو نمودار دانش روستا جی، ما قصد داریم پیش بینی کنیم که آیا روستا vالگوی منطبق پ. هدف ما یادگیری یک تابع پیشگویی است y^پ،v، به حداقل رساندن تفاوت بین مقدار پیش بینی شده و مقدار واقعی:

y^پ،v=افپ،vΘ،Y،جی

(۱)

جایی که y^پ،vبیانگر امکاناتی است که روستاها vبا الگو مطابقت خواهد داشت پ، و Θپارامترهای تابع را نشان می دهد اف. معانی نمادها در KGCN4CEPR در جدول ۱ نشان داده شده است.

۳٫۲٫۲٫ اجرای روش توصیه KGCN4CEP

این بخش فرعی ابتدا چارچوب KGCN4CEPR را شرح می دهد و چهار مرحله اجرای کلیدی را دنبال می کند، همانطور که در شکل ۵ نشان داده شده است.

مرحله ۱٫ ماتریس مجاورت وزن ها: نمودار دانش ناهمگن اصلی حومه شهر را با وزن ها به نمودار دانش روستایی تبدیل کنید، وزن یال ها را یاد بگیرید. wrمنپبرای به دست آوردن یک ماتریس مجاورت

گام ۲٫ v= ساخت و ساز : ویژگی های مجاورت فضایی جغرافیایی حومه شهر را توسط شبکه های کانولوشن گراف استخراج کنید، و سپس اطلاعات مجاورت فضایی جغرافیایی را در موجودیت های روستایی جاسازی کنید. vبرای به دست آوردن بردار همسایگی v¯، و در نهایت در یک بردار موجودیت روستایی جمع می شوند v=.

مرحله ۳٫ تکرار : با استفاده از الگوریتم گرادیان نزول، گرادیان خطا را به عقب و جلو پخش کنید تا پارامترها را به روز کنید و آموزش را چندین بار تکرار کنید تا تفاوت بین مقدار پیش بینی شده و مقدار واقعی به حداقل برسد.

مرحله ۴٫ توصیه : بر اساس نتیجه به حداقل رسیده در مرحله ۳، پیش بینی کنید که آیا حومه شهر vالگوی منطبق پ.

در مرحله ۱، برای محاسبه وزن لبه نمودار دانش روستایی، از فرمول (۲) استفاده می کنیم:

wrمنپ=gپ،rمن

(۲)

جایی که پبردار الگوی اکولوژیکی حومه شهر را نشان می دهد و rمنبردار رابطه همسایگی i را نشان می دهد. کارکرد g∶ℝد×ℝد→ℝبرای محاسبه حاصل ضرب درونی بردار استفاده می شود پو بردار rمن. وزن با تابع محصول داخلی محاسبه می شود g. الگوی توسعه صنعتی را به عنوان مثال در نظر بگیرید، با توجه به امتیازدهی این الگو در ماتریس تعامل الگو-حومه، می‌توانیم بردار الگوی اکولوژیکی حومه شهر را بدست آوریم. پ. به همین ترتیب، می‌توانیم بردار رابطه همسایگی را پیدا کنیم rمنبر اساس ارتباط با این الگو در نمودار دانش. به طور کلی، wrمنپنشان دهنده اهمیت رابطه است rمنروی الگو پ. نتایج اهمیت از هر محاسبه دقیق هستند wrمنپتأثیر رابطه را در نظر می گیرد rمنروی الگو پبه جای استفاده از تأثیر ثابت رابطه.

در مرحله بعد، طبق فرمول (۳)، نرمال سازی softmax را روی آن انجام می دهیم wrمنپ:

w˜rمنپ=سofتیمترآایکسwrمنپ=هایکسپwrمنپ∑j∈نvهایکسپwrمنپwrمنپ=gپ،rمن

(۳)

جایی که نvمجموعه ای از تمام موجودیت هایی را که مستقیماً به موجودیت روستایی متصل می شوند را نشان می دهد v.

سپس ترکیب خطی را محاسبه می کنیم v¯از v’s همسایه ها برای به دست آوردن مقدار پیش بینی شده y^پ،vدر مرحله ۲:

v¯=∑من∈اسvw˜rمنپهمن

(۴)

جایی که همننشان دهنده یکم نمایش بردار همسایگی است، اسvمحدوده انتخاب نهاد روستایی را نشان می دهد.

طبق قوانین جغرافیا، هر چه فاصله نزدیکتر باشد، همبستگی بین اشیاء بیشتر است. بنابراین، شباهت‌های خاصی بین الگوهای اکولوژیکی حومه روستاهای همجوار جغرافیایی وجود دارد. وقتی تعداد همسایگان یک نهاد روستایی بسیار زیاد است vدر نمودار دانش روستایی، فشار محاسباتی و اطلاعات غیر ضروری محله را به همراه خواهد داشت. بنابراین، ما مقیاس فضایی بازدید از محله‌های هر یک از مناطق روستایی را محدود می‌کنیم، در عوض از کل موجودیت‌های قابل دسترسی بازدید می‌کنیم. اسv. برای هر موجودیت روستایی، فقط از گره های همسایگی بازدید می کند کبار و زیر مجموعه به دست می آورد نvبا اشاره به فرمول (۵). این تضمین می‌کند که تجمیع موجودیت‌های همسایگی به طور نامحدود به بیرون گسترش نمی‌یابد در حالی که اطلاعات کافی را با ارتباط بالا حفظ می‌کند:

نv←vv∈اسvآnدنv=ک

(۵)

جایی که نvزیر مجموعه ای از اسv.

در مرحله ۲، تجمع از v¯به v=در فرمول (۶) نشان داده شده است:

v==σدبلیو=v¯+ه+ب

(۶)

جایی که دبلیوماتریس تبدیل خطی است، بسوگیری، برداری است هتوسط موجودیت روستایی در تکرار قبلی ایجاد می شود و σتابع غیرخطی است که نتیجه آن نمایش بردار نهایی موجودیت روستایی است v=.

در نهایت، یک تابع ضرر برای محاسبه تفاوت بین مقدار پیش بینی شده استفاده می شود y^پ،vو ارزش واقعی yپ،vهمانطور که در مراحل ۳ و ۴ با اشاره به فرمول (۷) توضیح داده شده است:

لoسس=Lyپ،v،y^پ،v

(۷)

در ادامه، یک توصیه الگوهای بوم‌شناختی حومه شهر برای روستای مشخص Hancunhe را به عنوان مثال برای نشان دادن اجرای KGCN4CEPR، که شامل چهار مرحله است، در نظر می‌گیریم.

در مرحله ۱، ابتدا وزن هر یال مجاور Hancunhe در نمودار دانش روستایی را محاسبه می کنیم. وزن wrمنپنشان دهنده ترجیح الگوی توسعه صنعتی برای هر رابطه است.

در مرحله ۲، تعداد دفعات تجمع محله ک۲ است که لایه دوم شامل: ” شهر پکن “، “طول جاده” و “منطقه” است. برای بدست آوردن بردار تجمیع، موجودیت ها را نرمال و وزن می کنیم vاز ” منطقه فانگشان “. لایه اول شامل « منطقه فانگشان »، «منطقه»، «جمعیت» و « الگوی توسعه صنعتی » است. به همین ترتیب، بردار همسایگی را به دست می آوریم v¯محل مرکزی ” Hancunhe Countryside”. سپس، یک تجمیع پیام از بردار همسایگی را انجام می دهیم v¯از ” Hancunhe Countryside” و نهاد روستایی vاز ” Hancunhe Countryside” برای به دست آوردن نمایش بردار نهایی v=از ” Hancunhe Countryside”. شکل ۶ عملیات تجمع بالا KGCN4CEPR را شرح می دهد. در شکل ۶ ، ۲ نوع شی وجود دارد، یعنی موجودیت ها و خصوصیات. دایره ها موجودیت های مختلف را نشان می دهند. مستطیل ها ویژگی های متفاوتی را نشان می دهند. فلش به معنای جهت عملیات تجمع است. اشیاء با همان رنگ اشیاء درگیر در عملیات تجمع یکسان را نشان می دهند.

در مرحله ۳، حداقل مقدار تفاوت بین مقدار پیش بینی شده و مقدار واقعی ” Hancunhe Countryside” به طور مکرر به دست می آید.

در نهایت، در مرحله ۴، الگوی متناظر با نتیجه به حداقل رسیده برای ” Hancunhe Countryside”، یعنی الگوی توسعه صنعتی توصیه می شود .

۴٫ ارزیابی تجربی و بحث

برای ارزیابی عملکرد KGCN4CEPR، آزمایش بر اساس نمودار دانش حومه شهر انجام شد.

۴٫۱٫ مجموعه داده ها

مجموعه داده شامل ۱۰۰ منطقه حومه شهر ( https://www.sohu.com/a/133462746_731911 ، قابل دسترسی در ۱ نوامبر ۲۰۲۰)، ۴۴۱ موجودیت و ۲۲ رابطه است. ۴۴۱ موجودیت شامل ۱۰ الگوی اکولوژیکی، ۱۰۱ منطقه حومه شهر و سایر موجودات است. ما داده‌های خام مورد علاقه خود را فیلتر کردیم. داده‌های خاصی که استفاده می‌کنیم نشان داده شده‌اند جدول ۲ نشان داده شده است. حجم زیادی از داده های جمع آوری شده در نمودار دانش ثبت شده و به صورت دستی در سیستم توصیه های جغرافیایی وارد می شود. ما عناصر جغرافیایی زیادی در مدل خود داریم، مانند مساحت آب و سطح زمین زیر کشت. علاوه بر این، ما عناصر جغرافیایی بیشتری مانند countryside.locate.district، countryside.locate.city و countryside.locate.province اضافه کرده‌ایم. از طریق این عناصر، ما می توانیم ویژگی های جغرافیایی مدل را بهتر غنی کنیم.

نسبت آموزش، ارزشیابی و مجموعه آزمون ۶:۲:۲ است. برای ماتریس تعامل الگوهای اکولوژیکی حومه شهر، آستانه برای هر عنصر در ماتریس ۴ است. این ماتریس از رتبه دهی روستا به هر یک از ۱۰ الگوی اکولوژیکی تشکیل شده است، نمره کامل آن ۵ است. اگر مقدار عنصری بزرگتر یا مساوی باشد. ۴، عنصر به عنوان نمونه مثبت در نظر گرفته می شود. در غیر این صورت نمونه منفی محسوب می شود. برای نمودار دانش حومه، تعاملات بین موجودیت‌ها را نگه می‌دارد، که در آن موجودیت‌ها شامل حومه و برخی اطلاعات مربوط به حومه شهر هستند، برای مثال: Xiaonan Countryside، countryside.locate.district، Lvshunkou District.

۴٫۲٫ آزمایش کنید

۴٫۲٫۱٫ معیار تنظیم و ارزیابی آزمایش

محیط آزمایشی : سیستم سخت افزاری مورد استفاده در این مطالعه شامل: CPU AMD Ryzen 5 3600 و Nvidia GeForce RTX 2070 SUPER GPU است. محیط نرم افزار شامل Python 3.6، TensorFlow 1.12.0 و Numpy 1.14.3 می باشد. ما از مقدار میانگین بعد از ده تکرار برای ارزیابی استفاده می کنیم.

پارامترهای آزمایشی: ما مجموعه را برای تعیین پارامترهای آزمایشی با توجه به نتایج آزمایشی بهینه می‌کنیم ( برای جزئیات به بخش ۵ مراجعه کنید). هنگام آموزش KGCN4CEPR، عدد تکرار H را روی ۲، بعد تعبیه d را بر روی ۸، زمان تجمع همسایه k را به ۲، اندازه دسته ای را ۱۶، نرخ یادگیری را ۱e-3 تنظیم می کنیم. در نهایت آنها به طور مکرر می دوند تا بیش از حد فیت شوند و سپس متوقف می شوند.

معیار ارزیابی : ما عملکرد روش خود را با سایر خطوط پایه با استفاده از AUC به عنوان معیار ارزیابی مقایسه می کنیم [ ۲۳ ، ۲۴ ]. علاوه بر AUC فوق، دقت رایج ، فراخوان و F1 نیز به عنوان معیارهای ارزیابی استفاده می شود.

AUC به عنوان مساحت زیر منحنی مشخصه عملکرد گیرنده ( ROC ) تعریف می شود، ما از مقدار AUC به عنوان استاندارد ارزیابی روش به جای منحنی ROC استفاده می کنیم ، زیرا AUC می تواند به وضوح توضیح دهد که کدام طبقه بندی بهتر است [ ۲۳ ].

دقت ابتدایی ترین معیار ارزیابی در مسائل طبقه بندی است. دقت به عنوان درصد نتایج پیش‌بینی‌شده صحیح در کل نمونه تعریف می‌شود و با فرمول (۸) ارائه می‌شود، که در آن TP به معنی مثبت واقعی، TN به معنای منفی واقعی، FP نشان‌دهنده مثبت کاذب و FN به معنای منفی کاذب است:

آسیسی=تیپ+تین/تیپ+تین+افپ+افن

(۸)

فراخوان نشان دهنده درصد نمونه های مثبت است که به طور کامل شناسایی شده اند و فرمول فراخوان به شرح زیر است:

آرهجآلل=تیپ/تیپ+افن

(۹)

دقت نشان دهنده درصد نمونه های مثبت است که به درستی شناسایی شده اند و فرمول دقت به شرح زیر است:

پrهجمنسon=تیپ/تیپ+افپ

(۱۰)

F1 میانگین وزنی Precision و Recall است که با توجه به فرمول (۱۱) می توان آن را به عنوان عملکرد کلی با توجه به اثرات کامل بودن و نویز تفسیر کرد:

اف۱=۲×پrهجمنسمنon×آرهجآلل/پrهجمنسمنon+آرهجآلل

(۱۱)

ارزیابی KGCN4CEPR : ما KGCN4CEPR را در سناریوی توصیه الگوهای اکولوژیکی حومه شهر ارزیابی می کنیم. AUC و F1 برای پیش بینی دقت امکان توصیه در مجموعه تست استفاده می شود. در توصیه Top-K، Recall برای ارزیابی الگوهای انتخابی K با بالاترین احتمال توصیه پیش‌بینی‌شده برای هر کشور در مجموعه آزمایشی انتخاب می‌شود.

۴٫۲٫۲٫ معیار تنظیم و ارزیابی آزمایش

ما KGCN4CEPR را با خطوط پایه زیر مقایسه می کنیم تا کارایی و امکان سنجی KGCN4CEPR را در سناریوی توصیه الگوهای اکولوژیکی حومه شهر بررسی کنیم.

SVD [ ۱۳ ] ( تجزیه ارزش منفرد ) یک روش سنتی توصیه فیلتر مشترک مبتنی بر مدل‌های عامل پنهان است.

MKR [ ۲۵ ] یک روش توصیه گراف دانش چند وظیفه ای است که می تواند وظایف توصیه و وظایف جاسازی نمودار دانش را به روشی متناوب آموزش دهد.

RippleNet [ ۹ ] یک روش توصیه گراف دانش ترکیبی است که ترجیحات موجودیت‌ها را منتشر می‌کند، مانند میزان علاقه یک موجودیت روستایی به موجودیت دیگری از الگوی بوم‌شناختی روستایی.

KGCN4CEPR روش ما است، که یک روش توصیه الگوهای اکولوژیکی حومه شهر بر اساس KGCN [ ۱۹ ] است. به طور خاص، ما یک نمودار دانش حومه شهر ایجاد می کنیم تا پراکندگی داده های الگوهای اکولوژیکی حومه شهر را جبران کنیم. ما یک شبکه کانولوشن برای استخراج مجاورت جغرافیایی الگوهای اکولوژیکی در میان حومه های مجاور طراحی می کنیم.

ما KGCN4CEPR را با خطوط پایه بالا مقایسه می کنیم و نتیجه ۳ توصیه برتر ” Hancunhe Countryside” را به عنوان مثال در نظر می گیریم. الگوهای واقعی تاپ ۳ به عنوان برچسب های مناسب برای این روستا ، الگوی توسعه صنعتی و به دنبال آن الگوی حاکمیت جامع اجتماعی و الگوی گردشگری اوقات فراغت است .

اولین نتیجه پیشنهادی SVD الگوی گردشگری تفریحی است که به هیچ یک از الگوهای ۳ برتر تعلق ندارد. این به این دلیل است که SVD تنها از تجزیه ماتریس تعامل به جای استفاده از نمودار دانش حومه شهر برای کشف رابطه معنایی بین موجودیت ها استفاده می کند.

همانطور که برای MKR و RippleNet بر اساس نمودار دانش روستایی، نتایج توصیه Top-1 آنها الگوی توسعه صنعتی است ، اما آنها تفاوت های قابل توجهی را در توصیه های Top-3 خود نشان می دهند. نتایج سه توصیه برتر MKR و RippleNet عبارتند از الگوی توسعه صنعتی ، الگوی فشرده حومه شهر و الگوی بهبود محیطی . این به این دلیل است که آنها با استفاده از نمودار دانش حومه شهر ، شباهت های بین ” Hancunhe Countryside” و سایر حومه ها را در نظر می گیرند. با این حال، موقعیت جغرافیایی ” Hancunhe Countryside” در دو نتیجه فوق نادیده گرفته شده است، که منجر به توصیه الگوی اشتباه می شود.الگوی فشرده حومه شهر .

در مورد روش ما، KGCN4CEPR، نتایج ۳ توصیه برتر آن عبارتند از الگوی توسعه صنعتی ، الگوی گردشگری اوقات فراغت و الگوی حاکمیت جامع اجتماعی . اگرچه هنوز شکاف مشخصی با الگوی واقعی وجود دارد، نتیجه KGCN4CEPR نزدیکترین به برچسب واقعی است. این به این دلیل است که KGCN4CEPR نه تنها از نمودار دانش حومه شهر بهره برداری می کند، بلکه یک شبکه کانولوشنی برای استخراج به اندازه کافی شباهت جغرافیایی الگوهای اکولوژیکی طراحی می کند. علاوه بر این، KGCN4CEPR به جای گسترش نامحدود مقیاس فضایی ، مجاورت جغرافیایی ” Hancunhe Countryside” را بررسی می کند. در واقع هیچ الگوی متراکم حومه ای در پکن وجود نداردو حومه اطراف آن

نتایج آزمایش در جدول ۳ ارائه شده است. می‌توانیم ببینیم که روش ما بهترین عملکرد را در تمام معیارها، AUC ، F1 ، ACC و Recall دارد. به عنوان مثال، در AUC ، روش ما در مقایسه با MKR ~ 3٪ بهبود یافته است. F1 ۸% بالاتر از SVD است و به ۶۳٫۷۹% می رسد . ACC ~3٪ بالاتر از SVD است و به ۶۰٫۹۴٪ می رسد. در حالی که Recall ~۳٪ بالاتر از RippleNet است و به ۵۶٫۷۷٪ می رسد. نتایج تجربی بالا امکان‌سنجی و اثربخشی روش ما را نشان می‌دهد.

۵٫ بحث در مورد انتخاب پارامترها

۵٫۱٫ بحث در مورد انتخاب پارامترها

در این بخش، با توجه به نتایج تجربی، روش را با انتخاب پارامترها بهینه می‌کنیم و تأثیر پارامترها را بیشتر تحلیل می‌کنیم: اندازه تجمع همسایه. س، شماره تکرار اچو ابعاد تعبیه شده دبا اشاره به رویکرد تجربی کلاسیک [ ۲۵ ].

اثر اندازه تجمع همسایه، س: برای تجزیه و تحلیل اثر اندازه تجمع همسایه بر توصیه، آزمایش‌های متعددی با اندازه تجمع همسایگان مختلف انجام دادیم. نتایج قابل توجه بود، بنابراین، سبرای آزمایش بر روی ۲ تنظیم شد که بر اساس مقادیر AUC نتایج تجربی مختلف است، همانطور که در جدول ۴ نشان داده شده است.
اثر تعداد تکرار، اچهمانطور که در جدول ۵ نشان داده شده است، AUC ابتدا افزایش یافته و سپس با افزایش تعداد تکرار کاهش می یابد. وقتی تعداد تکرار بیش از حد کوچک است، اثر تمرین بهینه نیست. هنگامی که تعداد دفعات تکرار ۳ یا ۴ باشد، AUC کاهش قابل توجهی را نشان می دهد، زیرا نویز زیادی به همراه دارد. بنابراین، بهترین عدد تکرار برای سناریوی توصیه الگوهای اکولوژیکی حومه شهر روی ۲ تنظیم شده است.
اثر تعبیه ابعاد، د: در آزمایش، تأثیر تعبیه ابعاد را بر استفاده از نمودار دانش روستا مشاهده کردیم. دروی ۸ تنظیم شده است زیرا AUC زمانی که تعداد ابعاد تعبیه شده ۸ باشد، حداکثر است، همانطور که در جدول ۶ نشان داده شده است.

از بحث بالا، برای استفاده کامل از مجاورت جغرافیایی، عدد تکرار را تعیین کردیم اچبه ۲، بعد تعبیه دتا ۸، زمان تجمع همسایه کبه ۲ و اندازه تجمع همسایه ستا ۸ که برای عملکرد توصیه بسیار مهم هستند.

از بحث بالا می توان دریافت که KGCN4CEPR می تواند AUC پیشنهادی الگوهای اکولوژیکی حومه شهر را بهبود بخشد و داده های ایجاد شده را می توان برای حل مشکلات توصیه روستایی به کار برد. به طور خاص، هنگامی که ” Hancunhe Countryside” به عنوان یک موجودیت حومه ورودی وارد می شود، روش ما KGCN4CEPR می تواند بهترین الگوی توسعه صنعتی خروجی توصیه را به دست آورد ( برای جزئیات به بخش ۳٫۲٫۲ مراجعه کنید). علاوه بر این، پارامترها هنگام حل مسائل توصیه های جغرافیایی نیز مهم هستند. ساخت روش و انتخاب پارامترها می تواند مشکلات توصیه الگوهای روستایی را به خوبی حل کند.

۵٫۲٫ بحث در مورد کاربرد KCN4CERP در واقعیت

در این بخش، ما در مورد چگونگی اعمال روش ما در واقعیت بحث می کنیم. لطفا برای جزئیات بیشتر به ادامه مطلب مراجعه کنید.

” Hancunhe Countryside” را به عنوان مثال برای نشان دادن توصیه KGCN4CEPR در نظر بگیرید. به طور کلی، نمودار دانش و ماتریس تعامل الگوی روستایی یک حومه مشخص به عنوان داده‌های ورودی روش KGCN4CEPR تصویب می‌شود و به‌طور متناظر یک الگوی اکولوژیکی مناسب را به عنوان خروجی توصیه به‌دست می‌آورد. به طور خاص، موجودیت‌ها و ویژگی‌های مرتبط جغرافیایی « Hancunhe Countryside» ابتدا با استفاده از نمودار دانش حومه، مانند « Fangshan District»، «طول جاده» و غیره به دست می‌آیند که پراکندگی داده‌ها را از طریق معنایی غنی جبران می‌کند. اطلاعات سپس، شباهت جغرافیایی « HancunheCountryside» همانطور که در بخش ۳٫۲ نشان داده شده است، از طریق شبکه کانولوشن استخراج می شود . علاوه بر این، هر مقدار پیش بینی شده از ده الگو برای ” Hancunhe Countryside” محاسبه می شود و حداقل مقدار تفاوت بین مقدار پیش بینی شده و مقدار واقعی در نهایت انتخاب می شود. در نهایت، ما مناسب ترین الگو، الگوی توسعه صنعتی را برای ” Hancunhe Countryside” با حداقل مقدار انتخاب شده به دست می آوریم. به طور مشابه، روستاهای دیگر به جز ” Hancunhe Countryside” نیز می تواند توصیه شود. نتایج توصیه می تواند به مردم محلی کمک کند تا توسعه پایدار را به طور منطقی انجام دهند.

۶٫ نتیجه گیری

در این مطالعه، ما بر روی توصیه‌های الگوهای اکولوژیکی حومه تمرکز کردیم و دو بهینه‌سازی اصلی انجام دادیم: (۱) ما یک نمودار دانش دامنه را با استخراج ویژگی‌های جغرافیایی ایجاد کردیم، که به طور کامل همبستگی معنایی غنی بین الگوهای اکولوژیکی حومه شهر را نشان می‌دهد تا بتواند به طور موثر با مشکل پراکندگی داده ها (۲) ما یک شبکه کانولوشن طراحی می کنیم که به اندازه کافی مجاورت حومه محله را در فضای جغرافیایی بررسی می کند و اطلاعات محله الگوهای اکولوژیکی حومه شهر را به تصویر می کشد و با موفقیت به مشکل “شروع سرد” رسیدگی می کند. از نظر معیارهای ارزیابی AUC ، F1 ، ACC و Recallنتایج تجربی نشان می دهد که دو بهینه سازی فوق موثر بوده و روش پیشنهادی به طور قابل توجهی نسبت به روش های موجود برتری دارد.

در مقایسه با سیستم های توصیه سناریوهای کاربردی دیگر، مانند فیلم و موسیقی، توصیه الگوهای اکولوژیکی حومه شهر دارای ویژگی ها و چالش های خاصی است. هنوز مقداری برای بهبود اثر توصیه وجود دارد. بنابراین، کار آینده ما برای حل بیشتر مشکل پراکندگی داده‌های روستایی، مانند تکمیل داده‌ها از طریق خزنده‌های وب و افزایش داده‌ها با استفاده از یک شبکه تولید متخاصم، برنامه‌ریزی می‌کند. ما همچنین روش خود را در بسیاری از کاربردهای بیشتر مرتبط با حوزه جغرافیا در مقیاس فضایی بزرگتر مانند مناطق، شهرها و حتی استان ها گسترش خواهیم داد.

مشارکت های نویسنده

مفهوم سازی، Zhiqiang زو و شو وانگ. روش، Zhiqiang زو و Xuhui Zeng. نرم افزار، Zhiqiang Zou، Xuhui Zeng و Mengfei Xu. اعتبارسنجی، Zhiqiang Zou، Xuhui Zeng، Shu Wang و Mengfei Xu. تحلیل رسمی، Zhiqiang Zou و Xuhui Zeng; تحقیق، Zhiqiang Zou، Xuhui Zeng و Mengfei Xu; منابع، یونچیانگ زو; سرپرستی داده ها، Xuhui Zeng; نوشتن – آماده سازی پیش نویس اصلی، Zhiqiang Zou، Xuhui Zeng و Yunqiang Zhu. نوشتن-بررسی و ویرایش، Zhiqiang Zou، Shu Wang و Yunqiang Zhu. تجسم، Xuhui Zeng و Mengfei Xu; نظارت، شو وانگ. مدیریت پروژه، Zhiqiang زو و شو وانگ. کسب بودجه، Zhiqiang زو و شو وانگ. همه نویسندگان نسخه منتشر شده نسخه خطی را خوانده و با آن موافقت کرده اند.

منابع مالی

این کار توسط برنامه تحقیقاتی اولویت استراتژیک آکادمی علوم چین (شماره کمک هزینه XDA23100100)، شورای بورس تحصیلی چین (شماره کمک هزینه ۲۰۲۰۰۸۳۲۰۰۴۴) و بنیاد ملی علوم طبیعی چین (شماره کمک هزینه ۴۲۰۵۰۱۰۱) پشتیبانی شد.

بیانیه در دسترس بودن داده ها

مجموعه داده های در دسترس عموم در این مطالعه مورد تجزیه و تحلیل قرار گرفت. این داده‌ها را می‌توانید در اینجا بیابید: [ https://data.cnki.net/yearbook/Single/N2021110004 ، دسترسی به ۱۵ مارس ۲۰۲۱].

قدردانی ها

نویسندگان مایلند از موسسه تحقیقات علوم جغرافیایی و منابع طبیعی و دانشگاه پست و مخابرات نانجینگ تشکر کنند. علاوه بر این، ما از سردبیران و داوران برای نظرات ارزشمندشان تشکر می کنیم.

تضاد علاقه

نویسندگان هیچ تضاد منافع را اعلام نمی کنند.

منابع

آدوماویسیوس، جی. توژیلین، الف. به سوی نسل بعدی سیستم‌های توصیه‌گر: بررسی پیشرفت‌های پیشرفته و احتمالی. IEEE Trans. دانستن مهندسی داده ۲۰۰۵ ، ۱۷ ، ۷۳۴-۷۴۹٫ [ Google Scholar ] [ CrossRef ]
چیکایزا، جی. Valdiviezo-Diaz، P. بررسی جامع سیستم‌های توصیه‌گر مبتنی بر نمودار دانش: فناوری‌ها، توسعه، و مشارکت‌ها. اطلاعات ۲۰۲۱ ، ۱۲ ، ۲۳۲٫ [ Google Scholar ] [ CrossRef ]
وانگ، اچ. ژانگ، اف. Xie، X. Guo, M. DKN: شبکه آگاه از دانش عمیق برای توصیه اخبار. در مجموعه مقالات کنفرانس جهانی وب ۲۰۱۸، لیون، فرانسه، ۲۳ تا ۲۷ آوریل ۲۰۱۸؛ صفحات ۱۸۳۵-۱۸۴۴٫ [ Google Scholar ]
کورن، Y. فاکتورسازی با همسایگی ملاقات می کند: یک مدل فیلتر مشارکتی چندوجهی. در مجموعه مقالات چهاردهمین کنفرانس بین المللی ACM SIGKDD در مورد کشف دانش و داده کاوی، لاس وگاس، NV، ایالات متحده، ۲۴-۲۷ اوت ۲۰۰۸٫ صص ۴۲۶-۴۳۴٫ [ Google Scholar ]
یانگ، دی. وانگ، ز. جیانگ، جی. Xiao, Y. جاسازی دانش نسبت به توصیه با تعاملات کم کاربر-مورد. در مجموعه مقالات کنفرانس بین‌المللی IEEE/ACM 2019 درباره پیشرفت‌ها در تحلیل و استخراج شبکه‌های اجتماعی، ونکوور، BC، کانادا، ۲۷ تا ۳۰ اوت ۲۰۱۹؛ صص ۳۲۵-۳۳۲٫ [ Google Scholar ]
گو، ی. وو، ی. لیو، جی. خو، ام. زو، ت. اصلاحات تمدن بوم شناختی و سیستم اداری دولتی در چین. منبع. حفظ کنید. بازیافت. ۲۰۲۰ , ۱۵۵ , ۱۰۴۶۵۴٫ [ Google Scholar ] [ CrossRef ]
جیانگ، بی. بای، ی. وانگ، CP; خو، X. آلاتالو، برنامه تمدن زیست محیطی چین – اجرای سیاست خط قرمز زیست محیطی. سیاست کاربری زمین ۲۰۱۹ ، ۸۱ ، ۱۱۱-۱۱۴٫ [ Google Scholar ] [ CrossRef ]
دو، دبلیو. یان، اچ. فنگ، ز. یانگ، ی. لیو، اف. رابطه عرضه و مصرف منابع زیست محیطی تحت ساخت تمدن زیست محیطی در چین. منبع. حفظ کنید. بازیافت. ۲۰۲۱ , ۱۷۲ , ۱۰۵۶۷۹٫ [ Google Scholar ] [ CrossRef ]
وانگ، اچ. ژانگ، اف. وانگ، جی. ژائو، ام. لی، دبلیو. Xie، X. Guo, M. Ripplenet: انتشار ترجیحات کاربر در نمودار دانش برای سیستم های توصیه کننده. در مجموعه مقالات بیست و هفتمین کنفرانس بین المللی ACM در مدیریت اطلاعات و دانش، تورینو، ایتالیا، ۲۲ تا ۲۶ اکتبر ۲۰۱۸؛ صص ۴۱۷-۴۲۶٫ [ Google Scholar ]
گوا، کیو. ژوانگ، اف. کوین، سی. زو، اچ. Xie، X. شیونگ، اچ. او، Q. بررسی سیستم های توصیه گر مبتنی بر نمودار دانش. IEEE Trans. دانستن مهندسی داده ۲۰۲۰ ، ۳۴ ، ۳۵۴۹-۳۵۶۸٫ [ Google Scholar ] [ CrossRef ]
بالابانوویچ، م. Shoham, Y. Fab: توصیه مشارکتی مبتنی بر محتوا. اشتراک. ACM ۱۹۹۷ ، ۴۰ ، ۶۶-۷۲٫ [ Google Scholar ] [ CrossRef ]
Pazzani, MJ; Billsus, D. سیستم های توصیه مبتنی بر محتوا. در وب تطبیقی ؛ Springer: برلین/هایدلبرگ، آلمان، ۲۰۰۷; صص ۳۲۵-۳۴۱٫ [ Google Scholar ]
De Campos، LM; فرناندز-لونا، جی.ام. Huete، JF ترکیب توصیه‌های مبتنی بر محتوا و مشارکتی: یک رویکرد ترکیبی مبتنی بر شبکه‌های بیزی. بین المللی J. تقریبا. دلیل. ۲۰۱۰ ، ۵۱ ، ۷۸۵-۷۹۹٫ [ Google Scholar ] [ CrossRef ]
کنستاس، آی. استاتوپولوس، وی. Jose, JM در شبکه های اجتماعی و توصیه مشترک. در مجموعه مقالات سی و دومین کنفرانس بین المللی ACM SIGIR در مورد تحقیق و توسعه در بازیابی اطلاعات، بوستون MA ایالات متحده آمریکا، ۱۹ تا ۲۳ ژوئیه ۲۰۰۹٫ ص ۱۹۵-۲۰۲٫ [ Google Scholar ]
ژو، ک. ژائو، WX؛ بیان، اس. ژو، ی. ون، جی آر. یو، جی. بهبود سیستم‌های توصیه‌کننده مکالمه از طریق ترکیب معنایی مبتنی بر نمودار دانش. در مجموعه مقالات بیست و ششمین کنفرانس بین المللی ACM SIGKDD در زمینه کشف دانش و داده کاوی، رویداد مجازی، CA، ایالات متحده آمریکا، ۶ تا ۱۰ ژوئیه ۲۰۲۰؛ صص ۱۰۰۶-۱۰۱۴٫ [ Google Scholar ]
جی، اس. پان، اس. کامبریا، ای. مارتینن، پی. فیلیپ، SY نظرسنجی در مورد نمودارهای دانش: بازنمایی، اکتساب و کاربردها. IEEE Trans. شبکه عصبی فرا گرفتن. سیستم ۲۰۲۱ ، ۳۳ ، ۴۹۴-۵۱۴٫ [ Google Scholar ] [ CrossRef ] [ PubMed ]
خو، ام. وانگ، اس. آهنگ، سی. زو، ا. زو، ی. Zou, Z. توصیه الگوی تمدن اکولوژیکی روستایی بر اساس استدلال داده های جغرافیایی. Appl. علمی ۲۰۲۲ ، ۱۲ ، ۸۰۲۴٫ [ Google Scholar ] [ CrossRef ]
وانگ، اچ. ژانگ، اف. ژائو، ام. لی، دبلیو. Xie، X. Guo, M. یادگیری ویژگی چند وظیفه ای برای توصیه افزایش یافته نمودار دانش. در مجموعه مقالات کنفرانس وب جهانی، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، ۱۳ تا ۱۷ مه ۲۰۱۹؛ صفحات ۲۰۰۰–۲۰۱۰٫ [ Google Scholar ]
وانگ، اچ. ژائو، ام. Xie، X. لی، دبلیو. Guo, M. گراف دانش شبکه های کانولوشن برای سیستم های توصیه گر. در مجموعه مقالات کنفرانس وب جهانی، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، ۱۳ تا ۱۷ مه ۲۰۱۹؛ صص ۳۳۰۷–۳۳۱۳٫ [ Google Scholar ]
Tobler, WR یک فیلم کامپیوتری شبیه سازی رشد شهری در منطقه دیترویت. اقتصاد Geogr. ۱۹۷۰ ، ۴۶ (Suppl. S1)، ۲۳۴-۲۴۰٫ [ Google Scholar ] [ CrossRef ]
زو، تبر; لو، جی. لیو، جی. Qin، CZ; ژو، سی. پیش بینی فضایی بر اساس قانون سوم جغرافیا. ان GIS ۲۰۱۸ , ۲۴ , ۲۲۵–۲۴۰٫ [ Google Scholar ] [ CrossRef ]
یانگ، YJ; خو، بی. هو، JW; تانگ، MH؛ ژانگ، پی. Zheng, L. روش دقیق و کارآمد برای ساخت نمودار دانش دامنه. Ruan Jian Xue Bao/J. نرم افزار ۲۰۱۸ ، ۲۹ ، ۲۹۳۱-۲۹۴۷٫ [ Google Scholar ]
بردلی، AP استفاده از ناحیه زیر منحنی ROC در ارزیابی الگوریتم‌های یادگیری ماشین. تشخیص الگو ۱۹۹۷ ، ۳۰ ، ۱۱۴۵-۱۱۵۹٫ [ Google Scholar ] [ CrossRef ]
Fawcett, T. مقدمه ای بر تجزیه و تحلیل ROC. تشخیص الگو Lett. ۲۰۰۶ ، ۲۷ ، ۸۶۱-۸۷۴٫ [ Google Scholar ] [ CrossRef ]
چن، ایکس. لیو، ی. لی، اف. لی، ایکس. Jia, X. توصیه تصویر سنجش از دور بر اساس مدل موضوع جاسازی مکانی-زمانی. محاسبه کنید. Geosci. ۲۰۲۱ ، ۱۵۷ ، ۱۰۴۹۳۵٫ [ Google Scholar ] [ CrossRef ]

شکل ۱٫ چارچوب هستی شناسی الگوی اکولوژیکی حومه شهر.

شکل ۲٫ سیستم دانش الگوی اکولوژیکی روستا.

شکل ۳٫ اطلاعات جعبه اطلاعات دایره المعارف روستای هانکونه ، منطقه فانگشان ، پکن .

شکل ۴٫ نمودار دانش جزئی حومه شهر.

شکل ۵٫ چارچوب KGCN4CEPR.

شکل ۶٫ نمونه ای از عملیات تجمع در KGCN4CEPR.

هوش مکانی اتیم تحقیقاتی ونوس نصیرفام