کلید واژه ها:
یادگیری عمیق ؛ ابر نقطه ; تقسیم بندی معنایی ; مکانیسم توجه به خود ؛ پیچیدگی نمودار
۱٫ مقدمه
-
ویژگیهای ابعادی بالا بر اساس نقاط منطقهای، که میتوانند اشیاء مختلف را با ویژگیهای مشابه اما موقعیتهای متمایز تشخیص دهند، به طور کامل در هستههای پیچشی طراحیشده استفاده نمیشوند.
-
اطلاعات متنی به دست آمده از ساختار نمودار کاملاً متصل برای همه نقاط، نه تنها کارایی را کاهش می دهد، بلکه بر تعمیم تعامل جهانی تأثیر منفی می گذارد.
-
یک نوع ترانسفورماتور متقاطع دوگانه، به نام IAG-MLP، پیشنهاد شده است که مستقیماً به سوپرنقطههایی که از ابرهای نقطه خام به بخشهای همگن مبتنی بر هندسه و مبتنی بر رنگ سازماندهی مجدد میشوند، جهتگیری شود و توانایی ثبت تصاویر با ابعاد بالا را افزایش دهد. وابستگیهای زمینهای در تعبیههای محلی با یادگیری توجه موقعیت متقاطع و توجه بین کانالی.
-
با انتشار پیامهای متنی از طریق ابرنقطههای مجاور و سوپر لبههای مرتبط، یک شبکه گراف سرتاسر ساخته میشود تا به تدریج ویژگیهای جاسازیشده ابرنقطهها را بهروزرسانی کند، و در نهایت استنتاج معنایی سطح ابرنقطه را به استنتاج ریزدانه سطح نقطه تبدیل کند.
-
ما تحلیلهای نظری و تجربی معماری پیشنهادی IAGC و همچنین آزمایشهای کمی و کیفی را در سه معیار داخلی ارائه میکنیم که نشاندهنده اثربخشی و عملکرد قابل توجه آن است.
۲٫ کارهای مرتبط
۲٫۱٫ تقسیم بندی معنایی برای ابرهای نقطه ای
۲٫۲٫ شبکه های یادگیری عمیق برای تقسیم بندی معنایی
۲٫۳٫ شبکه های ترانسفورماتور مبتنی بر توجه
۲٫۴٫ پیچیدگی نمودار
۳٫ روش شناسی
۳٫۱٫ تولید بیش از حد سوپرپوینت
با توجه به مصرف محاسبات در پردازش میلیونها نقطه در یک صحنه داخلی در مقیاس بزرگ، ابرهای نقطهای به نقاط همگن هندسی و فیزیکی تقسیم میشوند، به عنوان مثال، ابرنقاطها را میتوان به عنوان واحدهای عملیاتی اساسی برای شبکههای یادگیری عمیق مشاهده کرد. به این ترتیب، تعداد ابرنقطهها در یک صحنه و تعداد نقاط موجود در یک ابرنقطه از قبل تعریف نمیشوند، که حداقل مقدار و حداکثر تکمیل ساختاری بخشهای ساده را برای یادگیری ویژگی محلی تضمین میکند. در این مورد، ما فرض میکنیم که نقاط یک ابرنقطه باید ویژگیهای مشابهی داشته باشند و در نتیجه برچسب کلاس یکسانی را به اشتراک بگذارند. بر اساس تجزیه و تحلیل اجزای اصلی (PCA) [ ۴۹] الگوریتم، ویژگی های شکل محاسبه شده بر روی نمودار مجاورت بهینه K نزدیکترین همسایگی را می توان با ساخت یک ماتریس کوواریانس و تجزیه مقادیر ویژه آن، که مثبت و مرتب هستند، بازیابی کرد، به عنوان مثال، ۰ <λ۱<λ۲<λ۳. سپس، PCA سه جهت اصلی را توصیف می کند که ویژگی های حجمی، مسطح و خطی محله را نشان می دهد.
به منظور خوشهبندی نقاط همگن با ویژگیهای مشابه، ویژگیهای هندسی ذکر شده در بالا و ویژگیهای فیزیکی مانند رنگ را میتوان برای مسئله پارتیشن حداقلی تعمیمیافته در نظر گرفت، که با تقریب ثابت تکهای تابع انرژی جهانی مورد مطالعه قرار میگیرد [ ۲۰ ] :
در نهایت، تا زمانی که ابرهای نقطه توسط نمودار ابرنقطه با ابرنقطهها به همراه لبههای متصل آنها بازسازی میشوند، ویژگیهای موقعیت مکانی (موقعیت فضایی، موقعیت نرمال شده، ارتفاع)، ویژگیهای هندسی (پراکندگی، مسطح بودن، خطی بودن، عمودی) را به هم متصل میکنیم. و ویژگی های رنگی (مقادیر RGB) سوپرنقاط به عنوان ویژگی های ورودی برای شبکه استخراج ویژگی محلی پیشنهادی ما. به طور خاص، ارتفاع برای تشخیص اجسام در ارتفاعات مختلف نسبت به کف داخلی معرفی شده است که به شرح زیر تعریف می شود:
۳٫۲٫ IAG–MLP
برای مقابله با اطلاعات مهم نادیده گرفته شده در عملیات پیچیدگی محلی ناشی از PointNet، ترانسفورماتور با مکانیزم خودتوجهی که به منطقه با اطلاعات غنی توجه می کند، می تواند به عنوان یک الگوریتم یادگیری ویژگی جدید استفاده شود. ما ابتدا مکانیسم توجه به خود را که توسط معروف ترین ترانسفورماتور وانیلی [ ۱۹ ] اعمال می شود (به شکل ۲ مراجعه کنید ) در زمینه ترجمه ماشینی بررسی می کنیم. با توجه به ویژگی ورودی، توجه به خود به صورت خطی ویژگی ورودی را در یک ماتریس پرس و جو طرح می کند س، یک ماتریس کلیدی کو یک ماتریس مقدار V، که می تواند به صورت زیر فرموله شود:
جایی که آماتریس توجهی است که پیوند زوجی را در میان نشانههای یک دنباله و به عنوان یک عامل مقیاسپذیر نشان میدهد، دکبعد ماتریس است ک.
- (۱)
-
عملیات انقباضی. برای فعال کردن تعامل متقابل کانال، لازم است یک عملیات انقباض در کل بعد ویژگی وجود داشته باشد. روش مختصر با اعمال یک طرح ریزی خطی همراه با یک تابع عادی سازی قدامی و یک تابع فعال سازی خلفی است که می تواند به صورت زیر فرموله شود:
fدبلیو، ب( X) = σ( W( n o r m ( X) ) + ب )که در آن ویژگی ورودی ایکسبه روش دسته ای نرمال می شود [ ۵۱ ]، که برای همگرایی یادگیری ضروری است. سپس یک طرح خطی با ضرب ماتریس اجرا می شود دبلیو∈آر۲ د× ۲ روزکه برای آن اندازه از ۲ دابعاد ویژگی پیش بینی شده است. علاوه بر این، بو σبه یک بایاس مراجعه کنید که می تواند یک ماتریس یا اسکالر و یک تابع فعال سازی مانند R EL U[ ۵۲ ].
- (۲)
-
موقعیت متقاطع توجه. توجه به خود معمولاً به عنوان یک الگوریتم طرح ریزی خطی در نظر گرفته می شود که از ارزش های خود نمونه های داده برای بهبود ویژگی های خود استفاده می کند، اما این ن× Nماتریس توجه به خود فقط می تواند رابطه متقابل بین نقاط در مجموعه داده آموزشی مشابه را توضیح دهد و مشخص نیست که آیا همبستگی خاصی بین نمونه داده ها در یک صحنه وجود دارد یا خیر. علاوه بر این، با وجود مقدار کمی از پارامترهای درگیر در ماژول توجه به خود، محاسبه توجه زوجی را نمی توان نادیده گرفت. بنابراین، ما یک واحد توجه تعاملی فضایی، با الهام از شبکه توجه خارجی [ ۵۵ ] طراحی کردیم]، برای محاسبه توجه موقعیت متقاطع بین ویژگی های با ابعاد بالا و یک واحد حافظه خارجی، که مستقل از ویژگی ورودی است و اطلاعات را در کل مجموعه داده آموزشی به اشتراک می گذارد. به طور خاص، ما واحد تعامل فضایی را با ساختار الگوی لایه خودتوجهی ترانسفورماتور وانیلی میسازیم و در ابتدا آن را به روشی مشابه PCT [ ۳۸ ] با روش نرمالسازی مضاعف عادی میکنیم، که به طور تجربی پایداری شبکههای تعبیهشده محلی را بهبود میبخشد. .
ایکس“من ، ج= s o ft m a x (ایکس“من ، ج) =انقضا (ایکس“من ، ج)∑nانقضا (ایکس“من ، ج)ایکسمن ، ج=ایکس“من ، ج∑nایکس“من ، ج
سپس با توجه به ساختار ترانسفورماتور وانیلی، واحد حافظه خارجی م_ k e y∈آرن× Nخدمت بر روی ماتریس کلید کمی تواند به تدریج اطلاعات متنی را در بین نقاط منطقه ای در عملیات ضرب ماتریس ثبت کند ⊗با ضرب در دو نرمال شده f1(ایکس۱) ∈آرن× dبا اشاره به ماتریس پرس و جو س.
- (۳)
-
توجه بین کانالی برخلاف وزنهای خودتوجهی که از توجه زوجی در بین نقاط به دست میآیند، واحد توجه متقابل کانالی را میتوان به عنوان مکانیزم توجه متقابل برای تعدیل نمایش نقطهای با استفاده از سیگنال فضایی مشاهده کرد. به طور خاص، نقشه توجه متقابل کانال از تولید نقطه استنباط می شود f2( X)و ماتریس وزن توجه موقعیت متقاطع اف:
A = F⊙f2( X)
- (۴)
-
بلوک اتصال باقیمانده از نظر تئوری، یک شبکه یادگیری عمیق با متغیرهای بیشتر باید بهتر بتواند وظایف چالش برانگیز را انجام دهد، اما ثابت شده است که عمیق کردن لایه ها، آموزش شبکه را سخت تر می کند، که به آن مشکل انحطاط می گویند. از این رو، با توجه به مشکل انحطاط یک شبکه یادگیری عمیق با افزایش لایه ها به عنوان ماژول های IAG-MLP بیشتر، بلوک اتصال باقیمانده برای ایجاد یک میانبر مختصر ارائه می شود که در آن ورودی پیش بینی شده در بلوک IAG قرار می گیرد و از چندین لایه عبور می کند. تا در نهایت با نقشه توجه پیش بینی شده ادغام شود.
۳٫۳٫ شبکه کانولوشن گراف توجه تعاملی (IAGC)
به عنوان مثال، برای یک نقطه فوق العاده Vمنو ابر نقطه متصل آن Vj، فرض کن که Ejمنلبه متصل بین ابرنقاط است منو jبا ویژگی های جهت دار در رابطه با نسبت ویژگی های هندسی، نسبت تعداد نقاط، و روابط فضایی مرکزها. پس از آن، اطلاعات متنی کلی هر راس در SPG را می توان با تابع تجمع میانگین زیر به عنوان یک پیام جهانی فرموله کرد:
جایی که دبلیوبه پارامترهای ایجاد شده به صورت پویا از شبکه فیلتر پویا اشاره دارد [ ۵۷ ]، که در اصل یک لایه MLP بدون بایاس است، به طوری که بعد ویژگی ویژگی های لبه با بعد ویژگی تعبیه نقطه فوق العاده یکسان است. v، که ضرب عنصر را تسهیل می کند ( ⋅ ). علاوه بر این، ۱نjسهم سایر نقاط ابرنقطه را در گراف جهانی متصل به ابرنقطه عادی و میانگین می کند.
در مرحله بعد، با توجه به قابلیت مدیریت ورودی متوالی برای پردازش اطلاعات متنی، GRU، که دارای پارامترهای کمتری است اما به اندازه LSTM موثر است، برای ساخت و بهروزرسانی مکرر یک حالت پنهان که توسط نمایش تعبیه شده و پیام متنی جهانی یکپارچه شده است، استفاده میشود. در امتداد لبه های متصل پخش می شود. در این حالت حالت پنهان را تعریف می کنیم ساعتمنهمانطور که با جاسازی مقداردهی اولیه شد vمنو تجمیع جهانی بین پیش بینی شده را انجام دهید ساعتو پیام جهانی متربا ضرب عنصر:
با توجه به مکانیزم گیتینگ در ماژول GRU، ابتدا ورودی جریان را به صورت خطی طرح ریزی می کنیم ایکستیمنو حالت پنهان قبلی ساعتt – ۱منبه یک جاسازی با ابعاد بالاتر ایکس¯تیمنو حالت پنهان ساعت¯t – ۱منکه در تی= tتکرارها
همانطور که در شکل ۵ نشان داده شده است ، ایکس¯تیمنو ساعتt – ۱منبا جمع بردار به هم متصل می شوند و به یک تابع سیگموئید منتقل می شوند تا مقادیر خود را بین ۰ و ۱ قرار دهند، جایی که ۰ به معنای ویژگی های نامربوط برای دور ریختن و ۱ به معنای ویژگی های مفید برای حفظ است. بنابراین، این عملیات فیلتر کردن به گیت به روز رسانی کمک می کند تومنو گیت را ریست کنید rمن.
جایی که توتیمنویژگی های نامربوط را دور می اندازد و اطلاعات جدید را اضافه می کند و rتیمنتصمیم گرفت چه مقدار از ویژگی های گذشته را در عملیات بعدی فراموش کند. سپس، یک کاندیدای دولت پنهان جدید ساعت⃗ تیمنبرای تأکید بر ابعاد شدیداً همبسته و نادیده گرفتن ابعاد همبسته ضعیف با استفاده از تابع tanh برای تنظیم مقادیر به هم پیوسته ساخته شده است. rتیمن، ساعت¯t – ۱من، و ایکس¯تیمنبین -۱ و ۱٫
پس از آن، به روز رسانی حالت پنهان ساعتتیمنبرای تکرار فعلی را می توان با دو جزء به شرح زیر ساخت:
جایی که ( ۱- _توتیمن) ⊙ساعت⃗ تیمنجریان اطلاعات وضعیت پنهان فعلی را تعیین می کند ساعتتیمن، و توتیمن⊙ساعت¯t – ۱منقبلی را تعیین می کند ساعت¯t – ۱مناز طریق گیت آپدیت توتیمن. در نهایت، زمینه سازی جهانی در ویژگی های ابعادی بالا که با توالی های طولانی حالت های پنهان به هم پیوسته اند، گنجانده می شود.
۴٫ آزمایشات
۴٫۱٫ مجموعه داده ها
-
S3DIS [ ۵۸ ]
- ۲٫
-
ScanNet (V2) [ ۵۹ ]
- ۳٫
-
SceneNN [ ۶۰ ]
۴٫۲٫ جزئیات پیاده سازی
۴٫۳٫ مطالعات و تجزیه و تحلیل فرسایش
۴٫۳٫۱٫ تست Ablation تابع جاسازی محلی
۴٫۳٫۲٫ آزمون فرسایشی تابع تجمع جهانی
۴٫۳٫۳٫ تست ابلیشن دانه بندی گراف ابرنقطه ای
۴٫۴٫ نتایج تقسیم بندی
۴٫۴٫۱٫ نتایج مربوط به مجموعه داده S3DIS
۴٫۴٫۲٫ نتایج مربوط به مجموعه داده ScanNet
۴٫۴٫۳٫ تجزیه و تحلیل نتایج
۵٫ نتیجه گیری و بحث
منابع
- تانگ، پی. هوبر، دی. آکینجی، بی. لیپمن، آر. Lytle، A. بازسازی خودکار مدلهای اطلاعات ساختمانی ساخته شده از ابرهای نقطهای اسکن شده با لیزر: مروری بر تکنیکهای مرتبط. خودکار ساخت و ساز ۲۰۱۰ ، ۱۹ ، ۸۲۹-۸۴۳٫ [ Google Scholar ] [ CrossRef ]
- پینتور، جی. مورا، سی. گانولی، اف. فوئنتس-پرز، ال. پاجارولا، آر. Gobbetti، E. آخرین هنر در بازسازی خودکار سه بعدی محیط های داخلی ساختاریافته. محاسبه کنید. نمودار. انجمن ۲۰۲۰ ، ۳۹ ، ۶۶۷–۶۹۹٫ [ Google Scholar ] [ CrossRef ]
- شیا، اس. چن، دی. وانگ، آر. لی، جی. ژانگ، X. اصول اولیه هندسی در ابرهای نقطه LiDAR: یک بررسی. IEEE J. Sel. بالا. Appl. زمین Obs. Remote Sens. ۲۰۲۰ , ۱۳ , ۶۸۵–۷۰۷٫ [ Google Scholar ] [ CrossRef ]
- لالوند، جی اف. ونداپل، ن. هوبر، دی اف. هیبرت، ام. طبقه بندی زمین طبیعی با استفاده از داده های لادار سه بعدی برای تحرک ربات زمینی. ربات صحرایی جی. ۲۰۰۶ ، ۲۳ ، ۸۳۹-۸۶۱٫ [ Google Scholar ] [ CrossRef ]
- گولووینسکی، آ. کیم، وی جی؛ فانک هاسر، T. تشخیص مبتنی بر شکل ابرهای نقطه سه بعدی در محیط های شهری. در مجموعه مقالات دوازدهمین کنفرانس بین المللی IEEE در سال ۲۰۰۹ در بینایی کامپیوتر، کیوتو، ژاپن، ۲۹ سپتامبر تا ۲ اکتبر ۲۰۰۹٫ صص ۲۱۵۴–۲۱۶۱٫ [ Google Scholar ]
- گوا، ی. سهل، ف. بن نامون، م. لو، ام. Wan, J. آمار طرح ریزی چرخشی برای توصیف سطح محلی سه بعدی و تشخیص شی. بین المللی جی. کامپیوتر. Vis. ۲۰۱۳ ، ۱۰۵ ، ۶۳-۸۶٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- بهداناو، د. چو، ک. Bengio، Y. ترجمه ماشینی عصبی با یادگیری مشترک تراز و ترجمه. arXiv ۲۰۱۴ ، arXiv:1409.0473. [ Google Scholar ]
- یین، دبلیو. کان، ک. یو، م. Schütze, H. مطالعه تطبیقی CNN و RNN برای پردازش زبان طبیعی. arXiv ۲۰۱۷ , arXiv:1702.01923. [ Google Scholar ]
- کریژفسکی، آ. سوتسکور، آی. هینتون، GE ImageNet طبقه بندی با شبکه های عصبی کانولوشن عمیق. اشتراک. ACM ۲۰۱۷ ، ۶۰ ، ۸۴–۹۰٫ [ Google Scholar ] [ CrossRef ]
- او، ک. ژانگ، ایکس. رن، اس. Sun, J. یادگیری باقیمانده عمیق برای تشخیص تصویر. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو، لاس وگاس، NV، ایالات متحده، ۲۷-۳۰ ژوئن ۲۰۱۶٫ صص ۷۷۰-۷۷۸٫ [ Google Scholar ]
- بلو، SA; یو، اس. وانگ، سی. بررسی: یادگیری عمیق در ابرهای نقطه سه بعدی. Remote Sens. ۲۰۲۰ , ۱۲ , ۱۷۲۹٫ [ Google Scholar ] [ CrossRef ]
- گوا، ی. وانگ، اچ. هو، کیو. لیو، اچ. لیو، ال. یادگیری عمیق برای ابرهای نقطه سه بعدی: یک بررسی. IEEE Trans. الگوی مقعدی ماخ هوشمند ۲۰۲۱ ، ۴۳ ، ۴۳۳۸-۴۳۶۴٫ [ Google Scholar ] [ CrossRef ]
- Qi، CR; سو، اچ. کایچون، م. Juibas، LJ PointNet: یادگیری عمیق در مجموعه های نقطه برای طبقه بندی و تقسیم بندی سه بعدی. در مجموعه مقالات کنفرانس IEEE 2017 در مورد دید رایانه و تشخیص الگو (CVPR)، هونولولو، HI، ایالات متحده آمریکا، ۲۱ تا ۲۶ ژوئیه ۲۰۱۷؛ انجمن کامپیوتر IEEE: Los Alamitos، CA، USA، ۲۰۱۷٫ [ Google Scholar ]
- Qi، CR; یی، ال. سو، اچ. Guibas، LJ Pointnet++: یادگیری ویژگی های سلسله مراتبی عمیق در مجموعه های نقطه در یک فضای متریک. در مجموعه مقالات پیشرفتها در سیستمهای پردازش اطلاعات عصبی، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، ۴ تا ۹ دسامبر ۲۰۱۷؛ ص ۵۰۹۹-۵۱۰۸٫ [ Google Scholar ]
- وانگ، سی. سامری، بی. صدیقی، ک. پیچیدگی نمودار طیفی محلی برای یادگیری ویژگی مجموعه نقطه. در مجموعه مقالات کنفرانس اروپایی بینایی کامپیوتر (ECCV)، مونیخ، آلمان، ۸ تا ۱۴ سپتامبر ۲۰۱۸؛ صص ۵۲-۶۶٫ [ Google Scholar ]
- لندریو، ال. Simonovsky، M. تقسیم بندی معنایی ابر نقطه ای بزرگ با نمودارهای ابرنقطه ای. در مجموعه مقالات کنفرانس IEEE/CVF 2018 درباره بینایی کامپیوتری و تشخیص الگو، سالت لیک سیتی، UT، ایالات متحده آمریکا، ۱۸ تا ۲۳ ژوئن ۲۰۱۸٫ [ Google Scholar ]
- یانگ، جی. ژانگ، Q. نی، بی. لی، ال. لیو، جی. ژو، ام. تیان، کیو. مدلسازی ابرهای نقطه با توجه به خود و نمونهبرداری زیر مجموعه آدامس. در مجموعه مقالات کنفرانس IEEE/CVF در مورد دید کامپیوتری و تشخیص الگو، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، ۱۵ تا ۲۰ ژوئن ۲۰۱۹؛ صص ۳۳۲۳–۳۳۳۲٫ [ Google Scholar ]
- وانگ، ال. هوانگ، ی. هو، ی. ژانگ، اس. شان، جی. پیچیدگی توجه نمودار برای تقسیم بندی معنایی ابر نقطه. در مجموعه مقالات کنفرانس IEEE/CVF در مورد دید کامپیوتری و تشخیص الگو، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، ۱۵ تا ۲۰ ژوئن ۲۰۱۹؛ ص ۱۰۲۹۶-۱۰۳۰۵٫ [ Google Scholar ]
- واسوانی، ع. Shazeer، N. پارمار، ن. Uszkoreit، J. جونز، ال. گومز، AN; قیصر، ال. Polosukhin، I. توجه تمام چیزی است که شما نیاز دارید. در مجموعه مقالات NIPS’17: سی و یکمین کنفرانس بین المللی سیستم های پردازش اطلاعات عصبی، رد هوک، نیویورک، ایالات متحده آمریکا، ۴ تا ۹ دسامبر ۲۰۱۷٫ Curran Associates Inc.: Red Hook، نیویورک، ایالات متحده آمریکا، ۲۰۱۷؛ صفحات ۶۰۰۰–۶۰۱۰٫ [ Google Scholar ]
- گینارد، اس. Landrieu، L. طبقهبندی صحنههای شهری با کمک تقسیمبندی ضعیف از ابرهای نقطه LiDAR سه بعدی. ISPRS Int. قوس. فتوگرام حسگر از راه دور اسپات. Inf. علمی ۲۰۱۷ ، XLII-1/W1 ، ۱۵۱–۱۵۷٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- لیو، اچ. دای، ز. بنابراین، DR; Le, QV به MLP ها توجه کنید. arXiv ۲۰۲۱ ، arXiv:2105.08050. [ Google Scholar ]
- گرف، ک. سریواستاوا، RK; کوتنیک، جی. Steunebrink، BR; Schmidhuber, J. LSTM: یک اودیسه فضای جستجو. IEEE Trans. شبکه عصبی فرا گرفتن. سیستم ۲۰۱۶ ، ۲۸ ، ۲۲۲۲-۲۲۳۲٫ [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
- چو، ک. ون مرینبور، بی. گلچهره، سی. بهداناو، د. بوگارس، اف. شونک، اچ. Bengio، Y. آموزش نمایش عبارات با استفاده از رمزگذار-رمزگشا RNN برای ترجمه ماشینی آماری. arXiv ۲۰۱۴ ، arXiv:1406.1078. [ Google Scholar ]
- شیائو، جی. وانگ، اچ. لای، تی. Suter، D. مدل سازی هایپرگراف برای برازش مدل هندسی. تشخیص الگو ۲۰۱۶ ، ۶۰ ، ۷۴۸-۷۶۰٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- Truong، پردازش ابرهای نقطه سه بعدی مبتنی بر دانش QH. Ph.D. پایان نامه، دانشگاه Bourgogne، دیژون، فرانسه، ۲۰۱۳٫ [ Google Scholar ]
- پونچیانو، جی جی. روتنر، ام. ریترر، آ. Boochs, F. تقسیم بندی معنایی شی در ابرهای نقطه-مقایسه یک روش یادگیری عمیق و یک روش مبتنی بر دانش. ISPRS Int. J. Geo-Inf. ۲۰۲۱ ، ۱۰ ، ۲۵۶٫ [ Google Scholar ] [ CrossRef ]
- Qi، CR; سو، اچ. نیبنر، ام. دای، ا. یان، م. CNN های حجمی Guibas، LJ و Multi-View برای طبقه بندی اشیاء در داده های سه بعدی. در مجموعه مقالات کنفرانس IEEE 2016 در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، لاس وگاس، NV، ایالات متحده آمریکا، ۲۷ تا ۳۰ ژوئن ۲۰۱۶٫ [ Google Scholar ]
- فنگ، ی. ژانگ، ز. ژائو، ایکس. جی، ر. گائو، Y. GVCNN: شبکه های عصبی کانولوشنال مشاهده گروهی برای تشخیص شکل سه بعدی. در مجموعه مقالات کنفرانس IEEE/CVF 2018 درباره بینایی کامپیوتری و تشخیص الگو، سالت لیک سیتی، UT، ایالات متحده آمریکا، ۱۸ تا ۲۳ ژوئن ۲۰۱۸٫ [ Google Scholar ]
- سو، اچ. جامپانی، وی. سان، دی. مجی، س. کالوگراکیس، ای. یانگ، M.-H. Kautz، J. SPLATNet: شبکه های شبکه پراکنده برای پردازش ابر نقطه ای. در مجموعه مقالات کنفرانس IEEE/CVF 2018 در مورد دید رایانه و تشخیص الگو (CVPR)، سالت لیک سیتی، UT، ایالات متحده آمریکا، ۱۸ تا ۲۳ ژوئن ۲۰۱۸٫ [ Google Scholar ]
- دو، ج. جیانگ، ز. هوانگ، اس. وانگ، ز. سو، جی. سو، اس. وو، ی. شبکه تقسیم بندی معنایی ابر نقطه ای Ca، G. بر اساس ترکیب ویژگی های چند مقیاسی. Sensors ۲۰۲۱ , ۲۱ , ۱۶۲۵٫ [ Google Scholar ] [ CrossRef ]
- جیانگ، م. وو، ی. ژائو، تی. ژائو، ز. Lu, C. PointSIFT: یک ماژول شبکه SIFT مانند برای تقسیم بندی معنایی ابر نقطه سه بعدی. arXiv ۲۰۱۸ , arXiv:1807.00652. [ Google Scholar ]
- لی، ی. بو، ر. سان، م. وو، دبلیو. دی، ایکس. Chen, B. Pointcnn: Convolution on x-transformed points. Adv. عصبی Inf. Proc. سیستم ۲۰۱۸ ، ۳۱ ، ۸۲۰-۸۳۰٫ [ Google Scholar ]
- لین، ی. وانگ، سی. ژای، دی. لی، دبلیو. لی، جی. به سوی مرزبندی بهتر، تقسیم بندی سوپروکسل برای ابرهای نقطه سه بعدی حفظ شده است. ISPRS J. Photogramm. Remote Sens. ۲۰۱۸ ، ۱۴۳ ، ۳۹–۴۷٫ [ Google Scholar ] [ CrossRef ]
- هوی، ال. یوان، جی. چنگ، م. زی، جی. ژانگ، ایکس. یانگ، جی. شبکه سوپرپوینت برای تقسیم بندی بیش از حد ابر نقطه. در مجموعه مقالات کنفرانس بینالمللی IEEE/CVF در بینایی رایانه، مونترال، QC، کانادا، ۱۰ تا ۱۷ اکتبر ۲۰۲۱٫ [ Google Scholar ]
- چنگ، م. هوی، ال. زی، جی. یانگ، جی. کنگ، H. شبکه عصبی غیر محلی آبشاری برای تقسیمبندی معنایی ابر نقطهای. در مجموعه مقالات کنفرانس بین المللی IEEE/RSJ 2020 در مورد ربات ها و سیستم های هوشمند (IROS)، لاس وگاس، NV، ایالات متحده آمریکا، ۲۵ تا ۲۹ اکتبر ۲۰۲۰؛ صص ۸۴۴۷–۸۴۵۲٫ [ Google Scholar ]
- دوسوویتسکی، آ. بیر، ال. کولسنیکوف، آ. وایسنبورن، دی. ژای، ایکس. Unterthiner، T. دهقانی، م. مایندرر، م. هیگلد، جی. گلی، اس. و همکاران ارزش یک تصویر ۱۶ × ۱۶ کلمه است: ترانسفورماتور برای تشخیص تصویر در مقیاس. arXiv ۲۰۲۰ ، arXiv:2010.11929. [ Google Scholar ]
- ژائو، اچ. جیانگ، ال. جیا، جی. تور، پی. ترانسفورماتور کلتون، V. نقطه ای. arXiv ۲۰۲۰ ، arXiv:2012.09164. [ Google Scholar ]
- Guo، MH; Cai، JX; لیو، ZN; مو، تی. مارتین، آر. Hu, S. PCT: ترانسفورماتور ابر نقطه ای. محاسبه کنید. Vis. رسانه ۲۰۲۱ ، ۷ ، ۱۸۷-۱۹۹٫ [ Google Scholar ] [ CrossRef ]
- پان، X. شیا، ز. آهنگ ها.؛ لی، ال. Huang, G. تشخیص شی سه بعدی با pointformer. در مجموعه مقالات کنفرانس IEEE/CVF در مورد دید رایانه و تشخیص الگو، نشویل، TN، ایالات متحده، ۲۰-۲۵ ژوئن ۲۰۲۱؛ صص ۷۴۶۳-۷۴۷۲٫ [ Google Scholar ]
- هو، کیو. یانگ، بی. زی، ال. رزا، اس. گوا، ی. وانگ، ز. تریگونی، ن. مارکهام، A. Randla-net: تقسیم بندی معنایی کارآمد ابرهای نقطه ای در مقیاس بزرگ. در مجموعه مقالات کنفرانس IEEE/CVF در مورد بینایی کامپیوتری و تشخیص الگو، سیاتل، WA، ایالات متحده آمریکا، ۱۳ تا ۱۹ ژوئن ۲۰۲۰؛ ص ۱۱۱۰۸–۱۱۱۱۷٫ [ Google Scholar ]
- وانگ، ایکس. او، جی. Ma، L. بهرهبرداری از ساختار محلی و جهانی برای تقسیمبندی معنایی ابر نقطهای با بازنماییهای نقطهای متنی. در مجموعه مقالات کنفرانس سیستم های پردازش اطلاعات عصبی (NeurIPS)، ونکوور، BC، کانادا، ۸ تا ۱۵ دسامبر ۲۰۱۹؛ صص ۴۵۷۳-۴۵۸۳٫ [ Google Scholar ]
- ژو، جی. کوی، جی. هو، اس. ژانگ، ز. یانگ، سی. لیو، ز. وانگ، ال. لی، سی. Sun، M. گراف شبکه های عصبی: مروری بر روش ها و کاربردها. AI Open ۲۰۲۰ ، ۱ ، ۵۷–۸۱٫ [ Google Scholar ] [ CrossRef ]
- وو، زی. پان، اس. چن، اف. لانگ، جی. ژانگ، سی. فیلیپ، SY یک بررسی جامع در مورد شبکه های عصبی نمودار. IEEE Trans. شبکه عصبی فرا گرفتن. سیستم ۲۰۲۰ ، ۳۲ ، ۴-۲۴٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- ژانگ، ز. کوی، پی. زو، دبلیو. یادگیری عمیق روی نمودارها: نظرسنجی. IEEE Trans. بدانید. مهندسی داده ۲۰۲۰ ، ۳۴ ، ۲۴۹-۲۷۰٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- Kipf، TN; Welling, M. طبقه بندی نیمه نظارت شده با شبکه های کانولوشن گراف. arXiv ۲۰۱۶ , arXiv:1609.02907. [ Google Scholar ]
- شومان، دی. نارنگ، SK; فروسارد، پ. اورتگا، آ. Vandergheynst، P. زمینه در حال ظهور پردازش سیگنال در نمودارها: گسترش تجزیه و تحلیل داده های با ابعاد بالا به شبکه ها و سایر حوزه های نامنظم. پروسه سیگنال IEEE Mag. ۲۰۱۳ ، ۳۰ ، ۸۳-۹۸٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- ژی هنگ، ک. Ning، L. PyramNet: شبکه توجه هرم ابر نقطه ای و ماژول تعبیه گراف برای طبقه بندی و تقسیم بندی. arXiv ۲۰۱۹ ، arXiv:1906.03299. [ Google Scholar ]
- لو، اچ. چن، سی. نیش، ال. خوشلحم، ک. Shen, G. Ms-rrfsegnet:f شبکه تقسیمبندی ویژگی روابط منطقهای چند مقیاسی برای تقسیمبندی معنایی ابرهای نقطه صحنه شهری. IEEE Trans. Geosci. Remote Sens. ۲۰۲۰ , ۵۸ , ۸۳۰۱–۸۳۱۵٫ [ Google Scholar ] [ CrossRef ]
- دمانتکی، جی. مالت، سی. دیوید، ن. Vallet، B. انتخاب مقیاس مبتنی بر ابعاد در ابرهای نقطه لیدار سه بعدی. بین المللی قوس. فتوگرام حسگر از راه دور اسپات. Inf. علمی ۲۰۱۱ ، ۳۸ ، ۹۷-۱۰۲٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- لندریو، ال. Obozinski، G. Cut pursuit: الگوریتمهای سریع برای یادگیری توابع ثابت تکهای روی نمودارهای وزندار عمومی. SIAM J. Imaging Sci. ۲۰۱۷ ، ۱۰ ، ۱۷۲۴-۱۷۶۶٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- سنتورکار، اس. سیپراس، دی. الیاس، ع. Dry، A. نرمال سازی دسته ای چگونه به بهینه سازی کمک می کند؟ در مجموعه مقالات سی و دومین کنفرانس بین المللی سیستم های پردازش اطلاعات عصبی، مونترال، QC، کانادا، ۳ تا ۸ دسامبر ۲۰۱۸؛ ص ۲۴۸۸-۲۴۹۸٫ [ Google Scholar ]
- Agarap، AF یادگیری عمیق با استفاده از واحدهای خطی اصلاح شده (relu). arXiv ۲۰۱۸ , arXiv:1803.08375. [ Google Scholar ]
- انواع Shazeer، N. Glu ترانسفورماتور را بهبود می بخشد. arXiv ۲۰۲۰ ، arXiv:2002.05202. [ Google Scholar ]
- Dauphin، YN; فن، ا. اولی، م. Grangier، D. مدلسازی زبان با شبکههای کانولوشنال دردار. بین المللی Conf. ماخ فرا گرفتن. PMLR ۲۰۱۷ ، ۷۰ ، ۹۳۳-۹۴۱٫ [ Google Scholar ]
- Guo، MH; لیو، ZN; مو، تی جی; Hu، SM فراتر از توجه به خود: توجه خارجی با استفاده از دو لایه خطی برای وظایف بصری. در مجموعه مقالات کنفرانس IEEE 2021 در مورد دید رایانه و تشخیص الگو (CVPR)، یک رویداد مجازی. ۱۹ ژوئن ۲۰۲۱٫ [ Google Scholar ]
- سیمونوفسکی، م. کوموداکیس، N. فیلترهای شرطی لبه پویا در شبکه های عصبی کانولوشن روی نمودارها. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو، هونولولو، HI، ایالات متحده آمریکا، ۲۱ تا ۲۶ ژوئن ۲۰۱۷؛ صص ۳۶۹۳-۳۷۰۲٫ [ Google Scholar ]
- جیا، ایکس. دی براباندر، بی. تویتلارس، تی. شبکه های فیلتر پویا Gool، L. V. در مجموعه مقالات پیشرفتها در سیستمهای پردازش اطلاعات عصبی، بارسلون، اسپانیا، ۵ تا ۱۰ دسامبر ۲۰۱۶٫ صص ۶۶۷-۶۷۵٫ [ Google Scholar ]
- ارمنی، من. سنر، او. ضمیر، ع. جیانگ، اچ. بریلاکیس، آی. فیشر، ام. Savarese, S. تجزیه معنایی سه بعدی فضاهای داخلی در مقیاس بزرگ. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو، لاس وگاس، NV، ایالات متحده، ۲۷-۳۰ ژوئن ۲۰۱۶٫ صص ۱۵۳۴-۱۵۴۳٫ [ Google Scholar ]
- دای، ا. چانگ، تبر. ساوا، م. هالبر، ام. فانک هاسر، تی. Niessner, M. Scannet: بازسازی های سه بعدی با حاشیه های غنی از صحنه های داخلی. در مجموعه مقالات کنفرانس IEEE 2017 در مورد دید رایانه و تشخیص الگو (CVPR)، هونولولو، HI، ایالات متحده آمریکا، ۲۱ تا ۲۶ ژوئن ۲۰۱۷؛ ص ۲۴۳۲-۲۴۴۳٫ [ Google Scholar ]
- Hua، BS; فام، QH; نگوین، دی.تی. Tran، MK; یو، LF; Yeung, SK Scenenn: A Scene Meshes Dataset با حاشیه نویسی. در مجموعه مقالات کنفرانس بینالمللی روی دید سه بعدی (۳DV)، استنفورد، کالیفرنیا، ایالات متحده آمریکا، ۲۵ تا ۲۸ اکتبر ۲۰۱۶٫ [ Google Scholar ]
- سیلبرمن، ن. هویم، دی. کهلی، پ. Fergus, R. تقسیم بندی داخلی و استنتاج پشتیبانی از تصاویر RGBD. در Computer Vision-ECCV 2012 ; Fitzgibbon, A., Lazebnik, S., Perona, P., Sato, Y., Schmid, C., Eds.; یادداشت های سخنرانی در علوم کامپیوتر; Springer: برلین/هایدلبرگ، آلمان، ۲۰۱۲; صص ۷۴۶-۷۶۰٫ [ Google Scholar ]
- ولیچکوویچ، پ. کوکورول، جی. کازانووا، آ. رومرو، آ. لیو، پی. Bengio، Y. گراف شبکه های توجه. در مجموعه مقالات کنفرانس بین المللی در مورد بازنمایی های یادگیری، ونکوور، بریتیش کلمبیا، کانادا، ۳۰ آوریل تا ۳ مه ۲۰۱۸٫ [ Google Scholar ]
- دای، ا. Nießner, M. 3dmv: پیشبینی مشترک سه بعدی چند نمای برای تقسیمبندی صحنه معنایی سه بعدی. در مجموعه مقالات کنفرانس اروپایی بینایی کامپیوتر (ECCV)، مونیخ، آلمان، ۸ تا ۱۴ سپتامبر ۲۰۱۸؛ ص ۴۵۲-۴۶۸٫ [ Google Scholar ]
- یانگ، ی. لیو، اس. پان، اچ. لیو، ی. Tong, X. PFCNN: شبکه های عصبی کانولوشن روی سطوح سه بعدی با استفاده از فریم های موازی. در مجموعه مقالات کنفرانس IEEE/CVF در مورد دید کامپیوتری و تشخیص الگو، سیاتل، WA، ایالات متحده آمریکا، ۱۶-۱۸ ژوئن ۲۰۲۰؛ ص ۱۳۵۷۸–۱۳۵۸۷٫ [ Google Scholar ]
- تاتارچنکو، م. پارک، جی. کلتون، وی. ژو، پیچش مماس QY برای پیشبینی متراکم در سه بعدی. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، سالت لیک سیتی، UT، ایالات متحده آمریکا، ۱۸ تا ۲۳ ژوئن ۲۰۱۸؛ صص ۳۸۸۷–۳۸۹۶٫ [ Google Scholar ]
- رتاژ، دی. والد، جی. استورم، جی. نواب، ن. Tombari, F. شبکه های نقطه ای کاملاً پیچیده برای ابرهای نقطه ای در مقیاس بزرگ. در مجموعه مقالات کنفرانس اروپایی بینایی کامپیوتر (ECCV)، مونیخ، آلمان، ۸ تا ۱۴ سپتامبر ۲۰۱۸؛ صص ۵۹۶-۶۱۱٫ [ Google Scholar ]
بدون دیدگاه