خلاصه
کلید واژه ها:
ابر نقطه سه بعدی ; شبکه پیچیدگی ; مکاتبات مکان مکانی ; طبقه بندی ; تقسیم بندی معنایی
۱٫ معرفی
- (۱)
-
ما ماهیت پیچیدگی گسسته را آشکار می کنیم – جمع محصولات بر اساس مکاتبات. آنچه مهم است مکاتبه است. ما معتقدیم که کانولوشن عملیاتی است که نه به ترتیب، بلکه به تناظر بین محدوده کانولوشن و هسته کانولوشن مربوط می شود. ما استدلال می کنیم که تا زمانی که مطابقت بین محدوده کانولوشن و عناصر موجود در یک هسته کانولوشن ثابت بماند، مقدار کانولوشن تغییر نمی کند.
- (۲)
-
ما دریافتیم که مکاتبات مکان مکانی ابرهای نقطه سه بعدی را برآورده می کند، که می تواند مشکل بی نظمی در ابرهای نقطه را حل کند. علاوه بر این، ما سبک های مختلف مکاتبات را تجزیه و تحلیل کردیم، و پیشنهاد می کنیم که ابرهای نقطه ای باید مطابقت های N-to-M را اتخاذ کنند، که می تواند مشکل بی نظمی در ابرهای نقطه را حل کند. اینها در سایر شبکه های کانولوشن موجود پوشش داده نمی شوند.
- (۳)
-
ما یک چارچوب کانولوشن کلی را برای ابرهای نقطه ای با توجه به مکاتبات مکان مکانی پیشنهاد می کنیم و نمونه ای از یک شبکه کانولوشن را بر اساس این چارچوب ارائه می دهیم. ما چندین آزمایش را روی وظایف ابر نقطه ای، مانند طبقه بندی و تقسیم بندی معنایی انجام دادیم. همه نتایج ما با شبکه های جریان اصلی فعلی سازگاری داشت.
۲٫ کارهای مرتبط
۲٫۱٫ مبتنی بر فرافکنی
۲٫۱٫۱٫ مبتنی بر چند نمایش
۲٫۱٫۲٫ مبتنی بر وکسل
۲٫۲٫ مبتنی بر نقطه
۲٫۳٫ مبتنی بر نمودار
۲٫۴٫ مبتنی بر پیچیدگی
۲٫۵٫ مبتنی بر ترانسفورماتور
۳٫ مواد و روشها
۳٫۱٫ ماهیت ریاضی پیچیدگی
فرمول ریاضی برای کانولوشن پیوسته ۱ بعدی به شرح زیر است:
جایی که fو gتوابع پیچیدگی درگیر هستند، nمحدوده پیچیدگی است، τعنصر در عملکرد است fدر محدوده پیچیدگی n، و (n-τ)عنصر مطابقت در تابع کانولوشن است g.
فرمول کانولوشن گسسته دو بعدی روی تصاویر به شرح زیر است:
جایی که fتصویر دو بعدی است، gهسته کانولوشن است، من،jمحدوده پیچیدگی را بیان می کند، (متر،n)عنصر پیچیدگی را در تابع بیان می کند fدر محدوده پیچیدگی من،j، و (من-متر،j-n)عنصر مطابقت در هسته کانولوشن است g.
به طور خلاصه، فرمول کانولوشن گسسته به صورت زیر فرموله می شود:
جایی که کعنصر پیچیدگی مورد بررسی است، من∈ن(ک)یعنی که منیک نقطه همسایه است کدر یک سیستم همسایه، jعنصری است که به هسته کانولوشن تعلق دارد و ψ(من،j)=سینشان میدهد که منو jباید یک محدودیت را برآورده کند – که به آن رابطه مکاتبات نیز گفته می شود.
۳٫۲٫ مکاتبات مکان مکانی
۳٫۳٫ چارچوب پیچیدگی نقطه
- (۱)
-
ابتدا یک سیستم محله ابر نقطه ای مناسب را تعیین کنید.
- (۲)
-
دوم، نحوه ایجاد نقاط مختصات هسته کانولوشن و اندازه مناسب هسته کانولوشن را تعیین کنید. در این مطالعه، ما نقاط هسته را از ماتریس کوواریانس یک نمونه تولید کردیم.
- (۳)
-
سوم، محدوده تأثیر هر یک از نقاط هسته پیچیدگی را بر اساس مکان فضایی اقلیدسی تعیین کنید.
- (۴)
-
در نهایت عمل کانولوشن را طبق مکاتبات اعمال کنید.
۳٫۴٫ نمونه ای از یک شبکه
۴٫ نتایج و بحث
۴٫۱٫ وظایف طبقه بندی
طبقه بندی ModelNet40
۴٫۲٫ وظایف تقسیم بندی معنایی
۴٫۲٫۱٫ S3DIS: تقسیم بندی معنایی برای صحنه های داخلی
۴٫۲٫۲٫ Semantic3D: LiDAR Semantic Segmentation
۴٫۲٫۳٫ SensatUrban: مجموعه داده های ابر نقطه فتوگرامتری در سطح شهر
۴٫۳٫ بحث
۴٫۳٫۱٫ روشی که در آن نقاط هسته ایجاد شد
۴٫۳٫۲٫ تعداد نقاط هسته
۵٫ نتیجه گیری ها
منابع
- ارمنی، من. سنر، او. ضمیر، ع. جیانگ، اچ. بریلاکیس، آی. فیشر، ام. Savarese, S. تجزیه معنایی سه بعدی فضاهای داخلی در مقیاس بزرگ. در مجموعه مقالات کنفرانس IEEE 2016 در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، لاس وگاس، NV، ایالات متحده آمریکا، ۲۷ تا ۳۰ ژوئن ۲۰۱۶؛ IEEE: لاس وگاس، NV، ایالات متحده؛ صص ۱۵۳۴-۱۵۴۳٫ [ Google Scholar ]
- هاکل، تی. ساوینوف، ن. لدیکی، ال. Wegner، JD; شیندلر، ک. Pollefeys، M. Semantic3D. Net: معیار طبقه بندی ابر نقطه ای جدید. arXiv ۲۰۱۷ , arXiv:1704.03847. [ Google Scholar ]
- هو، کیو. یانگ، بی. خالد، س. شیائو، دبلیو. تریگونی، ن. مارکهام، A. به سوی تقسیم بندی معنایی ابرهای نقطه سه بعدی در مقیاس شهری: مجموعه داده، معیارها و چالش ها در مجموعه مقالات کنفرانس IEEE/CVF 2021 در مورد دید رایانه و تشخیص الگو (CVPR)، نشویل، TN، ایالات متحده، ۲۰-۲۵ ژوئن ۲۰۲۱؛ IEEE: نشویل، TN، ایالات متحده؛ صفحات ۴۹۷۵-۴۹۸۵٫ [ Google Scholar ]
- رهبری محاسبات هوش مصنوعی از NVIDIA. در دسترس آنلاین: https://www.nvidia.com/en-us/ (در ۱۸ ژوئیه ۲۰۲۲ قابل دسترسی است).
- TensorFlow. در دسترس آنلاین: https://tensorflow.google.cn/?hl=en (در ۱۸ ژوئیه ۲۰۲۲ قابل دسترسی است).
- PyTorch. در دسترس آنلاین: https://pytorch.org/ (در ۱۸ ژوئیه ۲۰۲۲ قابل دسترسی است).
- Wang, Y. DGCNN: نمایشهای ابر نقطه یادگیری توسط دینامیک گراف CNN. Ph.D. پایان نامه، موسسه فناوری ماساچوست، کمبریج، MA، ایالات متحده آمریکا، ۲۰۲۰٫ [ Google Scholar ]
- توماس، اچ. Qi، CR; Deschaud, J.-E.; مارکوتگی، بی. گولت، اف. Guibas، LJ KPConv: پیچش انعطاف پذیر و تغییر شکل پذیر برای ابرهای نقطه ای. در مجموعه مقالات کنفرانس بین المللی IEEE/CVF در بینایی رایانه (ICCV)، سئول، جمهوری کره، ۲۷ اکتبر تا ۲ نوامبر ۲۰۱۹٫ [ Google Scholar ]
- ماتورانا، دی. Scherer, S. VoxNet: یک شبکه عصبی کانولوشن سه بعدی برای تشخیص اشیاء در زمان واقعی. در مجموعه مقالات کنفرانس بین المللی IEEE/RSJ 2015 در مورد ربات ها و سیستم های هوشمند (IROS)، هامبورگ، آلمان، ۲۸ سپتامبر تا ۳ اکتبر ۲۰۱۵؛ ص ۹۲۲-۹۲۸٫ [ Google Scholar ]
- لی، ی. بو، ر. سان، م. وو، دبلیو. دی، ایکس. چن، بی. پوینت سی ان ان: پیچیدگی در نقاط تبدیل شده X. در مجموعه مقالات پیشرفتها در سیستمهای پردازش اطلاعات عصبی، ونکوور، BC، کانادا، ۸ تا ۱۴ دسامبر ۲۰۱۹؛ Curran Associates, Inc.: Red Hook, NY, USA, 2018; جلد ۳۱٫ [ Google Scholar ]
- Hua، B.-S.; تران، M.-K. یونگ، اس.-کی. شبکه های عصبی کانولوشنال نقطه ای در مجموعه مقالات کنفرانس IEEE/CVF 2018 در مورد دید رایانه و تشخیص الگو، سالت لیک سیتی، UT، ایالات متحده آمریکا، ۱۸ تا ۲۳ ژوئن ۲۰۱۸؛ IEEE: سالت لیک سیتی، UT، ایالات متحده آمریکا؛ ص ۹۸۴-۹۹۳٫ [ Google Scholar ]
- تاتارچنکو، م. پارک، جی. کلتون، وی. ژو، Q.-Y. پیچش های مماس برای پیش بینی متراکم در سه بعدی. arXiv ۲۰۱۸ , arXiv:1807.02443. [ Google Scholar ]
- وانگ، اس. سو، اس. ما، W.-C. پوکروفسکی، آ. Urtasun، R. شبکه های عصبی کانولوشن پیوسته پارامتریک عمیق. در مجموعه مقالات کنفرانس IEEE/CVF 2018 در مورد دید رایانه و تشخیص الگو، سالت لیک سیتی، UT، ایالات متحده آمریکا، ۱۸ تا ۲۳ ژوئن ۲۰۱۸؛ صص ۲۵۸۹–۲۵۹۷٫ [ Google Scholar ]
- Deuge، MD; کوادروس، ا. هونگ، سی. Douillard, B. آموزش ویژگی بدون نظارت برای طبقه بندی اسکن های سه بعدی در فضای باز. در مجموعه مقالات کنفرانس استرالیایی در مورد رباتیک و اتوماسیون، سیدنی، استرالیا، ۲ تا ۴ دسامبر ۲۰۱۳٫ [ Google Scholar ]
- هو، کیو. یانگ، بی. زی، ال. رزا، اس. گوا، ی. وانگ، ز. تریگونی، ن. مارکهام، A. RandLA-Net: تقسیم بندی معنایی کارآمد ابرهای نقطه ای در مقیاس بزرگ. در مجموعه مقالات کنفرانس IEEE/CVF در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، سیاتل، WA، ایالات متحده آمریکا، ۱۳ تا ۱۹ ژوئن ۲۰۲۰٫ [ Google Scholar ]
- گراهام، بی. انگلک، م. van der Maaten، L. تقسیمبندی معنایی سه بعدی با شبکههای کانولوشنال پراکنده زیرمنیفولد. در مجموعه مقالات کنفرانس IEEE/CVF 2018 در مورد دید رایانه و تشخیص الگو، سالت لیک سیتی، UT، ایالات متحده آمریکا، ۱۸ تا ۲۳ ژوئن ۲۰۱۸؛ IEEE: سالت لیک سیتی، UT، ایالات متحده آمریکا؛ ص ۹۲۲۴–۹۲۳۲٫ [ Google Scholar ]
- Qi، CR; سو، اچ. مو، ک. Guibas، LJ PointNet: یادگیری عمیق در مجموعه های نقطه برای طبقه بندی و تقسیم بندی سه بعدی. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، هونولولو، HI، ایالات متحده آمریکا، ۲۱ تا ۲۶ ژوئیه ۲۰۱۷٫ [ Google Scholar ]
- Qi، CR; یی، ال. سو، اچ. Guibas، LJ PointNet++: یادگیری ویژگی های سلسله مراتبی عمیق در مجموعه های نقطه در یک فضای متریک. Adv. عصبی Inf. روند. سیستم ۲۰۱۷ ۳۰ . _ [ Google Scholar ]
- سیمونوفسکی، م. کوموداکیس، N. فیلترهای شرطی لبه پویا در شبکه های عصبی کانولوشن روی نمودارها. در مجموعه مقالات کنفرانس IEEE 2017 در مورد دید رایانه و تشخیص الگو (CVPR)، هونولولو، HI، ایالات متحده آمریکا، ۲۱ تا ۲۶ ژوئیه ۲۰۱۷؛ ص ۲۹-۳۸٫ [ Google Scholar ]
- لندریو، ال. Simonovsky، M. تقسیم بندی معنایی ابر نقطه ای بزرگ با نمودارهای ابرنقطه ای. در مجموعه مقالات کنفرانس IEEE/CVF 2018 در مورد دید رایانه و تشخیص الگو، سالت لیک سیتی، UT، ایالات متحده آمریکا، ۱۸ تا ۲۳ ژوئن ۲۰۱۸؛ صص ۴۵۵۸–۴۵۶۷٫ [ Google Scholar ]
- گوو، ام.-اچ. کای، جی. لیو، Z.-N. مو، تی.-جی. مارتین، آر. Hu, S. PCT: Point Cloud Transformer. تعریف نشده ۲۰۲۱ ، ۷ ، ۱۸۷-۱۹۹٫ [ Google Scholar ] [ CrossRef ]
- ژائو، اچ. جیانگ، ال. جیا، جی. تور، پی. کلتون، ترانسفورماتور V. Point. در مجموعه مقالات کنفرانس IEEE/CVF در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، سیاتل، WA، ایالات متحده آمریکا، ۱۳ تا ۱۹ ژوئن ۲۰۲۰٫ [ Google Scholar ]
- انگل، ن. بلاگیانیس، وی. Dietmayer، K. Point Transformer. دسترسی IEEE ۲۰۲۱ ، ۹ ، ۱۳۴۸۲۶–۱۳۴۸۴۰٫ [ Google Scholar ] [ CrossRef ]
- گرو، اف. ویشولک، پی. Lensch، HPA Flex-Convolution (Million-Scale Point-Cloud Learning Beyond Grid-Worlds). arXiv ۲۰۲۰ ، arXiv:1803.07289. [ Google Scholar ]
- لی، اچ. اختر، ن. Mian، A. Octree CNN را با هسته های کروی برای ابرهای نقطه سه بعدی هدایت می کند. در مجموعه مقالات کنفرانس IEEE/CVF 2019 در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، ۱۵ تا ۲۰ ژوئن ۲۰۱۹؛ IEEE: لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا؛ صص ۹۶۲۳–۹۶۳۲٫ [ Google Scholar ]
- وو، دبلیو. چی، ز. Fuxin، L. PointConv: شبکههای پیچیده عمیق در ابرهای نقطه سه بعدی. در مجموعه مقالات کنفرانس IEEE/CVF در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، سیاتل، WA، ایالات متحده آمریکا، ۱۳ تا ۱۹ ژوئن ۲۰۲۰٫ [ Google Scholar ]
- لی، اچ. اختر، ن. Mian، A. هسته کروی برای پیچیدگی نمودار کارآمد در ابرهای نقطه سه بعدی. IEEE Trans. الگوی مقعدی ماخ هوشمند ۲۰۲۱ ، ۴۳ ، ۳۶۶۴-۳۶۸۰٫ [ Google Scholar ] [ CrossRef ] [ PubMed ]
- سو، اچ. مجی، س. کالوگراکیس، ای. Learned-Miller, E. شبکه های عصبی کانولوشنال چند نمای برای تشخیص شکل سه بعدی. در مجموعه مقالات کنفرانس بین المللی IEEE 2015 در بینایی کامپیوتر (ICCV)، سانتیاگو، شیلی، ۷ تا ۱۳ دسامبر ۲۰۱۵؛ ص ۹۴۵-۹۵۳٫ [ Google Scholar ]
- لین، ز.-اچ. هوانگ، S.-Y. Wang, Y.-CF Convolution in the Cloud: Learning Kernels Deformable in 3D Graph Convolution Networks for Point Cloud Analysis. در مجموعه مقالات کنفرانس IEEE/CVF 2020 در مورد دید رایانه و تشخیص الگو (CVPR)، سیاتل، WA، ایالات متحده آمریکا، ۱۳ تا ۱۹ ژوئن ۲۰۲۰؛ صفحات ۱۷۹۷-۱۸۰۶٫ [ Google Scholar ]
- توماس، اچ. گولت، اف. Deschaud, J.-E.; مارکوتگی، بی. LeGall، Y. طبقهبندی معنایی ابرهای نقطهای سهبعدی با همسایگیهای کروی چند مقیاسی. در مجموعه مقالات کنفرانس بین المللی ۲۰۱۸ در ۳D Vision (3DV)، ورونا، ایتالیا، ۵-۸ سپتامبر ۲۰۱۸؛ صص ۳۹۰-۳۹۸٫ [ Google Scholar ]
- وو، زی. آهنگ ها.؛ خسلا، ع. یو، اف. ژانگ، ال. تانگ، ایکس. Xiao, J. ShapeNets 3D: A Deep Representation for Volumetric Shapes. در مجموعه مقالات کنفرانس IEEE 2015 در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، بوستون، MA، ایالات متحده آمریکا، ۷ تا ۱۲ ژوئن ۲۰۱۵؛ IEEE: بوستون، MA، ایالات متحده آمریکا؛ صفحات ۱۹۱۲-۱۹۲۰٫ [ Google Scholar ]
- لی، جی. چن، BM; لی، GH SO-Net: شبکه خودسازماندهی برای تحلیل ابر نقطه ای. در مجموعه مقالات کنفرانس IEEE/CVF 2018 در مورد دید رایانه و تشخیص الگو، سالت لیک سیتی، UT، ایالات متحده آمریکا، ۱۸ تا ۲۳ ژوئن ۲۰۱۸؛ ص ۹۳۹۷–۹۴۰۶٫ [ Google Scholar ]
- خو، ی. فن، تی. خو، ام. زنگ، ال. Qiao, Y. SpiderCNN: یادگیری عمیق در مجموعه های نقطه با فیلترهای کانولوشن پارامتری شده. در مجموعه مقالات کنفرانس اروپایی بینایی کامپیوتر (ECCV)، مونیخ، آلمان، ۸ تا ۱۴ سپتامبر ۲۰۱۸٫ [ Google Scholar ]
- چاپمی، ال. چوی، سی. ارمنی، من. گواک، جی. Savarese, S. SEGCloud: Semantic Semmentation of 3D Point Clouds. در مجموعه مقالات کنفرانس بین المللی ۲۰۱۷ در ۳D Vision (3DV)، چینگدائو، چین، ۱۰-۱۲ اکتبر ۲۰۱۷؛ صص ۵۳۷-۵۴۷٫ [ Google Scholar ]
- Semantic3D. در دسترس آنلاین: http://semantic3d.net/ (در ۱۶ نوامبر ۲۰۲۲ قابل دسترسی است).
بدون دیدگاه