کلید واژه ها:
یادگیری عمیق ؛ شبکه عصبی کانولوشنال ; شبکه ستون فقرات ; شناسایی هدف ؛ تصاویر سنجش از دور
۱٫ مقدمه
- ۱٫
-
تحت تأثیر RepVgg [ ۱۴ ]، ما یک شبکه ستون فقرات به نام «RepDarkNet» پیشنهاد کردیم که دقت آموزش و سرعت تشخیص را ترکیب میکند. آزمایشها نشان میدهند که RepDarkNet در مقایسه با YOLOv3 و YOLOv4 با سبک DarkNet بهعنوان ستون فقرات، هنگام اعمال بر مجموعه دادههای Dior بهتر عمل میکند.
- ۲٫
-
ما یک شبکه همگرای چندلایه برای اهداف کوچک در تصاویر سنجش از دور نوری پیشنهاد کردیم. این شبکه شامل شبکههای تشخیص چند لایه و ویژگی فیوژن است.
- ۳٫
-
علاوه بر این، ورودی بزرگتر و GIoU [ ۱۵ ] برای بهبود تشخیص اهداف بسیار کوچک استفاده شد و به طور جداگانه با اعمال آنها بر روی مجموعه داده Dior-vehicle آزمایش شد.
۲٫ کارهای مرتبط
۳٫ مواد و روشها
۳٫۱٫ دلایل انتخاب سبک DarkNet
۳٫۲٫ مروری بر شبکه ستون فقرات به سبک DarkNet
CSPDarkNet یکی از شبکه های ستون فقرات ماژول CSP (Cross-Stage-Partial-connections) [ ۷ ] است. اگر CSPDarkNet یک ساختار دو شاخه ای است، RepDarkNet یک ساختار سه شاخه ای ساده، اما قدرتمند است. در مقایسه با CSPDarkNet، تنها یک لایه شاخه در هر لایه اضافه می کند و یک ماژول با اطلاعات تشکیل می دهد. ، جایی که را می توان به صورت زیر بیان کرد:
جایی که خروجی لایه قبلی است، اطلاعات وزن است، پیچیدگی را نشان می دهد، B عملیات عادی سازی دسته ای است، و تابع Relu است. توضیح دادن ، ما به عنوان مثال R2 را در نظر می گیریم که شامل دو ماژول باقیمانده است که هر کدام را می توان به صورت زیر بیان کرد:
با توجه به یک مقدار ورودی ، سپس اولین خروجی باقی مانده است:
به طور مشابه، نتیجه پیچیدگی دوم است ، بنابراین:
۳٫۳٫ شبکه فیوژن متقابل
۳٫۴٫ گزینه هایی برای بهبود دقت تشخیص هدف کوچک
۳٫۴٫۱٫ GIoU
به عنوان از دست دادن رگرسیون Bbox، GIoU [ ۱۵ ] (تقاطع عمومی بر روی اتحاد) همیشه کمتر یا برابر با IoU [ ۲۹ ] (تقاطع روی اتحادیه) است، که در آن و . وقتی دو شکل دقیقاً منطبق شوند، GIoU = IoU = 1. GIoU و IoU را می توان به صورت زیر بیان کرد:
جایی که و اشکال دلخواه هستند در این الگوریتم، و شناسایی جعبه نشانگر در تصویر، و الگوریتم جعبه انتخاب لنگر را پیش بینی می کند. حداقل شکل بسته است.
۳٫۴٫۲٫ اندازه ورودی بزرگتر
۴٫ آزمایش ها، نتایج، و بحث
۴٫۱٫ مجموعه داده
۴٫۱٫۱٫ مجموعه داده Dior-Vehicle
۴٫۱٫۲٫ مجموعه داده دیور
۴٫۱٫۳٫ مجموعه داده NWPU VHR-10
۴٫۲٫ استانداردهای ارزیابی
امتیاز F1، دقت، فراخوانی و IoU نیز در اندازه گیری ما در آزمایش فرسایش برای آزمایش مجموعه داده Dior-vehicle در نظر گرفته شده است. فرمول IoU در معادله (۱) آورده شده است و امتیاز F1، دقت و یادآوری را می توان به صورت زیر بیان کرد:
، ، و به ترتیب تعداد مثبت واقعی، مثبت کاذب و منفی کاذب است. در این مقاله از AP (دقت متوسط) و mAP (دقت متوسط متوسط) برای ارزیابی همه روشها استفاده میکنیم. این موارد را می توان به صورت زیر بیان کرد:
۴٫۳٫ نتایج تجربی و تجزیه و تحلیل
۴٫۳٫۱٫ نتایج Dior-Vehicle و تجزیه و تحلیل
۴٫۳٫۲٫ نتایج مجموعه داده دیور و تجزیه و تحلیل
۴٫۳٫۳٫ نتایج NWPU VHR-10 و تجزیه و تحلیل
۵٫ نتیجه گیری ها
منابع
- چنگ، جی. هان، جی. بررسی تشخیص اشیا در تصاویر سنجش از دور نوری. ISPRS J. Photogramm. Remote Sens. ۲۰۱۶ ، ۱۱۷ ، ۱۱-۲۸٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- گیرشیک، آر. دوناهو، جی. دارل، تی. Malik, J. Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation. در مجموعه مقالات کنفرانس IEEE در مورد دید رایانه و تشخیص الگو، کلمبوس، OH، ایالات متحده آمریکا، ۲۳ تا ۲۸ ژوئن ۲۰۱۴٫ [ Google Scholar ]
- Girshick, R. Fast R-CNN. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتر (ICCV)، سانتیاگو، شیلی، ۱۱-۱۸ دسامبر ۲۰۱۵٫ ص ۱۴۴۰-۱۴۴۸٫ [ Google Scholar ]
- رن، اس. او، ک. گیرشیک، آر. Sun, J. Faster R-CNN: Towards towards realtime object detection with region proposal networks. IEEE Trans. الگوی مقعدی ماخ هوشمند ۲۰۱۷ ، ۳۹ ، ۱۱۳۷-۱۱۴۹٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- لیو، دبلیو. آنگلوف، دی. ایرهان، د. سگدی، سی. رید، اس. فو، سی. Berg، AC SSD: آشکارساز MultiBox تک شات. در کنفرانس اروپایی بینایی کامپیوتر ; Springer: Cham، Switzerland، ۲۰۱۶٫ [ Google Scholar ]
- ردمون، جی. فرهادی، A. YOLOv3: یک پیشرفت افزایشی. arXiv ۲۰۱۸ , arXiv:1804.02767. [ Google Scholar ]
- بوچکوفسکی، آ. وانگ، سی. لیائو، H. YOLOv4: سرعت و دقت بهینه تشخیص اشیا. arXiv ۲۰۲۰ ، arXiv:2004.10934. [ Google Scholar ]
- او، ک. ژانگ، ایکس. رن، اس. Sun، J. یادگیری باقیمانده عمیق برای تشخیص تصویر. در مجموعه مقالات کنفرانس IEEE 2016 در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، لاس وگاس، NV، ایالات متحده آمریکا، ۲۷ تا ۳۰ ژوئن ۲۰۱۶٫ [ Google Scholar ]
- خاخام، ج. ری، ن. شوبرت، ام. چاودری، اس. Chao، D. تشخیص اشیای کوچک در تصاویر سنجش از راه دور با GAN پیشرفته لبه به انتها و شبکه آشکارساز شی. Remote Sens. ۲۰۲۰ , ۱۲ , ۱۴۳۲٫ [ Google Scholar ] [ CrossRef ]
- سیمونیان، ک. زیسرمن، الف. شبکه های پیچیده بسیار عمیق برای تشخیص تصویر در مقیاس بزرگ. arXiv ۲۰۱۴ ، arXiv:1409.1556. [ Google Scholar ]
- هوارد، AG; زو، ام. چن، بی. کالنیچنکو، دی. وانگ، دبلیو. ویاند، تی. آندریتو، م. Adam, H. MobileNets: شبکه های عصبی کانولوشن کارآمد برای برنامه های کاربردی بینایی موبایل. arXiv ۲۰۱۷ , arXiv:1704.04861. [ Google Scholar ]
- سندلر، ام. هوارد، آ. زو، ام. ژموگینوف، آ. Chen, LC MobileNetV2: باقیمانده های معکوس و تنگناهای خطی. در مجموعه مقالات کنفرانس IEEE/CVF 2018 در مورد دید رایانه و تشخیص الگو (CVPR)، سالت لیک سیتی، UT، ایالات متحده آمریکا، ۱۸ تا ۲۳ ژوئن ۲۰۱۸٫ [ Google Scholar ]
- هوارد، آ. سندلر، ام. چو، جی. چن، ال سی; چن، بی. تان، م. وانگ، دبلیو. زو، ی. پانگ، آر. Vasudevan, V. جستجو برای MobileNetV3. arXiv ۲۰۱۹ ، arXiv:1905.02244. [ Google Scholar ]
- دینگ، ایکس. ژانگ، ایکس. مرد.؛ هان، جی. دینگ، جی. Sun، J. RepVGG: دوباره ساختن ConvNets به سبک VGG. در مجموعه مقالات کنفرانس IEEE/CVF در مورد دید رایانه و تشخیص الگو، نشویل، TN، ایالات متحده، ۲۰-۲۵ ژوئن ۲۰۲۱؛ صص ۱۳۷۳۳–۱۳۷۴۲٫ [ Google Scholar ]
- رضاتوفیقی، ح. تسوی، ن. گواک، جی. صادقیان، ع. رید، آی. Savarese، S. تقاطع تعمیم یافته بر روی اتحاد: یک متریک و یک ضرر برای رگرسیون جعبه محدود. در مجموعه مقالات کنفرانس IEEE/CVF در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، ۱۵ تا ۲۰ ژوئن ۲۰۱۹٫ [ Google Scholar ]
- ژانگ، ی. یوان، ی. فنگ، ی. Lu, X. شبکه عصبی کانولوشنال سلسله مراتبی و قوی برای تشخیص اشیاء سنجش از دور با وضوح بسیار بالا. IEEE Trans. Geosci. Remote Sens. ۲۰۱۹ , ۵۷ , ۵۵۳۵–۵۵۴۸٫ [ Google Scholar ] [ CrossRef ]
- Etten، AV شما فقط دو بار نگاه می کنید: تشخیص سریع شی چند مقیاسی در تصاویر ماهواره ای. arXiv ۲۰۱۸ , arXiv:1805.09512. [ Google Scholar ]
- دینگ، جی. زو، ن. لانگ، ی. Xia، GS; Lu, Q. ترانسفورماتور RoI یادگیری برای تشخیص اجسام جهت دار در تصاویر هوایی. arXiv ۲۰۱۸ , arXiv:1812.00155. [ Google Scholar ]
- یانگ، ایکس. یانگ، جی. یان، جی. ژانگ، ی. Fu، K. SCRDet: به سوی تشخیص قوی تر برای اجسام کوچک، بهم ریخته و چرخان. در مجموعه مقالات کنفرانس بین المللی IEEE/CVF 2019 در بینایی رایانه (ICCV)، سئول، کره، ۲۷ اکتبر تا ۲ نوامبر ۲۰۱۹٫ [ Google Scholar ]
- ژو، ال. وی، اچ. لی، اچ. ژائو، دبلیو. Zhang، Y. تشخیص شی دلخواه گرا در تصاویر سنجش از دور بر اساس مختصات قطبی. دسترسی IEEE ۲۰۲۰ ، ۸ ، ۲۲۳۳۷۳–۲۲۳۳۸۴٫ [ Google Scholar ] [ CrossRef ]
- اودبرت، ن. لو ساکس، بی. Lefèvre, S. Segment-Before-Detect: Vehicle Detection and Classification from the Semantic Semantic Semantic Semmentic of Aerial Images. Remote Sens. ۲۰۱۷ , ۹ , ۳۶۸٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- ژانگ، ز. لیو، ی. لیو، تی. لین، ز. Wang, S. DAGN: چارچوب تشخیص وسیله نقلیه تصویری سنجش از راه دور پهپاد در زمان واقعی. IEEE Geosci. سنسور از راه دور Lett. ۲۰۲۰ ، ۱۷ ، ۱۸۸۴-۱۸۸۸٫ [ Google Scholar ] [ CrossRef ]
- شی، اف. ژانگ، تی. Zhang، T. تشخیص وسیله نقلیه با آگاهی جهتگیری در تصاویر هوایی از طریق یک رویکرد تشخیص شی بدون لنگر. IEEE Trans. Geosci. Remote Sens. ۲۰۲۰ , ۵۹ , ۵۲۲۱–۵۲۳۳٫ [ Google Scholar ] [ CrossRef ]
- سگدی، سی. آیوف، اس. ونهوک، وی. Alemi، A. Inception-v4، Inception-ResNet و تاثیر اتصالات باقیمانده بر یادگیری. در مجموعه مقالات سی و یکمین کنفرانس AAAI در مورد هوش مصنوعی، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، ۴ تا ۹ فوریه ۲۰۱۷٫ [ Google Scholar ]
- هوانگ، جی. لیو، ز. لورن، وی. واینبرگر، شبکههای کانولوشن با اتصال متراکم KQ. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، هونولولو، HI، ایالات متحده آمریکا، ۲۱ تا ۲۶ ژوئیه ۲۰۱۶٫ [ Google Scholar ]
- ویت، ا. ویلبر، ام. Belongie, S. شبکههای باقیمانده مانند مجموعهای از شبکههای نسبتا کم عمق رفتار میکنند. در مجموعه مقالات پیشرفتها در سیستمهای پردازش اطلاعات عصبی، بارسلون، اسپانیا، ۵ تا ۱۰ دسامبر ۲۰۱۶٫ [ Google Scholar ]
- کینگ، ی. لیو، دبلیو. فنگ، ال. Gao, W. بهبود شبکه YOLO برای تشخیص هدف از راه دور با زاویه آزاد. Remote Sens. ۲۰۲۱ , ۱۳ , ۲۱۷۱٫ [ Google Scholar ] [ CrossRef ]
- لیم، جی اس؛ آسترید، ام. یون، اچ جی; لی، SI تشخیص شی کوچک با استفاده از زمینه و توجه. در مجموعه مقالات کنفرانس بین المللی ۲۰۲۱ هوش مصنوعی در اطلاعات و ارتباطات (ICAIIC)، جزیره ججو، کره، ۲۰ تا ۲۳ آوریل ۲۰۲۱٫ [ Google Scholar ]
- یو، جی. جیانگ، ی. وانگ، ز. گائو، ز. Huang, T. UnitBox: An Advanced Object Detection Network. در مجموعه مقالات بیست و چهارمین کنفرانس بین المللی ACM در چند رسانه ای، آمستردام، هلند، ۱۵ تا ۱۹ اکتبر ۲۰۱۶٫ [ Google Scholar ]
- لی، ک. وان، جی. چنگ، جی. منگ، ال. Han, J. تشخیص شیء در تصاویر سنجش از دور نوری: یک بررسی و یک معیار جدید. ISPRS J. Photogramm. Remote Sens. ۲۰۲۰ , ۱۵۹ , ۲۹۶–۳۰۷٫ [ Google Scholar ] [ CrossRef ]
- چنگ، جی. هان، جی. ژو، پی. Guo, L. تشخیص شی چند طبقه جغرافیایی و طبقه بندی تصویر جغرافیایی بر اساس مجموعه آشکارسازهای قطعه. ISPRS J. Photogramm. Remote Sens. ۲۰۱۴ ، ۹۸ ، ۱۱۹-۱۳۲٫ [ Google Scholar ] [ CrossRef ]
- لین، تی.-ای. مایر، م. بلنگی، اس. هیز، جی. پرونا، پی. رامانان، دی. دلار، P. Zitnick، C. مایکروسافت کوکو: اشیاء مشترک در زمینه. در مجموعه مقالات کنفرانس اروپایی بینایی کامپیوتر، زوریخ، سوئیس، ۶ تا ۱۲ سپتامبر ۲۰۱۴٫ صص ۷۴۰-۷۵۵٫ [ Google Scholar ]
- هوانگ، دبلیو. لی، جی. چن، کیو. جو، م. Qu, J. CF2PN: تشخیص هدف شبکه هرمی ترکیبی مبتنی بر سنجش از دور. Remote Sens. ۲۰۲۱ , ۱۳ , ۸۴۷٫ [ Google Scholar ] [ CrossRef ]
- یوان، ز. لیو، ز. زو، سی. چی، جی. Zhao، D. تشخیص شیء در تصاویر سنجش از راه دور از طریق شبکه هرمی چند ویژگی با بلوک میدان پذیرنده. Remote Sens. ۲۰۲۱ , ۱۳ , ۸۶۲٫ [ Google Scholar ] [ CrossRef ]
- لی، ی. هوانگ، Q. پی، ایکس. چن، ی. جیائو، ال. Shang, R. شبکه توجه متقابل لایه برای تشخیص اشیاء کوچک در تصاویر سنجش از دور. IEEE J. Sel. بالا. Appl. زمین Obs. Remote Sens. ۲۰۲۱ , ۱۴ , ۲۱۴۸–۲۱۶۱٫ [ Google Scholar ] [ CrossRef ]
- شیونگ، اس. تان، ی. لی، ی. ون، سی. Yan, P. تشخیص شیء مبتنی بر توجه در تصاویر سنجش از راه دور. Remote Sens. ۲۰۲۱ , ۱۳ , ۱۹۲۵٫ [ Google Scholar ] [ CrossRef ]
بدون دیدگاه