کلید واژه ها:
تقسیم بندی وضوح بالا ؛ ترانسفورماتور ; یادگیری عمیق
۱٫ مقدمه
۲٫ روش شناسی
۲٫۱٫ شاخه استخراج معنایی با وضوح چندگانه
بسیاری از CNN های عالی در سال های اخیر ظاهر شده اند، از جمله ResNet [ ۲۱ ]، VGG [ ۲۲ ] و GoogLeNet [ ۲۳ ]. پس از در نظر گرفتن مقدار پارامترها و دقت شبکه، این کار ماژول پایه ResNet-18 را به عنوان بلوک باقیمانده در سه شاخه اتخاذ می کند. ساختار دو ماژول باقیمانده در شکل ۳ در شکل ۴ نشان داده شده است . این کار از ماژول های باقیمانده با دو نوع گام استفاده می کند، انتشار رو به جلو مدول باقیمانده با گام ۱ در معادله ( ۱ ) نشان داده شده است.
جایی که سیo nv3 × ۳یک پیچش ۳×۳ با گام ۱ است، βBN است، σیک تابع فعال سازی ReLU است.
انتشار رو به جلو ماژول باقیمانده با گام ۲ در معادله ( ۲ ) نشان داده شده است.
جایی که سیo nv3 × ۳هست یک ۳ × ۳پیچیدگی با گام ۲، βBN است، σیک تابع فعال سازی ReLU است، سیo nv“3 × ۳هست یک ۳ × ۳پیچیدگی با گام ۱٫
۲٫۲٫ شعبه استخراج معنایی ترانسفورماتور
اهمیت شاخه استخراج معنایی ترانسفورماتور این است که میدان پذیرای کوچک شبکههای عصبی کانولوشنال معمولی باعث عدم درک صحنه از راه دور میشود. اگرچه روشهای زیادی برای بهبود مشکل میدانهای ادراک کوچک وجود داشته است، مانند بزرگکردن هسته کانولوشن و استفاده از کانولوشن آتروس، اما همه آنها دارای اشکالاتی هستند. از یک طرف، پس از بزرگ شدن هسته کانولوشن، مقدار پارامترهای مدل و محاسبات مدل افزایش می یابد که باعث افزایش سربار محاسباتی زیادی می شود. در صورت کمبود زمان و منابع محاسباتی محدود، انتخاب خوبی نیست. از سوی دیگر، اگرچه استفاده از کانولوشن آتروس میتواند میدان دریافت هسته کانولوشن اصلی را بدون افزودن محاسبات اضافی گسترش دهد. پیچش آتروس با ۰ پر می شود وقتی هسته پیچیدگی گسترش می یابد و در نتیجه جزئیات داخلی از بین می رود. پیچ خوردگی آتروس برای استخراج اجسام هدف بزرگ دوستانه تر است و می تواند وابستگی اشیاء هدف بزرگ را در فواصل طولانی به تصویر بکشد، اما مزایای اجسام هدف کوچک به اندازه کافی آشکار نیست. از آنجایی که padding 0 مورد استفاده توسط هسته کانولوشن بر تداوم هسته کانولوشن در فرآیند استخراج ویژگی تأثیر می گذارد، اشیاء هدف کوچک تقسیم می شوند یا نادیده گرفته می شوند، که بر اثربخشی استخراج شی هدف کوچک تأثیر می گذارد. تغییر در اندازه میدان پذیرنده نقش زیادی در فرآیند استخراج ویژگی دارد. یک هسته کانولوشن با یک میدان پذیرنده بزرگ می تواند وابستگی طولانی مدت یک هدف بزرگ را استخراج کند. در حالی که یک هسته کانولوشن با یک میدان پذیرنده کوچک می تواند ویژگی های کامل یک شی هدف کوچک را استخراج کند. با در نظر گرفتن ابعاد عرض هسته کانولوشن به عنوان مثال، فرآیند استخراج میدان پذیرنده در معادله نشان داده شده است (۳ ).
که در آن K اندازه و عرض هسته کانولوشن است، d نرخ اتساع است، ک“اندازه میدان پذیرنده است.
۲٫۲٫۱٫ چارچوب کلی شاخه استخراج معنایی ترانسفورماتور
۲٫۲٫۲٫ ویژگی استخراج شبکه ستون فقرات
۲٫۲٫۳٫ رمزگذاری و رمزگشایی ترانسفورماتور
اولاً، نقشه ویژگی ورودی، نقشه ویژگی (D، H/16، W/16) است که توسط شبکه ستون فقرات استخراج شده است. در مرحله دوم، تابع مسطح کردن دو بعد آخر را در یک بردار یک بعدی برای به دست آوردن یک نقشه ویژگی جدید (D، H/16، W/16) ترسیم می کند. سپس ماتریس کدگذاری موقعیت p ∈آر( D , H / ۱۶ , W / ۱۶ )هر پیکسل در نقشه ویژگی و نقشه ویژگی به عنوان ورودی لایه کدگذاری روی هم قرار می گیرند. لایه کدنویسی ابتدا تحت لایه نرمال سازی ویژگی قرار می گیرد تا ابعاد کانال را عادی کند و سپس از نگاشت های مختلف ماتریس عبور می کند تا ماتریس پرس و جو را به دست آورد. q∈آر( H / ۱۶ , W / ۱۶ , D )، ماتریس کلید-مقدار k ∈آر( H / ۱۶ , W / ۱۶ , D )و ماتریس عددی v ∈آر( H / ۱۶ , W / ۱۶ , D ). فرآیند محاسبه در معادلات (۴) – (۷) نشان داده شده است. ایکسمن n p u tورودی لایه کدگذاری است. Δلایه عادی سازی ویژگی را نشان می دهد. کqیک تابع نگاشت ماتریس پرس و جو لایه رمزگذاری است. ککتابع نگاشت ماتریس کلید-مقدار لایه کدگذاری است. کvتابع نگاشت ماتریس عددی لایه کدگذاری است.
پس از به دست آوردن ماتریس پرس و جو، ماتریس کلید-مقدار و ماتریس عددی، سه ماتریس برای محاسبه توجه به ماژول مکانیسم توجه چند سر وارد می شوند. ماژول مکانیسم توجه چند سر با اتصال چندین ماژول مکانیسم توجه به خود به دست می آید (این مقاله تعداد سرهای مکانیسم توجه چند سر را ۴ تنظیم می کند). مزیت توجه چند سر این است که اطلاعات ویژگی را می توان از شاخه های مختلف برای غنی سازی اطلاعات معنایی به دست آورد و شاخه های مختلف می توانند به طور مستقل ویژگی ها را استخراج کرده و سپس آنها را ادغام کنند که می تواند تنوع استخراج ویژگی را افزایش دهد. پس از ماژول مکانیسم توجه چند سر، نقشه ویژگی خروجی و نقشه ویژگی قبل از لایه عادی سازی ویژگی، اطلاعات نقشه ویژگی اصلی را از طریق اتصال پرش جمع می کنند. همانطور که در معادله نشان داده شده است (۸ ).
جایی که Γنشان دهنده ماژول مکانیسم توجه چند سر است، ایکسa t t e nخروجی مکانیزم توجه چند سر است، q , k , v به ترتیب نشان دهنده ماتریس پرس و جو، ماتریس کلید-مقدار و ماتریس عددی لایه کدگذاری است. ایکسمن n p u tورودی لایه کدگذاری است.
سپس از طریق لایه عادی سازی ویژگی و لایه کاملاً متصل، بعد ویژگی به بعد بالا نگاشت می شود. نگاشت کاملا متصل یک نقشه برداری ۴ بار است. در نهایت، نقشه ویژگی اصلی قبل از ورود به اتصال کامل نیز با اتصال پرش جمع می شود تا نقشه ویژگی خروجی لایه کدگذاری (HW,D) به دست آید. فرآیند محاسبه در معادله ( ۹ ) نشان داده شده است.
جایی که ایکسe n c o de rخروجی لایه کدنویسی است، Πنقشه برداری کاملاً متصل را نشان می دهد، Δنمایانگر لایه عادی سازی ویژگی و ایکسa t t e nخروجی مکانیسم توجه چند سر است.
ورودی لایه رمزگشایی از دو بخش تشکیل شده است: نقشه ویژگی خروجی لایه کدگذاری و نقشه ویژگی جستجوی دسته که بر اساس تعداد دسته ها ایجاد شده است. لایه ویژگی قبل از ورود به مکانیسم توجه چند سر لایه رمزگشایی نرمال می شود و سپس نقشه ویژگی خروجی لایه کدگذاری به یک ماتریس ارزش کلیدی تجزیه می شود. ک“∈آر( H / ۱۶ , W / ۱۶ , N )و یک ماتریس عددی v“∈آر( H / ۱۶ , W / ۱۶ , N )از طریق نگاشت های ماتریسی مختلف در میان آنها، N تعداد دسته ها است. فرآیند محاسبه در معادلات (۱۰) – (۱۲) نشان داده شده است.
جایی که ایکس“e n c o de rخروجی لایه عادی سازی ویژگی است، Δلایه عادی سازی ویژگی را نشان می دهد، ایکسe n c o de rخروجی لایه کدنویسی است، ک“کتابع نگاشت ماتریس کلید-مقدار را در لایه رمزگشایی نشان می دهد، ک“vتابع نگاشت ماتریس عددی را در لایه رمزگشایی نشان می دهد.
ماتریس پرس و جو لایه رمزگشایی q“∈آر( H / ۱۶ , W / ۱۶ , N )با توجه به مقدار دهی اولیه دسته و ماتریس کلید-مقدار به دست می آید ک“∈آر( H / ۱۶ , W / ۱۶ , N )و ماتریس عددی v“∈آر( H / ۱۶ , W / ۱۶ , N )از طریق نقشه برداری ماتریسی به دست می آیند. در مرحله بعد، ما آنها را به مکانیسم توجه چند سر برای رمزگشایی به طور همزمان وارد می کنیم و نتیجه رمزگشایی شده از طریق لایه عادی سازی ویژگی و نقشه برداری کاملاً متصل می رود. نگاشت کاملا متصل یک نقشه برداری ۴ بار است. سپس، اولین ویژگی لایه رمزگشایی و نقشه ویژگی قبل از لایه عادی سازی ویژگی به ترتیب با هم ترکیب می شوند. در نهایت نقشه ویژگی دسته خروجی لایه رمزگشایی و نقشه ویژگی ورودی لایه کدگذاری بعدی به دست می آید. فرآیند محاسبه در معادله ( ۱۳ ) نشان داده شده است.
جایی که ایکسدe c o de rخروجی لایه رمزگشایی است، Πنقشه برداری کاملاً متصل را نشان می دهد، Δلایه عادی سازی ویژگی را نشان می دهد، Γنشان دهنده ماژول مکانیسم توجه چند سر است، q“، ک“، v“ماتریس پرس و جو، ماتریس کلید-مقدار و ماتریس عددی لایه رمزگشایی هستند.
فرآیند تجزیه یک ماژول مکانیزم توجه به خود در شکل ۸ نشان داده شده است . در مورد ورودی سه هدف، سه هدف با ماتریس نگاشت ماتریس پرس و جو مربوطه آنها محاسبه می شود. دبلیوqتو هستی _ _، ماتریس نگاشت کلید-مقدار دبلیوk e y− v a l u eو ماتریس نگاشت عددی دبلیوn u m e r i c l v a l u eبرای به دست آوردن ماتریس پرس و جو مربوطه، ماتریس کلید-مقدار و ماتریس عددی ( q1،q2،q3،ک۱،ک۲،ک۳،v1،v2،v3). سپس سافت مکس وزن خود هدف و تمام اهداف را محاسبه می کند. فرآیند محاسبه وزنهای اندازهگیری در معادله ( ۱۴ ) و ساختار تجزیه فرآیند محاسبه مکانیسم توجه به خود در شکل ۹ نشان داده شده است .
جایی که دبلیوe i gh tسمنوزن های اندازه گیری هدف i است، qمننشان دهنده ماتریس پرس و جو از هدف i است، کمننشان دهنده ماتریس کلید-مقدار هدف i است.
در نهایت، وزن خود با ضرب وزن هر هدف و ماتریس عددی مربوطه به دست می آید. فرآیند محاسبه در معادله ( ۱۵ ) نشان داده شده است.
جایی که A t e n t i o _nمنوزن خود (اطلاعات توجه) هدف i است، دبلیوe i gh tسمنوزن های اندازه گیری هدف i است، vمننشان دهنده ماتریس عددی هدف i است.
۳٫ آزمایش و تجزیه و تحلیل نتایج
۳٫۱٫ مجموعه داده ها
۳٫۱٫۱٫ مجموعه داده AISD
۳٫۱٫۲٫ مجموعه داده ISPRS
۳٫۲٫ جزئیات پیاده سازی
در این آزمایش، ما پنج شاخص ارزیابی شامل نرخ دقت کلی ( OA )، نرخ فراخوان ( Recall )، امتیاز F ۱ و تقاطع روی اتحاد ( IoU ) را انتخاب کردیم. آنها به شرح زیر است:
تابع تلفات متقاطع آنتروپی (CEloss) برای محاسبه مقدار تفاوت بین مقدار واقعی و مقدار پیشبینی شده اعمال شد. مدل پس انتشار را انجام داد و بهترین پارامترها را تحت هدایت مقدار تفاوت آموخت. فرآیند استخراج اتلاف CE در معادله ( ۲۱ ) نشان داده شده است:
که در آن m تعداد نمونه ها است، n نشان دهنده تعداد دسته ها است، p (ایکسمن ج)یک متغیر است (اگر دسته j با نمونه i یکی باشد، ۱ است، در غیر این صورت ۰ است) q(ایکسمن ج)نمونه احتمال است، i کلاس j پیشبینی میشود .
۳٫۳٫ تجزیه و تحلیل نتایج
۳٫۳٫۱٫ معیارهای ارزیابی و اثر پیش بینی
- (۱)
-
آزمایش اصلی
- (۲)
-
تعمیم تجربی
۳٫۳٫۲٫ تحلیل کمی استراتژی ارتقای نتایج پیشبینی مدل
۴٫ نتیجه گیری
منابع
- فام، اچ ام. یاماگوچی، ی. Bui, TQ مطالعه موردی در مورد رابطه بین برنامه ریزی شهری و رشد شهری با استفاده از سنجش از دور و معیارهای فضایی. Landsc. طرح شهری. ۲۰۱۱ ، ۱۰۰ ، ۲۲۳-۲۳۰٫ [ Google Scholar ] [ CrossRef ]
- آهنگ، ال. شیا، م. جین، جی. کیان، م. Zhang، Y. SUACDNet: شبکه تشخیص تغییر توجه مبتنی بر ساختار U شکل سیامی. بین المللی J. Appl. زمین Obs. Geoinf. ۲۰۲۱ ، ۱۰۵ ، ۱۰۲۵۹۷٫ [ Google Scholar ] [ CrossRef ]
- شیا، م. Qu، Y. Lin, H. PADANet: شبکه توجه دوگانه نامتقارن موازی برای ابرها و تشخیص سایه آن. J. Appl. Remote Sens. ۲۰۲۱ , ۱۵ , ۰۴۶۵۱۲٫ [ Google Scholar ] [ CrossRef ]
- ون، کیو. جیانگ، ک. وانگ، دبلیو. لیو، کیو. گوا، کیو. لی، ال. Wang, P. استخراج خودکار ساختمان از تصاویر google Earth تحت پسزمینههای پیچیده بر اساس شبکه تقسیمبندی نمونه عمیق. Sensors ۲۰۱۹ , ۱۹ , ۳۳۳٫ [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
- بهرا، MD; گوپتا، AK; باریک، SK; داس، پ. پاندا، RM استفاده از سنجش از دور ماهوارهای به عنوان ابزار نظارتی برای فعالیتهای توسعه منابع آب و زمین در یک سایت گرمسیری هند. محیط زیست نظارت کنید. ارزیابی کنید. ۲۰۱۸ ، ۱۹۰ ، ۴۰۱٫ [ Google Scholar ] [ CrossRef ]
- Qu، Y. شیا، م. ژانگ، Y. شبکه توجه فضایی کانال ادغام نوار برای تقسیم بندی ابر و سایه ابر. محاسبه کنید. Geosci. ۲۰۲۱ ، ۱۵۷ ، ۱۰۴۹۴۰٫ [ Google Scholar ] [ CrossRef ]
- یوان، جی. وانگ، دی. Li, R. تقسیمبندی تصویر سنجش از دور با ترکیب ویژگیهای طیفی و بافت. IEEE Trans. Geosci. Remote Sens. ۲۰۱۳ ، ۵۲ ، ۱۶-۲۴٫ [ Google Scholar ] [ CrossRef ]
- لی، دی. ژانگ، جی. وو، زی. Yi, L. یک الگوریتم حوضه آبخیز مبتنی بر نشانگر تعبیه شده برای تقسیم بندی تصویر سنجش از دور با وضوح فضایی بالا. IEEE Trans. فرآیند تصویر ۲۰۱۰ ، ۱۹ ، ۲۷۸۱-۲۷۸۷٫ [ Google Scholar ] [ PubMed ]
- فن، جی. هان، م. Wang, J. الگوریتم فازی وزنی تکراری تک نقطه ای C-به معنی الگوریتم خوشه بندی برای تقسیم بندی تصویر سنجش از دور. تشخیص الگو ۲۰۰۹ ، ۴۲ ، ۲۵۲۷-۲۵۴۰٫ [ Google Scholar ] [ CrossRef ]
- پانبونیوئن، تی. واتیکول، پ. جیتکاجورنوانیچ، ک. Lawawirojwong، S. یک شبکه رمزگذار-رمزگشا کانولوشنال پیشرفته برای تقسیمبندی جادهها در تصاویر هوایی. در مجموعه مقالات کنفرانس بین المللی محاسبات و فناوری اطلاعات ۲۰۱۷، هلسینکی، فنلاند، ۲۱ تا ۲۳ اوت ۲۰۱۷٫ صص ۱۹۱-۲۰۱٫ [ Google Scholar ] [ CrossRef ]
- کلورت، دی. Unterthiner، T. Hochreiter, S. یادگیری سریع و دقیق شبکه عمیق توسط واحدهای خطی نمایی (elus). arXiv ۲۰۱۵ , arXiv:1511.07289. [ Google Scholar ]
- بدرینارایانان، وی. کندال، ا. Cipolla، R. Segnet: یک معماری رمزگذار-رمزگشای پیچیده پیچیده برای تقسیمبندی تصویر. IEEE Trans. الگوی مقعدی ماخ هوشمند ۲۰۱۷ ، ۳۹ ، ۲۴۸۱-۲۴۹۵٫ [ Google Scholar ] [ CrossRef ] [ PubMed ]
- سان، دبلیو. Wang, R. شبکه های کاملاً پیچیده برای تقسیم معنایی تصاویر سنجش از راه دور با وضوح بسیار بالا همراه با DSM. IEEE Geosci. سنسور از راه دور Lett. ۲۰۱۸ ، ۱۵ ، ۴۷۴-۴۷۸٫ [ Google Scholar ] [ CrossRef ]
- لیو، دبلیو. ژانگ، ی. فن، اچ. زو، ی. Cui, Z. یک شبکه عصبی پیچیده چند کاناله جدید برای بخش بندی معنایی تصویر سنجش از دور. دسترسی IEEE ۲۰۲۰ ، ۸ ، ۱۳۱۸۱۴–۱۳۱۸۲۵٫ [ Google Scholar ] [ CrossRef ]
- Qi، X. لی، ک. لیو، پی. ژو، ایکس. Sun، M. توجه عمیق و شبکه های چند مقیاسی برای تقسیم بندی تصویر از راه دور دقیق. دسترسی IEEE ۲۰۲۰ ، ۸ ، ۱۴۶۶۲۷–۱۴۶۶۳۹٫ [ Google Scholar ] [ CrossRef ]
- لی، جی. ژیو، جی. یانگ، ز. لیو، سی. شبکه توجه دو مسیر برای تقسیم بندی تصویر معنایی سنجش از دور. ISPRS Int. J. Geo-Inf. ۲۰۲۰ ، ۹ ، ۵۷۱٫ [ Google Scholar ] [ CrossRef ]
- لان، ام. ژانگ، ی. ژانگ، ال. Du, B. تقسیمبندی خودکار جاده مبتنی بر زمینه جهانی از طریق شبکه عصبی پیچیده. Inf. علمی ۲۰۲۰ ، ۵۳۵ ، ۱۵۶-۱۷۱٫ [ Google Scholar ] [ CrossRef ]
- او، ن. نیش، ال. Plaza، A. توجه مرتبه اول و دوم ترکیبی Unet برای تقسیم بندی ساختمان در تصاویر سنجش از دور. Inf. علمی ۲۰۲۰ ، ۶۳ ، ۱۴۰۳۰۵٫ [ Google Scholar ] [ CrossRef ]
- شیا، م. ژانگ، ایکس. لیو، دبلیو. ونگ، ال. Xu, Y. یادگیری محدودیتهای ویژگی چند مرحلهای برای تخمین سن. IEEE Trans. Inf. پزشکی قانونی امن. ۲۰۲۰ ، ۱۵ ، ۲۴۱۷-۲۴۲۸٫ [ Google Scholar ] [ CrossRef ]
- وانگ، پی. چن، پی. یوان، ی. لیو، دی. هوانگ، ز. هو، ایکس. کاترل، جی. درک پیچیدگی برای تقسیم بندی معنایی. در مجموعه مقالات کنفرانس زمستانی IEEE 2018 در مورد کاربردهای بینایی کامپیوتری (WACV)، دریاچه تاهو، NV، ایالات متحده، ۱۲ تا ۱۵ مارس ۲۰۱۸؛ ص ۱۴۵۱-۱۴۶۰٫ [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- او، ک. ژانگ، ایکس. رن، اس. Sun, J. یادگیری باقیمانده عمیق برای تشخیص تصویر. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو (CVPR)، لاس وگاس، NV، ایالات متحده، ۲۷-۳۰ ژوئن ۲۰۱۶٫ صص ۷۷۰-۷۷۸٫ [ Google Scholar ]
- سیمونیان، ک. Zisserman, A. شبکه های پیچیده بسیار عمیق برای تشخیص تصویر در مقیاس بزرگ. arXiv ۲۰۱۴ ، arXiv:1409.1556. [ Google Scholar ]
- سگدی، سی. لیو، دبلیو. جیا، ی. سرمانت، پ. رید، اس. آنگلوف، دی. ایرهان، د. ونهوک، وی. رابینوویچ، الف. با پیچیدگی ها عمیق تر می رویم. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، بوستون، MA، ایالات متحده آمریکا، ۷ تا ۱۲ ژوئن ۲۰۱۵٫ صفحات ۱-۹٫ [ Google Scholar ]
- شیا، م. وانگ، ک. آهنگ، دبلیو. چن، سی. Li, Y. تفکیک بار غیر نفوذی بر اساس شبکه حافظه کوتاه مدت بلند مرکب عمیق. سیستم خبره Appl. ۲۰۲۰ , ۱۶۰ , ۱۱۳۶۶۹٫ [ Google Scholar ] [ CrossRef ]
- زی، ای. وانگ، دبلیو. وانگ، دبلیو. سان، پ. خو، اچ. لیانگ، دی. Luo, P. قطعه بندی شی شفاف در طبیعت با ترانسفورماتور. arXiv ۲۰۲۱ ، arXiv:2101.08461. [ Google Scholar ]
- دوسوویتسکی، آ. بیر، ال. کولسنیکوف، آ. وایسنبورن، دی. ژای، ایکس. Unterthiner، T. دهقانی، م. مایندرر، م. هیگلد، جی. گلی، اس. و همکاران ارزش یک تصویر ۱۶×۱۶ کلمه است: ترانسفورماتور برای تشخیص تصویر در مقیاس. arXiv ۲۰۲۰ ، arXiv:2010.11929. [ Google Scholar ]
- کاریون، ن. ماسا، اف. سینایو، جی. یوسونیر، ن. کریلوف، آ. Zagoruyko, S. تشخیص سرتاسر شی با ترانسفورماتور. در مجموعه مقالات کنفرانس اروپایی بینایی کامپیوتر، گلاسکو، بریتانیا، ۲۳ تا ۲۸ اوت ۲۰۲۰؛ صص ۲۱۳-۲۲۹٫ [ Google Scholar ] [ CrossRef ]
- ژنگ، اس. لو، جی. ژائو، اچ. زو، ایکس. لو، ز. وانگ، ی. فو، ی. فنگ، جی. شیانگ، تی. Torr، PHS; و همکاران بازاندیشی تقسیم بندی معنایی از دیدگاه توالی به دنباله با ترانسفورماتورها. arXiv ۲۰۲۰ ، arXiv:2012.15840. [ Google Scholar ]
- واسوانی، ع. Shazeer، N. پارمار، ن. توجه تمام چیزی است که نیاز دارید. در پیشرفت در سیستم های پردازش اطلاعات عصبی ; Curran Associates Inc.: Red Hook، نیویورک، ایالات متحده آمریکا، ۲۰۱۷؛ صفحات ۵۹۹۸-۶۰۰۸٫ [ Google Scholar ]
- قیصر، پی. Wegner، JD; لوچی، ا. جگی، م. هافمن، تی. شیندلر، ک. آموزش تقسیم بندی تصویر هوایی از نقشه های آنلاین. IEEE Trans. Geosci. Remote Sens. ۲۰۱۷ , ۵۵ , ۶۰۵۴–۶۰۶۸٫ [ Google Scholar ] [ CrossRef ]
- روتنشتاینر، اف. سون، جی. گرکه، ام. Wegner، JD ISPRS Semantic Labeling Contest. ISPRS ۲۰۱۴ ، ۱ ، ۴٫ [ Google Scholar ]
- لانگ، جی. شلهامر، ای. دارل، تی. شبکه های کاملاً پیچیده برای تقسیم بندی معنایی. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، بوستون، MA، ایالات متحده آمریکا، ۷ تا ۱۲ ژوئن ۲۰۱۵٫ صص ۳۴۳۱–۳۴۴۰٫ [ Google Scholar ]
- رونبرگر، او. فیشر، پی. Brox، T. U-net: شبکه های کانولوشن برای تقسیم بندی تصاویر زیست پزشکی. در مجموعه مقالات کنفرانس بین المللی محاسبات تصویر پزشکی و مداخله به کمک کامپیوتر، مونیخ، آلمان، ۵ تا ۹ اکتبر ۲۰۱۵٫ Springer: برلین/هایدلبرگ، آلمان، ۲۰۱۵; صص ۲۳۴-۲۴۱٫ [ Google Scholar ]
- ژائو، اچ. شی، ج. Qi، X. وانگ، ایکس. شبکه تجزیه صحنه هرم جیا، جی. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو (ECCV)، هونولولو، HI، ایالات متحده آمریکا، ۲۱ تا ۲۶ ژوئیه ۲۰۱۷؛ صص ۲۸۸۱-۲۸۹۰٫ [ Google Scholar ]
- چن، ال سی; زو، ی. پاپاندرو، جی. شروف، اف. Adam, H. رمزگذار-رمزگشا با پیچیدگی قابل جداسازی آتروس برای تقسیم بندی تصویر معنایی. در مجموعه مقالات کنفرانس اروپایی بینایی کامپیوتر (ECCV)، مونیخ، آلمان، ۸ تا ۱۴ سپتامبر ۲۰۱۸؛ ص ۸۰۱-۸۱۸٫ [ Google Scholar ]
بدون دیدگاه