Skip to content

Latest commit

 

History

History
69 lines (36 loc) · 7.33 KB

File metadata and controls

69 lines (36 loc) · 7.33 KB

بخش‌بندی

ما قبلاً درباره تشخیص اشیا یاد گرفتیم، که به ما امکان می‌دهد اشیا را در تصویر با پیش‌بینی جعبه‌های محدودکننده مکان‌یابی کنیم. با این حال، برای برخی وظایف، نه تنها به جعبه‌های محدودکننده نیاز داریم، بلکه به مکان‌یابی دقیق‌تر اشیا نیز احتیاج داریم. این وظیفه بخش‌بندی نامیده می‌شود.

بخش‌بندی را می‌توان به عنوان طبقه‌بندی پیکسل‌ها در نظر گرفت، به این صورت که برای هر پیکسل تصویر باید کلاس آن را پیش‌بینی کنیم (پس‌زمینه یکی از کلاس‌ها است). دو الگوریتم اصلی برای بخش‌بندی وجود دارد:

  • بخش‌بندی معنایی فقط کلاس پیکسل را مشخص می‌کند و بین اشیای مختلف از یک کلاس تفاوتی قائل نمی‌شود.
  • بخش‌بندی نمونه‌ای کلاس‌ها را به نمونه‌های مختلف تقسیم می‌کند.

برای بخش‌بندی نمونه‌ای، این گوسفندها اشیای مختلفی هستند، اما برای بخش‌بندی معنایی همه گوسفندها به عنوان یک کلاس نمایش داده می‌شوند.

تصویر از این پست وبلاگ

معماری‌های عصبی مختلفی برای بخش‌بندی وجود دارد، اما همه آن‌ها ساختار مشابهی دارند. به نوعی، این معماری‌ها شبیه به خودرمزگذارهایی هستند که قبلاً درباره آن‌ها یاد گرفتید، اما به جای بازسازی تصویر اصلی، هدف ما بازسازی یک ماسک است. بنابراین، یک شبکه بخش‌بندی شامل بخش‌های زیر است:

  • رمزگذار ویژگی‌ها را از تصویر ورودی استخراج می‌کند.
  • رمزگشا این ویژگی‌ها را به تصویر ماسک تبدیل می‌کند، با همان اندازه و تعداد کانال‌ها که به تعداد کلاس‌ها مربوط می‌شود.

تصویر از این مقاله

باید به طور ویژه به تابع زیان مورد استفاده برای بخش‌بندی اشاره کنیم. هنگام استفاده از خودرمزگذارهای کلاسیک، باید شباهت بین دو تصویر را اندازه‌گیری کنیم و می‌توانیم از میانگین مربعات خطا (MSE) برای این کار استفاده کنیم. در بخش‌بندی، هر پیکسل در تصویر ماسک هدف نشان‌دهنده شماره کلاس است (به صورت یک‌کدگذاری در بعد سوم)، بنابراین باید از توابع زیان خاص برای طبقه‌بندی استفاده کنیم - زیان آنتروپی متقاطع، که میانگین آن بر روی تمام پیکسل‌ها گرفته می‌شود. اگر ماسک دودویی باشد، از زیان آنتروپی متقاطع دودویی (BCE) استفاده می‌شود.

✅ یک‌کدگذاری روشی برای کدگذاری برچسب کلاس به یک بردار با طول برابر با تعداد کلاس‌ها است. به این مقاله درباره این تکنیک نگاهی بیندازید.

بخش‌بندی در تصویربرداری پزشکی

در این درس، بخش‌بندی را در عمل مشاهده خواهیم کرد، با آموزش شبکه برای شناسایی خال‌های انسانی (که به عنوان مول نیز شناخته می‌شوند) در تصاویر پزشکی. ما از پایگاه داده PH2 تصاویر درموسکوپی به عنوان منبع تصاویر استفاده خواهیم کرد. این مجموعه داده شامل 200 تصویر از سه کلاس است: خال معمولی، خال غیرمعمولی، و ملانوما. همه تصاویر همچنین شامل یک ماسک هستند که خال را مشخص می‌کند.

✅ این تکنیک به طور خاص برای این نوع تصویربرداری پزشکی مناسب است، اما چه کاربردهای واقعی دیگری را می‌توانید تصور کنید؟

navi

تصویر از پایگاه داده PH2

ما مدلی را آموزش خواهیم داد تا هر خال را از پس‌زمینه آن بخش‌بندی کند.

✍️ تمرین‌ها: بخش‌بندی معنایی

دفترچه‌های زیر را باز کنید تا درباره معماری‌های مختلف بخش‌بندی معنایی بیشتر بیاموزید، با آن‌ها کار کنید و آن‌ها را در عمل مشاهده کنید.

نتیجه‌گیری

بخش‌بندی یک تکنیک بسیار قدرتمند برای طبقه‌بندی تصاویر است که از جعبه‌های محدودکننده فراتر رفته و به طبقه‌بندی در سطح پیکسل می‌پردازد. این تکنیک در تصویربرداری پزشکی و سایر کاربردها استفاده می‌شود.

🚀 چالش

بخش‌بندی بدن فقط یکی از وظایف رایج است که می‌توانیم با تصاویر افراد انجام دهیم. وظایف مهم دیگر شامل تشخیص اسکلت و تشخیص حالت است. کتابخانه OpenPose را امتحان کنید تا ببینید چگونه می‌توان از تشخیص حالت استفاده کرد.

مرور و مطالعه خودآموز

این مقاله ویکی‌پدیا نمای کلی خوبی از کاربردهای مختلف این تکنیک ارائه می‌دهد. درباره زیرشاخه‌های بخش‌بندی نمونه‌ای و بخش‌بندی پانورامیک در این حوزه تحقیق کنید.

در این آزمایشگاه، بخش‌بندی بدن انسان را با استفاده از مجموعه داده بخش‌بندی کامل بدن MADS از Kaggle امتحان کنید.