تشخیص سر با استفاده از مجموعه داده Hollywood Heads

تمرین آزمایشگاهی از برنامه درسی AI for Beginners.

وظیفه

شمارش تعداد افراد در جریان دوربین نظارتی یک وظیفه مهم است که به ما امکان می‌دهد تعداد بازدیدکنندگان در فروشگاه‌ها، ساعات شلوغی در رستوران‌ها و غیره را تخمین بزنیم. برای حل این وظیفه، باید بتوانیم سر انسان را از زوایای مختلف تشخیص دهیم. برای آموزش مدل تشخیص اشیا برای تشخیص سر انسان، می‌توانیم از مجموعه داده Hollywood Heads استفاده کنیم.

مجموعه داده

مجموعه داده Hollywood Heads شامل 369,846 سر انسان است که در 224,740 فریم فیلم‌های هالیوودی علامت‌گذاری شده‌اند. این مجموعه داده در قالب PASCAL VOC ارائه شده است، که برای هر تصویر یک فایل توضیحات XML نیز وجود دارد که به این شکل است:

<annotation>
	<folder>HollywoodHeads</folder>
	<filename>mov_021_149390.jpeg</filename>
	<source>
		<database>HollywoodHeads 2015 Database</database>
		<annotation>HollywoodHeads 2015</annotation>
		<image>WILLOW</image>
	</source>
	<size>
		<width>608</width>
		<height>320</height>
		<depth>3</depth>
	</size>
	<segmented>0</segmented>
	<object>
		<name>head</name>
		<bndbox>
			<xmin>201</xmin>
			<ymin>1</ymin>
			<xmax>480</xmax>
			<ymax>263</ymax>
		</bndbox>
		<difficult>0</difficult>
	</object>
	<object>
		<name>head</name>
		<bndbox>
			<xmin>3</xmin>
			<ymin>4</ymin>
			<xmax>241</xmax>
			<ymax>285</ymax>
		</bndbox>
		<difficult>0</difficult>
	</object>
</annotation>

در این مجموعه داده، فقط یک کلاس از اشیا وجود دارد head، و برای هر سر، مختصات جعبه محدودکننده ارائه می‌شود. شما می‌توانید فایل‌های XML را با استفاده از کتابخانه‌های پایتون تجزیه کنید، یا از این کتابخانه برای کار مستقیم با قالب PASCAL VOC استفاده کنید.

آموزش مدل تشخیص اشیا

شما می‌توانید مدل تشخیص اشیا را به یکی از روش‌های زیر آموزش دهید:

استفاده از Azure Custom Vision و API پایتون آن برای آموزش مدل به صورت برنامه‌ریزی شده در فضای ابری. Custom Vision نمی‌تواند از بیش از چند صد تصویر برای آموزش مدل استفاده کند، بنابراین ممکن است نیاز باشد مجموعه داده را محدود کنید.
استفاده از مثال موجود در آموزش Keras برای آموزش مدل RetunaNet.
استفاده از ماژول داخلی torchvision.models.detection.RetinaNet در torchvision.

نتیجه‌گیری

تشخیص اشیا یک وظیفه است که اغلب در صنعت مورد نیاز است. در حالی که برخی خدمات وجود دارند که می‌توانند برای انجام تشخیص اشیا استفاده شوند (مانند Azure Custom Vision)، مهم است که درک کنید چگونه تشخیص اشیا کار می‌کند و بتوانید مدل‌های خود را آموزش دهید.

سلب مسئولیت:
این سند با استفاده از سرویس ترجمه هوش مصنوعی Co-op Translator ترجمه شده است. در حالی که ما تلاش می‌کنیم دقت را حفظ کنیم، لطفاً توجه داشته باشید که ترجمه‌های خودکار ممکن است حاوی خطاها یا نادرستی‌هایی باشند. سند اصلی به زبان اصلی آن باید به عنوان منبع معتبر در نظر گرفته شود. برای اطلاعات حساس، ترجمه حرفه‌ای انسانی توصیه می‌شود. ما هیچ مسئولیتی در قبال سوءتفاهم‌ها یا تفسیرهای نادرست ناشی از استفاده از این ترجمه نداریم.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

تشخیص سر با استفاده از مجموعه داده Hollywood Heads

وظیفه

مجموعه داده

آموزش مدل تشخیص اشیا

نتیجه‌گیری

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

تشخیص سر با استفاده از مجموعه داده Hollywood Heads

وظیفه

مجموعه داده

آموزش مدل تشخیص اشیا

نتیجه‌گیری