AI for Beginners Curriculum ലെ ലാബ് അസൈൻമെന്റ്.
വീഡിയോ നിരീക്ഷണ ക്യാമറ സ്ട്രീമിൽ ആളുകളുടെ എണ്ണം എണ്ണുക എന്നത് ഒരു പ്രധാന ടാസ്കാണ്, ഇത് കടകളിലെ സന്ദർശകരുടെ എണ്ണം, റെസ്റ്റോറന്റിലെ തിരക്കുള്ള സമയങ്ങൾ എന്നിവ കണക്കാക്കാൻ സഹായിക്കും. ഈ ടാസ്ക് പരിഹരിക്കാൻ, വ്യത്യസ്ത കോണുകളിൽ നിന്നുള്ള മനുഷ്യ തലകൾ കണ്ടെത്താൻ കഴിയണം. മനുഷ്യ തലകൾ കണ്ടെത്താൻ ഒബ്ജക്റ്റ് ഡിറ്റക്ഷൻ മോഡൽ പരിശീലിപ്പിക്കാൻ, ഹോളിവുഡ് ഹെഡ്സ് ഡാറ്റാസെറ്റ് ഉപയോഗിക്കാം.
ഹോളിവുഡ് ഹെഡ്സ് ഡാറ്റാസെറ്റ് 224,740 ഹോളിവുഡ് സിനിമാ ഫ്രെയിമുകളിൽ 369,846 മനുഷ്യ തലകൾ അനോട്ടേറ്റ് ചെയ്തിരിക്കുന്നു. ഇത് [https://host.robots.ox.ac.uk/pascal/VOC/](../../../../../../lessons/4-ComputerVision/11-ObjectDetection/lab/PASCAL VOC) ഫോർമാറ്റിൽ ലഭ്യമാണ്, ഓരോ ചിത്രത്തിനും അനുബന്ധമായ ഒരു XML വിവരണ ഫയൽ ഇതുപോലെയാണ്:
<annotation>
<folder>HollywoodHeads</folder>
<filename>mov_021_149390.jpeg</filename>
<source>
<database>HollywoodHeads 2015 Database</database>
<annotation>HollywoodHeads 2015</annotation>
<image>WILLOW</image>
</source>
<size>
<width>608</width>
<height>320</height>
<depth>3</depth>
</size>
<segmented>0</segmented>
<object>
<name>head</name>
<bndbox>
<xmin>201</xmin>
<ymin>1</ymin>
<xmax>480</xmax>
<ymax>263</ymax>
</bndbox>
<difficult>0</difficult>
</object>
<object>
<name>head</name>
<bndbox>
<xmin>3</xmin>
<ymin>4</ymin>
<xmax>241</xmax>
<ymax>285</ymax>
</bndbox>
<difficult>0</difficult>
</object>
</annotation>ഈ ഡാറ്റാസെറ്റിൽ, ഒറ്റ ക്ലാസ് മാത്രമേ ഉള്ളൂ, അതായത് head, ഓരോ തലത്തിനും ബൗണ്ടിംഗ് ബോക്സിന്റെ കോർഡിനേറ്റുകൾ ലഭ്യമാണ്. XML പാഴ്സുചെയ്യാൻ Python ലൈബ്രറികൾ ഉപയോഗിക്കാം, അല്ലെങ്കിൽ PASCAL VOC ഫോർമാറ്റ് നേരിട്ട് കൈകാര്യം ചെയ്യാൻ ഈ ലൈബ്രറി ഉപയോഗിക്കാം.
താഴെപ്പറയുന്ന വഴികളിൽ ഏതെങ്കിലും ഒരു വഴി ഉപയോഗിച്ച് ഒബ്ജക്റ്റ് ഡിറ്റക്ഷൻ മോഡൽ പരിശീലിപ്പിക്കാം:
- Azure Custom Vision ഉപയോഗിച്ച് Python API വഴി ക്ലൗഡിൽ പ്രോഗ്രാമാറ്റിക്കായി മോഡൽ പരിശീലിപ്പിക്കുക. Custom Vision മോഡൽ പരിശീലനത്തിന് കുറച്ച് നൂറു ചിത്രങ്ങൾക്കു മുകളിൽ ഉപയോഗിക്കാൻ കഴിയില്ല, അതിനാൽ ഡാറ്റാസെറ്റ് പരിധി കുറയ്ക്കേണ്ടിവരും.
- Keras ട്യൂട്ടോറിയൽ ൽ നിന്നുള്ള ഉദാഹരണം ഉപയോഗിച്ച് RetinaNet മോഡൽ പരിശീലിപ്പിക്കുക.
- torchvision ൽ ഉള്ള torchvision.models.detection.RetinaNet ബിൽറ്റ്-ഇൻ മോഡ്യൂൾ ഉപയോഗിക്കുക.
ഒബ്ജക്റ്റ് ഡിറ്റക്ഷൻ വ്യവസായത്തിൽ ആവശ്യമുള്ള ഒരു ടാസ്കാണ്. Azure Custom Vision പോലുള്ള സേവനങ്ങൾ ഉപയോഗിച്ച് ഒബ്ജക്റ്റ് ഡിറ്റക്ഷൻ നടത്താൻ കഴിയുന്നുണ്ടെങ്കിലും, ഒബ്ജക്റ്റ് ഡിറ്റക്ഷൻ എങ്ങനെ പ്രവർത്തിക്കുന്നു എന്ന് മനസ്സിലാക്കുകയും സ്വന്തം മോഡലുകൾ പരിശീലിപ്പിക്കാൻ കഴിയുകയും ചെയ്യുന്നത് വളരെ പ്രധാനമാണ്.
അസൂയാ:
ഈ രേഖ AI വിവർത്തന സേവനം Co-op Translator ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. നാം കൃത്യതയ്ക്ക് ശ്രമിച്ചെങ്കിലും, സ്വയം പ്രവർത്തിക്കുന്ന വിവർത്തനങ്ങളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്ന് ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കണം. നിർണായക വിവരങ്ങൾക്ക്, പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിക്കുന്നതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിദ്ധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.