பிரபலமான CNN கட்டமைப்புகள்

VGG-16

VGG-16 என்பது 2014 ஆம் ஆண்டில் ImageNet top-5 வகைப்படுத்தலில் 92.7% துல்லியத்தை அடைந்த ஒரு நெட்வொர்க் ஆகும். இதன் அடுக்குகளின் அமைப்பு பின்வருமாறு உள்ளது:

நீங்கள் காணும் படி, VGG ஒரு பாரம்பரிய பyramிட் கட்டமைப்பை பின்பற்றுகிறது, இது கான்வல்யூஷன்-பூலிங் அடுக்குகளின் வரிசையாகும்.

Researchgate இல் இருந்து படம்

ResNet

ResNet என்பது 2015 ஆம் ஆண்டில் Microsoft Research மூலம் முன்மொழியப்பட்ட மாடல்களின் குடும்பமாகும். ResNet இன் முக்கிய யோசனை மீதமுள்ள பிளாக்குகளை பயன்படுத்துவது:

இந்தக் கட்டுரையில் இருந்து படம்

Identity pass-through ஐ பயன்படுத்துவதற்கான காரணம், முந்தைய அடுக்கின் முடிவுக்கும் மீதமுள்ள பிளாக்கின் வெளியீட்டுக்கும் இடையிலான வேறுபாட்டை எங்கள் அடுக்கு கணிக்க அனுமதிக்க வேண்டும் - அதனால் மீதமுள்ள என்ற பெயர் வந்தது. இந்த பிளாக்குகளை பயிற்சி செய்ய மிகவும் எளிதாக இருக்கும், மேலும் பல நூற்றுக்கணக்கான பிளாக்குகளுடன் நெட்வொர்க்குகளை உருவாக்கலாம் (அதிகமாகப் பயன்படுத்தப்படும் மாறுபாடுகள் ResNet-52, ResNet-101 மற்றும் ResNet-152).

இந்த நெட்வொர்க்கை dataset இன் சிக்கல்களை சரிசெய்யும் திறன் கொண்டதாகவும் நீங்கள் கருதலாம். ஆரம்பத்தில், நெட்வொர்க்கை பயிற்சி செய்ய தொடங்கும்போது, எடை மதிப்புகள் சிறியதாக இருக்கும், மேலும் பெரும்பாலான சிக்னல் passthrough identity அடுக்குகள் வழியாக செல்கிறது. பயிற்சி முன்னேறும்போது எடைகள் அதிகமாகி, நெட்வொர்க்கின் அளவுருக்கள் முக்கியத்துவம் பெறுகிறது, மேலும் நெட்வொர்க்குகள் பயிற்சி படங்களின் சரியான வகைப்படுத்தலுக்கான தேவையான வெளிப்பாட்டுத் திறனை சரிசெய்யும்.

Google Inception

Google Inception கட்டமைப்பு இந்த யோசனையை மேலும் ஒரு படி முன்னேற்றுகிறது, மேலும் ஒவ்வொரு நெட்வொர்க் அடுக்கையும் பல்வேறு பாதைகளின் கலவையாக உருவாக்குகிறது:

Researchgate இல் இருந்து படம்

இங்கு, 1x1 கான்வல்யூஷன்களின் பங்கு முக்கியத்துவம் பெறுகிறது, ஏனெனில் முதலில் அவை பொருத்தமாகத் தோன்றாது. 1x1 ஃபில்டரைப் பயன்படுத்தி படத்தை எதற்காகச் சுழற்சிக்க வேண்டும்? எனினும், கான்வல்யூஷன் ஃபில்டர்கள் பல ஆழக் சேனல்களுடன் வேலை செய்கின்றன (முதலில் - RGB நிறங்கள், பின்னர் - வெவ்வேறு ஃபில்டர்களுக்கான சேனல்கள்), மேலும் 1x1 கான்வல்யூஷன் இந்த உள்ளீட்டு சேனல்களை வெவ்வேறு பயிற்சி செய்யக்கூடிய எடைகளைப் பயன்படுத்தி ஒன்றாகக் கலக்க பயன்படுத்தப்படுகிறது. இது சேனல் பரிமாணத்தில் குறைக்க (pooling) பார்க்கப்படலாம்.

இதில் ஒரு நல்ல வலைப்பதிவு மற்றும் அசல் கட்டுரை உள்ளது.

MobileNet

MobileNet என்பது குறைந்த அளவுடைய மாடல்களின் குடும்பமாகும், இது மொபைல் சாதனங்களுக்கு ஏற்றது. நீங்கள் வளங்கள் குறைவாக இருந்தால், மேலும் சிறிது துல்லியத்தை தியாகம் செய்ய தயாராக இருந்தால், அவற்றைப் பயன்படுத்தவும். இதன் முக்கிய யோசனை depthwise separable convolution ஆகும், இது கான்வல்யூஷன் ஃபில்டர்களை இடைவெளி கான்வல்யூஷன்கள் மற்றும் ஆழ சேனல்களில் 1x1 கான்வல்யூஷன் ஆகியவற்றின் கலவையாகக் குறிக்க அனுமதிக்கிறது. இது அளவுருக்களின் எண்ணிக்கையை குறிப்பிடத்தக்க அளவில் குறைக்கிறது, நெட்வொர்க்கை அளவில் சிறியதாகவும், குறைந்த தரவுடன் பயிற்சி செய்ய எளிதாகவும் ஆக்குகிறது.

இதில் MobileNet பற்றிய ஒரு நல்ல வலைப்பதிவு உள்ளது.

முடிவு

இந்த அலகில், கணினி பார்வை நரம்பியல் நெட்வொர்க்குகளின் முக்கிய கருத்தை நீங்கள் கற்றுக்கொண்டீர்கள் - கான்வல்யூஷனல் நெட்வொர்க்குகள். பட வகைப்படுத்தல், பொருள் கண்டறிதல், மற்றும் பட உருவாக்க நெட்வொர்க்குகளை இயக்கும் உண்மையான வாழ்க்கை கட்டமைப்புகள் அனைத்தும் CNNக்களை அடிப்படையாகக் கொண்டவை, மேலும் சில கூடுதல் பயிற்சி யுக்திகளுடன்.

🚀 சவால்

இணைக்கப்பட்ட நோட்புக்குகளில், அதிக துல்லியத்தைப் பெறுவது எப்படி என்பதைப் பற்றிய குறிப்புகள் கீழே உள்ளன. அதிக துல்லியத்தை அடைய நீங்கள் சில பரிசோதனைகளைச் செய்யுங்கள்.

பாடத்திற்குப் பிந்தைய வினாடி வினா

மதிப்பீடு & சுயபயிற்சி

CNNக்கள் பெரும்பாலும் கணினி பார்வை பணிகளுக்கு பயன்படுத்தப்படுகின்றன, அவை பொதுவாக நிலையான அளவுடைய முறைமைகளை எடுக்க சிறந்தவை. உதாரணமாக, நாம் ஒலிகளுடன் வேலை செய்கிறோம் என்றால், ஒலிச் சிக்னலில் சில குறிப்பிட்ட முறைமைகளைத் தேடவும் CNNக்களைப் பயன்படுத்த விரும்பலாம் - அந்தச் சூழலில் ஃபில்டர்கள் 1-பரிமாணமாக இருக்கும் (இந்த CNN 1D-CNN என்று அழைக்கப்படும்). மேலும், சில நேரங்களில் 3D-CNN பல பரிமாண இடத்தில் அம்சங்களை எடுக்க பயன்படுத்தப்படுகிறது, உதாரணமாக வீடியோவில் நிகழும் சில நிகழ்வுகள் - CNN நேரத்தின் போது அம்சங்கள் மாறும் சில முறைமைகளைப் பிடிக்க முடியும். CNNக்களால் செய்யக்கூடிய பிற பணிகளைப் பற்றி மதிப்பீடு மற்றும் சுயபயிற்சி செய்யுங்கள்.

பணி

இந்த ஆய்வகத்தில், நீங்கள் வெவ்வேறு பூனைகள் மற்றும் நாய் இனங்களை வகைப்படுத்த பணியமர்த்தப்படுகிறீர்கள். இந்த படங்கள் MNIST dataset ஐ விட சிக்கலானவை மற்றும் அதிக பரிமாணங்களைக் கொண்டவை, மேலும் 10 க்கும் மேற்பட்ட வகைகள் உள்ளன.

அறிவிப்பு:
இந்த ஆவணம் Co-op Translator என்ற AI மொழிபெயர்ப்பு சேவையை பயன்படுத்தி மொழிபெயர்க்கப்பட்டுள்ளது. நாங்கள் துல்லியத்திற்காக முயற்சிக்கிறோம், ஆனால் தானியங்கி மொழிபெயர்ப்புகளில் பிழைகள் அல்லது தவறுகள் இருக்கக்கூடும் என்பதை கவனத்தில் கொள்ளவும். அதன் சொந்த மொழியில் உள்ள மூல ஆவணம் அதிகாரப்பூர்வ ஆதாரமாக கருதப்பட வேண்டும். முக்கியமான தகவல்களுக்கு, தொழில்முறை மனித மொழிபெயர்ப்பு பரிந்துரைக்கப்படுகிறது. இந்த மொழிபெயர்ப்பைப் பயன்படுத்துவதால் ஏற்படும் எந்த தவறான புரிதல்களுக்கும் அல்லது தவறான விளக்கங்களுக்கும் நாங்கள் பொறுப்பல்ல.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

பிரபலமான CNN கட்டமைப்புகள்

VGG-16

ResNet

Google Inception

MobileNet

முடிவு

🚀 சவால்

பாடத்திற்குப் பிந்தைய வினாடி வினா

மதிப்பீடு & சுயபயிற்சி

பணி

FilesExpand file tree

CNN_Architectures.md

Latest commit

History

CNN_Architectures.md

File metadata and controls

பிரபலமான CNN கட்டமைப்புகள்

VGG-16

ResNet

Google Inception

MobileNet

முடிவு

🚀 சவால்

பாடத்திற்குப் பிந்தைய வினாடி வினா

மதிப்பீடு & சுயபயிற்சி

பணி