Skip to content

Latest commit

 

History

History
68 lines (36 loc) · 11.3 KB

File metadata and controls

68 lines (36 loc) · 11.3 KB

ప్రసిద్ధి చెందిన CNN నిర్మాణాలు

VGG-16

VGG-16 అనేది 2014లో ImageNet టాప్-5 వర్గీకరణలో 92.7% ఖచ్చితత్వాన్ని సాధించిన నెట్‌వర్క్. దీని లేయర్ నిర్మాణం ఈ విధంగా ఉంది:

ImageNet Layers

మీరు చూడగలిగినట్లుగా, VGG సంప్రదాయమైన పిరమిడ్ నిర్మాణాన్ని అనుసరిస్తుంది, ఇది కన్‌వల్యూషన్-పూలింగ్ లేయర్ల శ్రేణి.

ImageNet Pyramid

చిత్రం Researchgate నుండి

ResNet

ResNet అనేది 2015లో Microsoft Research ప్రతిపాదించిన మోడల్స్ కుటుంబం. ResNet యొక్క ప్రధాన ఆలోచన రెసిడ్యువల్ బ్లాక్స్ ఉపయోగించడం:

చిత్రం ఈ పేపర్ నుండి

ఐడెంటిటీ పాస్-త్రూ ఉపయోగించే కారణం, మన లేయర్ గత లేయర్ ఫలితం మరియు రెసిడ్యువల్ బ్లాక్ అవుట్పుట్ మధ్య తేడాను అంచనా వేయడం - అందుకే దీనికి రెసిడ్యువల్ అనే పేరు. ఆ బ్లాక్స్ శిక్షణకు చాలా సులభం, మరియు వందల సంఖ్యలో బ్లాక్స్ కలిగిన నెట్‌వర్క్‌లను నిర్మించవచ్చు (సాధారణ వేరియంట్లు ResNet-52, ResNet-101, ResNet-152).

ఈ నెట్‌వర్క్‌ను డేటాసెట్‌కు అనుగుణంగా తన సంక్లిష్టతను సర్దుబాటు చేసుకునేలా కూడా భావించవచ్చు. మొదట శిక్షణ ప్రారంభంలో, వెయిట్లు చిన్నవిగా ఉంటాయి, మరియు ఎక్కువ భాగం సిగ్నల్ ఐడెంటిటీ లేయర్ల ద్వారా వెళుతుంది. శిక్షణ కొనసాగుతుండగా వెయిట్లు పెరిగి, నెట్‌వర్క్ పరామితుల ప్రాముఖ్యత పెరుగుతుంది, తద్వారా నెట్‌వర్క్ అవసరమైన వ్యక్తీకరణ శక్తిని సరిగ్గా వర్గీకరించడానికి సర్దుబాటు అవుతుంది.

Google Inception

Google Inception నిర్మాణం ఈ ఆలోచనను మరింత ముందుకు తీసుకెళ్తుంది, ప్రతి నెట్‌వర్క్ లేయర్‌ను అనేక మార్గాల సమ్మేళనంగా నిర్మిస్తుంది:

చిత్రం Researchgate నుండి

ఇక్కడ, 1x1 కన్‌వల్యూషన్స్ పాత్రను ప్రత్యేకంగా గుర్తించాలి, ఎందుకంటే మొదట అవి అర్థం కాకపోవచ్చు. 1x1 ఫిల్టర్‌తో ఇమేజ్‌ను ఎందుకు స్కాన్ చేయాలి? అయితే, కన్‌వల్యూషన్ ఫిల్టర్లు అనేక డెప్త్ ఛానల్స్‌తో పనిచేస్తాయని గుర్తుంచుకోవాలి (మూలంగా - RGB రంగులు, తరువాతి లేయర్లలో - వివిధ ఫిల్టర్ల ఛానల్స్), 1x1 కన్‌వల్యూషన్ ఆ ఇన్‌పుట్ ఛానల్స్‌ను వేర్వేరు శిక్షణీయ వెయిట్లతో కలిపేందుకు ఉపయోగిస్తారు. దీన్ని ఛానల్ డైమెన్షన్‌పై డౌన్‌సాంప్లింగ్ (పూలింగ్)గా కూడా చూడవచ్చు.

ఇది గురించి ఒక మంచి బ్లాగ్ పోస్ట్ మరియు మూల పేపర్ ఉన్నాయి.

MobileNet

MobileNet అనేది చిన్న పరిమాణం కలిగిన, మొబైల్ పరికరాలకు అనుకూలమైన మోడల్స్ కుటుంబం. మీరు వనరులు తక్కువగా ఉన్నప్పుడు, కొంత ఖచ్చితత్వం త్యాగం చేసుకోవడానికి వీటిని ఉపయోగించవచ్చు. వీటి వెనుక ప్రధాన ఆలోచన డెప్త్‌వైజ్ సెపరబుల్ కన్‌వల్యూషన్, ఇది కన్‌వల్యూషన్ ఫిల్టర్లను స్థల కన్‌వల్యూషన్స్ మరియు డెప్త్ ఛానల్స్‌పై 1x1 కన్‌వల్యూషన్ సమ్మేళనంగా ప్రదర్శించడానికి అనుమతిస్తుంది. ఇది పరామితుల సంఖ్యను గణనీయంగా తగ్గించి, నెట్‌వర్క్ పరిమాణాన్ని చిన్నదిగా చేస్తుంది, అలాగే తక్కువ డేటాతో శిక్షణ సులభం చేస్తుంది.

MobileNet గురించి ఒక మంచి బ్లాగ్ పోస్ట్ ఇక్కడ ఉంది.

ముగింపు

ఈ యూనిట్‌లో, మీరు కంప్యూటర్ విజన్ న్యూరల్ నెట్‌వర్క్స్ వెనుక ఉన్న ప్రధాన భావన - కన్‌వల్యూషనల్ నెట్‌వర్క్స్ గురించి నేర్చుకున్నారు. చిత్ర వర్గీకరణ, ఆబ్జెక్ట్ డిటెక్షన్, మరియు ఇమేజ్ జనరేషన్ నెట్‌వర్క్స్ అన్నీ CNNలపై ఆధారపడి ఉంటాయి, కేవలం ఎక్కువ లేయర్లు మరియు కొన్ని అదనపు శిక్షణ చిట్కాలతో.

🚀 సవాలు

సహాయక నోటుబుక్స్‌లో, ఎక్కువ ఖచ్చితత్వం సాధించడానికి సూచనలు చివరలో ఉన్నాయి. మీరు ప్రయోగాలు చేసి మరింత ఖచ్చితత్వం సాధించగలరా చూడండి.

సమీక్ష & స్వీయ అధ్యయనం

CNNలు సాధారణంగా కంప్యూటర్ విజన్ పనుల కోసం ఉపయోగిస్తారు, కానీ అవి స్థిర పరిమాణపు నమూనాలను వెలికి తీయడంలో మంచి పనితీరు చూపిస్తాయి. ఉదాహరణకు, మనం శబ్దాలతో పని చేస్తే, ఆడియో సిగ్నల్‌లో కొన్ని నిర్దిష్ట నమూనాలను కనుగొనడానికి CNNలను ఉపయోగించవచ్చు - ఈ సందర్భంలో ఫిల్టర్లు 1-డైమెన్షనల్ (1D-CNN) అవుతాయి. అలాగే, కొన్ని సందర్భాల్లో 3D-CNN ఉపయోగించి బహుమితీయ స్థలంలో ఫీచర్లను వెలికి తీయవచ్చు, ఉదాహరణకు వీడియోలో జరిగే కొన్ని సంఘటనలు - CNN సమయానుగుణంగా ఫీచర్ మార్పుల నమూనాలను పట్టుకోవచ్చు. CNNలతో చేయగల ఇతర పనుల గురించి సమీక్ష మరియు స్వీయ అధ్యయనం చేయండి.

ఈ ల్యాబ్‌లో, మీరు వివిధ పిల్లి మరియు కుక్క జాతులను వర్గీకరించాల్సి ఉంటుంది. ఈ చిత్రాలు MNIST డేటాసెట్ కంటే క్లిష్టమైనవి మరియు పెద్ద పరిమాణంలో ఉంటాయి, అలాగే 10 కంటే ఎక్కువ తరగతులు ఉన్నాయి.


అస్పష్టత:
ఈ పత్రాన్ని AI అనువాద సేవ Co-op Translator ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.