Hozirgi kunda Convolutional Neural Network ning bir nechta modellari ommaga taqdim etilgan.
Ushbu modellar juda chuqur(deep) qatlamga ega va yuqori texnik xususiyatlarga ega kompyuterlar yordamida o'qitiladi (GPU,TPU). Ushbu loyiha tarkibidagi arxitekturalar ImageNet tomonidan o'tkazilgan musobaqalarda g'alaba qozongan mashhur arxitekturalar hisoblanib, ular yordamida 1000 ta sinfga ajratuvchi classification modellarini yaratish mumkin.
Yil | Arxitektura nomi | Tavsif |
---|---|---|
2011-2012 | AlexNet | Aleks Krizhevskiy, Ilya Sutskever va Jeffri Xinton tomonidan ishlab chiqilgan konvolyutsion neyron tarmog'i (CNN) |
2013 | ZFNet | Nyu-York universitetida Metyu Zayler va Rob Fergus tomonidan ishlab chiqilgan CNN |
2014 | GoogleNet (Inception-v1) | Kristian Szegedi va uning Googledagi hamkasblari tomonidan ishlab chiqilgan CNN |
2015 | ResNet | Kaiming He va uning Microsoft Research Asiadagi hamkasblari tomonidan ishlab chiqilgan juda chuqur CNN |
2016 | ResNet | yanada chuqurroq versiya bilan (ResNet-152) |
2017 | Inception-v4 va Inception-ResNet-v2 | Kristian Szegedi va uning Googledagi hamkasblari tomonidan ishlab chiqilgan |
2018 | SENet (Squeeze and Excitation Network) | Jie Xu va uning Microsoft Research Asiadagi hamkasblari tomonidan ishlab chiqilgan |
2019 | EfficientNet | Google kompaniyasida Mingxing Tan va Quoc V. Le tomonidan ishlab chiqilgan CNN |
2020 | Big Transfer (BiT) | Google tomonidan ishlab chiqilgan modellar oilasi boʻlib, oldindan oʻrgatilgan yirik modellardan transfer oʻrganishdan foydalanadi |
2021 | ViT (Vision Transformer) | Aleksey Dosovitskiy va uning Googledagi hamkasblari tomonidan ishlab chiqilgan transformatorga asoslangan arxitektura |
tensorflow.datasets tarkibidagi oxford_flowers102 dataseti 102 sinfdan iborat. Mana shu dataset yordamida mashhur arxitekturalar sinovdan o'tkazildi. Quyida arxitekturalar haqida qisqacha ma'lumot, modelning qurilishi hamda train va test qilish natijalari haqida ma'lumot olishingiz mumkin.
VGG-19 konvolyutsion neyron tarmog'i (CNN) bo'lib, 19 ta asosiy qatlam (16 ta konvolyutsion, 3 ta to'liq ulangan), shuningdek 5 ta MaxPool qatlami va 1 ta SoftMax qatlamiga ega. U 2014 yilda Oksford universitetida ishlab chiqilgan va o'qitilgan.
VGG-19 tarmog'ini o'qitish uchun ImageNet ma'lumotlar bazasidan 1 milliondan ortiq tasvir ishlatilgan. Tabiiyki, siz ImageNetdan o'qitilgan vaznli modelni import qilishingiz mumkin. Bu oldindan tayyorlangan tarmoq 1000 tagacha obyektni tasniflashi mumkin. Tarmoq 224×224 piksel o'lchamdagi rangli tasvirlarga o'rgatilgan. O'lchami va VGG-19 ishlashi haqida qisqacha ma'lumot:
- Parametrlar soni: 143,769,342 ta
- Qatlamlarning umumiy soni: 25
VGG-19.ipynb
notebookda arxitektura oxford_flowers102 dataseti uchun moslangan va noldan qurilgan. Train va Test qilingan.
GoogLeNet - bu ko'p qatlamli chuqur konvolyutsion neyron tarmoq bo'lib, u Google tadqiqotchilari tomonidan ishlab chiqilgan Inception Network, chuqur konvolyutsion neyron tarmog'ining bir variantidir.,GoogLeNet arxitekturasi 22 qatlamdan iborat (27 qatlam, shu jumladan birlashtiruvchi qatlamlar) va bu qatlamlarning bir qismi jami 9 ta boshlang'ich moduldan iborat.
ImageNet Large-Scale Visual Recognition Challenge 2014 (ILSVRC14) da taqdim etilgan GoogLeNet arxitekturasi tasvirlarni tasniflash va obyektni aniqlash kabi kompyuterni ko'rish vazifalarini hal qildi — uning qanchalik yaxshi ishlashini ushbu maqoladan bilib olishingiz mumkin:
Bugungi kunda GoogLeNet kompyuterni ko'rishning boshqa vazifalari uchun ishlatiladi, masalan, yuzni aniqlash va tanib olish va boshqalar. GoogLeNet tarmog'ini o'qitish uchun ImageNet ma'lumotlar bazasidan 1 milliondan ortiq tasvir ishlatilgan. Tabiiyki, siz ImageNetdan o'qitilgan vaznli modelni import qilishingiz mumkin. Bu oldindan tayyorlangan tarmoq 1000 tagacha obyektni tasniflashi mumkin. Tarmoq 224×224 piksel o'lchamdagi rangli tasvirlarga o'rgatilgan. O'lchami va GoogLeNet ishlashi haqida qisqacha ma'lumot:
- Parametrlar soni: 9 804 474 ta (oxford_flowers102)
- Qatlamlarning umumiy soni: 22
GoogleNet.ipynb
notebookda arxitektura oxford_flowers102 dataseti uchun moslangan va noldan qurilgan. Train va Test qilingan.
ResNet50 2015 yilda Microsoft Research tomonidan taklif qilingan chuqur konvolyutsion neyron tarmoq arxitekturasidir. U ResNet oilasining bir qismi bo'lib, "qoldiq tarmoq" degan ma'noni anglatadi va u 50 ta qatlamga ega.
ResNet50 arxitekturasi juda chuqur neyron tarmoqlarda paydo bo'lishi mumkin bo'lgan gradientlarning yo'qolishi muammosini hal qilish uchun mo'ljallangan. U tarmoqqa ma'lum qatlamlarni o'tkazib yuborish va ma'lumotni bir qatlamdan boshqasiga to'g'ridan-to'g'ri uzatish imkonini beruvchi qoldiq ulanishlarni joriy etish orqali bunga erishadi.
ResNet50 ImageNet kabi katta ma'lumotlar to'plamlarida o'qitiladi va tasvirlarni tasniflash, ob'ektlarni aniqlash va semantik segmentatsiyani o'z ichiga olgan turli xil kompyuter ko'rish vazifalari uchun ishlatilishi mumkin. U bir nechta ko'rsatkichlar bo'yicha eng zamonaviy ko'rsatkichlarga erishdi va sanoatda ham, akademiyada ham keng qo'llaniladi.
ResNet50 arxitekturasi bir necha bosqichlardan iborat bo'lib, ularning har biri bir nechta konvolyutsion qatlamlarni o'z ichiga oladi, undan keyin ommaviy normalizatsiya qatlami va ReLU faollashtirish funktsiyasi mavjud. Tarmoq, shuningdek, yakuniy bashoratlarni ishlab chiqarish uchun oxirida o'rtacha birlashma va to'liq bog'langan qatlamlarni o'z ichiga oladi.
- Parametrlar soni: 25 738 814 ta (oxford_flowers102)
- Qatlamlarning umumiy soni: 50
ResNet.ipynb
notebookda arxitektura oxford_flowers102 dataseti uchun moslangan va noldan qurilgan. Train va Test qilingan.
DenseNet121 konvolyutsion neyron tarmoq arxitekturasi boʻlib, 2017-yilda taqdim etilgan. U DenseNet modellar oilasining bir qismi boʻlib, “Zich bogʻlangan konvolyutsion tarmoqlar” degan maʼnoni anglatadi. DenseNet121 shunday nomlanadi, chunki u 121 qatlamdan iborat.
DenseNet modellarining asosiy g'oyasi har bir qatlamni har bir boshqa qatlamga oldinga uzatish usulida ulashdir. Boshqacha qilib aytganda, har bir qatlam nafaqat oldingi qatlamdan, balki barcha oldingi qatlamlardan ham ma'lumot oladi. Bu qatlamlar orasidagi zich ulanishga olib keladi va tarmoqqa kirish ma'lumotlaridan ko'proq xususiyatlarni olish imkonini beradi.
DenseNet121 turli filtr o'lchamlariga ega bo'lgan konvolyutsion qatlamlar to'plamidan iborat bo'lib, undan keyin qatlamlarni normallashtirish va faollashtirish funksiyalari mavjud. Har bir qatlam oldingi barcha qatlamlarga zich ulanishlar orqali ulanadi. Tarmoq global o'rtacha birlashtiruvchi qatlam bilan tugaydi, undan keyin tasniflash bashoratlarini chiqaradigan to'liq bog'langan qatlam.
DenseNet121 tasvirni tasniflash, ob'ektlarni aniqlash va semantik segmentatsiyani o'z ichiga olgan kompyuter ko'rish vazifalarining keng doirasi uchun ishlatilgan. U bir nechta ko'rsatkichlar bo'yicha eng so'nggi ko'rsatkichlarga erishdi va xotiradan foydalanish va hisoblash vaqti nuqtai nazaridan o'zining samaradorligi bilan mashhur.
- Parametrlar soni: 7 147 942 ta (oxford_flowers102)
- Qatlamlarning umumiy soni: 121
DenseNet.ipynb
notebookda arxitektura oxford_flowers102 dataseti uchun moslangan va noldan qurilgan. Train va Test qilingan.