售前電話
135-3656-7657
售前電話 : 135-3656-7657
近年來(lái),計(jì)算機(jī)視覺(jué)領(lǐng)域的優(yōu)秀算法層出不窮,以下?lián)褚?jiǎn)介研究使用的一些模型。
(1)VGG
2014年,牛津大學(xué)計(jì)算機(jī)視覺(jué)組和谷歌公司的研究員聯(lián)合研發(fā)出一種新的深度卷積神經(jīng)網(wǎng)絡(luò),即VGGNet,并獲得當(dāng)年ILSVRC分類比賽的亞軍。VGGNet分為VGG16和VGG19:VGG16通過(guò)13層3×3的卷積網(wǎng)絡(luò)和3層全連接網(wǎng)絡(luò)構(gòu)建,VGG19則通過(guò)16層3×3的卷積網(wǎng)絡(luò)和3層全連接網(wǎng)絡(luò)構(gòu)建。VGG19被廣泛應(yīng)用于不同行業(yè)的圖像特征提取領(lǐng)域。
(2)Resnet
深度殘差網(wǎng)絡(luò)(Residual Network, ResNet)是過(guò)去幾年中計(jì)算機(jī)視覺(jué)領(lǐng)域頗具開(kāi)創(chuàng)性的工作。因其強(qiáng)大的表征能力,除圖像分類以外,包括目標(biāo)檢測(cè)和人臉識(shí)別在內(nèi)的許多計(jì)算機(jī)視覺(jué)應(yīng)用都得到了性能提升。ResNet101是其中的一種網(wǎng)絡(luò)堆疊方式,101層網(wǎng)絡(luò)指齊總的卷積或全連接層數(shù)目。
(3)SIFT
尺度不變特征轉(zhuǎn)換(Scale-invariant feature transform,SIFT)是一種用來(lái)偵測(cè)與描述影像局部性特征的重要算法,由 David Lowe在1999年所發(fā)表,并于2004年總結(jié)完善。SIFT算法主要用于處理兩幅圖像之間發(fā)生平移、旋轉(zhuǎn)、仿射變換情況下的匹配問(wèn)題。
(4)Mask R-CNN
Mask R-CNN是華人學(xué)者何愷明提出的一種簡(jiǎn)潔、靈活的圖像實(shí)例分割框架,用于判斷圖像中不同目標(biāo)的類別和位置,并可做出像素級(jí)預(yù)測(cè)。該算法不僅能夠有效地檢測(cè)圖像中的目標(biāo),而且還能為每個(gè)實(shí)例生成一個(gè)高質(zhì)量的分割掩碼。