A. 如何通過人工神經網路實現圖像識別
人工神經網路(Artificial Neural Networks)(簡稱ANN)系統從20 世紀40 年代末誕生至今僅短短半個多世紀,但由於他具有信息的分布存儲、並行處理以及自學習能力等優點,已經在信息處理、模式識別、智能控制及系統建模等領域得到越來越廣泛的應用。尤其是基於誤差反向傳播(Error Back Propagation)演算法的多層前饋網路(Multiple-Layer Feedforward Network)(簡稱BP 網路),可以以任意精度逼近任意的連續函數,所以廣泛應用於非線性建模、函數逼近、模式分類等方面。
目標識別是模式識別領域的一項傳統的課題,這是因為目標識別不是一個孤立的問題,而是模式識別領域中大多數課題都會遇到的基本問題,並且在不同的課題中,由於具體的條件不同,解決的方法也不盡相同,因而目標識別的研究仍具有理論和實踐意義。這里討論的是將要識別的目標物體用成像頭(紅外或可見光等)攝入後形成的圖像信號序列送入計算機,用神經網路識別圖像的問題。
一、BP 神經網路
BP 網路是採用Widrow-Hoff 學習演算法和非線性可微轉移函數的多層網路。一個典型的BP 網路採用的是梯度下降演算法,也就是Widrow-Hoff 演算法所規定的。backpropagation 就是指的為非線性多層網路計算梯度的方法。一個典型的BP 網路結構如圖所示。
六、總結
從上述的試驗中已經可以看出,採用神經網路識別是切實可行的,給出的例子只是簡單的數字識別實驗,要想在網路模式下識別復雜的目標圖像則需要降低網路規模,增加識別能力,原理是一樣的。
B. 深度神經網路具體的工作流程是什麼樣的
所謂神經網路演算法,就是對人類學習能力的一種模擬演算法。理論認為人的認知模式,處事方式是存儲在神經元與神經元之間的連接上的,稱為「神經元連接權重」,人腦神經布局類似網狀結構,神經元是網的交叉點,權重就是網的連線,這些連線有粗有細,也就是權重的大小不同。而人類的學習能力就是去不斷改變權重的值,從而改變自己的認知模式和處事方式,簡單的說,不同人對同一個外部事物有不同看法,就是因為同樣的初始信號,在不同粗細的神經元連線放大或縮小後,變成了側重點不同的最終信號。最開始的「感知機"只用了2層神經元,即輸入層和輸出層,發現很多問題無法模擬,最著名的就是「異或」問題。 後來聰明的人在輸入層和輸出層之間加了一層神經元叫做隱藏層,3層的神經網路已經可以模擬二維上的任意函數曲線。只不過此時對「連接權重」的訓練過程就變得非常復雜,通常使用一種叫「誤差反傳」的計算方法。參考人腦,人腦大概有億級層數的神經元(當然,人腦是多任務處理器集合,某些特定的任務如人臉識別,只需用到大腦的某個局部)。於是人們會猜想,更多的隱藏層是否會有更高的學習效果。事實證明的確如此,隨著隱藏層數的增加,一些圖片,語音的識別率越來越高。因此,就有了深度神經網路這一概念。但隱藏層數越多訓練過程也越復雜,且誤差會在多層傳遞的時候衰減,導致GradientVanish問題,最終導致訓練結果收斂在局部最優或者難以收斂。後來又有聰明的人不斷改進誤差訓練演算法,神經網路的層數深度越來越大,現在最NB的是微軟的「殘差神經網路」,已經將隱藏層提高至152層。
C. 神經網路如何識別和編碼性別
神經網路模擬人腦中的神經元,神經元相互連接。每個神經元接收數據,並將判斷過程中產生的信號傳輸到下一個神經元,該神經元逐層傳輸,最終達到識別的目的,與其他模型不同,神經網路很像模糊統計預測模型。由於這一特點,其適應性非常強。只要有充足的數據和充足的神經元,就可以實現識別,決策,預測等功能。
其實人工神經網路他是一種簡單的數學模型,它將類似於大腦神經突觸連接的結構應用於信息處理。因為在工程和學術界裡面,它也經常被直接稱為神經網路或准神經網路。神經網路是一種操作模型,它由大量的節點或神經元及其相互連接組成,每個節點代表一個稱為激勵函數的特定輸出函數。