① 【神經網路原理】神經網路結構 & 符號約定
神經元模型的符號約定:輸入: ,權重(weight): ,偏置(bias): ,未激活值: ,激活輸出值:
神經元可用於解決部分二分類問題 ——當有一個類別未知的 輸入感知機,若 輸出值a = 1時,感知機被激活 ,代表 x 屬於第一類;若 輸出值a = 0時,感知機未激活 ,則代表 x 屬於第二類。而對於sigmoid神經元,若輸出值a ≥ 0.5時,代表 x 屬於第一類,否則為第二類。
不難看出,感知機可以輕松實現「與非」邏輯,而與非邏輯可以組合成其他任意的邏輯,但對於一些過於復雜的問題,我們難以寫出其背後地邏輯結構。 這時候神經網路就能大顯身手 :它可以自適應的學習規律,調節網路地權重和偏置等參數,我們只需要用大量的數據對其正確地訓練,即可得到我們想要的效果!
那有一個很有意思的問題:相比於階躍函數,為什麼我們在神經網路中更願意採用sigmoid函數作為激活函數呢?
首先,由於感知機的激活函數為階躍函數(在0處突變),權重的一個小的變化就可能導致輸出值的突變,而如果將激活函數替換為sigmoid函數,輸出值的變化就能發生相應的小的變化,有利於網路學習;另外,由於採用二次代價函數作為損失函數時,利用BP演算法求梯度值需要對沖激函數求導,sigmoid函數正好時連續可導的,而且導數很好求。
為了便於理解,先畫一個三層的全連接神經網路示意圖,激活函數都選用sigmoid函數。 全連接神經網路 指除輸出層外,每一個神經元都與下一層中的各神經元相連接。網路的第一層為 輸入層 ,最後一層為 輸出層 ,中間的所有層統稱為 隱藏層 。其中,輸入層的神經元比較特殊,不含偏置 ,也沒有激活函數 。
神經網路結構的符號約定 : 代表第 層的第 個神經元與第 層的第 個神經元連線上的權重; 代表第 層與第 層之間的所有權重 構成的權重矩陣。 分別代表第 層的第 個神經元對應的偏置、未激活值、激活值; 則分別代表第 層的所有偏置組成的列向量、所有未激活值組成的列向量以及所有激活值組成的列向量。
下面展示了一個手寫體識別的三層全連接神經網路結構:
隱藏層的功能可以看作是各種特徵檢測器的組合:檢測到相應特徵時,相應的隱藏層神經元就會被激活,從而使輸出層相應的神經元也被激活。
② Pangolin 使用深度學習從 DNA 序列預測 RNA 剪接
在基因調控機制中,RNA剪接扮演著核心角色,它涉及從前mRNA中去除內含子,以生成功能性RNA。這一過程的復雜性使得深入理解細胞如何選擇使用特定剪接位點變得尤為重要。近年來,深度學習的進展極大地提高了從DNA序列預測RNA剪接的能力,本文介紹了一種名為Pangolin的深度學習模型,旨在預測多個組織中的剪接位點強度。
Pangolin能夠改進遺傳變異對RNA剪接影響的預測,包括常見、罕見和譜系特異性變異。模型在功能喪失突變識別方面表現出高精度和召回率,特別是在非錯義或無意義突變中,這凸顯了其在識別致病變異方面的巨大潛力。
RNA剪接的序列決定性因素復雜,端到端的深度神經網路非常適合從DNA序列學習特徵以預測剪接結果。現有最先進的深度神經網路如MMSplice和SpliceAI已成功用於預測剪接位點,但它們在組織特異性剪接預測方面存在局限性。相比之下,Pangolin不僅能夠預測剪接的概率,還能預測剪接位點的使用情況,這為遺傳變異對RNA剪接影響的預測提供了更全面的視角。
Pangolin的開發旨在以定量、組織特異性的方式對剪接進行建模。模型架構包含16個帶有跳躍連接的堆疊殘差塊,每個塊包含批量歸一化、ReLU激活和卷積層。與SpliceAI類似,Pangolin允許對每個目標拼接位點上游和下游多達5000個鹼基對的特徵進行建模。但Pangolin在最終神經網路層添加了多個輸出,用於預測不同組織中的剪接位點使用情況。
為了訓練Pangolin,使用了來自四個物種(人類、恆河猴、大鼠和小鼠)的數據,推斷這可能需要更大的訓練集以預測多個組織中剪接位點的使用。訓練集由人類染色體2、4、6、8、10-22、X和Y上的基因組成,包括剪接和非剪接位點,而測試集則包括人類染色體1上基因的位置。使用來自多種物種的序列和對二進制標簽進行定量的方法,已證明在某些應用中可以顯著改善預測,但這些方法在RNA剪接背景下的測試尚屬首次。
評估顯示,Pangolin在預測剪接位點方面表現優於SpliceAI和其他測試方法,特別是在測試組織中。當僅考慮上半部分最有信心的剪接位點預測時,Pangolin的表現也優於其他方法。Pangolin在預測稀有變異對RNA剪接影響的能力方面表現出色,特別是在剪接位點附近的變異中,這表明它能夠捕獲與遺傳效應高度相關的序列特徵。
此外,Pangolin能夠預測多重突變對剪接結果的影響,揭示上位效應。在組織特異性剪接位點使用預測方面,Pangolin能夠在一定程度上捕捉組織特異性剪接效應,盡管相關性較低,但仍比其他方法有優勢。
在計算機誘變應用中,Pangolin預測了突變對剪接位點使用的影響,揭示了與已知序列基序的高一致性。對於常見的遺傳變異,Pangolin能夠幫助預測影響RNA剪接的變異,並識別導致功能喪失的變異。在預測功能影響方面,Pangolin發現LOF變異在預測會影響RNA剪接的變異中高度富集。
在致病變異預測方面,Pangolin能夠區分標記為致病的變異與標記為良性或未知意義的變異,特別是在剪接區域或注釋剪接位點標記為未知意義的變異中。這些發現表明,Pangolin能夠以顯著的准確性識別非錯義和非無義致病變異。
綜上所述,Pangolin在預測DNA序列附近的RNA剪接方面展現出色性能,適用於多種應用,並且在GitHub上免費提供,為遺傳變異分析和基因調控研究提供了有力工具。
③ 加州大學中國博後開發嵌合突變檢測工具,顯著提升非癌症嵌合突變的檢測效率
楊曉旭及其團隊在加州大學開發的DeepMosaic工具確實顯著提升了非癌症嵌合突變的檢測效率。以下是詳細解答:
工具名稱與開發者:該工具名為DeepMosaic,由加州大學聖地亞哥分校及Rady兒童遺傳學研究所的楊曉旭博士後研究員及其團隊開發。
工具功能:DeepMosaic主要用於非對照嵌合單核苷酸變異的檢測。它結合了基於圖像的單核苷酸嵌合突變可視化模塊與基於卷積神經網路的分類模塊,能夠不依賴對照樣本進行嵌合突變的檢測。
檢測效率提升:通過訓練大量模擬或實驗驗證過的嵌合突變,DeepMosaic在非癌症全基因組測序數據上的檢測准確性遠超傳統生物數據方法。同時,在全外顯子組測序數據上,其驗證率也比最優方法高出兩倍。
應用范圍與影響:DeepMosaic不僅促進了人類發育與疾病研究,還使得相關領域研究者能更深入理解人類突變。此外,該工具在檢測癌症嵌合突變上的潛力也受到關注,未來可能進一步擴展其應用范圍。
開源與共享:DeepMosaic的所有代碼均為開源,團隊還提供了訓練代碼和部分已訓練或部分訓練完成的模型,鼓勵領域內研究者使用自己的數據訓練模型,從而推動基於圖像識別的嵌合突變檢測工具在更廣泛的應用。
④ 神經網路模型的信息處理
人工神經網路對神經元的興奮與抑制進行模擬,故而首先應了解神經元的興奮與抑制狀態。
一個神經元的興奮和抑制兩種狀態是由細胞膜內外之間不同的電位差來表徵的。在抑制狀態,細胞膜內外之間有內負外正的電位差,這個電位差大約在-50— -100mv之間。在興奮狀態,則產生內正外負的相反電位差,這時表現為約60—100mv的電脈沖。細胞膜內外的電位差是由膜內外的離子濃度不同導致的。細胞的興奮電脈沖寬度一般大約為1ms。神經元的興奮過程電位變化如圖1—3所示。
圖1-3.神經元的興奮過程電位變化 對神經細胞的研究結果表明:神經元的電脈沖幾乎可以不衰減地沿著軸突傳送到其它神經元去。
由神經元傳出的電脈沖信號通過軸突,首先到達軸突末梢,這時則使其中的囊泡產生變化從而釋放神經遞質,這種神經遞質通過突觸的間隙而進入到另一個神經元的樹突中。樹突上的受體能夠接受神經遞質從而去改變膜向離子的通透性.使膜外內離子濃度差產生變化;進而使電位產生變化。顯然,信息就從一個神經元傳送到另一個神經元中。
當神經元接受來自其它神經元的信息時,膜電位在開始時是按時間連續漸漸變化的。當膜電位變化經超出一個定值時,才產生突變上升的脈沖,這個脈沖接著沿軸突進行傳遞。神經元這種膜電位高達一定閥值才產生脈沖傳送的特性稱閥值特性。
這種閥值特性從圖1—3中也可以看出。
神經元的信息傳遞除了有閥值特性之外,還有兩個特點。一個是單向性傳遞,即只能從前一級神經元的軸突末梢傳向後一級神經元的樹突或細胞體,不能反之。另一個是延時性傳遞.信息通過突觸傳遞,通常會產生0.5-1ms的延時。 神經元對來自其它神經元的信息有時空綜合特性。
在神經網路結構上,大量不同的神經元的軸突末梢可以到達同一個神經元的樹突並形成大量突觸。來源不同的突觸所釋放的神經遞質都可以對同一個神經元的膜電位變化產生作用。因此,在樹突上,神經元可以對不同來源的輸入信息進行綜合。這就是神經元對信息的空間綜合特性。
對於來自同一個突觸的信息,神經元可以對於不同時間傳入的信息進行綜合。故神經元對信息有時間綜合特性。 從神經元軸突上傳遞的信息是等幅、恆寬、編碼的離散電脈沖信號,故而是一個數字量。但在突觸中神經遞質的釋放和樹突中膜電位的變化是連續的。故而,這時說明突觸有D/A功能。在神經元的樹突膜電位高過一定閥值時,則又變成電脈沖方式由軸突傳送出去。故而,這個過程說明神經元有A/D功能。
很明顯,信息通過一個神經元傳遞時,神經元對信息執行了D/A、A/D轉換過程。
從上面可知,神經元對信息的處理和傳遞有閥值,D/A、A/D和綜合等一系列特性和功能。