① 【神经网络原理】神经网络结构 & 符号约定
神经元模型的符号约定:输入: ,权重(weight): ,偏置(bias): ,未激活值: ,激活输出值:
神经元可用于解决部分二分类问题 ——当有一个类别未知的 输入感知机,若 输出值a = 1时,感知机被激活 ,代表 x 属于第一类;若 输出值a = 0时,感知机未激活 ,则代表 x 属于第二类。而对于sigmoid神经元,若输出值a ≥ 0.5时,代表 x 属于第一类,否则为第二类。
不难看出,感知机可以轻松实现“与非”逻辑,而与非逻辑可以组合成其他任意的逻辑,但对于一些过于复杂的问题,我们难以写出其背后地逻辑结构。 这时候神经网络就能大显身手 :它可以自适应的学习规律,调节网络地权重和偏置等参数,我们只需要用大量的数据对其正确地训练,即可得到我们想要的效果!
那有一个很有意思的问题:相比于阶跃函数,为什么我们在神经网络中更愿意采用sigmoid函数作为激活函数呢?
首先,由于感知机的激活函数为阶跃函数(在0处突变),权重的一个小的变化就可能导致输出值的突变,而如果将激活函数替换为sigmoid函数,输出值的变化就能发生相应的小的变化,有利于网络学习;另外,由于采用二次代价函数作为损失函数时,利用BP算法求梯度值需要对冲激函数求导,sigmoid函数正好时连续可导的,而且导数很好求。
为了便于理解,先画一个三层的全连接神经网络示意图,激活函数都选用sigmoid函数。 全连接神经网络 指除输出层外,每一个神经元都与下一层中的各神经元相连接。网络的第一层为 输入层 ,最后一层为 输出层 ,中间的所有层统称为 隐藏层 。其中,输入层的神经元比较特殊,不含偏置 ,也没有激活函数 。
神经网络结构的符号约定 : 代表第 层的第 个神经元与第 层的第 个神经元连线上的权重; 代表第 层与第 层之间的所有权重 构成的权重矩阵。 分别代表第 层的第 个神经元对应的偏置、未激活值、激活值; 则分别代表第 层的所有偏置组成的列向量、所有未激活值组成的列向量以及所有激活值组成的列向量。
下面展示了一个手写体识别的三层全连接神经网络结构:
隐藏层的功能可以看作是各种特征检测器的组合:检测到相应特征时,相应的隐藏层神经元就会被激活,从而使输出层相应的神经元也被激活。
② Pangolin 使用深度学习从 DNA 序列预测 RNA 剪接
在基因调控机制中,RNA剪接扮演着核心角色,它涉及从前mRNA中去除内含子,以生成功能性RNA。这一过程的复杂性使得深入理解细胞如何选择使用特定剪接位点变得尤为重要。近年来,深度学习的进展极大地提高了从DNA序列预测RNA剪接的能力,本文介绍了一种名为Pangolin的深度学习模型,旨在预测多个组织中的剪接位点强度。
Pangolin能够改进遗传变异对RNA剪接影响的预测,包括常见、罕见和谱系特异性变异。模型在功能丧失突变识别方面表现出高精度和召回率,特别是在非错义或无意义突变中,这凸显了其在识别致病变异方面的巨大潜力。
RNA剪接的序列决定性因素复杂,端到端的深度神经网络非常适合从DNA序列学习特征以预测剪接结果。现有最先进的深度神经网络如MMSplice和SpliceAI已成功用于预测剪接位点,但它们在组织特异性剪接预测方面存在局限性。相比之下,Pangolin不仅能够预测剪接的概率,还能预测剪接位点的使用情况,这为遗传变异对RNA剪接影响的预测提供了更全面的视角。
Pangolin的开发旨在以定量、组织特异性的方式对剪接进行建模。模型架构包含16个带有跳跃连接的堆叠残差块,每个块包含批量归一化、ReLU激活和卷积层。与SpliceAI类似,Pangolin允许对每个目标拼接位点上游和下游多达5000个碱基对的特征进行建模。但Pangolin在最终神经网络层添加了多个输出,用于预测不同组织中的剪接位点使用情况。
为了训练Pangolin,使用了来自四个物种(人类、恒河猴、大鼠和小鼠)的数据,推断这可能需要更大的训练集以预测多个组织中剪接位点的使用。训练集由人类染色体2、4、6、8、10-22、X和Y上的基因组成,包括剪接和非剪接位点,而测试集则包括人类染色体1上基因的位置。使用来自多种物种的序列和对二进制标签进行定量的方法,已证明在某些应用中可以显着改善预测,但这些方法在RNA剪接背景下的测试尚属首次。
评估显示,Pangolin在预测剪接位点方面表现优于SpliceAI和其他测试方法,特别是在测试组织中。当仅考虑上半部分最有信心的剪接位点预测时,Pangolin的表现也优于其他方法。Pangolin在预测稀有变异对RNA剪接影响的能力方面表现出色,特别是在剪接位点附近的变异中,这表明它能够捕获与遗传效应高度相关的序列特征。
此外,Pangolin能够预测多重突变对剪接结果的影响,揭示上位效应。在组织特异性剪接位点使用预测方面,Pangolin能够在一定程度上捕捉组织特异性剪接效应,尽管相关性较低,但仍比其他方法有优势。
在计算机诱变应用中,Pangolin预测了突变对剪接位点使用的影响,揭示了与已知序列基序的高一致性。对于常见的遗传变异,Pangolin能够帮助预测影响RNA剪接的变异,并识别导致功能丧失的变异。在预测功能影响方面,Pangolin发现LOF变异在预测会影响RNA剪接的变异中高度富集。
在致病变异预测方面,Pangolin能够区分标记为致病的变异与标记为良性或未知意义的变异,特别是在剪接区域或注释剪接位点标记为未知意义的变异中。这些发现表明,Pangolin能够以显着的准确性识别非错义和非无义致病变异。
综上所述,Pangolin在预测DNA序列附近的RNA剪接方面展现出色性能,适用于多种应用,并且在GitHub上免费提供,为遗传变异分析和基因调控研究提供了有力工具。
③ 加州大学中国博后开发嵌合突变检测工具,显着提升非癌症嵌合突变的检测效率
杨晓旭及其团队在加州大学开发的DeepMosaic工具确实显着提升了非癌症嵌合突变的检测效率。以下是详细解答:
工具名称与开发者:该工具名为DeepMosaic,由加州大学圣地亚哥分校及Rady儿童遗传学研究所的杨晓旭博士后研究员及其团队开发。
工具功能:DeepMosaic主要用于非对照嵌合单核苷酸变异的检测。它结合了基于图像的单核苷酸嵌合突变可视化模块与基于卷积神经网络的分类模块,能够不依赖对照样本进行嵌合突变的检测。
检测效率提升:通过训练大量模拟或实验验证过的嵌合突变,DeepMosaic在非癌症全基因组测序数据上的检测准确性远超传统生物数据方法。同时,在全外显子组测序数据上,其验证率也比最优方法高出两倍。
应用范围与影响:DeepMosaic不仅促进了人类发育与疾病研究,还使得相关领域研究者能更深入理解人类突变。此外,该工具在检测癌症嵌合突变上的潜力也受到关注,未来可能进一步扩展其应用范围。
开源与共享:DeepMosaic的所有代码均为开源,团队还提供了训练代码和部分已训练或部分训练完成的模型,鼓励领域内研究者使用自己的数据训练模型,从而推动基于图像识别的嵌合突变检测工具在更广泛的应用。
④ 神经网络模型的信息处理
人工神经网络对神经元的兴奋与抑制进行模拟,故而首先应了解神经元的兴奋与抑制状态。
一个神经元的兴奋和抑制两种状态是由细胞膜内外之间不同的电位差来表征的。在抑制状态,细胞膜内外之间有内负外正的电位差,这个电位差大约在-50— -100mv之间。在兴奋状态,则产生内正外负的相反电位差,这时表现为约60—100mv的电脉冲。细胞膜内外的电位差是由膜内外的离子浓度不同导致的。细胞的兴奋电脉冲宽度一般大约为1ms。神经元的兴奋过程电位变化如图1—3所示。
图1-3.神经元的兴奋过程电位变化 对神经细胞的研究结果表明:神经元的电脉冲几乎可以不衰减地沿着轴突传送到其它神经元去。
由神经元传出的电脉冲信号通过轴突,首先到达轴突末梢,这时则使其中的囊泡产生变化从而释放神经递质,这种神经递质通过突触的间隙而进入到另一个神经元的树突中。树突上的受体能够接受神经递质从而去改变膜向离子的通透性.使膜外内离子浓度差产生变化;进而使电位产生变化。显然,信息就从一个神经元传送到另一个神经元中。
当神经元接受来自其它神经元的信息时,膜电位在开始时是按时间连续渐渐变化的。当膜电位变化经超出一个定值时,才产生突变上升的脉冲,这个脉冲接着沿轴突进行传递。神经元这种膜电位高达一定阀值才产生脉冲传送的特性称阀值特性。
这种阀值特性从图1—3中也可以看出。
神经元的信息传递除了有阀值特性之外,还有两个特点。一个是单向性传递,即只能从前一级神经元的轴突末梢传向后一级神经元的树突或细胞体,不能反之。另一个是延时性传递.信息通过突触传递,通常会产生0.5-1ms的延时。 神经元对来自其它神经元的信息有时空综合特性。
在神经网络结构上,大量不同的神经元的轴突末梢可以到达同一个神经元的树突并形成大量突触。来源不同的突触所释放的神经递质都可以对同一个神经元的膜电位变化产生作用。因此,在树突上,神经元可以对不同来源的输入信息进行综合。这就是神经元对信息的空间综合特性。
对于来自同一个突触的信息,神经元可以对于不同时间传入的信息进行综合。故神经元对信息有时间综合特性。 从神经元轴突上传递的信息是等幅、恒宽、编码的离散电脉冲信号,故而是一个数字量。但在突触中神经递质的释放和树突中膜电位的变化是连续的。故而,这时说明突触有D/A功能。在神经元的树突膜电位高过一定阀值时,则又变成电脉冲方式由轴突传送出去。故而,这个过程说明神经元有A/D功能。
很明显,信息通过一个神经元传递时,神经元对信息执行了D/A、A/D转换过程。
从上面可知,神经元对信息的处理和传递有阀值,D/A、A/D和综合等一系列特性和功能。