第二百零八章 AI和计算生物学(2 / 3)

主要应用于生物数据的无监督模型。”

郑理鼓掌道:“很好。”

其实计算生物学的进化路线,和现代法师的研究有很多相似之处。

法师们通过生物云的高频计算能力,对基因、蛋白质等构成生命的基本要素进行定性定量分析。

法师们的优势不仅在碳基计算机的运算能力和上限比硅基更高,而且来源于他们可以直接通过意志干涉物质世界。

能有更多的特殊样本和针对性诱导样本进行研究。

郑理继续问道:“其实你们目前主要使用的还是神经网络对吧?”

“卷积神经网络、循环神经网络、自动编码机这些。”

研发主管深知郑理的科研能力和所涉及领域之广泛,因此对于郑理一语把他们的关键点透丝毫不意外:

“是的,主要还是神经网络在计算生物领域的应用。”

涉及到研发层面,郑理从来都是有话直说:

“深度学习在计算生物层面的应用很早之前就开始了。”

“早在2012年就开始用神经网络研究基因组学和生物图像分析,将序列变异和分子特征联系到一起了。”

“也就是说我们使用的技术,如果是外行来听,会觉得很先进,深度学习、人工智能,但是实际上这已经是十年前别人就在玩的东西。”

“我们自己有什么突破?别告诉我只是把别人的方法拿来用。”

“如果只是做到这个程度”

郑理没说完,他转头看向李渺渺:“渺渺,江城研发中心每年投入的预算是多少?”

李渺渺不假思索道:“今年给他们编的预算是17.4亿元。”

郑理点头道:“好的,如果你们只是这个水平,那今年的预算把零头砍掉。”

李渺渺问道:“砍掉7.4亿元吗?”

“嗯。”

郑理说完直视坐他对面的研发主管。

每年各个研发中心的预算不仅是钱和资源,而且代表着你在公司内部的重要程度。

郑理砍预算,不代表会把他们今年的研发目标降低。

研发主管连忙道:“郑董, 我们有很多自主的研发。”

他知道自己拿出来的东西一定不能湖弄。

郑理太懂了, 当你的上司对你的业务过于了解的时候,上班摸鱼的难度被提升到了极点。

“我们优化了从dna序列对分子特征优化的神经网络算法。”

“郑董,这是个体的 dna 序列和基因组的分子反应变量。”

“在传统的调控基因组学方法中主要需要考虑个体之间的差异,而我们优化之后的深度学习算法允许通过将基因组平铺到以个体特征为中心的序列 dna 窗口中。”

“然后利用个体内部的差异,从而从单个样本中产生大量的训练数据集。”

“这是用于从原始 dna 序列预测分子特征的一维卷积神经网络。”

“第一个卷积层的过滤器扫描输入序列中的图桉。随后的池化减少了输入维度,并且额外的卷积层可以模拟前一层中dna序列的交互。”

“再看这里,c图由b图中所示的神经网络预测的野生型和突变序列的响应变量被用作另一个神经网络的输入,该网络预测变体分数并允许区分正常与有害变体。”

“d 再通过对齐最大程度地激活过滤器的基因序列并创建序列基序来可视化卷积过滤器。”

“这是序列窗口的突变图。行对应于四种可能的碱基对替换,列对应于序列位置。任何序列变化的预测影响都是用颜色编码的。”

“顶部的字母表示野生型序列,每个核苷酸的高度表示突变的最大影响......”

结束对狮城研发中心的调研后