农企新闻网

《Nature》重磅

发布者:马熙远
导读雷锋网音讯,《Nature》杂志近日发布音讯称,研讨人员应用人工智能发现了近6000种未知的病毒。这项任务是在3月15日由美国动力部(DOE)组织的一次会议上提出的,它展现了一种探究地球上宏大而未知的病毒多样性的新工具。从人类安康到渣滓降解,虽然病毒的影响力非常宏大,但它们却很难被摸透。 迷信家们无法在实验室环境中培育大少数病毒,辨认其基因序列的尝试也往往无法停止,由于病毒的基因组很小并且退化得很

《Nature》重磅

雷锋网音讯,《Nature》杂志近日发布音讯称,研讨人员应用人工智能发现了近6000种未知的病毒。这项任务是在3月15日由美国动力部(DOE)组织的一次会议上提出的,它展现了一种探究地球上宏大而未知的病毒多样性的新工具。

从人类安康到渣滓降解,虽然病毒的影响力非常宏大,但它们却很难被摸透。 迷信家们无法在实验室环境中培育大少数病毒,辨认其基因序列的尝试也往往无法停止,由于病毒的基因组很小并且退化得很快。

近年来,研讨人员经过对来自不同环境的样本停止DNA测序,来寻觅未知的病毒。为了辨认呈现的微生物,研讨人员搜索已知病毒和细菌的遗传特征,正如文字处置器的“查找”功用会突出显示文档中包括特定字母的单词。但是这种办法常常失败,由于病毒学家无法搜索他们不晓得的东西。

不过,机器学习处理了这个成绩,由于它可以发现海量信息中的新兴形式。机器学习算法解析数据,从中学习,然后自主分类信息。

南加州大学洛杉矶分校的计算生物学家Jie Ren表示,“以前,人们没有方法很好地研讨病毒,但如今我们有新工具可以找到它们。”

在最近的一项研讨中,美国动力部结合基因组研讨所(JGI)的计算生物学家 Simon Roux 训练计算机辨认不罕见的 Inoviridae 病毒家族的基因序列。 这些病毒生活在细菌中并改动宿主的行为,例如,它们会使得惹起霍乱的霍乱弧菌细菌毒性更强。在加州旧金山召开的会议上,他提出了本人的研讨效果。他表示,在他的研讨开端之前曾经有不到100种基因组被发现。

Roux提出了一种机器学习算法,其中包括两组数据:其中一组含有来自已知的Inoviridae的805个基因组序列,另一个含有来自细菌和其他类型病毒的约2000个基因序列。该算法可以找到区分它们的办法。

接上去,Roux 向模型馈送少量宏基因组学数据集。该计算机回收了超越10000种的Inoviridae基因组,并蓬勃发展的行业不仅给从业者提供了巨大的发展机遇,也带来了全新的挑战。将其分红不同品种的集群。他说,其中一些集群之间的遗传变异很大,以致于Inoviridae能够有很多家族。

雷锋网 (大众号:雷锋网) 理解到,在另一项研讨中,巴西圣保罗大学的生物信息学家Deyvid Amgarten应用机器学习在城市植物园寻觅肥料堆中的病毒。他编写了算法来搜索病毒基因组的一些明显特征,例如给定长度的DNA链中的基因密度。训练完毕后,计算机恢复了几个似乎是新型的基因组,Amgarten表示。他在JGI会议上引见了他的后果。最初一步是理解这些病毒发生的蛋白质,看看它们中的哪些会减速无机物质分解的速度。“我们想进步肥料的质量。”他说。

Amgarten 是从去年报告的一项机器学习工具即 Ren 的团队开发的 VirFinder 中失掉灵感的。VirFinder被设计为寻觅 DNA 碱基组合,例如 DNA 双链中的 AT 或 GC。据雷锋网理解, Ren将该算法使用于安康人和肝硬化患者(一种由肝炎、慢性酒精中毒惹起的疾病)的基因组样本。机器将取样的病毒完成了分组之后,该团队留意到样本中某些特定类型的基因组在安康人群中绝对更少或更多,这意味着这些基因组相关的病毒能够招致了疾病。

Ren的发现是一个有目共睹的发现:生物医学研讨人员不断在想,病毒能否会招致一些难以捉摸的症状,如慢性疲劳综合征(也称为肌痛性脑脊髓炎)和炎症性肠病。康涅狄格州法明顿的Jackson基因组医学实验室的免疫学家Derya Unutmaz揣测,病毒能够会引发一种毁坏性炎症反响,或许他们能够会改动人体微生物群中细菌的行为,反过去会毁坏推陈出新和免疫零碎。

Unutmaz说,经过使用机器学习,研讨人员可以确定隐藏在患者身上的病毒。此外,由于AI有才能在海量数据集中寻觅形式,这种办法也答应以将病毒数据与细菌相关联,然后将症状数据与蛋白量变化联络起来。Unutmaz说,“机器学习甚至可以提醒我们历来没有想过的成绩。”

原文地址: https://www.nature.com/articles/d41586-018-03358-3

《Nature》重磅