内布拉斯加州团队合并机器学习,植物遗传学以最大化高粱潜力

通过美国能源部提供的270万美元拨款,内布拉斯加大学林肯分校的一个研究小组正在研究如何在全美最大限度地发挥高粱的潜力。
图1.内布拉斯加州林肯研究队大学通过美国能源部获得了270万美元的批准。开发了最大化美国高粱潜力的方法。

内布拉斯加州团队合并机器学习,植物遗传学以最大化高粱潜力

高粱是美国第三次丰富的谷物作物,是生物燃料行业的星星球员。利用其用水效率,对种子的耐热性和低成本,它具有超出玉米的能力,特别是在西部和高平原中,灌溉供应限制农业生产力超过土地可用性。

然而,目前,最大化这种作物的潜力是一项挑战。它的大部分基因组——它的整套DNA——的功能仍然是一个谜。如果不能确定高粱中大约3万个基因中的更多基因的功能,研究人员就无法完全优化高粱的生物燃料生产。

这是一群内布拉斯加州 - 林肯研究人员的问题,由植物遗传学家詹姆斯·斯科尔德领导,已阐述。该队伍最近从美国能源部获得了270万美元,为期三年的批准,开发了表征高粱基因功能的快速,高效的方法。

内布拉斯加州的科学家们正在领导一个由来自玉米带各地的机构组成的团队进行这项工作,其中包括爱荷华州立大学、密歇根州立大学、普渡大学和伊利诺伊大学厄巴纳-香槟分校。

他们的方法是机器学习和植物遗传学的创新融合,将为高粱品种在特定环境中茁壮成长铺平道路。这种方法还可以推广到玉米和大豆等其他作物,这些作物的绝大多数基因都没有被研究过。

农学和园艺学副教授Schnable说:“如果我们了解植物对环境的感知和反应的细节,我们就可以培育出专门针对美国某些地区的品种。”“现在,对于许多基因,我们不知道它们的作用。”

要开始填补这些差距,Schnable的团队正在使用称为反向遗传的方法。它基本上是传统方法的倒带,称为前向遗传学,起点是一种具有异形外观或表型的植物。研究人员发现奇怪的植物,然后尝试确定哪些基因是负责任的。

随着逆向遗传,该过程移动另一个方向。科学家从已知的基因开始,改变特定基因,然后分析所得植物的特征,脱落在基因的功能上。虽然这种方法已被使用超过十年,但在大多数情况下,改变基因没有效果。鉴定右基因的研究就像在干草堆中挖掘针。

为了克服这一点,Schnable的团队正在设计一种系统的方法,可以选择哪些基因来调查它是有意义的。它在机器学习中心 - 通过将它们暴露于先前收集的数据的山脉来教学计算机的过程。对于这个项目,研究人员将喂养关于高粱和玉米基因的大量信息已经深入研究过的高粱和玉米基因。

从这些数据中,计算机将学会识别某些基因类型的模式,这些基因类型可能在决定高粱的特性方面发挥着巨大的作用。一旦改进,该算法将省去研究人员随机挑选一个基因,使其突变,然后空手而归的繁琐过程。

随着研究高粱,Schnable也正在开发一个用于玉米的茎秆传感器,这将有助于他的团队更好地理解并最终改善其如何应对干旱。

Schnable说:“实验室里的人们发现,当一种基因在植物中产生了一些奇怪的东西时,这些基因看起来与基因组中的其他基因真的不同。”“我们将利用这些信息训练计算机识别其他可能在植物突变时产生重大影响的基因。”

系统识别有前途的基因后,Schnable的团队将编辑它们并测量所产生的高粱,如应力反应,营养素和用水效率,生物量和生物量,可用于生产可再生能源的有机材料。

为此,许多研究都集中在识别跨越国内大部分地区的作物品种,从内布拉斯加州到伊利诺伊州的东部地区。但更深入地了解高粱的基因功能如何运作,重点可以转移到开发繁殖的品种,在较少的地理口袋里蓬勃发展,输入较少。该策略可以提高燃料,食品和动物饲料的整体高粱生产。

Schnable说,该项目是第一个将人工智能和植物科学结合在一起的项目,这种结合在过去18个月里开始得到发展。他希望这种方法能在植物遗传学领域打开新的大门。

他说:“当你开始在两种不同的学术筒仓之间进行沟通时,有很多潜力,”他说。

跨学科方法反映在团队的组成中。内布拉斯加州小组还包括生物系统工程副教授葛玉峰(Yufeng Ge)和植物病理学实践助理教授布兰迪·西格蒙(Brandi Sigmon)。其他大学的研究人员包括统计学家、工程师和地理学家。

该项目由DOE的基因组学的植物生物学资助,以确定基因功能计划。