面试公司丹尼尔·埃利斯,理学学士。的见解rami mehio illumina软件和信息学主管
在这次采访中,Illumina软件和信息学主管Rami Mehio分享了他在英国生物银行(UK Biobank)全基因组测序等重大基因组项目中的经验和贡献。他讨论了基因组数据分析的挑战和创新,强调了Illumina在推进基因研究和精准医学方面的作用。
我的名字是Rami Mehio。我领导Illumina的软件和信息学开发。我于2018年加入Illumina,作为Edico Genome收购的一部分,此后负责监督Illumina产品组合中的生物信息学、测序软件、云数据平台和临床软件。在加入Illumina之前,我在Edico工作,领导DRAGEN BioIT处理器的开发,并协助其商业化。
Illumina是该项目的测序技术合作伙伴,这意味着全基因组测序(WGS)是用Illumina测序仪完成的。Illumina还被选为生物信息学合作伙伴,对每个基因组进行分析,并将它们联合到一个队列中。因此,使用DRAGEN屡获殊荣的生殖系管道及其多基因组图谱和变体调用进行二次分析。为了跟上500,000个WGS的计算和存储任务,在Illumina Connected Analytics (ICA)云平台上使用DRAGEN迭代gVCF基因型(IGG)进行聚合,并采用基于ml的过滤,以提高变异的灵敏度和精度。
主要的挑战是确保我们有合适的计算基础设施来支持分析50万个基因组。在亚马逊网络服务(AWS)上,对50万个基因组的二次分析在大约六周内完成。我们必须将质量保证过程放在适当的位置,以确保我们的其他客户的分析工作不会缺少计算节点。
我们遇到的另一个挑战是聚合,特别是在文件数量、API调用数量、数据大小和成本方面。这项工作使我们能够构建和调整DRAGEN IGG和ICA,使其成为无与伦比的产品,能够以高精度和低成本聚合数百万个基因组。该架构还允许解决N+1问题。这意味着,如果我们要再聚合1000个基因组,我们就可以循序渐进,而不是做51万个基因组的工作。
DRAGEN管道具有独特的功能,可以提高数据的灵敏度和精度,这意味着我们可以检测到其他管道难以识别的变体。DRAGEN通过使用多参考基因组技术来做到这一点,该技术可以更好地匹配参考样本。这允许在基因组的困难和高度多态区域进行准确的检测和绘图。我们还在DRAGEN的后期版本中引入了机器学习,使我们能够在提高灵敏度的同时显着减少误报。DRAGEN的精确性和敏感性已经接受了测试,并在生殖系疾病、遗传疾病和肿瘤方面获得了两项PrecisionFDA奖项。
这要归功于英国生物银行及其制药联盟成员、“我们所有人”项目及其相关测序中心的一些领导者,以及英国基因组学公司的领导层。他们同意采用相同版本的DRAGEN管道,Illumina能够支持并消除障碍。我们提供了管道和配置的详细信息,并与每个项目密切合作,以确保团队之间的一致性。公共管道是数据兼容和增加队列统计能力的关键必要条件。
这可能是目前世界上最大的全基因组测序集合。通常,聚集大的队列是相当困难的。根据我们的经验,当处理超过10,000个样本时,项目往往会遇到困难。基于ICA的DRAGEN IGG现在能够扩展到数十万个样本,同时也解决了N+1问题——在500,000个样本中再添加10,000个样本不需要用户从头开始重新启动联合调用。
WGS数据将使研究人员能够识别导致疾病发病和进展的罕见非编码变异。它还将识别防止疾病的突变。通过将WGS数据与英国生物银行参与者丰富的临床和生活方式数据相结合,研究人员现在有了独特的装备来回答为什么有些人会患上特定的疾病,而另一些人则不会,以及为什么某些人的某些情况会随着时间的推移而恶化。
它还将使研究人员能够确定新的药物靶点,从而有助于加速药物的发现和开发。这一点很重要,因为制药公司已经发现,有明确遗传证据支持的潜在药物靶点产生有效药物的可能性是其他靶点的两倍。
通过合作,这种伙伴关系使测序和分析大量基因组以改善医疗保健的梦想成为现实。
英国生物银行(UK Biobank)制作并公开这些数据的愿景值得称赞。它为多基因风险评分评估和更精确的药物发现打开了大门。
通过这次合作,Illumina的软件已经成熟,我们的能力也得到了提升。我们已经在信息学领域建立了自己的能力,这使我们能够为数据带来更精确的含义。
https://www.illumina.com/products/by-type/informatics-products/dragen-secondary-analysis.html
https://www.illumina.com/products/by-type/informatics-products/connected-analytics.html
Rami是Illumina公司软件和信息学开发的全球负责人。他于2018年加入Illumina,作为Edico Genome收购的一部分,并不断扩大他的领导地位,现在包括监督Illumina整个产品组合中的所有仪器软件、云平台、生物信息学和临床软件。在过去的几年中,Rami的组织帮助Illumina成为信息学领域的领先供应商,提供与kol深度合作开发的创新,可靠的软件产品。








