转录组解释依赖于高质量的参考转录组,用于基因表达的准确定量以及遗传变体的功能分析。目前对马基因组的注释缺乏评估基因表达所必需的特异性和敏感性,特别是在同种型水平,并且缺乏对非翻译区(UTR)使用的注释不足。来自加利福尼亚大学戴维斯分校的研究人员为马建立了一个注释管道,并用它将来自多个RNA-seq数据集的19亿个读数整合到一个新的精制转录组中。
该马转录组整合了来自59个个体的8种不同组织,改善了基因结构和同种型分辨率,同时提供了大量的组织特异性信息。研究人员在其管道中使用了四个级别的转录本过滤,旨在产生适合不同下游分析的几种转录组版本。他们最精确的转录组包括36,876个基因和76,125个同种型,其中6474个候选转录基因座对马转录组是新的。
用于生成每个版本的转录组的工作流程概述
转录组产品是椭圆形的。用于执行各种步骤的程序在括号中表示。所有转录组版本和管道脚本都是公开可用的
这些研究人员采用了各种描述性统计数据和数据,证明了转录组的质量和内容。由该管道提供的马转录组显示迄今为止任何马转录组的最佳组织特异性分辨率,并且对于若干下游分析是灵活的。他们鼓励将其他马转录组与其注释管道整合,以继续并改进马转录组。