一个物种的基因组根据质量,一般分为4类:
- 基因组草图(Draft genome)
- 高质量基因组(High-quality genome)
- 同一物种的多个高质量基因组(Multiple High-quality genome),比如不同亚种、品种,不同地理区域的个体
- 端粒到端粒基因组(T2T genome),一般为单倍型
在启动基因组项目之前,需要先了解是否有相同物种或近缘物种发表。有以下几个渠道:
- NCBI genome数据库:https://www.ncbi.nlm.nih.gov/genome/browse#!/overview/
- 植物已发表基因组汇总:https://www.plabipd.de/plant_genomes_pa.ep
一个基因组项目一般包含以下几个分析步骤:
- 通过Kmer分析,获取基因组大小、杂合度、重复性等信息.
- 根据评估结果制定测序策略
- 基因组拼接、挂载. 组装质量评估
- 重复序列注释
- 基因结构注释
- 基因功能注释
- 基因家族聚类
- 分歧时间估计
- 共线性分析以
- Ks和4DTV值计算及分布
- WGD事件推测
- 功能基因生信分析
- 实验验证