概述

一个物种的基因组根据质量,一般分为4类:
  1. 基因组草图(Draft genome)
  2. 高质量基因组(High-quality genome)
  3. 同一物种的多个高质量基因组(Multiple High-quality genome),比如不同亚种、品种,不同地理区域的个体
  4. 端粒到端粒基因组(T2T genome),一般为单倍型
在启动基因组项目之前,需要先了解是否有相同物种或近缘物种发表。有以下几个渠道:
  1. NCBI genome数据库:https://www.ncbi.nlm.nih.gov/genome/browse#!/overview/
  2. 植物已发表基因组汇总:https://www.plabipd.de/plant_genomes_pa.ep
一个基因组项目一般包含以下几个分析步骤:
  1. 通过Kmer分析,获取基因组大小、杂合度、重复性等信息.
  2. 根据评估结果制定测序策略
  3. 基因组拼接、挂载. 组装质量评估
  4. 重复序列注释
  5. 基因结构注释
  6. 基因功能注释
  7. 基因家族聚类
  8. 分歧时间估计
  9. 共线性分析以
  10. Ks和4DTV值计算及分布
  11. WGD事件推测
  12. 功能基因生信分析
  13. 实验验证
2023-10-01
0