LOGO
当前位置: 首页 > 分析服务 > 生物信息分析服务 > 细菌泛基因组学数据分析
  细菌泛基因组学数据分析

1995年,第一个细菌基因组流感嗜血杆菌(H.influenzae)全基因组序列的发表,开启了细菌全基因组测序的大门。近些年来,随着生物信息学的不断深入、分子生物学技术的迅猛发展及二代测序和三代测序平台等高通量测序技术的飞跃,细菌全基因组测序日益完善,完成一个细菌全基因组的费用变得非常低廉,时间也变得非常短,公共数据库中全基因组的数据也是飞速增长。随着数据的增多,研究发现细菌各菌株基因组间存在着丰富的遗传多样性,有资料表明,某一细菌株的基因组有20%DNA序列为该株系所特有。

2005年,美国基因组研究所(TheInstitutefor GenomeResearch, TIGR)的科学家HerveTettelin等在 《美国国家科学院院刊》(PNAS)的网络版中发表了他们对8株B群链球菌(GBS)独立的基因组序列的研究结果。研究 [5] 发现:菌株间共有的基因约为 1806个(链球菌基因组含有2000~2400个基因), 这意味着还有相当数量的基因(200~600个)在其中至少1个菌株内缺失;此外,通过数学模型估算,研究者还推定每完成1个新菌株的测序就会有约33个该菌株特有的新基因将被发现,即使是数以千计的基因组测序已经完成,这样的基因仍会继续出现。因此,该项研究几乎得出了一个让人吃惊的结果 —“细菌基因组数量可能是无限的”。为了更准确地描述一种细菌基因组的全部信息,Tettelin和他的同事们于2005年首次提出了泛基因组的概念。
泛基因组是指同种细菌不同菌株所有遗传信息 的集合, 可分为核心基因组(coregenome)和附属基因组(accessorygenome)两部分,其中核心基因组 是包括了一个细菌种内绝大多数菌株中都存在的所 有基因,这些基因决定了这一细菌种内几乎所有个体都具有的基本功能和表型特征,如病原菌的感染以及在自然宿主细胞内存活、繁殖和复制等。核心基因组中的基因多数为信息基因和管家基因, 代表着生命活动所必需的代谢和功能, 决定着基因的复制、转录和翻译功能,指导着细胞膜、调节因子、转运 和锚定蛋白等的生物学功能。正是基于这些特征,使得对核心基因组的分析研究在科学研究上具有非 同寻常的意义, 引起了越来越多研究者的兴趣,在具有交叉免疫保护性疫苗候选蛋白的确定、分型基因筛选以及探究个体间系统发生关系等方面都发挥了重要作用。
泛基因组概念的引入使得传统的基于真核生物的物种概念受到了挑战。通过泛基因组学的研究,我们可以全面地从基因组水平分析细菌种内遗传多样性,探究个体间的系统发生关系和表型差异的遗传基础,突破了运用多位点序列分析方法研究种群内菌株间进化关系时,只涉及少数管家基因变化分析的局限,通过分析种群基因组中全部基因的变化情况,可以更科学而准确地推测个体间的分子进化轨迹。随着泛基因组学研究的逐步深入,该项研究技术已被广泛证明在病原微生物重要毒力因子的发现、具有交叉免疫保护性的疫苗候选蛋白的确定 和分型基因筛选等方面也具有实际应用价值。
(以上内容引用自庄绪冉,朱泳璋 细菌泛基因组学的研究)
   可以通过高通量测序技术测序获得细菌基因组序列,此外,NCBI中也可以获取已经发布的细菌基因组,可以通过生物信息学技术进行分析。以下是我们从NCBI下载了Bifidobacterium longum的全基因组数据做的分析结果。

 


 

 
The pan-genome plot is of the accumulated number of new genes against the number of genomes added.

 
The core-genome plot is represented by the accumulated number of genes attributed to the core-genomes versus the number of added genomes.

 

-------------------------------------------------------------------------

微信扫一扫,加我们的公众号,可以有更多的信息。

招贤纳士  |   合作伙伴  |   企业文化  |   公司介绍  |   访问次数: Website Hit Counters
上海生咨生物科技有限公司版权所有 沪ICP备14048106号