当前位置:首页 > 生信分析 > Gene Ontology(GO)分析

Gene Ontology(GO)分析

基因本体论(Gene Ontology, GO)[1]是一个被广泛使用的生物学数据库,它由两个方面组成:其一为本体自身,即由生物学家定义好的词条以及它们之间的结构化关系;其二为基因产物和词条之间的关系,即基因本体注释。本体是某一专门领域的有严格约束的功能词汇或称作功能类,它们通过有向无环图(Directed Acyclic Graph, DAG)的形式将严格定义的不同功能类之间的关系组织起来。GO是跨越原核生物与真核生物各物种的基因功能分类体系,分为三个独立的ontology, 分别是生物过程(biological process, BP),分子功能(molecular function, MF),和细胞组分(cellular component, CC)。GO分析是对这三个ontology分别进行分析。更多的内容可以参考gene ontology官网http://www.geneontology.org。这方面进一步的学习可以参加由上海生咨生物(www.biorefer.com)组织的研习班, 示例视频http://www.biorefer.com/biorefer/flv/playflv.php?id=14

我们对GO分析对于有功能注释的物种和对功能注释缺少的物种采用二种不同的方法进行分析。有功能注释的物种,如人类、大鼠、小鼠通常我们采用DAVID(The Database for Annotation,Visualization and Integrated Discovery)[2]进行分析。DAVID是一个生物信息数据库,整合了生物学数据和分析工具,为大规模的基因或蛋白列表(成百上千个基因ID或者蛋白ID列表)提供系统综合的生物功能注释信息。DAVID的使用非常广,有超过2.6篇的引用。提交分析列表获得结果之后,采用内部的用Perl和R开发的DAVIDPipeline软件进行绘图。对于没有功能注释的物种,如果有蛋白质序列优先选用蛋白质序列,采用BLAST+软件(version: 2.2.30+)与GO序列数据库(****年**月**日更新)进行比对,选择E-value<1e-8且相似度大于30%的序列的匹配最好的序列的注释做为GO注释,同时采用Interproscan软件(version: 5.25-64.0 )进行GO功能注释预测。将两种方法得到的GO注释合并后,采用[****年**月**日]更新的GO数据库对GO功能进行分类分析。对于选取差异表达基因或者差异表达蛋白,以[****]为背景参照,然后采用Fisher’s exact test方法,检验该功能模块中是否非随机地富集了差异基因。

GO分析结果主要包括GO功能分类结果和GO功能富集结果。

GO功能分类分析

GO功能分类是在某一功能层次上统计蛋白或者基因的数目或组成,往往是在GO的第二层次。此外也有研究都挑选一些Term,而后统计直接对应到该Term的基因或蛋白数。目的是展示数据集大概的GO功能情况,我们提供几种不同风格的图形以供选择。

图1.参考图注,GO categories assigned to all proteins. Y-axis represents the count of proteins. The proteins were categorized according to the annotation of GO, and the number of each category is displayed based on biological process, cellular components, and molecular functions.
图2.风格2,3,4
图3.风格5

GO功能富集分析

GO功能富集目的是为了获得相对于本底参照显著富集的功能类别,通过该项分析可以找出在统计上显著富集的.该功能或者定位有可能与研究的目前有关。我们也提供了几种不同的风格的图形以供选择。

 

图4. Top 10 enrichment GO categories. X-axis represents –log10 p-value. The count of proteins corresponds to circular size.
 
图5. 示例图2,分别的条状图显示Top 10 enrichment GO categories.
图5. 示例图3,气泡图Top 20 enrichment GO categories.

其它结果

筛选出的细胞定位

 
 
-------------------------------------------
分析软件参考, Biorefer-DAVIDPipeline , Biorefer-GOPipeline
  1. Ashburner, M. , et al., Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nat Genet, 2000. 25(1):p. 25-9.
  2. Huang da W, Sherman BT, Lempicki RA (2009) Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nat Protoc 4:44–57.