Posted on

OnGene是一个肿瘤基因的数据库,通过文献检索的方式获得了803个肿瘤基因,文章的链接如下

http://dx.doi.org/10.1016/j.jgg.2016.12.004 IF: 5.723 B2

数据库网址如下

http://ongene.bioinfo-minzhao.org/index.html

数据库构建的pipeline如下图所示

https://ask.qcloudimg.com/http-save/6552462/awdb7cskls.jpeg?imageView2/2/w/2560/h/7000

首先在pubmed中用以下几个关键词进行检索

  1. oncogene
  2. oncogenic
  3. oncoprotein
  4. proto-oncogene

得到候选的17033篇文献,然后从long non-coding RNA和oncogene两个关键词检索,得到435篇文献。另外又从oncomirdb和miRCancer数据库中得到肿瘤相关的miRNA。

对以上得到的文献进行人工核对,最终筛选得到了803个有文献支持的肿瘤基因,并对这些基因进行了以下几种数据分析

  1. 功能注释,提供了基因名称,参与的通路,相关疾病等注释信息
  2. 差异分析,利用TCGA中的表达谱数据,进行肿瘤和正常样本的差异分析
  3. 与lncRNA的共表达分析,利用MiTranscriptome数据库中的表达谱数据,分析肿瘤基因与lncRNA之间的共表达
  4. 突变信息注释,利用TCGA中的mutation信息进行注释

通过首页的browser菜单,可以浏览肿瘤基因的相关信息,以蛋白编码基因MYC为例,包含以下几个部分的结果

1. Gene information

包含了基因名称,染色体位置,对应的pathway与疾病,序列等信息,示意如下

https://ask.qcloudimg.com/http-save/6552462/dh2f0u26zk.png?imageView2/2/w/2560/h/7000

2. Literature

展示了该基因相关的文献和摘要信息,示意如下

https://ask.qcloudimg.com/http-save/6552462/ftvms05ywo.jpeg?imageView2/2/w/2560/h/7000

3. Expression

展示该基因在样本中的表达量信息,示意如下

https://ask.qcloudimg.com/http-save/6552462/sfnxydh8hs.jpeg?imageView2/2/w/2560/h/7000

4. lncRNA

展示与该基因存在共表达的lncRNA信息,示意如下

https://ask.qcloudimg.com/http-save/6552462/vn412iaw2l.png?imageView2/2/w/2560/h/7000

5. Mutation

展示该基因上存在的mutation信息,示意如下

https://ask.qcloudimg.com/http-save/6552462/465wa8thmv.jpeg?imageView2/2/w/2560/h/7000

6. Homolog

展示其他物种中该基因的同源基因信息,示意如下

https://ask.qcloudimg.com/http-save/6552462/evm908l8ug.png?imageView2/2/w/2560/h/7000

该数据库中的信息是可以免费下载的,链接如下

http://ongene.bioinfo-minzhao.org/download.html

https://ask.qcloudimg.com/http-save/6552462/w5fmtikvsi.jpeg?imageView2/2/w/2560/h/7000

对于肿瘤研究而言,该数据库非常值得参考,可以帮助我们快速的筛选候选的肿瘤基因。

One Reply to “ONGene:基于文献检索的肿瘤基因数据库”

  1. 您这可以写一篇学术论文了。基于文献计量学的……。有很多学术文章都是用的这个方法。可以用软件citespace进行可视化

发表评论

邮箱地址不会被公开。 必填项已用*标注