ceRNA全称为“competing endogenouse RNA”, 中文名称是“竞争性內源RNA”,和ncRNA等概念不同。ceRNA并不是代表某种特定类型的RNA,而是一种调控机制,在国自然中受到广泛关注,即ceRNA是通过与miRNA反应原件(MREs)竞争相同的miRNA,进而调节靶基因转录本的表达。已发现的ceRNA 包括蛋白编码 mRNA 和非编码 RNA, 其中后者包括假基因转录物、 长链非编码 RNA(LncRNA)、环状 RNA(circRNA)、人工miRNA抑制剂(Artificial miRNA sponges)、假基因(pseudogene)、病毒RNA抑制剂(viral miRNA sponges)。
LncRNA(Long non-coding RNA)是长度大于200个核苷酸的非编码RNA。LncRNAs作用范围广泛,机制非常复杂,可以与DNA、RNA、蛋白质互作,参与表观、转录、转录后等多个层面的调控,在生命活动中有重要作用。LncRNA可以与miRNA互作,作为ceRNA并吸收miRNA,抑制miRNA的作用,促进mRNA表达。常见的靶基因预测网站TargetScan、microRNA等只能预测编码基因3UTR与miRNA的结合,有些网站可以预测LncRNA与miRNA的结合位点,比如starbase,但是只能预测少部分且已知的LncRNA,碰到新发现的novel LncRNA就无能为力了。而今天我们要介绍的这两个网站可以帮助大家解决此问题。
一、 mirdb
进入mirdb网站,点击左侧的“Custom Prediction”。该功能可以使用自己的LncRNA序列进行预测。选择Species(可选物种:Human、Mouse、Rat、Dog、Chicken),选择Submission type(可选miRNA Sequence和miRNA Target Sequence),这里我们选择miRNA Target Sequence,对于miRNA Target Sequence的长度有要求,必须在100-3000bp之间。
接着,“Go”之后,输出结果如下,通过每个结果左侧的“Details”查看具体的结合位点。预测的原则方法同编码基因,都是种子区序列(seed sequence)与LncRNA结合。
二、 RNAhybrid
RNAhybrid是一种用于发现长链RNA和短链RNA的最小自由能杂交配对的工具。杂交配对的计算是在一种域模式(domain mode)下进行的,即短序列与长序列的最合适部分杂交配对。因此该工具主要是作为microRNA靶基因预测的手段。进入网站,选择“Submission”,小编的习惯是target Sequence(s)和miRNA sequence(s)的“data input method”选择“Copy & Paste”。这里,target Sequence(s)和miRNA sequence(s)可以是多个序列,“data input method”选择“File Upload”上传符合网站要求的文件。通常我们碰到的情况是预测某个LncRNA可能的miRNA,只要在miRNA sequence(s)位置输入对应的miRNA即可,按照fasta格式可输入多个miRNA。
如果要预测LncRNA与所有比如Human的miRNA的结合情况,那可以先从miRBase数据库下载mature序列,稍作整理即可用RNAhybrid进行预测。
需要注意的是,RNAhybrid预测LncRNA与miRNA结合位点并不是基于种子区序列(seed sequence)进行预测,而是基于最小自由能进行计算的。这里建议从预测结果中选择可能的miRNA结合位点时,同时考虑结合序列位于种子区序列(seed sequence),同时排除种子区序列存在G:U配对的预测结果。
两个网站就简单介绍到这里。而上述两个网站中都提到了种子区序列(seed sequence),简单为大家介绍下何为种子区序列(seed sequence)?
从下面三张图片,基本能了解种子区序列(seed sequence)在哪里?有哪几种结合方式?每种结合方式的稳定性如何?
图 1
图 2
图 3
预测circRNA与蛋白结合域的请问有吗?之前catRAPID可以,现在也打不开了,我已知circRNA分子和蛋白分子,想找到可能的结合域,谢谢!
您好 这个我倒不清楚,不过我试了一下catPAPID,这个网站现在可以访问使用的哇