Posted on

在做完m6A测序后,如何对差异甲基化的基因进行验证。简单来说就是IP后如何进行qPCR 实验。我们遇到的第一个疑问就是究竟能用多少RNA来做后期验证呢?换句话说,假如要验证10个基因,究竟需要多少total RNA或polyA的RNA才合适呢?

PART

01

我们先进行一个简单的计算,常规的RT-qPCR 1个反应(1个复孔)需要的total RNA至少0.1-1ug左右。我们按照最小反应起始量来算的话,那么1个反应需要至少100ngtotal RNA,3个技术重复(3个复孔),总计total RNA为300ng。

我们知道total RNA中绝大部分为rRNA,那么只有不到5%RNA为我们需要研究的对象。PCR反应需要引物跟目标序列区域进行充分碰撞,那么如果只使用mRNA会大大降低一次PCR反应的起始量。通过计算我们认为5-10ng做1PCR反应较为合理。也就是1个样本中验证1个基因不做生物学重复只做3个复孔需要至少15ngmRNA300ngtotal RNA。那么3个生物学重复就需要9个反应,总计45-90ng mRNA或900ngtotal RNA

根据上面的推算,IP下来的RNA若有500ng,可以验证6-12个基因左右(1个基因3个生物学重复,每个重复3个复孔即技术重复,所以一个基因总计9次反应)。哺乳动物IP效率在10-20%左右,植物在20-40%左右(最高可达50%)。那么假设要验证6-10个基因,哺乳动物需要至少2.5-5ug的mRNA100-200ugtotal RNA,植物样本至少需要1.25-2.5ug的mRNA50-100ugtotal RNA。若加入IgG抗体这个步骤,则需要对total RNA的起始量再次翻倍。

PART

02

那么接下来在进行讲解前的第二个问题就是,明明我们做高通量测序只有一个input文库和一个IP文库,为何我们做m6A-IPqPCR 要加入IgG抗体呢(如下图所示)?

那是因为高通量测序可以对所有被m6A抗体富集下来的RNA进行全转录层面的扫描分析,一旦m6A抗体有非特异性富集,在数据呈现上我们可以明显发现reads的分布比较乱且没有规律,而特异性富集则reads几乎富集在哺乳动物的3’ UTR区和植物的5’ UTR和3’ UTR区。所以这就是测序不需要IgG文库,而我们做m6A-IPqPCR 需要IgG富集的原因。

搞定了样本起始量和IgG的问题后,我们具体来看下步骤:

第一步,先对RNA进行特异性富集和打断。即在打断之前,我们需要搞清楚研究对象只是mRNA还是lncRNA。若只研究mRNA 可以先用oligodT磁珠进行富集后再进行打断。如果是lncRNAmRNA都要研究,则需要先用试剂盒将total RNA的rRNA先去除干净,再进行打断。如果是进行高通量测序打断长度约为100nt左右,而qPCR 则需要长度至少在200nt以上,部分论文甚至打断长度在300-500nt左右。一般根据文献中的资料显示,IP下来的片段用引物扩增出来的长度在130-150左右,所以100nt不到的长度要设计出合适的引物会非常困难。除非是用5’RACE扩增,否则还是建议大于200nt。

第二步,对打断完了的RNA片段进行抗体孵育和特异性富集。打断完了RNA我们会得到长度约为200-300RNA片段。这时候我们可以分出约占m6A-IP部分RNA只有10%RNA作为input。简单来说用于m6A IPRNA2ug,那么inputRNA需要在200ng左右。IgG富集的RNA起始量与m6A-IP的量一样,比例为1:12ug

第三步,洗脱和逆转录扩增。接下来我们需要对m6A抗体和IgG抗体上洗脱下来的RNA,以及inputRNA,按照常规试剂盒要求进行洗脱,并用随机引物进行逆转录。

第四步,设计m6A-IPqPCR 的特异性引物。由于m6A甲基化基本富集在UTR区和转录终止区,所以如上图所示在这些区域附近我们可以从测序结果里有明显的peak峰。那么我们设计引物可以考虑在基因高甲基化区域来进行。如果某几个常见的基因在不同文献里频繁出现,那么文献里列出来的引物可以被我们直接拿来引用。通常最后PCR产物长度会在130-150bp左右。这里需要注意的是,IP下来的RNA需要用随机引物进行逆转录,而第四步中设计的引物用的是特异性引物,这个大家要注意区分和甄别。

第五步,使用上一步设计好的引物,对input、m6A-IPIgG-IP中的RNA进行qPCR反应并计算相应的CT值。

所以到这里我们的实验部分已经完成了,简单总结下就是想要做够10个左右基因的验证,必须至少提供>200ug的total RNA以上。富集的RNA类型根据自己要求出发,如polyA RNArRNA-depleted RNA等,最后就是打断成200-300nt左右的长度。用于qPCR的RNA一共分成3类,即inputm6A-IPIgG-IP,其中input占m6A-IP起始量约10%。如果用数字来表示那就是input需要100ngm6AIP前需要1ugIgGIP前也需要1ug

所以接下来我们就要详细讨论下m6A-IP-qPCR 是如何计算相对表达量的。

PART

03

MeRIP-qPCR 是m6A-IP-qPCR 的另一种说法。所以从名称上我们就能发现,m6A-IPqPCR基本和常规的RIPqPCR相似。当然在讨论RIPqPCR之前,我们先来看看常规的RT-qPCR 是如何计算相对表达量的。

关于RT-qPCR的方法学论文很多,所以这里关于实验部分就不细讲了。计算基因的绝对定量需要加入外参基因,所以暂且我们先来看看相对表达量,也就是RT-qPCR传统的2-△△Ct法是如何计算的。

假设验证一个基因,那么3个生物学重复(biological replication)是必须的,每个生物学重复要做3个复孔,我们也称之为技术重复(technical replication)。那么一个基因总共要做9个反应。

每1个样本的1个基因做3个复孔,内参基因和目的基因的Ct值分别取均值,最后得到Ct内参和Ct目的。如哺乳动物会选择GAPDH作为内参基因。其公式为:

ΔCt=Ct目的-Ct内参

处理组和对照组的所有样本都要这样计算。例如,处理组和对照组分别有3个和3个样本(即3个生物学重复),你会分别得到处理组的3个ΔCt和对照组的3个ΔCt

然后用t检验检验下3个处理组样本的ΔCt3个对照组样本ΔCt之间是否有统计学差异。将处理组的3个ΔCt取均值得到ΔCt处理组,将对照组的3个ΔCt取均值得到ΔCt对照组。最后来计算ΔΔCt和相对表达量(即2ΔΔCt次方),公式分别为:

ΔΔCt=ΔCt处理组Ct对照组

相对表达量=2-ΔΔCt

也就是处理组中某基因的表达量是对照组中表达量的2-ΔΔCt倍。我们假设ΔCt处理组ΔCt对照组分别是7和10,那么ΔΔCt=-3,最后相对表达量为8(23次方)。

我们从传统的RT-qPCR会发现,每个样本都要做一个内参基因,如上面提到的哺乳动物会选择GAPDH,而miRNA则会选择U6。那么我们的m6A-IPqPCR 是不是也需要内参基因,根据我们查阅的大量文献来看,绝大部分是没有的,少量文献也会使用到内参基因或者我们称之为negative control gene。

那么是不是m6A-IPqPCR 就真的没内参了呢?其实也不是!实际上我们会发现整个input充当了内参基因的概念,一个基因的甲基化水平是无法直接用RIP下来的RNA在做qPCR后直接用Ct值高低来衡量的,需要input中的RNA作为背景。而IgG抗体的加入则是为了排除m6A抗体非特异性结合情况发生。由于有时候m6A抗体不同厂家、保质期、蛋白性能等因素可能会产生非特异性结合的结果,这时候就需要用IgG来排除这部分的干扰。目前市面上使用的绝大部分m6A抗体为兔抗,那么尽量在使用IgG做对照时也使用兔抗来源的IgG

那么我们首先依旧是与传统的RT-qPCR相似,用相应的软件实时监测扩增曲线。溶解曲线必须是单峰,以保证引物特异性扩增。然后就是校准每一个样本的平均Ct值,以消除样本准备过程中的差异。

接下来我们就要开始对每个样本中,RIP和input3个技术重复得到的Ct值计算平均值,再对3个生物学重复样本中的Ct平均值再去计算其Ct平均值,得到Average Ct RIP和Average Ct input。最后计算稀释系数,即input dilution factor,也就是inputRNAm6A-IPRNA有多少比例。根据上面的示例,也就是input RNA=100ngm6A-IP RNA=1ug,那此处的稀释系数=10%。最后根据这些数值,我们可以计算出归一化后的ΔCt值,也叫ΔCt normalized RIP

这里为什么归一化后的ΔCt normalized RIP还要减去log2(input dilution factor呢?那是因为需要减去input的噪音,排除其干扰。由于RNA样本特别稀少,所以在做实验的时候往往会把input的使用量按照一定比例减少。如本文中input的占比就只有10%,那么稀释倍数(Input Dilution Factor)就是0.1。最极端的情况,就是RNA十分的富余,所以当input的比例理论上和m6A-IPIgG-IP的比例一样时,那么log2(input dilution factor=0,也就无需相减了。所以加入稀释系数的校正,目的就是为了达到input:m6A-IP:IgG-IP=1:1:1的效果。

下一步就是要计算在RIP下来的RNA中某一个基因占input中这个基因有多少的百分比。换句话说就是有input中的某个基因究竟有百分之多少发生了甲基化,所以这里我们用%input来表示。基本上到这一步,部分老师不想做IgG验证的,会把这个数据直接放在论文里,但是我们建议还是要加入IgG的部分。当然这一步需要进行线性归一化处理,方法与上面的RT-qPCR 类似,其公式为:

%input = 2Ct normalized RIP

由于无法判断m6A抗体是否存在非特异性富集的情况,所以要过滤这些噪音还需要使用兔抗IgG再对RNA进行一次富集。这时候就需要对ΔCt再次进行背景去除。其中需要检测的目的基因在IgG中的ΔCt值就是ΔCt negative control。其公式为:

  

最后一步就是最激动人心的一刻,那就是计算甲基化富集倍数,也叫Fold Enrichment,其公式为:

那么不加IgG可以直接将结果用于论文中的数据呈现吗?其实在部分的高分文章中我们也发现不用IgG直接进行验证的,即用%input数据直接用于表示甲基化比例。但是为了保险起见,我们还是强烈推荐老师加入IgG组的数据用于后期校正。

Get到了m6A-IP-qPCR正确的打开方式了吗?

本文方法参考来自以下几篇文献,若要了解详细的方法,老师可以自行下载对应文献查看。

注意事项

m6A抗体富集这部分的protocol,请参考m6A权威,m6A-seq的发明人以色列特拉维夫大学医学院的Gideon Rechavi教授发表在Nature ProtocolsPubmed id23288318)的文章。这里面会有非常详细的步骤教你如何做m6A抗体去IP带有甲基化修饰的RNA。到时候注意打断长度为200-300nt即可,打断需要做几次条件实验。也就是说除了打断长度转换成200-300nt,富集到的RNA从上机测序变为PCR外,其他所有步骤全部一样。文章中的生物信息部分可以忽略不计。

参考文献:

1. Weng, HY., et al. METTL14 Inhibits Hematopoietic Stem/Progenitor Differentiation and Promotes Leukemogenesis via mRNA m6A Modification. Cell Stem Cell 22.2 (2017).

2. Ma, CH., et al. RNA m6A methylation participates in regulation of postnatal development of the mouse cerebellum. Genome Biology 19.1 (2018): 68.

3. Liu, J., et al. m6A mRNA methylation regulates AKT activity to promote the proliferation and tumorigenicity of endometrial cancer. Nature Cell Biology 20 (2018): 1074

4. Weng, YL., et al. “Epitranscriptomic m6A Regulation of Axon Regeneration in the Adult Mammalian Nervous System. Neuron 97.2 (2018): 313.

5. Gagliardi, M., et al. RIP: RNA Immunoprecipitation. Methods in Molecular Biology 1480 (2016): 73.

6. Dominissini, D, et al. Transcriptome-wide mapping of N(6)-methyladenosine by m(6)A-seq based on immunocapturing and massively parallel sequencing. Nature Protocols 8.1 (2013): 176-189.

2 Replies to “m6A-IP(MeRIP)-qPCR计算相对表达量”

  1. 写得很详尽,非常受用!想请问一下,要是IgG组测不到Ct值,如何校正呢?

    1. 这个我也不清楚,按道理IgG组多少会有少量富集的,是足够PCR反应的,是不是您的样本量太少?如果qPCR扩增曲线可以看出有扩增,只是还未到达阈值,可以试试增加循环。

发表评论

邮箱地址不会被公开。 必填项已用*标注