DNA甲基化检测方法
为什么要检测 DNA 甲基化? 首先,我们为什么要检测 DNA 甲基化呢?检测 DNA 甲基化能回答什么问题?我们都知道,DNA 甲基化可以调控基因表达,因此检测 DNA 甲基化至少可以为解释基因表达的调控提供一些线索。其次,DNA 甲基化参与一系列重要生物学过程,包括早期胚胎发育、基因组印记、X 染色体失活、重复序列的沉默以及癌症的发生发展转移,DNA 甲基化也有助于阐明这些重要的生命过程背后隐藏的奥秘。此外,DNA 甲基化一个非常重要的应用,是可以作为肿瘤的生物标志物。DNA 甲基化如此重要,我们可能需要时刻想着它。
图 2. 人类基因组中 DNA 甲基化概况
位点特异性的 DNA 甲基化 刚才我们介绍了总体 DNA 甲基化水平的检测,但是这些方法都没有提供序列信息。如果我们需要知道位点特异性的甲基化信息,这个时候需要问第二个问题,我是只检测感兴趣的几个基因就行了,还是需要知道全基因组每一个基因的甲基化状态。如果我们只需要检测特定基因的 DNA 甲基化状态,紧接着,我们需要问第三个问题,我们只是定性地看看甲基化状态,还是定量地看甲基化的水平。
图 13. 四个问题 2.0 版本之第二、三个问题 Methylation-specific PCR,MSP 如果只是定性地看甲基化的状态,最简单快捷的是甲基化特异性的 PCR。MSP 可以快速检测 CpG 岛中任意一组 CpG 位点的 DNA 甲基化状态。
图 16. 重亚硫酸盐转化&克隆测序[7]
基于高通量测序的全基因组 DNA 甲基化检测方法 接下来,我们看一下第四个问题的另一种答案,我们用高通量测序来检测全基因组的 DNA 甲基化。之所以最后讲这个,是因为这个比较烧钱,而且后续的生物信息学分析比较复杂。 WGBS &RRBS 对于二代测序的方法,WGBS(Whole-Genome Bisulfite Sequencing)是目前的“金标准”。WGBS 想必大家都已经很熟悉了,但是考虑到 WGBS 成本较高,因此还有一种跟 WGBS 十分相似,但是只测基因组中的一部分的方法,即 RRBS(Reduced representation bisulfite sequencing)。
图 21. WGBS &RRBS 的比较[10]两者的差别在于,WGBS 通常使用超声打断整个基因组,并对整个基因组进行重亚硫酸盐处理和测序;但是 RRBS 使用 MspI 限制性内切酶。RRBS 可以检测到人类基因组中 85% 的 CpG 岛。RRBS 大约需要 100ng-1ug 的 DNA,而对于 WGBS 而言,需要 50-100ng DNA。尽管 WGBS 被誉为检测 DNA 甲基化的“金标准”,但是依然存在很多的不足。首先,重亚硫酸盐必须转化未甲基化的 DNA,否则会造成假阳性,不过目前我们可以通过加入 spike-in 作为对照来克服这个问题;还有,目前测到的 DNA 甲基化是多个细胞的平均甲基化状态,单细胞的 DNA 甲基化检测可能克服这个问题;其次,重亚硫酸盐转化,会降低基因组的复杂度,造成后续的 mapping 率不高;重亚硫酸盐转化还可能造成 DNA 断裂,这使得扩增长片段比较困难。另外,WGBS 的成本还是非常高的。
参考资料: https://mp.weixin.qq.com/s?__biz=MzIxMjA0NzU0OA==&mid=2650983484&idx=1&sn=5386066548d8e218e5087ca2ff3e8554&scene=21#wechat_redirect
甲基化特异的PCR扩增法是采用重亚硫酸盐处理DNA, 未甲基化的胞嘧啶(C)转变为尿嘧啶(U),而甲基化的胞嘧啶(C)不变。采用特异两对的PCR引物,其中每对引物中的一条针对检测位点,其或A,若用3端的最后一个为G的引物从处理过的DNA扩增出特异产物,表明存在甲基化,若用3端的最后一个为A的引物从处理过的DNA扩增出特异产物,表明没有甲基化(因为C变为U)。这种方法的优点是避免了酶切不完全可能导致的假阳性问题,敏感性高。
DNA 甲基化是表观遗传学(Epigenetics)的重要组成部分,在维持正常细胞功能、遗传印记、胚胎发育以及人类肿瘤发生中起着重要作用,是目前新的研究热点之一。
DNA 甲基化及CpG岛
DNA 甲基化是最早发现的基因表观修饰方式之一,可能存在于所有高等生物中。DNA 甲基化能关闭某些基因的活性,去甲基化则诱导了基因的重新活化和表达。甲基化的主要形式有5-甲基胞嘧啶,N6-甲基腺嘌呤和7-甲基鸟嘌呤。原核生物中CCA/TGG和GATC常被甲基化,而真核生物中甲基化仅发生于胞嘧啶。DNA 的甲基化是在DNA 甲基化转移酶(DNMTs)的作用下使CpG二核苷酸5'端的胞嘧啶转变为5'甲基胞嘧啶。这种DNA 修饰方式并没有改变基因序列,但是它调控了基因的表达。脊椎动物基因的甲基化状态有三种:持续的低甲基化状态,如管家基因;去甲基化状态,如发育阶段中的一些基因;高度甲基化状态,如女性的一条失活的X染色体。
哺乳动物中,CpG序列在基因组中出现的频率仅有1%,远低于基因组中的其它双核苷酸序列。但在基因组的某些区域中,CpG序列密度很高,可以达均值的5倍以上,成为鸟嘌呤和胞嘧啶的富集区,形成所谓的CpG岛。通常,CpG岛大约含有500多个碱基。在哺乳动物基因组中约有4万个CpG岛,而且只有CpG岛的胞嘧啶能够被甲基化,CpG岛通常位于基因的启动子区或是第一个外显子区。健康人中,CpG岛中的CpG位点通常是处于非甲基化状态,而在CpG岛外的CpG位点则通常是甲基化的。这种甲基化的形式在细胞分裂的过程中能够稳定的保留。当肿瘤发生时,抑癌基因CpG岛以外的CpG序列非甲基化程度增加,而CpG岛中的CpG则呈高度甲基化状态,以致于染色体螺旋程度增加及抑癌基因表达的丢失。
随着高通量测序技术(NGS)技术的发展,使我们能够从全基因组水平来分析5’甲基胞嘧啶及组蛋白修饰等事件,由此能够发现很多传统的基因组学研究所不能发现的东西,这就是所谓的“DNA甲基化测序”!
DNA甲基化测序方法按原理可以分成三大类:
一、重亚硫酸盐测序;
二、基于限制性内切酶的测序;
三、靶向富集甲基化位点测序;
基于以上原理又有数种不同的测序方法,下面,就介绍10种DNA甲基化测序的常用方法及参考文献:
1) 重亚硫酸盐测序
该方法可以从单个碱基水平分析基因组中甲基化的胞嘧啶。首先,利用重烟硫酸盐对基因组DNA进行处理,将未发生甲基化的胞嘧啶脱氨基变成尿嘧啶。而发生了甲基化的胞嘧啶未发生脱氨基,因而,可以基于此将经重亚硫酸盐处理的和未处理的测序样本进行比较来发现甲基化的位点。
【相关文献】
Shotgun bisulphite sequencing of theArabidopsis genome reveals DNA methylation patterning
Highly integrated single-base resolutionmaps of the epigenome in Arabidopsis
2)重亚硫酸盐处理后接头标记技术(PBAT)
为了避免重亚硫酸盐处理时模板的丢失,通常会在重亚硫酸盐处理后进行接头连接和随机引物的扩增。
【相关文献】
Amplification-free whole-genome bisulfitesequencing by post-bisulfite adaptor tagging
3)限制性内切酶-重亚硫酸盐靶向测序(RRBS)
该技术是指对基因组上CpG岛或CpG甲基化较密集的区域进行靶向测序。样本首先经几种限制酶进行消化处理,然后经重亚硫酸盐处理,最后再测序。这种方法可以发现单个核苷酸水平的甲基化。
【相关文献】
Reduced representation bisulfite sequencingfor comparative high-resolution DNA methylation analysis
4)氧化-重亚硫酸盐测序(oxBS-Seq)
5’羟甲基胞嘧啶(5’hmC)是5’甲基胞嘧啶脱甲基成胞嘧啶过程的中间产物,重亚硫酸盐测序无法对二者进行区分。通过氧化-重亚硫酸盐测序,5’甲基胞嘧啶保留,而5’羟甲基胞嘧啶(5’hmC)被氧化,进而脱氨基成尿嘧啶。通过将经过氧化处理和未处理的样本进行测序比较,即可从单个碱基水平分辨5’羟甲基胞嘧啶(5’hmC)和5’甲基胞嘧啶。
【相关文献】
Quantitative sequencing of 5-formylcytosinein DNA at single-base resolution.
5)TET辅助的重亚硫酸盐测序(TAB-seq)
TAB-seq采用葡萄糖亚胺与5’羟甲基胞嘧啶(5’hmC)作用来保护免受TET蛋白的氧化。5’甲基胞嘧啶和未甲基化的胞嘧啶被脱氨基成尿嘧啶,进而可以从单个碱基水平鉴定5’羟甲基胞嘧啶(5’hmC)。
【相关文献】
Base-resolution analysis of5-hydroxymethylcytosine in the Mammalian genome
6)甲基化敏感性的限制酶测序(MRE-Seq)
MRE-Seq将甲基化作用的敏感性和限制酶的特异性结合起来进而鉴定CpG岛的甲基化状态。
【相关文献】
Genome-scale DNA methylation analysis
7)HELP-Seq
HELP-Seq采用HpaII及其甲基化不敏感的限制性内切酶MSPI处理,来对基因组内及基因组间的甲基化位点进行比较,进而实现甲基化测序。
【相关文献】
Comparative isoschizomer profiling ofcytosine methylation: the HELP assay
8)甲基化DNA免疫共沉淀测序(MeDIP)
MeDIP是一种采用抗体或甲基化DNA结合蛋白来捕获富集甲基化DNA的技术,这种技术可以发现基因组中高度甲基化的区域,如CpG岛,但不能进行单个碱基水平的分析。
【相关文献】
Chromosome-wide and promoter-specificanalyses identify sites of differential DNA methylation in normal andtransformed human cells
9)甲基化结合域捕获技术(MBD-CAP)
MBD-CAP技术利用甲基化DNA能够结合蛋白MeCP2,MBD1-2 和 MBD3LI来对甲基化的DNA进行免疫沉淀。与MeDIP技术相似,该技术也是可以发现基因组中高度甲基化的区域,不能从单个碱基水平分析甲基化。
【相关文献】
High-resolution mapping of DNAhypermethylation and hypomethylation in lung cancer
10)基于探针的靶向富集技术
甲基化测序靶向富集技术采用合成寡核苷酸探针来捕获CpG岛、基因启动子区域以及其他一些显著性甲基化的区域。目前,Agilent 和 Roche Nimblegen公司已有这种商品化的试剂盒。
最后,Pacific Biosciences(Pacbio)公司的这项SMRT DNA测序技术采用动力学原理来直接检测甲基化的胞嘧啶。
其中三代测序技术针对真核中的5mc检测需要的深度较深,大概要250x,但是利用特殊的试剂会降低其深度。
表观修饰不需要改变 DNA 序列便能实现对性状的改变,表观修饰的改变与基因功能乃至细胞状态、发育、衰老、疾病等存在重要的关联。在众多的表观遗传修饰中,最为重要且研究最为广泛的修饰之一是 DNA 甲基化,而全基因组甲基化测序(WGBS-seq)无疑是最有效的研究手段。
全基因组甲基化测序利用重亚硫酸盐能够将未甲基化的胞嘧啶(C)转化为胸腺嘧啶 (T)的特性,将基因组用重亚硫酸盐处理后测序,即可根据单个 C 位点上未转化为 C 未转化为 T 的 reads 数目与所有覆盖的 reads 数目的比例,计算得到甲基化率。该技术对于全面研究胚胎发育、衰老机制、疾病发生发展的表观遗传机制,以及筛选疾病相关的表观遗传学标记位点具有重要的应用价值。
全基因组甲基化测序原理示意图入下:
样品检测——样品打断 ——文库构建——BS处理——文库质检
(一)样品检测
对DNA样品的检测主要包括2种方法:
(1)琼脂糖凝胶电泳分析DNA降解程度以及是否有污染,检测具有明显的主带,且条带清晰;
Qubit 2.0对DNA浓度进行精确定量,DNA检测总量不低于1ug。
(二)文库构建
样本检测合格后,使用Bioruptor系统将1µg样品基因组DNA与未甲基化的lambda DNA混合,然后将其片段化,平均大小约为250bp。片段化后,纯化的随机片段化DNA随后用T4 DNA聚合酶,Klenow片段和T4多核苷酸激酶的混合物进行修复,钝化和磷酸化末端。随后使用Klenow片段(3'-5'exo-)对钝的DNA片段进行3'腺苷酸化,然后与连接5'-甲基胞嘧啶而不是使用T4 DNA连接酶的胞嘧啶连接的衔接子进行连接。完成每个步骤后,使用磁珠纯化DNA。之后,根据说明使用ZYMO EZ DNA甲基化金试剂盒将未甲基化的胞嘧啶转化为尿嘧啶。最后,用JumpStart Taq DNA聚合酶进行PCR扩增,再使用磁珠对PCR产物进行纯化获得最终文库。
(三)文库质检
文库构建完成后,先使用Qubit2.0进行初步定量,稀释文库至1ng/ul,随后使用Agilent 2100对文库的insert size进行检测,insert size符合预期后,使用qPCR方法对文库的有效浓度进行准确定量(文库有效浓度>2nM),以保证文库质量。
(四)上机测序
文库检测合格后,把不同文库按照有效浓度及目标下机数据量的需求pooling后在illumina Nova平台测序,测序策略为PE150。
(一)原始下机数据质控
原始下机数据为FASTQ格式,是高通量测序的标准格式。FASTQ文件每四行为一个单位,包含一条测序序列(read)的信息。该单位第一行为read的ID,一般以@符号开头;第二行为测序的序列,也就是reads的序列;第三行一般是一个+号,或者与第一行的信息相同;第四行是碱基质量值,是对第二行序列的碱基的准确性的描述,一个碱基会对应一个碱基质量值,所以这一行和第二行的长度相同。以下为一条read信息的示例:
原始下机数据包含建库时引进的接头序列以及质量过低的碱基,这些因素会导致后续比对到基因组的reads较少,从而导致得到的信息较少,因此需要进行过滤。利用trim_galore软件对原始数据进行去除接头序列及低质量碱基等质控步骤。
(二)序列比对
经过质控的reads需要根据与参考基因组的序列相似度比对到参考基因组上。相比于常规基因组及转录组测序,WGBS测序方法产生的数据的特点决定其在比对时存在三大困难:
(1)DNA片段正链和负链经过重亚硫酸盐转化后将不再反向互补,再经过PCR,便会产生四条不同的序列,这将大大增加比对时的计算量。
(2)经过重亚硫酸盐转化后,DNA序列大部分C碱基被转化成T碱基,因此序列含大量T而缺乏C;经过PCR后,产生的互补链则含有大量A而缺乏G。这样便导致序列的复杂度降低(即序列的组成特征更单一),从而增加比对的难度。
(3)C和T的比对是不对称的。经过重亚硫酸盐转化后,序列中非甲基化的C碱基(占大部分)被转化为T,这将导致测序序列与参考基因组不匹配,T既可能应该比对到T上,有可能应该比对到C上;而C则只能比对到C上。这也增加了比对的难度。
利用BSMAP软件进行比对。BSMAP进行比对时,先以参考基因组上C碱基的位置作为指导,将reads中对应参考基因组C碱基位置的T标记为C,其他T保持不变,从而使reads可以直接比对到参考基因组。
(三)甲基化水平计算
甲基化水平可根据未转化为 T 的 C 与转化为 T 的 C 的 reads 的比例计算得到,即:
Beta-value = C-reads / (C-reads + T-reads) * 100%
其中,Beta-value 即为该胞嘧啶的甲基化水平,C-reads 为覆盖该位点的支持甲基化的reads 数目(测得该位点为 C 的 reads),T-reads 为覆盖该位点的不支持甲基化的 reads 数目(测得该位点为 T 的 reads)。 计算原理示意图如下:
利用BSMAP统计甲基化水平。
(四)差异甲基化区域(DMR)鉴定及统计
DMR检测使用权威期刊发表的metilene软件。该软件先将基因组进行预分段,以排除较长序列中不包含CG位点的片段。随后,利用二元分隔算法,递归缩小检测范围,以搜索得到组间累积平均甲基化差异最大的区域,作为可能的DMR;最后,结合双重统计学检验(MWU-test和2D KS-test),得到准确的DMR。检测原理如下图所示:
本分析检测DMR的标准如下:
(1)区域平均甲基化差异不小于0.1;
(2)CpG位点数不少于5个;
(3)区域长度不小于50 bp;
(4)甲基化水平差异统计检验的校正P值小于0.05;
(5)2D KS-test检验P值小于0.05。
(五)信息分析流程示意图
DNA甲基化组学研究的核心内容在于对DNA甲基化数据的挖掘。DNA甲基化一般遵循三个步骤进行数据挖掘。
首先,进行整体全基因组甲基化变化的分析,包括平均甲基化水平变化、甲基化水平分布变化、降维分析、聚类分析、相关性分析等。
其次,进行甲基化差异水平分析,筛选具体差异基因,包括DMC/DMR/DMG鉴定、DMC/DMR在基因组元件上的分布、DMC/DMR的TF结合分析、时序甲基化数据的分析策略、DMG的功能分析等。
最后,将甲基化组学&转录组学关联分析,包括Meta genes整体关联、DMG-DEG对应关联、网络关联等。
Whole-Genome Bisulfite Sequencing of Two Distinct Interconvertible DNA Methylomes of Mouse Embryonic Stem Cells. 两种状态的小鼠胚胎干细胞的甲基化组学研究
1、背景
小鼠胚胎干细胞一般生长在含有血清的基质中,被称作血清干细胞(serum ESCs);加两种激酶抑制因子使胚胎干细胞在无血清的情况下更能保持多能性的基态,这种干细胞称为2i干细胞(2i ESCs);这两种状态的胚胎干细胞可以互相转化。以前这方面的甲基化研究大多基于质谱,覆盖度和研究结果有限,尚缺乏2i胚胎干细胞的甲基化组学研究。
2、方法
利用全基因组重亚硫酸盐甲基化测序(WGBS),对这两种可互相转换的小鼠胚胎干细胞进行甲基化组学研究
3、结论
全面准确的检测了两种小鼠胚胎干细胞的DNA甲基化修饰并进行了系统的比较;同serum ESCs相比,雄性2iESCs全局低甲基化;在血清中,雌性ESCs跟雄性2i ESCs类似呈现全局低甲基化,而在2i ESCs状态下,甲基化水平会进一步降低。
以上就是关于全基因组甲基化测序实验流程和分析思路的介绍。
参考文献:
[1] Ashburner, M. and C. A. Ball, et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nat Genet, 2000, 25 (1): 25-9.
[2] Dirk Schübeler. Function and information content of DNA methylation. Nature, 2015, 517: 321–326.
[3] Frank Jühling et al. metilene: Fast and sensitive calling of differentially methylated regions from bisulfite sequencing data. Genome Research, 2016, 26: 256-262.
[4] Kanehisa M, Goto S. KEGG: kyoto encyclopedia of genes and genomes. Nucleic acids research, 2000,28(1): 27-30.
[5] Tadafumi Kato Kazuya Iwamoto. Comprehensive DNA methylation and hydroxymethylation analysis in the human brain and its implication in mental disorders. Neuropharmacology, 2014, 80: 133-139.
[6] Xiaojing Yang et al. Gene Body Methylation Can Alter Gene Expression and Is a Therapeutic Target in Cancer. Cancer Cell 26, 577–590.
[7] Yuanxin Xi et al. BSMAP: whole genome bisulfite sequence MAPping program. BMC Bioinformatics, 2009, 10:232.
[8] Gao F, et al. De novo DNA methylation during monkey pre-implantation embryogenesis. Cell Res. 2017 Apr27(4):526-539. pii: cr201725.
在基因组所有甲基化的碱基中占比最多的是5-甲基胞嘧啶(5mC),在哺乳动物中占比为98%左右,由DNA甲基转移酶家族(Dnmts)催化甲基从S-腺嘌呤甲硫氨酸(SAM)转移至胞嘧啶残基的第五个碳而形成。与此同时,5mC可以在氧化蛋白TET的作用下转化为5-羟甲基胞嘧啶(5-hmC),进一步在TET的氧化下转化为5-甲酰基胞嘧啶(5-fC),最终在TET的氧化下转化为5-羧基胞嘧啶(5-caC)。在基因组中含有很多CpG结构,60%~ 90% 的CpG 都被甲基化,未甲基化的CpG 成簇地组成CpG 岛,位于结构基因启动子的核心序列和转录起始点。关于甲基化的维持只要受DNMT1和UHRF1两个蛋白控制,用于在DNA复制时让新生成的链维持原有的甲基化模式。目前,在植物中,主要存在两种去甲基化方式,一是被动去甲基化,即DNA复制时新生成的链丢失甲基化;二是主动去甲基化,在DNA糖基化酶(DME)和ROS1的作用下,通过碱基错配修复途径(BER)去除甲基化。在哺乳动物中,被动去甲基化与植物相同,而DNA修复酶-胸腺嘧啶DNA糖基化酶(TDG)在DNA主动去甲基化上扮演了重要角色,关于主动去甲基化的过程还需进一步的研究。
目前,关于DNA甲基化的测序方法分为两大类,一类是以蛋白质特异性结合为基础的富集方法,该类方法类似ChIP-seq,可以将甲基化区域富集下来,然后测序分析甲基化情况,该类方法有一个很明显的缺点就是不是单碱基分辨率水平,因为富集到只是区间没法确定具体是哪一个位置发生了甲基化。如果只是想知道某些区域是否发生甲基化,得到一个定性的结论,那么用该类方法就很方便;二是以C碱基转化为T碱基为基础的测序方法,随着技术的发展,该类方法又可以分为两种技术,一种是将未甲基化的C碱基转化为T,另一种是将甲基化的C碱基转化为T。目前市场上还是以未甲基化的C碱基做转化的方法为主流,这其中以重亚硫酸盐处理的方法被大家认为是甲基化测序的“金标准”。该类方法有一个很明显的特点就是甲基化的分辨率可以达到单碱基的水平,再结合NGS的高通量特点,让科研人员很容易就能得到全基因组上的甲基化图谱。虽然优势很明显,但其也存在一些缺陷,体现在以下几个方面:1、对DNA的破坏,亚硫酸盐处理的反应条件比较剧烈,高温高酸的条件下会使很多DNA序列发生降解,使得DNA序列的多样性下降。为了达到很好的建库效果就需要高质量高有浓度的DNA样本;2、亚硫酸盐处理方法依赖未碱基化的C碱基转化为T碱基,而基因组范围内95%左右都是为甲基化的C,转化后导致文库碱基严重失衡,对测序结果造成影响,故这类文库上机测序时需要参入一定比例的Phix文库。同时,如果C->T的转化效率低,由于其基数很大也会造成很高的假阳性。随着技术的发展,一些将甲基化的C转碱基化为T的方法崭露头角脚,这些技术的天然优势就是甲基化的C碱基本身占比就很少,而且反应条件比较温和,基本不会引起DNA降解保持很好的序列多样性和复杂度,通过测定C->T转化有一种“所见即所得的感觉”,可以降低假阳性的产生。Bisulfite-free技术也在发展。虽然这些技术还不很成熟,但其优势却很明显,未来技术成有所突破一定会让其成为主流。
通过对DNA甲基化方面的知识做一个梳理,自己从中有所收获。个人觉得了解一个方面的知识,最好的方法可能是找一些好的综述来阅读。关于DNA甲基化,下面给出了一篇不错的综述,虽然文章发表于2014年,距离现在已经过去有些年限,但对于不了解的人来说里面的内容还是属于比较经典的,值得一看。今天就分享到这了~~~
这里有几种常用的找甲基化位点的测序方法:
第一种是重亚硫酸盐测序。重亚硫酸盐使DNA中未发生甲基化的胞嘧啶脱氨基转变成尿嘧啶,而甲基化的胞嘧啶保持不变,行PCR扩增(引物设计时尽量避免有CpG,以免受甲基化因素的影响)所需片段,则尿嘧啶全部转化成胸腺嘧啶。最后,对PCR产物进行测序,并且与未经处理的序列比较,判断是否CpG位点发生甲基化。此方法一种可靠性及精确度很高的方法,能明确目的片段中每一个CpG位点的甲基化状态。在寻找有意义的关键性CpG位点上,有其他方法无法比拟的优点。测序法以CpG岛两侧不含CpG点的一段序列为引物配对区,所以能够同时扩增出甲基化和非甲基化靶序列。它的不足是耗费时间和耗资过多,至少要测序10个以上的克隆才能获得可靠数据,需要大量的克隆及质粒提取测序,过程较为繁琐、昂贵。
第二种甲基化DNA免疫共沉淀MeDIP-Seq(Methylated DNA Immunoprecipitation Sequencing)测序,是基于抗体富集原理进行测序的全基因组甲基化检测技术,采用甲基化DNA免疫共沉淀技术,通过5'-甲基胞嘧啶抗体特异性富集基因组上发生甲基化的DNA片段,然后通过高通量测序可以在全基因组水平上进行高精度的CpG密集的高甲基化区域研究。MeDIP-Seq(Methylated DNA Immunoprecipitation Sequencing)测序是基于抗体富集原理进行测序的全基因组甲基化检测技术,采用甲基化DNA免疫共沉淀技术,通过5'-甲基胞嘧啶抗体特异性富集基因组上发生甲基化的DNA片段,然后通过高通量测序可以在全基因组水平上进行高精度的CpG密集的高甲基化区域研究。
第三种是三代测序技术,采用pacbio测序仪的SMRT技术,采用的是对DNA聚合酶的工作状态进行实时监测的方法。DNA聚合酶催化荧光标记的核苷酸掺入到互补的核酸链中。核苷酸的掺入被检测成荧光脉冲,依据其颜色鉴定出核苷酸。当聚合酶切断连接在核苷酸末端的荧光基团时,脉冲终止。荧光脉冲的到达时间和持续时间产生了关于聚合酶动力学的信息,从而允许直接检测DNA模板链中的修饰核苷酸,包括N6-甲基腺嘌呤、5-甲基胞嘧啶和5-羟甲基胞嘧啶。
简单来说,DNA甲基化就是在DNA甲基化转移酶(DNMT)的作用下将甲基选择性地添加到胞嘧啶上形成5′-甲基胞嘧啶的过程。DNA甲基化是最早发现的基因表观修饰方式之一,在维持正常细胞功能、遗传印记、胚胎发育和肿瘤发生发展中起着重要作用,是目前及未来很长一段时间的研究热点之一。
DNA甲基化测序
随着高通量测序技术的发展,我们能够从全基因组水平来分析5’-甲基胞嘧啶及组蛋白修饰等事件,发现很多基因组学研究发现不了的东西,这就是 “DNA甲基化测序”!且近年来测序成本的不断下降及测序技术的迭代更新,DNA甲基化测序方法可选择性更多了。
目前表观遗传学DNA甲基化研究测序方法常见的有:全基因组重亚硫酸盐甲基化测序[WGBS]、精准DNA甲基化和羟甲基化测序[oxBS-seq]、优化版简化甲基化测序[RRBS/dRRBS/XRBS]、单/微量细胞全基因组甲基化测序[scWGBS]、扩增子(羟)甲基化测序、(羟)甲基化DNA免疫共沉淀测序[(h)MeDIP-seq]等6种,适用于不同DNA甲基化研究方向的解决方案。
(1)全基因组重亚硫酸盐甲基化测序(WGBS)
全基因组重亚硫酸盐甲基化测序(WGBS)可以在全基因组范围内精确的检测所有单个胞嘧啶碱基(C碱基)的甲基化水平,是DNA甲基化研究的金标准。WGBS能为基因组DNA甲基化时空特异性修饰的研究提供重要技术支持,能广泛应用在个体发育、衰老和疾病等生命过程的机制研究中,也是各物种甲基化图谱研究的首选方法。
常规全基因组甲基化测序技术通过T4-DNA连接酶,在超声波打断基因组DNA片段的两端连接接头序列,连接产物通过重亚硫酸盐处理将未甲基化修饰的胞嘧啶C转变为尿嘧啶U,进而通过接头序列介导的 PCR 技术将尿嘧啶U转变为胸腺嘧啶T。
技术优势:
l 应用范围广:适用于人和大多数动植物研究(参考基因组已知)
l 全基因组覆盖:最大限度地获取完整的全基因组甲基化信息,精确绘制甲基化图谱
l 单碱基分辨率:可精确分析每一个C碱基的甲基化状态
研究案例:
Whole-Genome Bisulfite Sequencing of Two Distinct Interconvertible DNA Methylomes of Mouse Embryonic Stem Cells. 两种状态的小鼠胚胎干细胞的甲基化组学研究
①背景
小鼠胚胎干细胞一般生长在含有血清的基质中,被称作血清干细胞(serum ESCs);加两种激酶抑制因子使胚胎干细胞在无血清的情况下更能保持多能性的基态,这种干细胞称为2i干细胞(2i ESCs);这两种状态的胚胎干细胞可以互相转化。以前这方面的甲基化研究大多基于质谱,覆盖度和研究结果有限,尚缺乏2i胚胎干细胞的甲基化组学研究。
②方法
利用全基因组重亚硫酸盐甲基化测序(WGBS),对这两种可互相转换的小鼠胚胎干细胞进行甲基化组学研究
③结论
全面准确的检测了两种小鼠胚胎干细胞的DNA甲基化修饰并进行了系统的比较;同serum ESCs相比,雄性2iESCs全局低甲基化;在血清中,雌性ESCs跟雄性2i ESCs类似呈现全局低甲基化,而在2i ESCs状态下,甲基化水平会进一步降低。
(2)精准DNA甲基化和羟甲基化测序(oxBS-seq)
DNA羟甲基化是近年发现的一种新的DNA修饰并迅速成为研究热点。随着研究的深入,发现之前被认为是检测DNA甲基化“金标准”的重亚硫酸盐测序并不能区分DNA甲基化(5mC)和DNA羟甲基化(5hmC)。易基因联合剑桥大学建立了化学氧化法结合重亚硫酸盐转化的测序技术(oxidative bisulfite sequencing, oxBS-Seq),该技术不仅可以精确检测DNA甲基化,排除DNA羟甲基化的影响,还可以双文库结合同时单碱基分辨率精确检测DNA羟甲基化。
技术原理:
oxBS-Seq将5hmC氧化5fC,后者可以被Bisulfite转为U,从而实现5mC的精准检测;同时,经过与常规Bisulfite结果比较可以实现对5hmC的准确检测。
技术优势:
l DNA甲基化检测全新的“金标准”
l 全基因组单碱基检测DNA羟甲基化修饰
l 多重标准验证高氧化效率和高Bisulfite转换率
l 实验偏好性低,重复性高(R²>0.98)
l 可满足多种测序应用需求:简化基因组氧化甲基化测序(oxRRBS),目标区域氧化甲基化测序(Target-oxBS)
研究案例:
Quantitative sequencing of 5-methylcytosine and 5-hydroxymethylcytosine at single-base resolution (oxBS 技术单碱基检测5mC和5hmC在鼠胚胎干细胞中的水平)
①背景
随着5hmC在哺乳动物基因组中的发现,传统的bisulfite测序已不能精确区分5mC和5hmC的修饰差异,传统BS的测序结果中,5mC的修饰水平实际是5mC和5hmC两者信号的合集,建立一种精确区分两者的实验技术迫在眉睫。
②方法
利用oxBS测序技术对小鼠胚胎干细胞DNA甲基化和羟甲基化进行检测和定量。
③结论
本研究首次建立了通过化学氧化结合重亚硫酸盐处理的实验技术。该技术首先将5hmC氧化为5fC,进而可被重亚硫酸盐转换成U,从而排除了5hmC对5mC的信号干扰,达到精确检测基因组5mC的目的。运用该技术对小鼠胚胎干细胞的研究发现,5hmC在CGI相关的转录调控区域和LINE1元件中含量较高,表明其对表观重编程可能起到重要作用。
(3)简化甲基化测序(RRBS/dRRBS/XRBS)
简化甲基化测序(Reduced Representation Bisulfite Sequencing,RRBS)是利用限制性内切酶对基因组进行酶切,富集启动子及CpG岛等重要的表观调控区域并进行重亚硫酸盐测序。该技术显著提高了高CpG区域的测序深度,在CpG岛、启动子区域和增强子元件区域可以获得高精度的分辨率,是一种准确、高效、经济的DNA甲基化研究方法,在大规模临床样本的研究中具有广泛的应用前景。为了适应科研技术的需要,我们进一步开发了可在更大区域内捕获CpG位点的双酶切RRBS(dRRBS),可研究更广泛区域的甲基化,包括CGI shore等区域。
为助力低样本量多维度分析,我们开发了富集覆盖CpG岛、启动子、增强子、CTCF结合位点的甲基化靶向测序方法:extend-ed-representation bisulfite sequencing(XRBS),实现了高灵敏度和样本复用,使其具有高度可扩展性,并适用于有限的样本和单个细胞。
技术优势:
l 精确度高:在其覆盖范围内可达到单碱基分辨率。
l 重复性好:多样本的覆盖区域重复性可达到85%-95%,适用于多样本间的差异分析。
l 性价比高:测序区域针对高CpG区域,数据利用率更高。
研究案例:
DNA Methyltransferase Inhibition Reverses Epigenetically Embedded Phenotypes in Lung Cancer Preferentially Affecting Polycomb Target Genes DNA甲基化的改变对癌症细胞侵袭能力的影响
①背景
癌细胞的表型在一定程度上由表观决定,比如DNA甲基化。癌症发展后期的转移特性可能与表观遗传修饰的改变有关。
②方法
利用RRBS技术检测具有高侵袭性的非小细胞肺癌细胞系(A549和HTB56)以及相应经过甲基化抑制剂氮杂胞苷(azacytidine)处理过的细胞系的甲基化修饰。探讨甲基化的改变对肺癌细胞系的侵袭能力的影响。
③结论
高侵袭性细胞系在发展过程中,DNA甲基化修饰发生了广泛的改变。同低侵袭能力的细胞系相比,RRBS检测到的CpG富集的区域中有2.5%的区域发生了差异修饰。当使用了DNA甲基化抑制剂azacytidine,伴随着这些高甲基化修饰的位点出现甲基化修饰的丢失,细胞系的侵袭能力也发生了逆转。
5-Azacytidine诱导的侵袭能力逆转
(4)单/微量细胞全基因组甲基化测序(scWGBS)
单细胞及微量样本的DNA甲基化组学研究很大程度上受制于建库测序技术。传统的文库构建方法或类似于基因组DNA的单细胞扩增技术很难应用到甲基化实验过程中。易基因建立了基于线性扩增和单管建库的技术,可充分降低文库偏好性,准确的完成珍贵样本的全基因组甲基化研究。
单细胞及微量珍稀样本的甲基化研究主要应用于肿瘤发生机制,癌症研究,胚胎植入前诊断,胚胎早期发育,生殖细胞重组,干细胞及细胞异质性等研究领域。应用的样本包括单细胞、微量细胞等。
技术优势:
l 超低起始量:单细胞或超低的建库DNA起始量
l 测序覆盖度高 :最大限度地获取完整的全基因组甲基化信息,精确绘制甲基化图谱
l 单碱基分辨率:可精确分析每一个C碱基的甲基化状态
研究案例:
Single-cell DNA methylome sequencing of human preimplantation embryos. 人类植入前胚胎发育的单细胞DNA甲基化组图谱
①背景
在哺乳动物基因组上,胞嘧啶(主要是CpG二连体中的胞嘧啶)在DNA甲基化酶的催化下会发生甲基化。研究显示,DNA甲基化对多个生物学过程都至关重要,如基因表达抑制、转座子转录活性调节、X染色体的失活,以及基因组印记的维持等。此前研究显示在着床前的早期胚胎发育过程中只有大规模的DNA去甲基化。而此次研究数据显示,精子和卵细胞结合受精之后,在人类早期胚胎大规模DNA去甲基化的同时,也在大量高度特异的DNA从头加甲基化,这表明在人类早期胚胎第一轮DNA甲基化组重编程过程中,全局的DNA去甲基化‘净结果’实际上是高度有序的大规模DNA去甲基化和局部DNA加甲基化两种分子过程相互拮抗产生的动态平衡的结果。
②方法
利用单细胞DNA甲基化组高通量测序方法,首次在单细胞分辨率对人类植入前胚胎发育过程进行了更加深入的分析。
③结论
在这篇文章中,为了进一步在单细胞水平研究DNA甲基化重编程过程的动态特征,利用单细胞全基因组DNA甲基化组高通量测序技术,对人类植入前胚胎发育的各个关键阶段进行了单细胞、单碱基分辨率的系统研究,主要发现有:(a)首次发现了人类植入前胚胎发育过程中存在大量特异性的DNA从头加甲基。(b)首次发现从二细胞胚胎阶段开始父母本基因组上的剩余甲基化水平发生逆转,在同一个单细胞中母本基因组上的剩余甲基化水平显著高于父本基因组上的剩余甲基化水平。(c)首次发现DNA甲基化在早期胚胎卵裂过程中的不对称分配可以用来追溯同一个胚胎中每个细胞的遗传谱系。内容来源:易基因科技
建议研究重点放在转基因引起的沉默现象,也可以研究不同转化事件之间的甲基化差异。
当然,如果想成就一篇SCI文章的话一定要做一些胁迫下的对比。
PS:
转基因(通俗解释)——将自然界中某种已知生物的基因转给另一种已知生物,使后者获得前者的优异性状。例如:将苏云金芽孢杆菌(革兰氏阳性土壤杆菌,被广泛作为生物防治工程菌)的bt基因转给农作物使其抗虫。
“邪恶的转基因”就好比说把鸡蛋的基因转给西红柿,假如您不吃西红柿炒鸡蛋的话。
上帝花费了六天时间创造世界,一天时间休息。尽管上帝是万能的,但不免所创造出的物种有些许的瑕疵,于是科研人员便致力于此。最初将野生资源驯化,后来开发耕作技术,再后来杂交育种、选育,如今分子育种、遗传修饰。于是科研人员便成为一个笑话,一边否定神的存在,一边成为神的助手。更可笑的是,就像传说中的古代英雄一样,飞的太高太靠近太阳,翅膀上的蜡被烤化了,活活摔死。许多分子生物学试剂是高毒的,长期积累于研究者体内。最可悲的是每一阶段的成就享用者——大众都是极力反对、甚至唾弃科研人员的。罗马的鲜花广场上焚烧布鲁诺的火焰从未熄灭。
后半多话有些感伤,恐有失客观,见谅。
一种全新的DNA甲基化研究方法——Pyrosequencing技术
DNA甲基化是一种表观遗传修饰,它是由DNA甲基转移酶(DNA methyl-transferase, Dnmt)催化S-腺苷甲硫氨酸作为甲基供体,将胞嘧啶转变为5-甲基胞嘧啶(mC)的一种反应,在真核生物DNA中,5-甲基胞嘧啶是唯一存在的化学性修饰碱基。CG二核苷酸是最主要的甲基化位点,它在基因组中呈不均匀分布,存在高甲基化、低甲基化和非甲基化的区域,在哺乳动物中mC约占C总量的2-7%。一般说来,DNA的甲基化会抑制基因的表达。DNA的甲基化对维持染色体的结构、X染色体的失活、基因印记和肿瘤的发生发展都起重要的作用。
CpG双核苷酸在人类基因组中的分布很不均一,而在基因组的某些区段,CpG保持或高于正常概率,这些区段被称作CpG岛。CpG岛主要位于基因的启动子和第一外显子区域,约有60%以上基因的启动子含有CpG岛。 CpG甲基化的研究在肿瘤的研究中有着非常主要的地位。通过基因启动子区及附近区域CpG岛胞嘧啶的甲基化可以在转录水平调节基因的表达,从而引起相应基因沉默,去甲基化又可恢复其表达。DNA甲基化在生理情况下就参与了控制基因的时空表达,在肿瘤发生时,肿瘤细胞全基因组低甲基化是一个重要特征。肿瘤细胞基因组甲基化的程度与正常细胞相比仅为20-60% , 同时伴有局部区域基因的高甲基化,包括肿瘤抑制基因、抑制肿瘤转移和浸润的基因、细胞周期调节基因、DNA修复基因、血管形成抑制基因等。但是目前研究手段的局限,限制了DNA甲基化的广泛研究。
近年来,研究者不断探索定性及定量检测单个或多个甲基化位点的方法,但由于甲基化多态性区域存在的密度很高,所以对于延伸反应其引物的位置很难设计。Pyrosequencing技术作为一种新的序列分析技术,能够快速地检测甲基化的频率,对样品中的甲基化位点进行定性及定量检测,为甲基化研究提供了新的途径。
从原理上来看,Pyrosequencing是一种通过合成方法进行序列分析的方法,它通过核苷酸和模板结合后释放的焦磷酸引发酶级联反应,促使荧光素发光并进行检测。这项技术曾经被用作单核苷酸多态性(SNP)的基因型和单倍型的检测,以及细菌和病毒的鉴定和分型研究。这项技术的一个主要特点是在Pyrogarm™软件上显示的峰值高度来自于序列分析的原始数据,通过峰值的高度可以精确的检测混合DNA模板中等位基因的频率。
目前甲基化研究方面,很多甲基化定量分析的报道采用亚硫酸氢盐处理甲基化样本,并用混合的PCR产物
作为校正。其主要原理是:亚硫酸氢盐可以将没有甲基化的胞嘧啶转化为尿嘧啶,而在适当的实验条件下甲基化的胞嘧啶保持不变。因而,用它处理样本后,再进行PCR扩增,甲基化的位点可以被当作一个C/T的SNP来处理,它的基因频率为0-100%。在此,我们给大家介绍一个研究人员使用Pyrosequencing技术分析并精确定量DNA甲基化水平的例子。
研究者在一个Pyrosequencing反应中同时检测了6个甲基化位点。这种方法同样可以用于石蜡包埋的组织,并且具有较高的重复性和精确性。实验选择谷胱甘肽-S-转移酶π(GSTP1)转录启动位点的CpG岛进行检测。这些位点在正常前列腺组织中是非甲基化的,而在肿瘤样本中高甲基化。通过PCR扩增一个包含17个甲基化多态位点140bp的片段,并用4个测序引物研究其中15个位点(Table 1)。使用在线的SNP测序引物设计软件(Pyrosequencing AB)设计测序引物,其中一些甲基化多态性位点用最可能的碱基所代替,以减少计算的数量。再通过人工检测测序引物可能存在的错配。此外,同时在PSQ 96MA DNA分析仪上运行空白对照,扣除由测序引物、生物素标记的引物或是模板引起的背景。
PCR引物设计完全与模板相匹配,不覆盖任何甲基化多态性区域。使用10ng亚硫酸氢盐转化的DNA样本或是10 fmol纯化的PCR产物,10 pmol 正向(5’-GTGATTTAGTATTGG-3’)和反向(5’-biotin-AACTCTAAACCCCATC-3’)引物扩增GSTP1转录启动位点的基因片段,扩增片段长度为144bp。反应体系为60 mM Tris-SO4, pH 8.9, 18 mM (NH4)2SO4, 1 mM MgSO4, 200 μM dNTPs,以及3 U Platinum Taq DNA高保真聚合酶,终体积为50μL。PCR循环设置:首先在95℃下变性4分钟,然后在95℃ 30S,50℃ 45S以及72℃ 20S条件下重复50个循环,最后一步延伸步骤在72℃下4分钟,中止反应。PCR反应在Eppendorf的Mastercycler 96
哺乳动物基因组中,DNA甲基化是指CpG二核苷酸中的胞嘧啶第5位碳原子被甲基化. DNA甲基化是一种基因外修饰,不改变DNA的一级结构他在细胞正常发育、基因表达模式以及基因组稳定性中起着至关重要的作用. 全基因组低甲基化,维持甲基化模式酶的调节失控和正常非甲基化CpG岛的高甲基化是人类肿瘤中普遍存在的现象. DNA高甲基化是导致抑癌基因失活的又一个机制.
http://www.wjgnet.com/1009-3079/abstract_cn.asp?f=1420&v=11
RRBS全称Reduced Representation Bisulfite Sequencing: 即简化代表性重亚硫酸盐测序。该方法在Bisulfite处理前,使用MspI(该酶的酶切位点为CCGG)酶切对样本进行处理, 去除低CG含量DNA片段 ,从而使用较小的数据量富集到尽可能多的包含CpG位点的DNA片段。
相比于WGBS技术,RRBS是一种准确、高效且经济的DNA甲基化研究方法,通过酶切,并进行Bisulfite测序,该方法在保证DNA甲基化状态检测的高分辨率的同时提升测序数据的高利用率。
甲基化数据处理流程: