武汉爱基百客生物科技有限公司

https://igenebook.biomart.cn

公众号

扫一扫
进入手机商铺

公司新闻

掌握这些细节,你就是 ChIP 实验大神

发布时间:2018-02-27 09:37 |  点击次数:

ChIP-seq 是一种结合染色质免疫共沉淀和二代测序来研究蛋白与 DNA 之间相互作用的技术,可用于鉴定转录因子的结合位点、比较不同样本之间组蛋白修饰的变化及检测等位基因之间的差异结合。在这类研究中,很多因素都会影响研究结果,我们要掌握其中一些关键细节才能得到一个近乎完美的结果,接着小编带着大家一起去看下到底都是哪些细节。
 
样本准备
ChIP 实验样本需求量视蛋白因子类型和样本类型而定。对于组蛋白修饰类型,因其属于结构成分,结合丰度较大,只需较少量即可完成一次实验,通常需要细胞量为 10^5-10^6 个;对于转录因子,结合丰度较小,需要细胞量达 10^6-10^7 个。对于组织,样本需要量视样本染色质提取情况而定,通常植物组织需求量为 3~5g,动物组织为 0.5~1g。
 
抗体准备
ChIP 实验对样本的要求较高,最好是商业化 ChIP Grade 抗体,这类抗体拥有较好的特异性及耐受缓冲液洗涤作用。对于非商业化 ChIP Grade抗体,若能在免疫印迹及免疫组化中表现良好且能通过 IP 检测,亦可进行 ChIP 实验尝试;对于 TF 类型,无商业化 ChIP Grade 抗体时也可进行转基因操作,给目的 TF 融合 Tag 标签。
 
对目的蛋白是否有商业化抗体,小编推荐在https://www.citeab.com/上查询,该网站可查到目前市面上绝大多数抗体公司家的抗体信息,且能查询到具体某种抗体在文献中的使用情况。
 
下图为小编检索的组蛋白 H3K4me3 抗体的情况,排前两位的均为 ChIP Grade 抗体,其中 Merck Millipore 的文献引用最多,达 521 篇,但不全是做 ChIP 研究的,有兴趣的老师可自己去点击这 521 篇文献查看。
         

    
值得注意的是,这些抗体里面有些 Application 里写的是“ChIP”,有些会写“ChIP-seq”,两者的区别在于“ChIP-seq”类抗体拥有更高的信噪比,在进行测序分析时能得到更准确的结合位点信息。
 
另外,根据经验,一种商业化 ChIP Grade 抗体在不同物种中存在效率不同,因此小编建议在选择抗体之前先查阅相关文献,看研究同类物种或近缘物种中使用的是哪家品牌的抗体,再加以选择,并借鉴文章中的抗体使用量。
 
对照选择
ChIP 实验中的对照可分为:
阴性对照,IgG 或 mock;
阳性对照,RNA polⅡ 或 H3;
自身对照,Input;
样本对照,生物胁迫或给药的未处理样本或转标签阴性样本。
   
各对照各自的作用是什么?
首先,阴阳性对照均是对实验操作正确与否的判断。理论上,阴性对照应富集不到产物或有很少量的产物,阳性对照应有较多的产物量,若不是满足这种关系可判断实验操作失败,需重新进行实验。亦可根据阳性结合位点信息进行 PCR 或 qPCR 验证实验成败。
 
其次,自身对照 Input 是起排除实验背景的作用。这是因为本身我们染色质就存在开放和致密区域,两部分区域在染色质裂解过程中的效率不一样,会造成部分偏差,另外在建库及测序过程中也会存在一部分的偏向性,这些都会引起假阳性的实验结果,需要利用自身没有富集的产物同步进行去排除。严格来讲,阴性对照是更适合作为对照来排除这部分背景的,因为其完全模拟了实验样本的操作情况,但其产物量通常很少,在建库过程中会引入新的偏差,所以在测序过程中一般选择 Input 作为对照样本去排除背景。

值得注意的是,Input 样本数量怎么选?是每个IP样本均需要一个 Input 样本吗?小编认为不需要,如对同一份材料进行多个蛋白因子的实验,如能保证实验同一时间进行,则可只进行一份Input 实验;再如,生物学重复,Input 也可选择混合建库测序的方式。但对于不同材料、不同时间进行的实验,则必须保证一个IP产物对应一个 Input 同步建库测序的方式。

样本对照的则是为了找生物胁迫、给药处理之后,蛋白因子结合情况的真实变化,或转录因子调控基因的真实情况。
 
文库构建
ChIP 小片段文库的构建可选择文献中常见的几种,如 NEBNext Ultra II DNA 文库制备试剂盒、Illumina TruSeq ChIP 文库制备试剂盒等。需要的注意的是,建库过程请尽量 PCR 处于线性扩增,避免测序较多重复片段,这些因为目前大部分的 peak caller 在进行 call peak 过程中均会过滤掉 duplication 的 reads,过多 duplication reads 会影响有效数据量,对下游分析结果造成影响。
 
测序策略及reads长度
Single-end(SE) sequencing or paired-end(PE) sequencing ?
How long the reads should are ?
 
理解这两个问题需要从以下几个方面认识
1. PE sequencing 和 long reads 均可提高比对(Bowtie)精确率与重复元件覆盖率,两者之间的权衡取决于预期数据的质量。
                      
   
                               
2. 在 call peak 方面,PE sequencing 产生更多的 peak,但其质量(主要是 motif 预测及分辨率)与 SE sequencing 相同。通俗来讲,即 PE sequencing 会得到更多 peak,但不影响motif 的判断。另外,reads length 对 call peak 而明显影响。
                            
   
          
3. PE sequencing 和 long reads 均可提高等位基因特异性结合检测的分辨率。
                        
   
            
那么,现在关于这两个问题你有答案了吗?
 
测序深度
随着高通量技术的发展,测序成本逐步下降,那么在 ChIP 实验中测序深度应该如何选择?
 
测序深度的选择应该基于研究物种的参考基因组大小和蛋白因子类型而定,绝不该是一个统一的深度,选择合适的测序深度可以在合理的花费情况下最大限度的去发现我们所要研究的信息。
下面以果蝇和人类为研究物种、组蛋白修饰为蛋白因子,去理解这个问题。
 
1. 对于与活性启动子相关的组蛋白标记如 H3K4me3 和 H3K4me2,只需比较小的测序深度即可完成全基因组的有效覆盖及 call peak 结果。Fly 约 10M reads 左右,Human 则需要 20M reads 左右。
2. 而与转录相关的组蛋白标记如 H3K36me3、或与增强子相关的组蛋白标记如 H3K27Ac 和 H3K4me1,则需要更多一点的测序深度才可完成全基因组的有效覆盖及 call peak 结果。Fly 约15M reads 左右,Human 则需要 30M reads 左右。
3. 对于抑制性组蛋白标记如 H3K27me3 和 H3K9me2 就需要较大的测序深度才可完成全基因组的有效覆盖及 call peak 结果。Fly 约 20M reads 左右,Human 则需要 40M reads 左右。
4. 对于核心组蛋白如 H1 和 H4、或广泛存在的组蛋白修饰则需要最大的测序深度才可完成全基因组的有效覆盖及 call peak 结果。Fly 约 30 M reads 左右,Human 则需要 70M reads 左右。
5. 对于大多数转录因子,其作为点源因子结合在基因组范围内,测序深度可与 H3K4me3 相当,Fly 选择 10M reads,Human 选择 20M reads 即可。
                     
                 
   
                       
对于其他组蛋白标记又该如下选择合适的测序深度?下面以果蝇为例,阐述常见组蛋白标记所需要的测序深度。

至于其他物种,小编给出经验如下:
1.对于和果蝇基因组相差不大的物种,按照果蝇相应标记选择测序深度即可;
2.若研究物种基因组大小比果蝇基因组大出一个数量级,则以相应标记的果蝇测序深度乘以 2~3x 即可。
   
   
   那么,今天的分享就到此为此,以上的这些你都掌握了吗?