采取得当的设计软件能极大地促进实验设计的进程。OligoArchitect供应了两种设计供选择。首先是OligoArchitect Online,是一种具有多种功能的软件设计工具。如果实验设计须要专门的功能,第二种选择便是OligoArchitect Consultative软件,包含我们专业的分子生物学家帮忙。
扩增子选择
扩增子是待剖析的靶标序列,包含在正向和反向PCR引物之间。扩增子大小的确定部分取决于所利用的剖析方法。当通过凝胶电泳可视化PCR片段时,须要PCR片段足够长,使得DNA结合染料能有效染色,并与所选的人工长度标记的范围相适应。同样地,当通过毛细管电泳仪剖析片段时,PCR产物将介于两者之间,100个碱基对和超过2kb的任何位置(终极被酶反应限定)。

当利用qPCR进行终极读数时,选择较小的扩增子以确保在每个循环中进行准确定量。空想情形下,qPCR扩增子的长度范围为75至200个碱基,除非设计限定使得引物超过该范围。事实上,片段大小可以通过考虑一些成分来确定,包括生物学考虑。
检测位置可根据实验的目的事先确定:空想情形下,用于确定mRNA是否存在或含量的检测定位于外显子-外显子连接处,以避免检测到污染的gDNA序列。然而,这些区域常日高折叠;因此,须要做一个决定,是优先选择一个可能性能较差的外显子超过实验,还是一个更高质量的外显子实验。比较来自多拷贝基因的低丰度转录物,如果mRNA丰度高且从单拷贝基因转录而来,gDNA污染旗子暗记的影响要小一些。SNP的检测须要在错配位点上定位探针或3'端引物。
剪接体的剖析须要根据靶标专门设计方法。有时候须要同时检测所有的剪接体,这可以通过选择在所有变体之间守旧的外显子区域来实现。然而,研究不同剪接体之间的表达差异则须要更有创造力的方法。这次示范实验目的是检测图6.1中所示的哪些替代转录物被表达了。由于外显子相对较小,扩增所有外显子产物大约为300个碱基,比扩增剪接体的产物长度短一些。本研究所选择的设计为:
在每个外显子连接处设计几个实验,并在每个实验中探测每种样品。
设计外显子1的3'端引物和外显子4的5'端引物。扩增任何由外显子组合组成的转录物,都会产生特定长度的扩增子。转录的定义将用qPCR确认及SYBR Green I染料反应溶化曲线确定。
图 6.1.四种潜在剪接体的表达示意图。区分每种剪接体时,可通过超过每个外显子连接的特定引物对设计,通过外显子1和外显子4的通用引物对的扩增,以及利用qPCR、SYBR Green I染料溶化剖析方法。
一样平常通过以下标准评估扩增子序列:
建议对靶标序列区域进行初步评估。
确认没有非常SNP。引物和模板之间的一个错配会使得溶化温度降落10°C,从而影响PCR的效率。
确认所选序列与目标物种的基因组/转录组中任何其它序列不具有同源性。靶向多种器官系统时(例如病原体检测),必须对样品中所有的序列进行同源性检测。
利用OligoArchitect的折叠算法检测靶序列可能的二级构造,利用选定的设计软件或mfold软件(http://mfold.rna.albany.edu/)仿照在设计的引物退火温度下模板的折叠。选择预测为开放构造的模板区域,避免非常负ÄG值的茎环二级构造。当利用一步法发转录方法和基因特异性引物时,这点须要重点考虑。
避免回文序列和重复区域。
避免G/C含量高的区域,目标是50%旁边的GC含量。
设计多重实验时,扩增子应尽可能具有相似的长度和GC含量,避免偏倚扩增。
设计针对基因家族的实验时,根据须要确定同源性或异质性区域。然后对序列进行比对,并检讨得当的共有序列的片段。
对付转录物特异性设计(以避免检测到gDNA模板),尽可能在外显子-外显子连接区域以外选择靶向区域。
转录物特异性扩增子的选择
大多数(但非全部)DNA在RNA纯化过程中从样品中去除的。为避免在RT-qPCR过程中扩增DNA,建议选择的引物要么在一个大内含子的两侧(不在mRNA的序列中),要么跨过一个外显子-外显子连接(图6.2)。
EnsemblGenomes网站(http://ensemblgenomes.org/)供应了许多脊椎动物、细菌、原生生物、真菌、植物和无脊椎后生生物物种的已知基因的内含子/外显子注释。其余,如果靶标基因组和cDNA序列都可以公开得到,可以在目标生物的基因组数据库中,用BLAST搜索检索cDNA序列确定内含子的位置(图6.3)。图6.3中的内含子1太长(~6.5kb),DNA不该在常规PCR或受控PCR条件下扩增。但是,其它的内含子相对较短(<1 kb),因此RT-qPCR期间可能会扩增DNA(例如,参测验验优化和确认)。引物必须超过外显子-外显子连接,或位于长内含子(几kb)的两侧,或在几个小内含子的两侧。
图 6.2.(A)超过内含子和(B)侧翼连接内含子的RT-PCR引物示意图。内含子为赤色,外显子为绿色。引物P1和P2超过内含子,引物P3和P4位于内含子两侧。把稳引物P1和P2不会产生PCR产物,除非退火温度极低。如果内含子较短(~1 kb),P3和P4可能会产生长于预期的PCR产物,但如果内含子足够长(几kb)则不会。
图 6.3.用BLAST将cDNA序列和基因组DNA序列进行比对。来自Genbank的大鼠p53的完全cDNA序列(登记号NM_030989)用megaBLAST在大鼠基因组(blastn)中搜索相同的序列。cDNA和gDNA的比对结果显示位于10号染色体上。通过该信息,cDNA的外显子可以与gDNA相应的区域对齐,引物可直接针对由长内含子分开的外显子设计,比如外显子1和外显子2。
甲基化特异性检测
DNA甲基化是细胞分解的主要部分,会导致基因表达以稳定的办法发生改变。甲基化对高档生物的正常发育很主要,并且可以遗传。DNA甲基化基因调控,包括将甲基加到胞嘧啶嘧啶环的5号位或腺嘌呤嘌呤环的6号氮上。在成人体细胞组织中,DNA甲基化常日发生在CpG二核苷酸环境中,而非CpG甲基化在胚胎干细胞中普遍存在。甲基化特异性实验须要鉴定序列内的CpG岛——常日位于基因的启动子区域。该信息在利用Beacon Designer(Premier Biosoft)时自动定位,可从以下网站获取:http://www.mybioinfo.info/index.php。
引物设计
本章中描述的一样平常引物和探针设计的建议对多种运用都适用,包括基因表达研究、SNP检测、甲基化检测研究、拷贝数测定、病毒载量检测和剪接体定量。每种运用也特定的设计考虑成分,接下来会单独谈论。
引物设计的一样平常标准
对付大多数运用,引物设计成与待扩增的模板DNA序列完备互补。PCR引物设计的基本考虑成分包括:
qPCR引物长度常日为20-24个核苷酸,溶化温度(Tm)约为60°C(59±2°C),但常规PCR可能有所不同,为(55±5°C)。特定运用可能须要修正引物长度和Tm。
引物的GC含量应为40-60%,并且不应有明显的二级构造。
引物自身及引物之间不应存在互补,特殊是3’末端。这降落了扩促进程中产生引物二聚体产物的可能性。
避免3’端发夹构造(检讨3’端5个碱基,3个为A或T,2个为G或C即可)。
避免运行长度超过4个重复相同核苷酸或回文区域。
SNP特异性引物
在某些情形下,例如在设计单核苷酸多态性(SNP)测定时,测定的位置不灵巧,周围的序列也会影响到所选的寡核苷酸序列。认识到临床条件与种系和得到的体细胞SNP之间的关系,对开拓更加敏感和特异的检测系统起到推动浸染。这反响了利用寡核苷酸杂交区分SNP存在的难题。这些难题是由不同的错配之间不稳定的差异引起的。个中G:A,C:T和T:T可能具有很强的毁坏稳定的浸染,G:T和C:A比较弱,由于可以形成氢键,因此难以将这些配对与天然G:C和T:A区分开来。许多系统都是根据扩增-受阻突变系统(ARMS)1改编的,它已经被广泛运用,并有助于筛查囊性纤维化突变2。ARMS引物长30个碱基(较长的引物,最多60个碱基,是有功能的)。3’的碱基是SNP特异性的,因此对靶序列(正常或突变碱基)具有特异性。在倒数第二的位置引入一个额外的错配。这是考虑莅临近的碱基和SNP不匹配而确定的(表6.1,摘自Little,2001)。
经《Current Protocols in Human Genetics》许可转载:Little, S. 2001.Amplification-Refractory Mutation System (ARMS) Analysis of Point Mutations.Curr.Protoc.Hum.Genet.7:9.8.1–9.8.12.
其他研究小组利用了类似的不雅观点并证明了引物中N-2和N-3位置引入错配的浸染,Liu等人3对错配的相对位置进行了深入剖析,以得到最大的不稳定浸染,因此具有最高的特异性。
多重PCR
要在每管中增加PCR的通量或节约样品材料时,须要利用多重PCR同时扩增多个靶标。引物设计是多重PCR成功的关键成分。遵照引物设计的一样平常标准,并对包含在反应中的所有引物(和探针)进行相容性验证至关主要。在一些情形下,利用略长的、Tm约为65℃的引物可能是有利的。如果要根据大小不同来剖析得到的扩增子,则须在实验设计时就考虑剖析方法的分辨能力。试图用qPCR定量多个靶标时,扩增子应尽可能相似以避免扩增偏倚。除引物外,模板不能形成稳定的二级构造也十分关键,由于这会阻碍PCR的进行。如果我们已经知道靶标之间浓度差异很大,则在高浓度的靶标中引入阻断引物可能有利于促进准确地检测出低浓度靶标4。
非编码RNA定量
与编码基因组相反,估计约有97%的人转录组由非编码RNA(ncRNA)组成5;6,7。长的非编码RNA是该家族的一员,被描述为一类调节RNA分子。这些分子在表不雅观遗传学,发育,癌症和关键的生物学过程中发挥浸染8,9。长ncRNA传统上被定义为由至少200个碱基的RNA链组成10,11,12。这意味着识别了扩增子长度后,在设计这些靶标时,除了上述内容外,不须要特殊考虑其它成分。
比较之下,microRNA(miRNA)家族成员则面临相称大的设计寻衅。其为21-23nt的短非编码RNA(sncRNA),通过繁芜的细胞路子在转录本处理的几个阶段产生。MicroRNA通过与转录本结合负面调节蛋白质翻译(见Kato等人在200813中的综述13),并勾引RNA勾引沉默复合物(RISC)形成14。商业化检测法,例如MystiCq®系列,是针对miRNA设计寻衅的一个热门办理方案。已经有几种用于miRNA剖析的qPCR方案15和无商业产品的生物学研究方案,有几篇文章描述了潜在的办理方案。个中许多依赖于通过连接一个衔接子(拜会第22章,Casoldi等,PCR Technologies;Current Innovations en Nolan16)或通过polyA聚合酶(PAP)添加poly-A尾17,向原始miRNA添加碱基。在每个miRNA特异性引物中添加标签可以优化杂交Tm,且已经证明含有DNA引物的反应比加入锁定核酸的反应更有效18。在报告中,设计特异于miRNA的DNA引物,除了考虑常规引物指南,还需把稳:
检讨miRNA序列并忽略3’真个所有末端A碱基。• 将正向引物定为从5’端到3’端末了4个碱基的最长序列(忽略上面鉴定出的A碱基)。
正向引物的3’真个2个碱基之一优先选为A或T。
3’真个3个碱基优先选择包含1个或2个A或T。
3’真个5个碱基优先选择包含2-3个A或T。
利用最临近算法剖析正向引物的Tm。如果低于59°C,按给定顺序将下列碱基添加到5’端并打算每次加入后的Tm:G、A、C、G、C(产生CGCAGN18形式的引物,个中N是miRNA特异性碱基)。选择Tm最靠近59°C的最短引物。如果温度高于59°C,则去除5’碱基并在每次去除碱基后打算Tm。选择Tm最靠近59°C的最长引物。
选择反向引物的3’碱基,确保它们不与正向引物互补。按照正向引物的描述评估末端5个碱基。
向引物添加15×T(例如,5’ T15 N5 3’)。
利用最临近算法剖析正向引物的Tm。如果低于59°C,将下列碱基依次添加到引物的5’,并在每次添加后打算Tm:G、A、C、C、T、G、G、A、C、C(产生CAGGTCCAG T15 N5形式的引物,个中N是miRNA特异性碱基)。选择Tm最靠近59°C的最短引物。
RT引物是CAGCTCCAG T15 V N(个中V=A,C和G,N=A,C,G,T)。
引物设计实例
由于靶序列决定了引物序列,因此可能无法始终达到所需的设计标准。因此,须要通过实验特异性优化避免降落实验设计哀求。在设计成功的实验前,一些PCR靶标可能须要进行分外的处理。常见的案例涉及病原体的检测,包括病毒。众所周知,许多病毒基因组的特定位置具有高度的变异性。乙肝病毒是一个很好的例子。在最近一项研究中,为成功设计针对已知HBV变异19的qPCR实验,须要对所有可用的HBV基因组序列进行广泛的比对。利用ClustalW比对几百个序列,试图找到可用于通用实验设计的显著序列的共有序列。比对结果的一个片段如图6.4所示。星号()代表在所有基因组等分析中创造的共有核苷酸。(由于空间限定,未显示这项比对中大部分其它序列)。
图 6.4.HBV基因组数据的部分ClustalW剖析。利用ClustalW比对所有已知的HBV基因组序列并鉴定出守旧的核苷酸()。
在这种情形下设计引物和探针时,可能须要利用含有稠浊碱基的寡核苷酸,也称为“摇摆”或简并碱基。例如,考虑如图所示的HBV共有序列的细节(图6.5)。
图 6.5.HBV比对的选定区域显示共有区域
该区域引物大约须要二十三个碱基。在这种情形下,当考虑所有HBV基因组序列的所有可能性时,该二十三个碱基区域的实际序列如图6.6所示:
图 6.6.引物序列的排列需适应所选共有引物区域的所有碱基选项。
模糊碱基的位置可用稠浊碱基的标准单字母代码表示(表6.3)。当这些运用于图6.5和6.6所示的序列时,寡核苷酸可以如图6.7所示。
A =腺苷,C =胞苷,G =鸟苷,T =胸苷
图 6.7.共有区域的寡核苷酸的模糊碱基由标准单字母代码表示。
该选择不太可能形成成功的PCR引物,由于利用大量简并碱基须要办理其余的考虑成分。尤其是利用该序列制备的合成寡核苷酸,实际上会产生每种可能的单碱基序列的稠浊物。可能的单个引物序列的数量通过乘以每个位置的各个碱基数来打算。对付该序列,这意味着1×2×1×1×2×1×1×2× 2×1×3×2×1×2×2×2×2×1×1×2×2×1×1 = 6,144个可能的寡核苷酸。因此,反应中每种特定寡聚物的有效浓度按比例减少。履历剖析表明,引物中不同序列排列的数量不应超过512,因此这个例子不是最佳的简并碱基引物。在不同的位置重新设计引物是一个可能的办理方案。在如图6.8所示的例子中,引物包含2个潜在的错配碱基。但是,它们各自有一个替代碱基,在稠浊物中产生4个寡聚核苷酸,且简并位于引物的5’端区域。这些成分供应了比图6.7所示的引物更高的成功几率。
图 6.8.在共有区域比对共有碱基和潜在引物位置的序列该共有引物利用简并代码显示。
当在PCR中利用简并寡核苷酸时,可能须要改进的扩增方案。循环可以从在低退火温度(35-45℃)下进行2-5个循环开始。此外,从退火温度到延伸温度缓慢上升坡道需详细化,大约须要3-5分钟才能达到延伸温度。然后应在更严格的退火温度下以25-40个循环完成方案,而不进行坡道润色。
在可能的情形下,只管即便避免核苷酸异质性。如果无法避免异质性区域,常日是在有困难靶标情形下,则使专门的寡核苷酸润色,例如肌苷和其它“通用”碱基,例如5-硝基吲哚,可能有助于降落繁芜性;添加润色基团,如锁定核酸(拜会定量PCR和数字PCR检测方法)可能提高性能。
引物润色
可以将润色的核苷酸掺入到PCR引物中。加入一个锁定核苷酸是常见实例。锁定的核苷酸是一个润色RNA核苷酸。锁定核酸的核糖部分用一个额外的桥连接2’的氧和4’的碳进行润色(拜会定量PCR和数字PCR检测方法)。这种桥将核糖“锁定”在3’内切构象中。必要时,锁定的核酸可以和寡核苷酸中的DNA或RNA碱基稠浊。锁定核酸的润色使得热稳定性增加,许可设计Tm较长的未润色的引物相相等的更短探针。含有锁定核酸的序列比仅有DNA组成的寡核苷酸特异性更强,非常适宜SNP检测。锁定核酸润色的其他运用包括为繁芜序列设计寡核苷酸,例如因具有高度变异性而难以设计通用检测方法的病毒22。
探针设计
关于PCR引物,qPCR探针设计也在很大程度上取决于序列内容和所需的运用。单探针,如双标记探针和分子信标,常日长度为20-30个碱基。Scorpions®探针长度较短,为15-25个碱基。在LightCycle或FRET系统中,有两个探针位于紧邻位置,由1-5个碱基隔开,分别为传感探针(探针1)和锚定探针(探针2)。
当利用双标记探针时,Tm应比引物高7°C至10°C,以确保探针在引物杂交和延伸之前与靶标结合。反应中的FRET探针也是如此。用于SNP检测时,传感探针(探针1)位于错配位点上方,避开探针末端的3个碱基,并且Tm值比锚定探针(探针2)低(约5°C)。Scorpions®探针是该建议的例外环境,由于探针与延伸后的新合成的模板结合(而不是和之前的结合,就像其他探针系统一样)。
对付利用双标记探针的定量研究,目标是将探针定位在靠近正向引物3’端但不重叠(约5个碱基)的位置;对付SNP检测,将双标记探针或分子信标置于扩增子的中央,并将SNP置于探针的中央。
避免在探针的5’端,靠近报告基因处利用胍,由于这会导致淬灭。
确保探针序列中G少于C。
避免运行相同的碱基(<4)和回文序列。
确保探针不会形成二级构造。
确保探针不能与引物杂交。
当设计用于多重反应的探针时,确保所有的探针和引物之间没有潜在的相互浸染。
分子信标
在选择了得当的探针区域后,将互补的茎添加到探针的5’和3’末端以产生分子信标构造20。以下例子显示了将茎序列(赤色)添加到双标记探针中以产生分子信标(图6.9摘自Thelwell 200021)。
图 6.9.将双标记探针修正身分子信标形式牛津大学出版社的核酸研究。经牛津大学出版社版版权容许中央容许,可以书本/电子书的形式重复利用。
Scorpions® 探针
Scorpions®探针须要将探针与正向引物组合,使得它们采取以下构造:5’染料茎-探针-茎-淬灭剂-阻断剂-引物。引物和探针必须位于相反的链上,由于探针与新产生的模板结合,该模板与引物位于同一条链上。如图6.10所示,将标记,淬灭剂,PCR阻断剂和茎序列添加到双标记探针来创建Scorpions®探针摘自Thelwell 200021)。
图 6.10.将双标记探针测定修正为Scorpions®探针形式。牛津大学出版社的核酸研究。经牛津大学出版社版版权容许中央容许,可以书本/电子书的形式重复利用。
探针润色
当探针位于含有非常异质性的序列区域时,如PCR引物中所述管控模糊碱基。类似地,可将锁定核酸添加到探针中,其缘故原由与在引物中添加一样。
双标记探针、分子信标或Scorpions®探针的5’端标记有荧光团,单次剖析常日用6-FAM™,多重剖析常日按FAM、HEX™/ JOE™、青蓝素5的顺序选择利用(确定标记与仪器的兼容性至关主要)。双标记探针或分子信标的3’端和Scorpions®探针内部茎区的3’末端用淬灭基团分子润色。以往,染料TAMRA用于FAM发光的受体,导致FAM淬灭。暗淬灭剂技能的发展使得Black Hole Quenchers®和我们最近推出的Onyx Quencher™系列广泛采取(拜会定量PCR和数字PCR检测方法)。
模板对照
利用相对较短的扩增子(常日短于150个碱基)的一个优点是,可以进一步合发展寡核苷酸,然后作为合成扩增子的靶标。利用这样的靶标有助于开拓和优化预期靶标可能很稀少或不敷的实验,例如抑制对照实验SPUD23(见附录A)或传染性疾病研究19。
寡核苷酸的合成和处理
订购用于PCR的定制寡核苷酸时,须根据所需合成产率/规模、纯度和所需的润色剖断产品。这些成分会相互影响,例如,纯化水平越高,寡核苷酸的质量就越好,代价则是会降落总产量。表6.4,6.5和6.6供应了我们关于生产寡核苷酸的合成规模和预期产量的辅导。
寡核苷酸纯化
当合成DNA时,每个核苷酸从序列的3’末端开始依次与成长链偶联。在每个偶联循环中,少量寡核苷酸链不会延伸,结果形玉成长产物和截小引列的稠浊物。当寡核苷酸从载体上被切掉,保护基团被移除后,通过纯化将全长产物从截短的序列等分离出来。常日,特定运用所需的纯度取决于存在的截短低聚物可能的影响。对付某些运用,仅存在全长(n)寡核苷酸十分关键的。对付PCR引物等其他运用,存在较短的寡核苷酸(n-1,n-2,...)可能不会影响实验结果。
脱盐纯化
脱盐程序可撤除合成、裂解和脱保护步骤的残余副产物。
对付包括PCR在内的许多运用,对长度超过35个碱基的寡核苷酸脱盐纯化是可接管的,由于寡核苷酸占绝大多数,超过了较短产物的其他任何影响。克隆所需的寡核苷酸或长度超过35个碱基的须要另一种纯化方法,例如反相滤芯纯化(RP1)、HPLC或PAGE(取决于长度)。
反相柱纯化(RP1)
反相柱上的分离去除了大部分截短的序列。这种分离方法基于全长产物和截小引列之间的疏水性差异。全长寡核苷酸保留在柱子上时,而截短的序列被洗掉了。然后,将所需的全长产物洗脱下来,并从柱中取出。
反相HPLC
随着寡核苷酸的长度增加,截小引列的比例也趋于增加。并非所有这些杂质都会被RP1去除,因此对付较长的寡核苷酸,例如人工扩增子模板寡核苷酸或标记的探针寡核苷酸,建议利用HPLC或PAGE纯化。反相高效液相色谱(RP-HPLC)的操作事理与反相色谱柱相同。但是,更高的分离度可实现更高的纯度水平。HPLC是一种有效的纯化荧光(如qPCR探针)标记寡核苷酸的纯化方法,由于它们固有的亲脂性能很好地分离产品与污染物。此外,由于色谱柱的容量和溶解性子,RP-HPLC的利用范围较广。基于亲脂性的分离度会随着寡核苷酸的长度而降落。因此,常日不建议RP-HPLC用于纯化超过50个碱基的产品。虽然较长的寡核苷酸(最多80个碱基)可以利用这种方法纯化,但可能会对纯度和产率有不利影响。
阴离子交流HPLC
阴离子交流分离基于分子中磷酸基团的数量。阴离子交流纯化方法是在季铵固定相柱或类似构造上利用盐梯度洗脱。该分辨率非常适宜于量少的纯化。这项技能可以和RP-HPLC联合利用,为分离过程增加第二个维度。阴离子交流HPLC受寡核苷酸长度限定(常日最高为40mer)。寡核苷酸越长,在阴离子交流HPLC柱上的分辨率就越低,因而靶标寡核苷酸的纯度就越低。
聚丙烯酰胺凝胶电泳(PAGE)
PAGE分离基于电荷而非分子量,因而有良好的尺寸分辨率,可产生纯度水平为95-99%的全长产物。从凝胶中提取寡核苷酸和撤除绝大多数截短的产物所须要的程序繁芜,以是PAGE的产率低于其他方法。当须要高纯度产品时,推举利用该方法。纯化较长寡核苷酸(≥50碱基)时,推举利用PAGE。
寡核苷酸制备
供应干燥的DNA寡核苷酸,即可通过重悬浮后利用。建议将寡核苷酸重悬浮于弱缓冲液中,比如TE(10mM Tris,pH 7.5-8.0,1 mM EDTA)。在不适宜利用TE的运用中,可利用无菌无核酸酶的水。