SiRNA序列的设计
SiRNA序列的设计
RNAi最终要通过siRNA片段与靶基因结合并使之降解,因此,确保高度同源于靶基因而绝无与其他基因同源的siRNA序列,是决定RNAi特异性的关键所在,也是siRNA设计的基本原则。从具有不同沉默效率的siRNA序列中筛选出高效的siRNA序列,需要经过严密的设计和不断的实验检验[1]。
1.1 siRNA序列在靶基因中的位置
从靶基因起始密码子AUG下游50~100个核苷酸开始搜寻理想的siRNA序列,越靠近靶基因的3′端,其基因沉默效果可能越好[2]。以前的研究表明:不要以5′非翻译区(5′UTR)和3′非翻译区(3′UTR)及起始密码子附近序列作为设计siRNA的模板,这些区域含有调节蛋白结合位点(如翻译起始复合物),调节蛋白可与RISC竞争结合siRNA序列,降低RNAi效应[3];也要避开外显子与外显子的交界区域和单核苷酸多形性(SNP)区域。最近,Yokota等发现在HCV(丙型肝炎病毒)基因组中,5′UTR是一个高度保守区,使之成为siRNA理想的靶点。运用RNAi技术作用于5′UTR或3′UTR序列,同样可引起靶基因沉默[4,5],这些发现使基因功能分析领域扩展到5′UTR和3′UTR内。
1.2 siRNA序列的起始碱基与长度
SiRNA序列最好为AA(N n)UU(N 代表任意碱基;n为碱基数目,在19~29 nt之间),NA(N n) UU和NA(N n) NN序列也可以。以前的研究表明,典型siRNA 的三大结构特征是:长度为21~23 nt;siRNA双链的3′端各有两个突出碱基;siRNA双链的5′端有磷酸基团。以AA N19 标准设计的siRNA,在哺乳动物细胞中70%~80%可产生RNAi 作用。但是一些具有较小脱靶效应的siRNA序列不是以AA为起始的,所以现在不推荐以“AA为起始”作为选择标准之一[6]。最新研究表明[7,8] ,27 nt或29 nt的siRNA与21 nt siRNA相比:(1)其抑制活性可提高数倍以上;(2)不易于诱导干扰素反应和激活PKR;(3)一些基因对21 nt siRNA不敏感,但是可以被27 nt siRNA有效
的抑制;(4)与21 nt SiRNA相比,27 nt SiRNA对靶基因的最大抑制率可在相对低的浓度下得到。另外,在选择siRNA 序列时,要考虑到所用启动子的类型。U6启动子要求转录产物的第一个碱基是G,正反义链均如此;H1启动子转录产物的第一位碱基为U、G、C均不影响基因的沉默效果[9]。
1.3 siRNA 3′端突出碱基的选择
当siRNA 的3′端突出碱基为UU时,其基因抑制效率最高;但是3′端的突出碱基不能为G,因为RNase会降解以G为末尾的RNA 单链。Elbashir等[2]建议用dTdT取代3′端的2 个碱基突出,增强siRNA 双链复合体的稳定性。需要注意的是,由于双链siRNA中的正义链不参与对靶mRNA的识别,所以正义链的3′端突出碱基可以用dTdT替代,但是反义链3′端突出碱基必需与靶mRNA序列相同的。
1.4 siRNA序列中G/ C含量的选择
在siRNA 序列中,G/C 含量的选择比确定以AA 为起始的序列更重要。具有均衡碱基含量(即G/C含量在30%~70% ) 的序列可以作为siRNA候选序列;而具有较低G/C含量(30%~52%)
的siRNA序列,其沉默基因效果较好[10]。
1.5 siRNA 中应避免连续的单一碱基和反向重复序列[10,11] 因为连续2个以上的G和C可以降低双链RNA 的内在稳定性,从而抑制RNAi作用[12];连续3个以上的U和A可能终止由RNA Polymerase III介导的转录[13]。siRNA序列中的重复序列或回文结构可能形成发夹状结构,这种结构的存在可以降低siRNA的有效浓度和沉默效率。
1.6 siRNA双链的内在稳定性
siRNA反义链5’端具有较低的热稳定性,即反义链5’端的第一个碱基为A或U;siRNA正义链的5’端第一个碱基为G或C。因为siRNA解旋可能从富含A/U的反义链5’端有效的起始,有利于反义链与RISC的结合,而抑制正义链与RISC的结合[14]。
1.7 siRNA正义链的碱基偏爱性
以3’端具有2 个碱基突出的19 nt siRNA为例,正义链的第一
位和第十九位碱基为A;正义链的第十位碱基为U;正义链的第十三位碱基不为G;正义链的第十九位碱基不为G或C时,siRNA 序列具有较高的基因沉默效率[10]。
1.8 siRNA 序列的特异性
为了确保侯选siRNA 序列只沉默单一的靶基因, 侯选siRNA 序列应在美国NCBI (National Center for Biotechnology Information) 的EST 或Unigene 数据库进行BLAST 同源性比对。当siRNA 序列只同源于靶基因时,才可以用于下一步的基因功能研究。
1.9 可能影响siRNA 效能的其他因素
RNA 结合蛋白的结合情况;mRNA 的二、三级结构;mRNA 的丰度、半衰期;以及所表达蛋白质的半衰期等等[15] 也可能影响siRNA的效能。有研究表明,与反义技术或核酶技术不同,在RNAi 过程中,靶mRNA 的二级结构对基因沉默的效果没有太大影响[16]。为了使siRNA具有最大的靶向特异性,在条件允许的情况下应该尽可能的全面考虑。
1.10 设计的siRNA序列数目
目前没有发现siRNA的干扰效率与mRNA中具体位置的关系,为确保对靶mRNA的有效抑制,针对每一个靶基因应该设计4条以上siRNA序列,进行化学合成后,通过实验筛选出沉默效率最高的siRNA 序列进行下一步的基因功能研究。
需要注意的是,有的siRNA序列在设计时没有遵守这些指导方针,实验证明也具有很高的干扰效应,这表明,我们只能根据上述指导方针设计出理论上具有较高沉默效应的siRNA序列,siRNA 的最终活性需要用实验来验证[17] 。
2 shRNA序列的设计
短发夹RNA (small hairpin RNA,shRNA)可在细胞中被加工成siRNA。设计shRNA时,shRNA 中两个反向重复序列的设计原则与siRNA序列的设计相同,需要重点考虑的是shRNA 环序列的长度及组成,而且环序列不能与靶基因内的其它序列具有同源性。
2.1 shRNA环序列的长度
一般来讲,设计shRNA时选择3~10 nt长度的发夹环均可。Brummelkamp等[18]构建了具有5 nt、7 nt、9 nt环的shRNA,比较它们在MCF7细胞中抑制CHD1基因的效果:9 nt环的shRNA 抑制率达90%;7 nt环的shRNA只有中等的抑制率;5 nt环的shRNA则无抑制活性。但是Siolas 等[8] 报道,环序列的长度对RNAi效率无明显影响。
2.2 shRNA环序列的组成
研究表明,当shRNA发夹环的组成为“UUGAUAUCCG”和“UUCAAGAGA”时具有较高的抑制效率。当发夹环前面的序列是以“UU”终止时,应该选用“CCACACC”环序列[12]。环序列中有2个U对产生有效的基因抑制很重要[18];但环序列中不能有连续3个以上的U[12] ,因为这可能导致shRNA转录的提前终止。
3 siRNA阴性对照序列的设计
所有的RNAi 试验均应设立阴性对照,siRNA 阴性对照序列的合理设计与siRNA 序列的设计同样重要。因为有效的对照可以充分证明siRNA 只对靶基因产生特异性基因沉默,从而增强实验的可信度。阴性对照siRNA包括碱基错配或混乱序列的siRNA。在实验中最好设计两条siRNA 对照序列。
3.1 碱基错配的阴性对照siRNA
最初的研究证明,在siRNA双链内,一个碱基的突变就足以阻断RNAi 过程。反义链内具有1~2 个碱基错配的阴性对照siRNA可用于鉴别RNAi 通路和micro RNA 通路,因为后者是由碱基的非精确配对引起。最近的研究表明:siRNA 允许其分子中心部位存在单个碱基突变,siRNA完全失活需要大于3个碱基的突变[19],在Mangeot [20]的研究中,对照siRNA序列中含有6个精确定位的突变碱基,也证明了这点。Kim 等[7]的研究表明,在27 nt的siRNA中,有3个碱基错配的对照siRNA序列可以在不同的浓度下阻断针对靶基因的RNAi过程,而单个碱基错配的siRNA仅在相对高的浓度下才可阻断RNAi过程,所以多碱基错配比单碱基错配的siRNA阴性对照序列具有更高的实际应用价值。此外,对于RNAi效应而言,位于siRNA序列中部的
碱基错配比位于siRNA序列尾部的碱基错配更有效。
3.2 混乱序列的阴性对照siRNA
来源于siRNA序列的混乱序列siRNA,在siRNA实验中是一个阴性对照,作为一个信息控制可反映RNAi的特异性。混乱序列siRNA与siRNA序列相比具有相同的核苷酸组成,但是核苷酸顺序被打乱,同样要保证它和靶mRNA没有同源性。