TALENs技术
转录激活子样效应子介导核酸酶(transcription activator-like effector nucleases,TALENs),它的核心区域是TALENs识别域,它来源于植物黄杆菌属,是最近才发现的一种特异性的DNA结合蛋白,在自然界中它的作用是直接调节宿主的基因表达。在通过细菌Ⅲ型分泌系统侵染进入宿主细胞后, TALENs进入细胞核并结合到效应子特异性的基因启动子序列上,从而激活基因转录达到入侵细胞的目的。TALENs包含一组特异性效应子蛋白,包括负责定位和激活功能的N末端和C末端以及中间负责DNA特异性识别结合的结构域。TALENs中的识别域是由大量重复性的结构单元串联而成,这些重复性结构单元的数目从5~30余个不等,平均为17.5个。每一个重复单元都是由34个氨基酸构成,其中32个都是固定的,中间12、13位的两个氨基酸在不同重复单元中存在差异,它们也因此被称为重复序列可变的双氨基酸残基(repeat variable diresidues,RVDs)并负责不同碱基的识别结合,属于TALENs的核心识别区域(图3-11)。
图3-11 TALENs基因打靶示意图
天然型TALENs最早被应用于植物基因组的改造中,也因此使人们了解了TALENs特异性识别碱基序列的规则。TALENs对于碱基的识别是由RVDs决定的,其中A、C、G、T分别对应NI(Asn Ile)、HD(His Asp)、NN(Asn Asn)/NK(Asn Lys)、NG(Asn Gly)。而最近的研究发现,NK比NN对于G碱基的识别效率更高,另外天然型TALENs更倾向于识别序列5'端第一个碱基为T。在了解了TALENs高度特异性的碱基识别机制后,人们开始考虑将其广泛用于动物基因改造中,通过将TALENs与FokI催化域融合表达产生了TALENs,并以此作为基因操作工具运用于各种模式动物体系和细胞培养体系中。
基因工程改造后的TALENs由N端的核定位序列连接部分的TALENs N端序列,中间部分是15~24个RVDs识别域,在部分C端序列后连接 Fok I催化域构成完整的结构。通过分别识别靶位点上下游序列的两条TALENs将其定位至靶位点,酶切产生DSB,诱发NHEJ导致基因插入或删除突变。如果将外源DNA序列与TALENs一同导入细胞也可以通过高效的同源重组产生定点插入。
TALENs提供给我们更简单快捷的靶基因插入,删除突变(targeted insertion/deletion mutations)方式,尤其在生产转基因动物方面与传统方法有着巨大的优势,同时还可以通过多个TALENs的导入实现大片段的删除、插入或者异位,这都是传统同源重组打靶方式难以轻松做到的。而且已经有在iPS细胞中将15个基因敲除获得了不同的细胞疾病模型的研究,并在其中的4个基因即APOB、 SORT1、AKT2和PLIN1中获得了明显的表型,对于研究这些基因在疾病中的作用提供了巨大的便利。在大动物基因敲除方面,研究者尝试以TALENs体外转录的mRNA直接注射猪、牛原核期胚胎后进行基因检测发现基因KO效率超过75%;通过转座子共转正筛选基因与TALENs至猪胎儿成纤维细胞中进行抗生素富集筛选后检测细胞克隆基因突变发现,发生单等位基因突变的比例为54%,而双等位基因突变率为17%,并以此生产了LDLR基因敲除猪模型。
相比于ZFNs,由于TALENs的识别序列更长且设计性和开源性更好,所以在脱靶效应出现率上也相应较低,不过由于TALENs的DNA识别域结构复杂,在基因构建中的难度系数要明显高于ZFN,但随着多种TALENs构建方式的出现,如 Golden Gate cloning,让TALENs从设计到构建、使用都比ZFN要方便许多,而从突变效率上看,ZFN并没有明显的优势,所以TALENs的应用变得越来越广泛。