011-单细胞测序--scRNA-seq

近期想学一些关于单细胞测序的知识,了解了解科技前沿 刘小泽写于18.7.14

选取的材料是剑桥大学的一门课程,最近更新时间是18-5-29, 课程地址

写在前面:

scRNA-seq有什么特别之处吗?为何最近这么火,单单2018年就在各大期刊上发表了快600篇文章!

它是什么?

对成千上万的单个细胞进行各式各样的二代测序,并且还尽量不搞混地获得单个细胞的遗传信息。它早在5年前就已经被Science杂志赋予了年度“奥斯卡”—年度技术奖。 目前二代测序百花齐放,DNA-seq、RNA-seq、BS-seq(甲基化组)、Chip-seq、ATAC-seq(利用转座酶获取染色质开放区域,研究与这段区域与一些调控蛋白的结合—这个特性叫染色质的可接近性,这个研究可以在DNA水平上了解转录调控)【要了解Chip-seq、ATAC-seq、DNase-seq的区别,可以参考:https://doi.org/10.1038/nrg3788

目前测序大多还是在分子水平解决问题,主要有这几个方面:

  1. DNA/RNA序列:排列顺序,各序列碱基丰度;
  2. DNA表观遗传:甲基化、羟甲基化、组蛋白修饰;
  3. RNA表观遗传:如2017年Nature发表的m6A修饰;【https://doi.org/10.1038/nature23450
  4. 染色质结构:3C、4C、HiC;
  5. 其他比如DNA损伤、蛋白间互作

scRNA-seq就是想更进一步从细胞水平去解释这些问题

为什么用它?

我们现在测序怎么测的?无论芯片还是NGS都是从大于10万细胞中抽取一大堆的DNA或者RNA。又是怎么分析的?是不是分析了一系列的均值、方差?但是,“世界上不存在两片相同的树叶”,细胞更是如此,细胞的多样性远超我们想象。比如我们体内的肝脏组织,具有大量各异的细胞类型,其中的每一种都来自不同的分化,行使不同的功能。

肿瘤组织中,瘤块中心细胞、瘤块边缘细胞、淋巴转移的细胞以及转移后远端的癌细胞它们的遗传信息都是有差异的,虽然都来源一处,都叫癌细胞,可这哥几个后来的发展变化可不是用一个平均数就能表示清楚的,这就是细胞遗传信息的异质性

要做到精准医疗,就必须从不同的细胞类型入手。因此,如果我们的研究能够到达一个细胞类型,看它是如何与周围细胞、环境沟通的,对理解许多疾病尤其癌细胞的起源、发展、变异意义重大。

怎么用它?

基本的流程是:单细胞分离、提取、建库–> 全基因组/全转录组扩增 –> 测序分析

首先看一下如何分离提取?

第一种:

其实我们首先想到的就是:把单个细胞筛出来,独立构建文库

主流方法有:流式细胞术(Flow Cytometry)、激光捕获显微切割技术(LCM)

想想这种方法,单个进行操作,有没有很像早期的Sanger测序,虽然比较准,但是通量上不去,成本降不下来。要分析的细胞这么多,一个一个建库,时间成本也是个问题。一般的实验室能撑下来几十个细胞已经算高投入了,但是,一个组织中数万个细胞,癌症样本中数量更是多,单单这几十个能说明问题么?因此来了第二种方法。

第二种: 利用barcode(标签)识别单细胞,就是为每个细胞加一小段特异的DNA序列,测序的时候,将携带一样标签的细胞算作同一个。这样一次测序可得到上千个细胞信息。

那么怎么加入呢?

对于RNA测序的单细胞来说,只需要在逆转录前在poly T引物的5‘端加入; 对于DNA测序的单细胞来说,可以使用带有barcode的Tn5 高效转座酶(transposon) 对DNA进行随机插入【这个转座酶就相当于一个小间谍,当转座子从染色体的一个位置蹦到另一个位置上,Tn5就揣着着barcode尾随,并把barcode植入基因组DNA,这一步叫做tagmentation】虽然只用Tn5相比较第一种方法进步了不少,但总感觉和NGS的高通量级别不在一个层次上,因此又加了一步,组合索引(combinatorial indexing),即:两步反应,两次标签

  • 先将细胞悬液分成96份(split-pool过程),用PCR或者Tn5的方法加进来barcode X1-X96,混合液体,再随意分成96份,再加入不同的barcode Y1-Y96, 重复多次,最后每个细胞都有类似X3-Y15-Z27的号码。这个过程中悬液没变,还是那些细胞,但细胞的barcode越来越细化,这个过程就是组合索引过程【但是,即使分的再细,也会有两个不同的细胞被贴上一样的标签放在用一处地方等待被测序,就像上图中,底部最左侧的小区域中假设绿色是一个脑组织细胞,但是之前有一个肿瘤组织细胞也被分成了绿色,并且加了红色标签,那么这样就把这两个完全不同的细胞判断成了同一个。这个误差确实存在,叫做collision rate,就是“撞了的概率”大概10%】collision rate的大小和tagmentation的复杂程度成反比,与分到每一个孔里的细胞数量成正比。

建库与标记细胞[来源:doi.org/10.1038/nmeth.4209]

这些方法的根本都离不开split-pool , 微珠、微孔、微液滴的物理技术的支撑

微流控技术(Microfluidics)这种技术就是不同于普通的96孔板的pool方法,它和微孔矩阵类似,每个微孔可以放入一个bead,每个稀释的细胞悬液在孔板上就能接触到bead,来引入barcode【 doi.org/10.1016/j.cell.2018.02.001】这个技术是浙大郭国骥教授18年首发于cell

Yunze Liu
Yunze Liu
Bioinformatics Sharer

Co-founder of Bioinfoplanet(生信星球)

Next
Previous

Related