163-生物基础知识-CDS、ORF、启动子、终止子、转录因子

刘小泽写于2020.2.8 大概回顾一下基础知识

一:ORF与CDS

ORF:open reading frame(开放阅读框)

它是理论上的蛋白编码区,一般是先在DNA序列中寻找起始密码子(AUG)对应的序列ATG,然后按每3个碱基一组向后延伸,一直到出现终止密码子(UAG、UGA、UAA)对应的序列

注意:起始密码子和启动子不是一回事!

CDS:coding sequences (编码区)

它就是与蛋白序列一一对应的DNA序列,并且序列中间不存在其他与蛋白无关的序列,和真实情况最接近

举个例子:

例如这个序列:AACGCATGCAGC

如果用预测的方法得到ORF,它会先找到ATG;然后会以中间的字母T为核心,推测三种可能:

  • 第一种:T就是在中心,即ATG,然后按每三个一组,得到:CGC、ATG、CAG
  • 第二种:T在左侧,即TGC,同样得到AAC、GCA、TGC、AGC【这就是真实的CDS组合】
  • 第三种::T在右侧,即CAT,得到ACG、CAT、GCA

还因为DNA双链,所以总共有3*2=6种不同密码子组合方式

补充

https://www.biostars.org/p/47022/

CDS 与 UTR:

A typical CDS starts with ATG and ends with a stop codon, it doesn’t have any introns, 5’- and 3’-UTR

CDS与ORF:

CDS can be a subset of an open reading frame (ORF).

二:启动子&起始密码子;终止子&终止密码子**

实际上二者之间没有任何关联

  • 启动子和终止子都是一段特殊的DNA序列,属于基因的**非编码区,**分别位于编码区的上游和下游,负责调控基因的转录
  • 起始密码子和终止密码子都是mRNA上的三联体碱基序列,分别决定翻译的起始和终止。

启动子 promoter

  • DNA分子上能与RNA聚合酶结合并形成转录起始复合体的区域

  • 与RNA聚合酶结合并能起始mRNA合成的序列。做生信分析时,有的选择上游1 kb,下游 500 nt,也有选上下游各1 kb的

强启动子(strong promoter):对RNA聚合酶有很高亲和力的启动子,可以指导合成大量的mRNA

起始密码子 start codon

指定信使RNA(mRNA)上开始合成蛋白质的密码子,也是第一个被核糖体翻译的mRNA上的密码子,位于编码区内,紧邻5′非翻译区。较为常见的起始密码子是AUG

终止子 terminator

  • 转录过程中能够终止RNA聚合酶转录的DNA序列
  • 终止子可分为两类:一类不依赖于蛋白质辅因子就能实现终止作用。另一类则依赖蛋白辅因子才能实现终止作用

终止密码子 stop codon

终止肽链合成的信使核糖核酸(mRNA)的三联体碱基序列,UAA、UAG和UGA,它们不编码氨基酸

三:转录因子 及结合位点

转录因子(transcription factor)

  • 一群能与基因5`端上游特定序列专一性结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子,这些蛋白质能调控其基因的转录。

  • 调控方法是转录因子可以调控核糖核酸聚合酶(RNA聚合酶,或叫RNA合成酶)与DNA模板的结合

更详细的转录因子介绍:https://cloud.tencent.com/developer/article/1376739

TF结合位点 transcription factor binding site,TFBS

转录因子调节基因表达时,与基因模板链结合的区域。一般应该分布在基因前端【但:人21和22号染色体上,只有22%的转录因子结合位点分布在蛋白编码基因的5’端】

四:UTR (Untranslated Regions)

非翻译区,是信使RNA(mRNA)分子两端的非编码片段

  • 5’-UTR从mRNA起点的甲基化鸟嘌呤核苷酸帽延伸至AUG起始密码子
  • 3’-UTR从编码区末端的终止密码子延伸至多聚A尾巴(Poly-A)的前端

最后补充几张图

关于表达调控

BIOL2060: Regulation of Gene Expression

Yunze Liu
Yunze Liu
Bioinformatics Sharer

Co-founder of Bioinfoplanet(生信星球)

Next
Previous

Related