注册 投稿
经济金融网 中国经济学教育科研网 中国经济学年会 EFN通讯社

当我们谈论基因,我们在谈论什么

昨天发玩儿关于“只有少数人用用blablabla基因”的吐槽文,工号九千多的BGI新员工玄澄问我,“基因是什么”。我的回复是“这真是一个很困难的问题”。作为节操导师,我不能随随便便就误导和打发了一个新员工,嗯,没错是这样,顺便在收入多于我几倍的新员工面前装装逼什么的。

我不知道“基因”是什么,或者说,我其实不知道我们每个人在每种语境下所谓的“基因”是什么。

【当我们谈论基因,我们可以谈论任何DNA】

根据我们 <吐槽> 非常值得呵呵的 的中学生物课本——暂且把初中义务教育的内容作为读者们的“共识”吧,基因是“具有遗传效应的DNA片段”。<假设> 如果基因的定义是这样的话,那么任何长度尺度、任何遗传效应的DNA片段都可以称之为“基因”。比如编码了一个蛋白的DNA序列——比如大家可能比较熟悉的BRCA1,可以称之为一个“基因”。一个外显子(编码一个蛋白质的一部分),可以称之为一个“基因”。一个启动子(让一段下游DNA开始转录成RNA再翻译成一个蛋白的DNA序列,可以简单看做是一个基因的开关 <自我吐槽> 卧槽概念一不小心迭代了,也可以称之为一个“基因”。甚至一整条几百兆的染色体(有遗传效应吧,是DNA片段吧,why not),或者甚至是一个只有6个碱基的酶切位点(比如在细菌里,吃他们的噬菌体会识别这些位点把细菌的基因组干掉),都可以称之为一个“基因”。

然而这样,“基因”就被我们玩儿坏了,因为它作为一个学术概念,变成了一个定义模糊、毫无门槛、能够引起无限误解的概念,一个连在强国论坛灌水转基因威胁论的街边象棋大爷都能随意使用,且不用担心任何概念和逻辑谬误的东西。

【当我们谈论基因,我们左手ATG,右手TGA】

但我们总不能这么随意,随意是对不求甚解和传播谬误的纵容。而且我们总是在冥冥之中觉得,“基因”大概需要是一个什么单位。为了避免造成误解,一般工作中我习惯使用Operon(操纵子)、Transcription Unit(转录单元)、CDS(编码序列)、ORF(开放读码框 <吐槽> 尼玛搜狗输入法默认选项不是“开放” )、Transcriptional Domain(转录区)等和“基因”相关却又有更确切定义的概念 <被吐槽> 卧槽你说的这些都是什么玩意儿 。然后想解释这些概念在何时何地能够在多大程度上扮演“基因”的概念,我们得先看看“基因”的结构。

<段子> 很巧的是,BGI知名的zhuangbility水平远在我至上的一个家伙某次讲课问“基因是什么”,然后自答说“我也不知道”。然后第二次讲课问“基因的结构是什么”,没人回答,丫很生气。如果我在场一定会站起来问“既然你问基因的结构是什么,请先告诉我基因是什么”。哎呀好了我们不就这个死循环抬杠了。

好吧我们看看基因的结构(这里只是蛋白质编码基因的结构啦,还有tRNA基因啦,lincRNA基因啦,我们就先不提了)。

 

原核生物广泛存在几个独立的蛋白质编码序列公用一个或一组启动子的情况,所以,一般提到原核生物的基因,启动子和终止子这种很容易被好几个“基因”共用的转录水平的元件,是常常不被纳入“基因”的界限的。方便起见,多数情况下我们仅以蛋白质翻译的起点和终点——也就是起始密码子和终止密码子——无比可信的界限,作为基因的边界。

 

真核生物则不同,绝大部分编码蛋白质的“基因”,都独享一套转录调控元件(启动子、终止子)。而且真核生物的非翻译区(UTR),存在着更丰富的调控元件。所以在定义基因时,把UTR区和参与转录调控的启动子和终止子也算作基因内,也是没啥问题的。

但真核生物更加麻烦的是,调控序列区域可能很长很长,更加难以预测,不存在像起始密码子和终止密码子这么明确的界限。所以其实,无论是原核生物或是真核生物,在多数情况下,我们谈论“基因”,指的是“从起始密码子到终止密码子的部分”。有些时候,比如我们拿到的基因注释信息里,基因还包括两侧UTR的部分,也就是完整的“转录区”,那是因为有足够的转录组测序帮我们确定了这个没那么容易看清的“边界”。并非我们不想让启动子到终止子这样整个完整的功能区块被纳入“基因”的范畴,只是我们对于DNA这种上帝的语言的理解还太多有限,还没发确切摸清这样的边界罢了。

【当我们谈论基因,我们其实在谈论遗传】

还有一种情况,我们在谈论“基因”,但实际上我们在讨论“遗传”。只是“基因”这个词太好听,太新潮,以至于我们都太爱使用它。

尤其是,“基因”被我们不经意地用作形容词的时候。汉语的词是看不出词性的,但英语里可以。Gene是基因,而Gene的形容词,Genetic,多数情况下翻译成“遗传的”而非“基因”,感觉会三观正好多。<吐槽>但是翻译成“遗传的”,又很容易和 inherited 混在一起,真是头疼呢。比如Genetic Engineering比较确切的翻译应该是“遗传工程”,而非“基因工程”;GM food翻译成“遗传改造食物”,要好于“基因改造食物”,而远远好于“转基因食物”;Genetic Counselor是遗传咨询师而不叫基因咨询师;相应的,大行其道的Genetic Testing也应该称为遗传检测而非基因检测。因为,“基因”的概念跨度太过奇葩,又有被大家玩儿坏的潜质。如果倔强地生活在狭隘的定义下,工程改造的对象未必是基因(比如有可能是调控元件),我们检测的DNA也未必是基因(比如我们暂时还不知道怎么解释的非编码区SNP)。<吐槽>不过比起“基因检测”,貌似“遗传检测”听起来赚不到什么钱的样子啊。

【当我谈论基因,我其实是再装】

我们越是喜欢用“基因”这个名词做噱头,就越有风险,招致很多人对“基因”这个肆意滥用的概念,以及因“基因”躺着也中枪的所有美好知识、技术和产品的反感。所以我的很不靠谱的建议是,专业一点儿,耐心一点儿,告诉大家什么是DNA,什么是遗传,什么是基因型,什么是编码序列,什么是转录和翻译。然后,我们少谈“基因”。

 

文章评论
关注我们

快速入口
回到顶部
深圳网站建设